[go: up one dir, main page]

EA041676B1 - BUILDING MAIS RESISTANT TO NORTHERN LEAF SPOT - Google Patents

BUILDING MAIS RESISTANT TO NORTHERN LEAF SPOT Download PDF

Info

Publication number
EA041676B1
EA041676B1 EA201990924 EA041676B1 EA 041676 B1 EA041676 B1 EA 041676B1 EA 201990924 EA201990924 EA 201990924 EA 041676 B1 EA041676 B1 EA 041676B1
Authority
EA
Eurasian Patent Office
Prior art keywords
seq
sequence
nlb18
nucleotide sequence
dna
Prior art date
Application number
EA201990924
Other languages
Russian (ru)
Inventor
Хойжун Гао
Байлинь Ли
Роберт Б. Мили
Леандро Даниэль Перуджини
Гирма М. Табор
Original Assignee
Пайонир Хай-Бред Интернэшнл, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Пайонир Хай-Бред Интернэшнл, Инк. filed Critical Пайонир Хай-Бред Интернэшнл, Инк.
Publication of EA041676B1 publication Critical patent/EA041676B1/en

Links

Description

Область изобретенияField of invention

Настоящее изобретение относится к области молекулярной биологии и, более конкретно, к способам редактирования генома растительной клетки для получения кукурузы, устойчивой к северной пятнистости листьев.The present invention relates to the field of molecular biology and, more specifically, to methods for editing the genome of a plant cell to obtain northern leaf spot resistant maize.

Ссылка на перечень последовательностей, предоставленный в электронном видеLink to the sequence listing provided electronically

Официальная копия данного перечня последовательностей предоставлена в электронном виде с помощью EFS-Web как перечень последовательностей в файле формата ASCII с названием 7156WO_SEQLIST.txt, созданном 13 октября 2016 г. и имеющем размер 240 килобайтов, и подана одновременно с настоящим описанием. Перечень последовательностей, содержащийся в данном документе в формате ASCII, является частью настоящего описания и включен в данный документ посредством ссылки во всей своей полноте.An official copy of this sequence listing is provided electronically via EFS-Web as a sequence listing in an ASCII file named 7156WO_SEQLIST.txt, created on October 13, 2016, with a size of 240 kilobytes, and submitted simultaneously with this description. The sequence listing contained herein in ASCII format is part of the present specification and is incorporated herein by reference in its entirety.

Предпосылки изобретенияBackground of the invention

Северная пятнистость листьев (NLB), вызываемая патогенным грибом Exserohilum turcicum (ранее называемым Helminthosporium turcicum), представляет собой серьезное сосудистое заболевание листьев маиса во многих тропических условиях и умеренных условиях окружающей среды. Симптомы могут различаться от поражений в форме сигары на нижних листьях до полного разрушения листвы, за счет чего обеспечивается уменьшение размера площади листовой поверхности, доступной для фотосинтеза. Снижение фотосинтетической способности приводит к недостатку углеводов, необходимых для налива зерна, что влияет на урожай зерна. Области средних широт тропиков на высоте приблизительно 900-1600 м над уровнем моря характеризуются особенно благоприятным климатом для северной пятнистости листьев благодаря длительным периодам присутствия росы и умеренным значениям температуры. Однако северная пятнистость листьев может также приводить к потерям урожая на 30-50% в умеренных условиях окружающей среды, как, например, в Соединенных Штатах Америки во время периода дождей, особенно, если инфекция устанавливается на верхних листьях растения до стадии выметывания пестичных столбиков.Northern leaf spot (NLB), caused by the pathogenic fungus Exserohilum turcicum (formerly called Helminthosporium turcicum), is a serious vascular disease of maize leaves in many tropical and temperate environments. Symptoms can range from cigar-shaped lesions on the lower leaves to complete destruction of the foliage, thereby reducing the amount of leaf area available for photosynthesis. A decrease in photosynthetic capacity leads to a lack of carbohydrates needed to fill the grain, which affects the grain yield. The mid-latitude regions of the tropics at about 900-1600 m above sea level have a particularly favorable climate for northern leaf spot due to long periods of dew and moderate temperatures. However, northern leaf spot can also result in yield losses of 30-50% under moderate environmental conditions, such as in the United States during the rainy season, especially if the infection establishes on the upper leaves of the plant before the pistillate stage.

Наиболее эффективным и наиболее предпочтительным способом контроля северной пятнистости листьев является выращивание устойчивых гибридов. Устойчивость к определенным штаммам патогена можно контролировать с помощью определенных нативных генов устойчивости маиса к заболеваниям, таких как Et1, Ht2, Et3, Html, Htnl, EtN, HtP, ht4 и rt (Welz and Geiger 2000. Plant Breeding. 119 (1):1-14; Ogliari et al. 2005. Genet Mol Biol 28:435-439; Hurni et al. 2015 PNAS 112 (28):8780-5). Однако интрогрессия генов устойчивости в другие инбреды является трудной задачей, что может или не может привести к ухудшению урожая ввиду шлейфа от сцепления. Существует необходимость в получении растений маиса, устойчивых к северной пятнистости листьев, с большей эффективностью и путем, с помощью которого уменьшат шлейф от сцепления, ассоциированный с интрогрессией нескольких локусов устойчивости в элитные линии маиса посредством традиционных способов.The most effective and most preferred way to control northern leaf spot is to grow resistant hybrids. Resistance to certain strains of the pathogen can be controlled by certain native maize disease resistance genes such as Et1, Ht2, Et3, Html, Htnl, EtN, HtP, ht4 and rt (Welz and Geiger 2000. Plant Breeding. 119 (1): 1-14 Ogliari et al 2005 Genet Mol Biol 28:435-439 Hurni et al 2015 PNAS 112(28):8780-5). However, introgression of resistance genes into other inbreds is a difficult task, which may or may not lead to poor yield due to linkage plume. There is a need to produce northern leaf spot resistant maize plants with greater efficiency and in a way that reduces the linkage plume associated with the introgression of multiple resistance loci into elite maize lines through conventional methods.

Краткое описаниеShort description

Ограничения традиционной селекции в отношении интрогрессии устойчивости к северной пятнистости листьев в линии маиса можно преодолеть путем редактирования генов, которые придают повышенную устойчивость к северной пятнистости листьев, таких как, например, Et1 и NLB18, или путем перемещения связанных с устойчивостью аллелей Et1 и NLB18 к другому сайту в геноме, так что повышенная устойчивость к северной пятнистости листьев может быть достигнута посредством интрогрессии одного геномного локуса, содержащего множество нуклеотидных последовательностей, каждая из которых придает повышенную устойчивость к северной пятнистости листьев, в растения маиса.The limitations of conventional breeding with respect to northern leaf spot resistance introgression in the maize line can be overcome by editing genes that confer increased northern leaf spot resistance, such as Et1 and NLB18, for example, or by moving the resistance-associated alleles of Et1 and NLB18 to another site in the genome so that increased resistance to northern leaf spot can be achieved by introgression of a single genomic locus containing multiple nucleotide sequences each conferring increased resistance to northern leaf spot into maize plants.

В данном документе предусматриваются способы получения клетки растения маиса с модифицированной нуклеотидной последовательностью Et1. Способы предусматривают введение двухнитевого разрыва или сайт-специфической модификации в один или несколько целевых сайтов в эндогенной последовательности, кодирующей НТ1, в клетке растения маиса, и получение клетки растения маиса, имеющей модифицированную нуклеотидную последовательность Et1. Способ может дополнительно предусматривать введение матрицы для замены Et1 в клетку растения маиса, где указанная матрица для замены Et1 содержит по меньшей мере одно изменение нуклеиновой кислоты по сравнению с эндогенной последовательностью, кодирующей НТ1, и где указанная матрица для замены Et1 включена в эндогенную последовательность, кодирующую НТ 1. Двухнитевый разрыв может быть индуцирован с помощью нуклеазы, такой как без ограничения TALEN, мегануклеаза, нуклеаза с цинковыми пальцами или нуклеаза, ассоциированная с CRISPR. Способ может дополнительно предусматривать выращивание растения маиса из клетки растения маиса, имеющей модифицированную нуклеотидную последовательность Ht1, и при этом растение маиса может проявлять повышенную устойчивость к северной пятнистости листьев.Provided herein are methods for producing a maize plant cell with a modified Et1 nucleotide sequence. The methods include introducing a double-strand break or site-specific modification at one or more target sites in an endogenous HT1 coding sequence in a maize plant cell and obtaining a maize plant cell having a modified Et1 nucleotide sequence. The method may further comprise introducing an Et1 replacement template into a maize plant cell, wherein said Et1 replacement template contains at least one nucleic acid change from an endogenous HT1 coding sequence, and wherein said Et1 replacement template is included in the endogenous coding sequence. HT 1 A double strand break can be induced with a nuclease such as, but not limited to, TALEN, meganuclease, zinc finger nuclease, or CRISPR associated nuclease. The method may further comprise growing a maize plant from a maize plant cell having a modified Ht1 nucleotide sequence, wherein the maize plant may exhibit increased resistance to northern leaf spot.

В некоторых аспектах модифицированная нуклеотидная последовательность Ht1 предусматривает делецию в промоторе эндогенной последовательности, кодирующей НТ1. Способы могут предусматривать применение эндонуклеазы Cas9 и одной или нескольких направляющих РНК. В одном варианте осуществления применяют по меньшей мере две направляющие РНК, причем первая направляющая РНК содержит вариабельный нацеливающий домен, который комплементарен SEQ ID NO:1 [Ht1-TS2], а вторая направляющая РНК содержит вариабельный нацеливающий домен, комплементарный SEQ ID NO:2In some aspects, the modified Ht1 nucleotide sequence provides for a deletion in the promoter of the endogenous sequence encoding HT1. The methods may involve the use of Cas9 endonuclease and one or more guide RNAs. In one embodiment, at least two guide RNAs are used, wherein the first guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:1 [Ht1-TS2] and the second guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:2

- 1 041676- 1 041676

[Ht1-TS4]. В другом варианте осуществления первая направляющая РНК содержит вариабельный нацеливающий домен, который комплементарен SEQ ID NO:1 [Ht1-TS2], а вторая направляющая РНК содержит вариабельный нацеливающий домен, комплементарный SEQ ID NO:3 [Ht1-ST1-TS1].[Ht1-TS4]. In another embodiment, the first guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:1 [Ht1-TS2], and the second guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:3 [Ht1-ST1-TS1].

В других аспектах используют матрицу для замены Ht1, которая содержит нуклеотидную последовательность Ht1 из PH4GP (Ht1-PH4GP). Нуклеотидная последовательность Ht1-PH4GP может содержать SEQ ID NO:59. В другом варианте осуществления нуклеотидная последовательность Ht1-PH4GP может содержать нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:52, где полипептид придает устойчивость к северной пятнистости листьев. Нуклеотидная последовательность Ht1-PH4GP может также содержать SEQ ID NO:65. Способы могут предусматривать применение эндонуклеазы Cas9 и одной или нескольких направляющих РНК. В одном варианте осуществления применяют по меньшей мере две направляющие РНК, причем первая направляющая РНК содержит вариабельный нацеливающий домен, который комплементарен SEQ ID NO:14 [Ht1-TS6], а вторая направляющая РНК содержит вариабельный нацеливающий домен, комплементарный SEQ ID NO:16 [Ht1-TS9]. В другом варианте осуществления первая направляющая РНК содержит вариабельный нацеливающий домен, комплементарный SEQ ID NO:15 [Ht1-TS7], a вторая направляющая РНК содержит вариабельный нацеливающий домен, который комплементарен SEQ ID NO:17 [Ht1-TS10]. В данном документе предусматриваются способы получения клетки растения маиса с модифицированной нуклеотидной последовательностью NLB18. Способы предусматривают введение двухнитевого разрыва или сайт-специфической модификации в один или несколько целевых сайтов в эндогенной последовательности, кодирующей NLB18, в клетке растения маиса, и получение растения маиса, имеющей модифицированную нуклеотидную последовательность NLB18. Способы могут дополнительно предусматривать введение матрицы для замены NLB18 в клетку растения маиса, где указанная матрица для замены NLB18 содержит по меньшей мере одно изменение нуклеиновой кислоты по сравнению с эндогенной последовательностью, кодирующей NLB18, и где указанная матрица для замены NLB18 включена в эндогенную последовательность, кодирующую NLB18. Двухнитевый разрыв может быть индуцирован с помощью нуклеазы, такой как без ограничения TALEN, мегануклеаза, нуклеаза с цинковыми пальцами или нуклеаза, ассоциированная с CRISPR. Способ может дополнительно предусматривать выращивание растения маиса из клетки растения маиса, имеющей модифицированную нуклеотидную последовательность NLB18, и при этом растение маиса может проявлять повышенную устойчивость к северной пятнистости листьев.In other aspects, an Ht1 replacement template is used that contains the Ht1 nucleotide sequence from PH4GP (Ht1-PH4GP). The nucleotide sequence of Ht1-PH4GP may contain SEQ ID NO:59. In another embodiment, the Ht1-PH4GP nucleotide sequence may comprise a nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% of SEQ ID NO :52, wherein the polypeptide confers resistance to northern leaf spot. The nucleotide sequence of Ht1-PH4GP may also contain SEQ ID NO:65. The methods may involve the use of Cas9 endonuclease and one or more guide RNAs. In one embodiment, at least two guide RNAs are used, wherein the first guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:14 [Ht1-TS6] and the second guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:16 [ Ht1-TS9]. In another embodiment, the first guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:15 [Ht1-TS7] and the second guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:17 [Ht1-TS10]. Provided herein are methods for producing a maize plant cell with a modified NLB18 nucleotide sequence. The methods include introducing a double strand break or site-specific modification at one or more target sites in an endogenous NLB18 coding sequence in a maize plant cell and obtaining a maize plant having a modified NLB18 nucleotide sequence. The methods may further comprise introducing an NLB18 replacement template into a maize plant cell, wherein said NLB18 replacement template contains at least one nucleic acid change from an endogenous NLB18 coding sequence, and wherein said NLB18 replacement template is included in an endogenous NLB18 coding sequence. NLB18. The double strand break can be induced with a nuclease such as, but not limited to, TALEN, meganuclease, zinc finger nuclease, or CRISPR associated nuclease. The method may further comprise growing a maize plant from a maize plant cell having a modified NLB18 nucleotide sequence, wherein the maize plant may exhibit increased resistance to northern leaf spot.

В некоторых аспектах модифицированная нуклеотидная последовательность NLB18 содержит модификацию в промоторе эндогенной последовательности, кодирующей NLB18. В некоторых вариантах осуществления модификация в промоторе эндогенной последовательности, кодирующей Ht1, предусматривает делецию участка повторяющихся последовательностей в промоторе Ht1. В одном варианте осуществления модификация в промоторе эндогенной последовательности, кодирующей Ht1, предусматривает делецию SEQ ID NO:71 из промотора Ht1.In some aspects, the modified NLB18 nucleotide sequence comprises a modification in the promoter of the endogenous sequence encoding NLB18. In some embodiments, a modification in the promoter of the endogenous Ht1 coding sequence involves the deletion of a portion of repetitive sequences in the Ht1 promoter. In one embodiment, the modification in the promoter of the endogenous Ht1 coding sequence provides for the deletion of SEQ ID NO:71 from the Ht1 promoter.

В других аспектах используют матрицу для замены NLB18, которая содержит нуклеотидную последовательность NLB18 из PH26N или PH99N (NLB18-PH26N или NLB18-PH99N). В одном варианте осуществления нуклеотидная последовательность NLB18-PH26N содержит любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:64, где полипептид придает устойчивость к северной пятнистости листьев. В некоторых аспектах нуклеотидная последовательность NLB18-PH26N содержит SEQ ID NO:70. Нуклеотидная последовательность NLB18-PH99N может содержать любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 90 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:62, где полипептид придает устойчивость к северной пятнистости листьев. Способы могут предусматривать применение эндонуклеазы Cas9 и одной или нескольких направляющих РНК. В одном варианте осуществления применяют по меньшей мере две направляющие РНК, причем первая направляющая РНК содержит вариабельный нацеливающий домен, который комплементарен SEQ ID NO:30 [NLB18TS1], а вторая направляющая РНК содержит вариабельный нацеливающий домен, комплементарный SEQ ID NO:32 [NLB18-TS4]. В другом варианте осуществления первая направляющая РНК содержит вариабельный нацеливающий домен, комплементарный SEQ ID NO:31 [NLB18-TS8], а вторая направляющая РНК содержит вариабельный нацеливающий домен, комплементарный SEQ ID NO:32 [NLB18TS4].In other aspects, an NLB18 replacement template is used that contains the NLB18 nucleotide sequence from PH26N or PH99N (NLB18-PH26N or NLB18-PH99N). In one embodiment, the NLB18-PH26N nucleotide sequence comprises any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% of SEQ ID NO :64, wherein the polypeptide confers resistance to northern leaf spot. In some aspects, the nucleotide sequence of NLB18-PH26N contains SEQ ID NO:70. The nucleotide sequence of NLB18-PH99N may comprise any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90% 91, 92, 93, 94, 95, 96, 97, 98, or 99% of SEQ ID NO:62, where the polypeptide confers resistance to northern leaf spot. The methods may involve the use of Cas9 endonuclease and one or more guide RNAs. In one embodiment, at least two guide RNAs are used, wherein the first guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:30 [NLB18TS1] and the second guide RNA contains a variable targeting domain that is complementary to SEQ ID NO:32 [NLB18- TS4]. In another embodiment, the first guide RNA contains a variable targeting domain complementary to SEQ ID NO:31 [NLB18-TS8] and the second guide RNA contains a variable targeting domain complementary to SEQ ID NO:32 [NLB18TS4].

В данном документе предусматриваются способы получения клетки растения маиса с редактированным геномным локусом, содержащим по меньшей мере одну нуклеотидную последовательность, которая придает повышенную устойчивость к северной пятнистости листьев. Способы предусматривают 1) введение двухнитевого разрыва или сайт-специфической модификации в один или несколько целевых сайтов в геномном локусе клетки растения маиса; 2) введение одной или нескольких нуклеотидных последовательностей, кодирующих полипептид, который придает повышенную устойчивость к северной пятнистости листьев, где каждая нуклеотидная последовательность фланкирована 300-500 смежными нуклеотидами нуклеотидных последовательностей, расположенных 5' или 3' относительно соответст- 2 041676 вующих целевых сайтов; и 3) получение клетки растения маиса, имеющей геномный локус, содержащий одну или несколько нуклеотидных последовательностей, которые придают повышенную устойчивость к северной пятнистости листьев. Двухнитевый разрыв или сайт-специфическая модификация могут быть индуцированы с помощью нуклеазы, такой как без ограничения TALEN, мегануклеаза, нуклеаза с цинковыми пальцами или нуклеаза, ассоциированная с CRISPR. Способ может дополнительно предусматривать выращивание растения маиса из клетки растения маиса, имеющей редактированный геномный локус, содержащий по меньшей мере одну нуклеотидную последовательность, которая обеспечивает повышенную устойчивость к северной пятнистости листьев, и при этом растение маиса может проявлять повышенную устойчивость к северной пятнистости листьев.Provided herein are methods for producing a genomic locus-edited maize plant cell containing at least one nucleotide sequence that confers increased resistance to northern leaf spot. The methods include 1) introducing a double strand break or site-specific modification at one or more target sites in the genomic locus of a maize plant cell; 2) introducing one or more nucleotide sequences encoding a polypeptide that confers increased resistance to northern leaf spot, wherein each nucleotide sequence is flanked by 300-500 contiguous nucleotide sequences of nucleotide sequences located 5' or 3' relative to the respective target sites; and 3) obtaining a maize plant cell having a genomic locus containing one or more nucleotide sequences that confer increased resistance to northern leaf spot. The double-strand break or site-specific modification can be induced with a nuclease such as, but not limited to, TALEN, a meganuclease, a zinc finger nuclease, or a CRISPR-associated nuclease. The method may further comprise growing a maize plant from a maize plant cell having an edited genomic locus containing at least one nucleotide sequence that provides increased resistance to northern leaf spot, and wherein the maize plant can exhibit increased resistance to northern leaf spot.

В некоторых аспектах редактированная растительная клетка содержит одну или несколько нуклеотидных последовательностей, включающих любое из следующего: Ht1-PH4GP (SEQ ID NO:51), NLB18PH26N (SEQ ID NO:63) и NLB18-PH99N (SEQ ID NO:61). В других аспектах геномный локус представляет собой CTL1. Нуклеотидная последовательность Ht1-PH4GP может содержать SEQ ID NO:59 или любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 9о, 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:52, где полипептид придает повышенную устойчивость растению маиса к северной пятнистости листьев. В некоторых аспектах нуклеотидная последовательность Ht1-PH4GP содержит SEQ ID NO:65. Нуклеотидная последовательность NLB18-PH2 6N может содержать любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:64, где полипептид придает повышенную устойчивость растению маиса к северной пятнистости листьев. В некоторых аспектах нуклеотидная последовательность NLB18-PH26N содержит SEQ ID NO:70. Нуклеотидная последовательность NLB18-PH99N может содержать любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:62, где полипептид придает повышенную устойчивость растению маиса к северной пятнистости листьев.In some aspects, the edited plant cell contains one or more nucleotide sequences including any of the following: Ht1-PH4GP (SEQ ID NO:51), NLB18PH26N (SEQ ID NO:63), and NLB18-PH99N (SEQ ID NO:61). In other aspects, the genomic locus is CTL1. The Ht1-PH4GP nucleotide sequence may comprise SEQ ID NO:59 or any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 9o, 91, 92, 93, 94, 95, 96, 97, 98, or 99% SEQ ID NO:52 wherein the polypeptide confers increased resistance to northern leaf spot in the maize plant. In some aspects, the nucleotide sequence of Ht1-PH4GP contains SEQ ID NO:65. The nucleotide sequence of NLB18-PH2 6N may comprise any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90, 91, 92, 93, 94, 95, 96, 97, 98, or 99% of SEQ ID NO:64 where the polypeptide confers increased resistance to northern leaf spot in the maize plant. In some aspects, the nucleotide sequence of NLB18-PH26N contains SEQ ID NO:70. The NLB18-PH99N nucleotide sequence may comprise any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% of SEQ ID NO:62, wherein the polypeptide confers increased resistance to northern leaf spot in the maize plant.

В еще других аспектах нуклеотидная последовательность, кодирующая NLB18-PH26N, нацелена на TS8 CTL1; нуклеотидная последовательность, кодирующая NLB18-PH4GP, нацелена на TS10 CTL1; и/или нуклеотидная последовательность, кодирующая NLB18-PH26N, нацелена на TS45 CTL1.In still other aspects, the nucleotide sequence encoding NLB18-PH26N is targeted at TS8 CTL1; the nucleotide sequence encoding NLB18-PH4GP targets TS10 CTL1; and/or the nucleotide sequence encoding NLB18-PH26N is targeted at TS45 CTL1.

В одном аспекте способ редактирования растительной клетки предусматривает применение эндонуклеазы Cas9 в качестве средства, индуцирующего DSB, и одой или нескольких направляющих РНК для нацеливания Cas9 на сайты в локусе CTL1. Одна направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:36 [CTL1-TS8]; одна направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:37 [CTL1TS10], и одна направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:38 [CTL1-TS45].In one aspect, a method for editing a plant cell involves using Cas9 endonuclease as a DSB inducing agent and one or more guide RNAs to target Cas9 to sites at the CTL1 locus. One guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:36 [CTL1-TS8]; one guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:37 [CTL1TS10], and one guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:38 [CTL1-TS45].

Также предусматриваются клетки растений маиса, полученные с помощью способов, предусмотренных в данном документе, а также растения маиса, продуцирующие клетки растений маиса и семена, продуцируемые растениями маиса.Also contemplated are maize plant cells obtained using the methods provided herein, as well as maize plants producing maize plant cells and seeds produced by maize plants.

В данном документе также предусматриваются направляющие полинуклеотиды, содержащие вариабельные нацеливающие домены, комплементарные целевым сайтам в эндогенной последовательности, кодирующей Ht1, эндогенной последовательности, кодирующей NLB18, или геномный локус CTL1. Направляющие полинуклеотиды могут представлять собой последовательности РНК, последовательности ДНК или комбинированные последовательности РНК-ДНК. Для Ht1 направляющие полинуклеотиды могут иметь вариабельный нацеливающий домен, комплементарный SEQ ID NO:1, SEQ ID NO:2, или SEQ ID NO:3. Для NLB18 направляющие полинуклеотиды могут иметь вариабельный нацеливающий домен, комплементарный SEQ ID NO:30, SEQ ID NO:31, или SEQ ID NO:32. Для CTL1 направляющие полинуклеотиды могут иметь вариабельный нацеливающий домен, комплементарный SEQ ID NO:36, SEQ ID NO:37, или SEQ ID NO:38.This document also provides guide polynucleotides containing variable targeting domains complementary to target sites in the endogenous Ht1 coding sequence, the endogenous NLB18 coding sequence, or the CTL1 genomic locus. The targeting polynucleotides can be RNA sequences, DNA sequences, or combined RNA-DNA sequences. For Ht1, targeting polynucleotides may have a variable targeting domain complementary to SEQ ID NO:1, SEQ ID NO:2, or SEQ ID NO:3. For NLB18, targeting polynucleotides may have a variable targeting domain complementary to SEQ ID NO:30, SEQ ID NO:31, or SEQ ID NO:32. For CTL1, targeting polynucleotides may have a variable targeting domain complementary to SEQ ID NO:36, SEQ ID NO:37, or SEQ ID NO:38.

Краткое описание графических материалов и перечней последовательностейBrief Description of Drawings and Sequence Listings

На фиг. 1 показано схематическое изображение локуса Ht1; расположение каждого целевого сайта в геномной последовательности Ht1 для делеции повторяющейся последовательности в промоторном участке; и положения праймеров, используемых для проверки. Интроны между экзонами выделены белым цветом, а целевые сайты обозначены треугольниками вверх. Е1 представляет собой экзон1; е2 представляет собой экзон 2; a pro представляет собой промоторный участок.In FIG. 1 shows a schematic representation of the Ht1 locus; the location of each target site in the Ht1 genomic sequence for the deletion of a repeating sequence in the promoter region; and the positions of the primers used for verification. Introns between exons are highlighted in white, and target sites are indicated by upward triangles. E1 is exon1; e2 is exon 2; a pro is a promoter region.

На фиг. 2А и 2В показаны ожидаемые последовательности участков границы сплайсинга после удаления повторяющихся последовательностей в промоторном участке гена Ht1. На фиг. 2А показана ожидаемая последовательность участков границы сплайсинга CR2/CR4 (последовательности, выделенные курсивом, являются последовательностями TS2, а подчеркнутые последовательности являются последовательностями TS4). На фиг. 2В показана ожидаемая последовательность участков границы сплайсинга CR2/ST1-CR1 (последовательности, выделенные курсивом, являются последовательностями TS2, а подчеркнутые последовательности являются последовательностями ST1-TS1). Участки в рамке указывают на участки границы сплайсинга.In FIG. 2A and 2B show the expected sequences of splice boundary regions after deletion of repetitive sequences in the promoter region of the Ht1 gene. In FIG. 2A shows the expected sequence of CR2/CR4 splicing boundary regions (sequences in italics are TS2 sequences and underlined sequences are TS4 sequences). In FIG. 2B shows the expected sequence of CR2/ST1-CR1 splicing boundary regions (sequences in italics are TS2 sequences and underlined sequences are ST1-TS1 sequences). The areas in the box indicate areas of the splicing boundary.

- 3 041676- 3 041676

На фиг. 3 показано положение каждого целевого сайта и схематическое изображение обмена аллелями Ht1. Аллель Ht1 PH4GP показан темно-серым, а аллель, который он заменяет, показан светлосерым.In FIG. 3 shows the position of each target site and a schematic of Ht1 allele exchange. The Ht1 PH4GP allele is shown in dark gray and the allele it replaces is shown in light gray.

На фиг. 4 показаны положения праймеров, применяемых для оценки обмена аллелями Ht1.In FIG. 4 shows the primer positions used to evaluate Ht1 allele exchange.

На фиг. 5 показано положение каждого целевого сайта и схематическое изображение обмена аллелями NLB18.In FIG. 5 shows the position of each target site and a schematic representation of NLB18 allele exchange.

На фиг. 6 показано положение трех локусов, содержащих целевые сайты (TS8, TS45 и TS10) для системы направляющая РНК/эндонуклеаза Cas в CTL1 на хромосоме 1 маиса.In FIG. 6 shows the position of three loci containing target sites (TS8, TS45 and TS10) for the Cas guide RNA/endonuclease system in CTL1 on maize chromosome 1.

На фиг. 7 показано схематическое изображение вставки NLB18-PH26N в TS8.In FIG. 7 shows a schematic of the NLB18-PH26N insert in TS8.

На фиг. 8 показано схематическое изображение вставки Ht1-PH4GP в TS10.In FIG. 8 shows a schematic of the Ht1-PH4GP insert in TS10.

На фиг. 9 показано схематическое изображение вставки NLB18-PH26N в TS45.In FIG. 9 shows a schematic of the NLB18-PH26N insert in the TS45.

На фиг. 10 показана экспрессия NLB18 с применением qRT-PCR в растениях маиса Т2 TS45 NLB18-BC26N.In FIG. 10 shows expression of NLB18 using qRT-PCR in T2 TS45 NLB18-BC26N maize plants.

На фиг. 11 показана экспрессия Ht1 с применением qRT-PCR в растениях маиса Т2 TS10 Ht1ED4GP.In FIG. 11 shows Ht1 expression using qRT-PCR in T2 TS10 Ht1ED4GP maize plants.

SEQ ID NO:1 представляет собой нуклеотидную последовательность целевого сайта Ht1-TS2.SEQ ID NO:1 is the nucleotide sequence of the target site of Ht1-TS2.

SEQ ID NO:2 представляет собой нуклеотидную последовательность целевого сайта Ht2-TS4.SEQ ID NO:2 is the nucleotide sequence of the Ht2-TS4 target site.

SEQ ID NO:3 представляет собой нуклеотидную последовательность целевого сайта Ht1-ST1-TS1.SEQ ID NO:3 is the nucleotide sequence of the target site of Ht1-ST1-TS1.

SEQ ID NO:4 представляет собой нуклеотидную последовательность гена Cas9.SEQ ID NO:4 is the nucleotide sequence of the Cas9 gene.

SEQ ID NO:5 представляет собой аминокислотную последовательность одинарного аминоконцевого сигнала внутриядерной локализации SV40.SEQ ID NO:5 is the amino acid sequence of the single amino terminal SV40 intranuclear localization signal.

SEQ ID NO:6 представляет собой нуклеотидную последовательность промотора U6 полимеразы III.SEQ ID NO:6 is the nucleotide sequence of the polymerase III U6 promoter.

SEQ ID NO:7 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК Ht1-CR2.SEQ ID NO:7 is the nucleotide sequence of DNA capable of expressing the Ht1-CR2 guide RNA.

SEQ ID NO:8 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК Ht1-CR4.SEQ ID NO:8 is the nucleotide sequence of DNA capable of expressing the Ht1-CR4 guide RNA.

SEQ ID NO:9 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК Ht1-ST1-CR1.SEQ ID NO:9 is the nucleotide sequence of DNA capable of expressing the Ht1-ST1-CR1 guide RNA.

SEQ ID NO:10 представляет собой нуклеотидную последовательность прямого праймера для Ht1f3.SEQ ID NO:10 is the nucleotide sequence of the forward primer for Ht1f3.

SEQ ID NO:11 представляет собой нуклеотидную последовательность обратного праймера для Ht1r4v2.SEQ ID NO:11 is the nucleotide sequence of the reverse primer for Ht1r4v2.

SEQ ID NO:12 представляет собой нуклеотидную последовательность прямого праймера, применяемого во второй реакции ПЦР.SEQ ID NO:12 is the nucleotide sequence of the forward primer used in the second PCR reaction.

SEQ ID NO:13 представляет собой нуклеотидную последовательность обратного праймера, применяемого во второй реакции ПЦР.SEQ ID NO:13 is the nucleotide sequence of the reverse primer used in the second PCR reaction.

SEQ ID NO:14 представляет собой нуклеотидную последовательность целевого сайта Ht1-TS6.SEQ ID NO:14 is the nucleotide sequence of the target site of Ht1-TS6.

SEQ ID NO:15 представляет собой нуклеотидную последовательность целевого сайта HT1-TS7.SEQ ID NO:15 is the nucleotide sequence of the target site of HT1-TS7.

SEQ ID NO:16 представляет собой нуклеотидную последовательность целевого сайта HT1-TS9.SEQ ID NO:16 is the nucleotide sequence of the target site of HT1-TS9.

SEQ ID NO:17 представляет собой нуклеотидную последовательность целевого сайта HT1-TS10.SEQ ID NO:17 is the nucleotide sequence of the target site of HT1-TS10.

SEQ ID NO:18 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК HT1-CR6.SEQ ID NO:18 is the nucleotide sequence of DNA capable of expressing the HT1-CR6 guide RNA.

SEQ ID NO:19 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК HT1-CR9.SEQ ID NO:19 is the nucleotide sequence of DNA capable of expressing the HT1-CR9 guide RNA.

SEQ ID NO:20 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК HT1-CR7.SEQ ID NO:20 is the nucleotide sequence of DNA capable of expressing the HT1-CR7 guide RNA.

SEQ ID NO:21 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК HT1-CR10.SEQ ID NO:21 is the nucleotide sequence of DNA capable of expressing the HT1-CR10 guide RNA.

SEQ ID NO:22 представляет собой нуклеотидную последовательность прямого праймера для Ht1HR1f1.SEQ ID NO:22 is the nucleotide sequence of the forward primer for Ht1HR1f1.

SEQ ID NO:23 представляет собой нуклеотидную последовательность обратного праймера для Ht1HR1r1.SEQ ID NO:23 is the nucleotide sequence of the reverse primer for Ht1HR1r1.

SEQ ID NO:24 представляет собой нуклеотидную последовательность прямого праймера для Ht1HR2f1.SEQ ID NO:24 is the nucleotide sequence of the forward primer for Ht1HR2f1.

SEQ ID NO:25 представляет собой нуклеотидную последовательность обратного праймера для Ht1HR2r1.SEQ ID NO:25 is the nucleotide sequence of the reverse primer for Ht1HR2r1.

SEQ ID NO:26 представляет собой нуклеотидную последовательность прямого праймера для hdr2b f.SEQ ID NO:26 is the nucleotide sequence of the forward primer for hdr2b f.

SEQ ID NO:27 представляет собой нуклеотидную последовательность обратного праймера для hdr2br.SEQ ID NO:27 is the nucleotide sequence of the reverse primer for hdr2br.

SEQ ID NO:28 представляет собой нуклеотидную последовательность зонда hdr2b PV.SEQ ID NO:28 is the nucleotide sequence of the hdr2b PV probe.

SEQ ID NO:29 представляет собой нуклеотидную последовательность зонда hdr2b PG.SEQ ID NO:29 is the nucleotide sequence of the hdr2b PG probe.

SEQ ID NO:30 представляет собой нуклеотидную последовательность целевого сайта NLB18-TS1.SEQ ID NO:30 is the nucleotide sequence of the target site of NLB18-TS1.

- 4 041676- 4 041676

SEQ ID NO:31 представляет собой нуклеотидную последовательность целевого сайта NLB18-TS8.SEQ ID NO:31 is the nucleotide sequence of the target site of NLB18-TS8.

SEQ ID NO:32 представляет собой нуклеотидную последовательность целевого сайта NLB18-TS4.SEQ ID NO:32 is the nucleotide sequence of the target site of NLB18-TS4.

SEQ ID NO:33 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК NLB18-CR1.SEQ ID NO:33 is the nucleotide sequence of DNA capable of expressing the NLB18-CR1 guide RNA.

SEQ ID NO:34 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК NLB18-CR8.SEQ ID NO:34 is the nucleotide sequence of DNA capable of expressing the NLB18-CR8 guide RNA.

SEQ ID NO:35 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК NLB18-CR4.SEQ ID NO:35 is the nucleotide sequence of DNA capable of expressing the NLB18-CR4 guide RNA.

SEQ ID NO:36 представляет собой нуклеотидную последовательность целевого сайта CTL1-TS8.SEQ ID NO:36 is the nucleotide sequence of the target site of CTL1-TS8.

SEQ ID NO:37 представляет собой нуклеотидную последовательность целевого сайта CTL1-TS45.SEQ ID NO:37 is the nucleotide sequence of the target site of CTL1-TS45.

SEQ ID NO:38 представляет собой нуклеотидную последовательность целевого сайта CTL1-TS10.SEQ ID NO:38 is the nucleotide sequence of the target site of CTL1-TS10.

SEQ ID NO:39 представляет собой нуклеотидную последовательность прямого праймера для 8HR1f1.SEQ ID NO:39 is the nucleotide sequence of the forward primer for 8HR1f1.

SEQ ID NO:40 представляет собой нуклеотидную последовательность обратного праймера для PH26NPr.SEQ ID NO:40 is the nucleotide sequence of the reverse primer for PH26NPr.

SEQ ID NO:41 представляет собой нуклеотидную последовательность прямого праймера для PH26NTf.SEQ ID NO:41 is the nucleotide sequence of the forward primer for PH26NTf.

SEQ ID NO:42 представляет собой нуклеотидную последовательность обратного праймера для 8HR2r1.SEQ ID NO:42 is the nucleotide sequence of the reverse primer for 8HR2r1.

SEQ ID NO:43 представляет собой нуклеотидную последовательность прямого праймера для 10HR1f.SEQ ID NO:43 is the nucleotide sequence of the forward primer for 10HR1f.

SEQ ID NO:44 представляет собой нуклеотидную последовательность обратного праймера для Ht1Pr.SEQ ID NO:44 is the nucleotide sequence of the Ht1Pr reverse primer.

SEQ ID NO:45 представляет собой нуклеотидную последовательность прямого праймера для Ht1Tf.SEQ ID NO:45 is the nucleotide sequence of the forward primer for Ht1Tf.

SEQ ID NO:46 представляет собой нуклеотидную последовательность обратного праймера для 10HR2r.SEQ ID NO:46 is the nucleotide sequence of the reverse primer for 10HR2r.

SEQ ID NO:47 представляет собой нуклеотидную последовательность прямого праймера для 45hr1f1.SEQ ID NO:47 is the nucleotide sequence of the forward primer for 45hr1f1.

SEQ ID NO:48 представляет собой нуклеотидную последовательность обратного праймера для PH26NPr.SEQ ID NO:48 is the nucleotide sequence of the reverse primer for PH26NPr.

SEQ ID NO:49 представляет собой нуклеотидную последовательность прямого праймера для PH26NTf.SEQ ID NO:49 is the nucleotide sequence of the forward primer for PH26NTf.

SEQ ID NO:50 представляет собой нуклеотидную последовательность обратного праймера для 45hr2r1.SEQ ID NO:50 is the nucleotide sequence of the reverse primer for 45hr2r1.

SEQ ID NO:51 представляет собой нуклеотидную последовательность cDNA Ht1, обнаруженную в инбредной линии PH4GP.SEQ ID NO:51 is the Ht1 cDNA nucleotide sequence found in the PH4GP inbred line.

SEQ ID NO:52 представляет собой аминокислотную последовательность полипептида, кодируемого SEQ ID NO:51.SEQ ID NO:52 is the amino acid sequence of the polypeptide encoded by SEQ ID NO:51.

SEQ ID NO:53 представляет собой нуклеотидную последовательность cDNA Ht1, обнаруженную в инбредной линии PH1W2.SEQ ID NO:53 is the Ht1 cDNA nucleotide sequence found in the PH1W2 inbred line.

SEQ ID NO:54 представляет собой аминокислотную последовательность полипептида, кодируемого SEQ ID NO:53.SEQ ID NO:54 is the amino acid sequence of the polypeptide encoded by SEQ ID NO:53.

SEQ ID NO:55 представляет собой нуклеотидную последовательность cDNA Htl, обнаруженную в инбредной линии В73, и в данном документе называемую аллелем B73-high.SEQ ID NO:55 is the Htl cDNA nucleotide sequence found in the B73 inbred line and herein referred to as the B73-high allele.

SEQ ID NO:56 представляет собой аминокислотную последовательность полипептида, кодируемого SEQ ID NO:55.SEQ ID NO:56 is the amino acid sequence of the polypeptide encoded by SEQ ID NO:55.

SEQ ID NO:57 представляет собой нуклеотидную последовательность cDNA Ht1, обнаруженную в инбредной линии В73, и в данном документе называемую аллелем B734ow.SEQ ID NO:57 is the Ht1 cDNA nucleotide sequence found in the B73 inbred line and referred to herein as the B734ow allele.

SEQ ID NO:58 представляет собой аминокислотную последовательность полипептида, кодируемого SEQ ID NO:57.SEQ ID NO:58 is the amino acid sequence of the polypeptide encoded by SEQ ID NO:57.

SEQ ID NO:59 представляет собой нуклеотидную последовательность геномной ДНК Ht1, обнаруженную в инбредной линии PH4GP.SEQ ID NO:59 is the Ht1 genomic DNA nucleotide sequence found in the PH4GP inbred line.

SEQ ID NO:60 представляет собой аминокислотную последовательность участка, обнаруженного в полипептидах Ht1 аллелей, связанных с устойчивостью.SEQ ID NO:60 is the amino acid sequence of the region found in the Ht1 polypeptides of alleles associated with resistance.

SEQ ID NO:61 представляет собой последовательность cDNA NLB18 из PH99N.SEQ ID NO:61 is the cDNA sequence of NLB18 from PH99N.

SEQ ID NO:62 представляет собой аминокислотную последовательность белка, кодируемого SEQ ID NO:61.SEQ ID NO:62 is the amino acid sequence of the protein encoded by SEQ ID NO:61.

SEQ ID NO:63 представляет собой последовательность cDNA NLB18 из PH26N.SEQ ID NO:63 is the cDNA sequence of NLB18 from PH26N.

SEQ ID NO:64 представляет собой аминокислотную последовательность белка, кодируемого SEQ ID NO:63.SEQ ID NO:64 is the amino acid sequence of the protein encoded by SEQ ID NO:63.

SEQ ID NO:65 представляет собой нуклеотидную последовательность ZM-HT1-PH4GP, содержащую промотор ZM-HT1-PH4GP, экзон 1, интрон 1 и терминатор.SEQ ID NO:65 is the nucleotide sequence of ZM-HT1-PH4GP containing the ZM-HT1-PH4GP promoter, exon 1, intron 1 and terminator.

- 5 041676- 5 041676

SEQ ID NO:66 представляет собой нуклеотидную последовательность NLB18 из РН184С, в том числе от 5' NLB18-CR8 по 3' NLB18-CR4.SEQ ID NO:66 is the nucleotide sequence of NLB18 from PH184C, including 5' NLB18-CR8 to 3' NLB18-CR4.

SEQ ID NO:67 представляет собой последовательность плеча гомологии, фланкирующую 5' NLB18TS1 в РН184С.SEQ ID NO:67 is the homology arm sequence flanking 5' of NLB18TS1 in PH184C.

SEQ ID NO:68 представляет собой последовательность плеча гомологии, фланкирующую 3' NLB18TS4 в РН184С.SEQ ID NO:68 is the homology arm sequence flanking 3' of NLB18TS4 in PH184C.

SEQ ID NO:69 представляет собой последовательность плеча гомологии, фланкирующую 5' NLB18TS8 в РН184С.SEQ ID NO:69 is the homology arm sequence flanking 5' of NLB18TS8 in PH184C.

SEQ ID NO:70 представляет собой нуклеотидную последовательность NLB18 из PH2 6N, содержащую промотор NLB18 PH26N, экзон 1, интрон 1, экзон 2, интрон 2, экзон 3 и терминатор.SEQ ID NO:70 is the nucleotide sequence of NLB18 from PH2 6N containing the NLB18 PH26N promoter, exon 1, intron 1, exon 2, intron 2, exon 3, and terminator.

SEQ ID NO:71 представляет собой нуклеотидную последовательность участка повторяющихся последовательностей в промоторе Ht1 PH184C.SEQ ID NO:71 is the nucleotide sequence of a portion of repetitive sequences in the PH184C Ht1 promoter.

SEQ ID NO:72 представляет собой нуклеотидную последовательность кассеты экспрессии, включающую убиквитиновый промотор Zea mays, 5'-UTR гена убиквитина ZM, интрон 1 гена убиквитина ZM, сигнал внутриядерной локализации SV40, экзон 1 Cas9 (ST1), интрон LS1 картофеля, экзон 2 Cas9 (ST1), сигнал внутриядерной локализации эндонуклеазы VirD2 и терминатор pinII.SEQ ID NO:72 is the nucleotide sequence of the expression cassette comprising the Zea mays ubiquitin promoter, ZM ubiquitin 5'-UTR, ZM ubiquitin intron 1, SV40 intranuclear localization signal, Cas9 exon 1 (ST1), potato LS1 intron, exon 2 Cas9 (ST1), VirD2 endonuclease intranuclear localization signal, and pinII terminator.

SEQ ID NO:73 представляет собой нуклеотидную последовательность, содержащую Cas9, используемую в примере 4; SEQ ID NO:73 содержит экзон 1 (SP) cas9, интрон 2 ST-LS1, экзон 2 (SP) Cas9 и сигнал внутриядерной локализации VirD2.SEQ ID NO:73 is the nucleotide sequence containing Cas9 used in Example 4; SEQ ID NO:73 contains cas9 exon 1 (SP), ST-LS1 intron 2, Cas9 exon 2 (SP), and VirD2 intranuclear localization signal.

SEQ ID NO:74 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК ZM-U6:08CR1.SEQ ID NO:74 is the nucleotide sequence of DNA capable of expressing the ZM-U6:08CR1 guide RNA.

SEQ ID NO:75 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК ZM-U6:45CR1.SEQ ID NO:75 is the nucleotide sequence of DNA capable of expressing the ZM-U6:45CR1 guide RNA.

SEQ ID NO:76 представляет собой нуклеотидную последовательность ДНК, способной экспрессировать направляющую РНК ZM-U6:10CR3.SEQ ID NO:76 is the nucleotide sequence of DNA capable of expressing the ZM-U6:10CR3 guide RNA.

SEQ ID NO:77 представляет собой нуклеотидную последовательность матрицы для репарации 8CR1HR2 геномной последовательности 08CR1HR1-NLB18 (PH26N), нацеленной на TS8 CTL1.SEQ ID NO:77 is the nucleotide sequence of the 8CR1HR2 repair template of the 08CR1HR1-NLB18 (PH26N) genomic sequence targeting TS8 CTL1.

SEQ ID NO:78 представляет собой нуклеотидную последовательность матрицы для репарации 45CR1HR2 геномной последовательности 45CR1HR1-NLB18 (PH26N), нацеленной на TS45 CTL1.SEQ ID NO:78 is the nucleotide sequence of the 45CR1HR2 repair template of the 45CR1HR1-NLB18 (PH26N) genomic sequence targeting TS45 CTL1.

SEQ ID NO:79 представляет собой нуклеотидную последовательность матрицы для репарации 10CR3HR2 геномной последовательности 10CR3HR1-HT1 (PH4GP), нацеленной на TS10 CTL1.SEQ ID NO:79 is the nucleotide sequence of the 10CR3HR2 repair template of the 10CR3HR1-HT1 (PH4GP) genomic sequence targeting TS10 CTL1.

SEQ ID NO:80 представляет собой аминокислотную последовательность двухсоставной последовательности сигнала внутриядерной локализации карбоксильного конца эндонуклеазы VirD2 для пограничных участков Т-ДНК Agrobacterium tumefaciens.SEQ ID NO:80 is the amino acid sequence of the VirD2 endonuclease carboxyl terminus intranuclear localization signal for Agrobacterium tumefaciens T-DNA border regions.

SEQ ID NO:81 представляет собой нуклеотидную рующую 5' HT1-TS6 в РН184С (пример 2).SEQ ID NO:81 is the 5' HT1-TS6 nucleotide in PH184C (Example 2).

SEQ ID NO:82 представляет собой нуклеотидную рующую 3' HT1-TS9 в РН184С (пример 2).SEQ ID NO:82 is the 3' HT1-TS9 nucleotide in PH184C (Example 2).

SEQ ID NO:83 представляет собой нуклеотидную рующую 5' HT1-TS7 в РН184С (пример 2).SEQ ID NO:83 is the 5' HT1-TS7 nucleotide in PH184C (Example 2).

SEQ ID NO:84 представляет собой нуклеотидную рующую 5' HT1-TS10 в РН184С (пример 2).SEQ ID NO:84 is the 5' HT1-TS10 nucleotide in PH184C (Example 2).

SEQ ID NO:85 представляет собой нуклеотидную рующую 5' CTL1-TS8 в РН184С (пример 4).SEQ ID NO:85 is the 5' CTL1-TS8 nucleotide in PH184C (Example 4).

SEQ ID NO:86 представляет собой нуклеотидную рующую 3' CTL1-TS8 в РН184С (пример 4).SEQ ID NO:86 is the 3' CTL1-TS8 nucleotide in PH184C (Example 4).

SEQ ID NO:87 представляет собой нуклеотидную рующую 5' CTL1-TS45 в РН184С (пример 4).SEQ ID NO:87 is the 5' CTL1-TS45 nucleotide in PH184C (Example 4).

SEQ ID NO:88 представляет собой нуклеотидную рующую 3' CTL1-TS45 в РН184С (пример 4).SEQ ID NO:88 is the 3' CTL1-TS45 nucleotide in PH184C (Example 4).

SEQ ID NO:89 представляет собой нуклеотидную рующую 5' CTL1-TS10 в РН184С (пример 4).SEQ ID NO:89 is the 5' CTL1-TS10 nucleotide in PH184C (Example 4).

SEQ ID NO:90 представляет собой нуклеотидную рующую 3' CTL1-TS10 в РН184С (пример 4).SEQ ID NO:90 is the 3' CTL1-TS10 nucleotide in PH184C (Example 4).

последовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкипоследовательность плеча гомологии, фланкиПодробное описаниеhomology arm sequence, flankshomology arm sequence, flankshomology arm sequence, flankshomology arm sequence, flankshomology arm sequence, flankshomology arm sequence, flankshomology arm sequence, flankshomology arm sequence, flankshomology arm sequence, flankshomology arm sequence, flanksDetailed description

Также следует понимать, что терминология, применяемая в данном документе, предназначена лишь для описания конкретных вариантов осуществления и не подразумевается как ограничивающая. Используемые в настоящем описании и в прилагаемой формуле изобретения термины в единственном числе и формы единственного числа, например, включают объекты во множественном числе, если только смысл явно не подразумевает иное. Таким образом, например, ссылка на растение, определенное растение или некоторое растение также включает несколько растений; также, в зависимости от контекста, применение термина растение также включает генетически подобного или идентичного потомства такогоIt should also be understood that the terminology used herein is only intended to describe specific embodiments and is not intended to be limiting. As used herein and in the appended claims, singular terms and singular forms, for example, include plural entities unless the meaning clearly implies otherwise. Thus, for example, a reference to a plant, a specific plant, or some plant also includes more than one plant; also, depending on the context, the use of the term plant also includes genetically similar or identical offspring of such

- 6 041676 растения; применение термина нуклеиновая кислота необязательно на практике включает множество копий такой молекулы нуклеиновой кислоты; аналогичным образом, термин зонд необязательно (и как правило) охватывает множество подобных или идентичных молекул зондов. Если не определено иное, все технические и научные термины, используемые в данном документе, имеют то же значение, которое обычно понимается специалистом в данной области техники, к которой принадлежит настоящее изобретение, если явно не указано иное.- 6 041676 plants; the use of the term nucleic acid optionally in practice includes multiple copies of such a nucleic acid molecule; similarly, the term probe optionally (and typically) encompasses a plurality of similar or identical probe molecules. Unless otherwise defined, all technical and scientific terms used herein have the same meaning as generally understood by a person skilled in the art to which the present invention belongs, unless expressly stated otherwise.

Композиции и способы представлены в данном документе для редактирования генома маиса с целью получения растений маиса, которые характеризуются повышенной устойчивостью к северной пятнистости листьев.Compositions and methods are provided herein for editing the maize genome to produce maize plants that have increased resistance to northern leaf spot.

Термин аллель относится к одной из двух или более различных нуклеотидных последовательностей, которые находятся в определенном локусе.The term allele refers to one of two or more different nucleotide sequences that are at a particular locus.

Exserohilum turcicum, ранее называемый Helminthosporium turcicum, представляет собой патогенный гриб, который вызывает инфекцию северной пятнистости листьев. Патогенный гриб в данном документе также называется Exserohilum или Et.Exserohilum turcicum, formerly Helminthosporium turcicum, is a pathogenic fungus that causes northern leaf spot infection. The pathogenic fungus is also referred to herein as Exserohilum or Et.

Устойчивость к заболеваниям (как, например, устойчивость к северной пятнистости листьев) является характерной особенностью растений, где у растения устраняются, сводятся к минимуму, уменьшаются симптомы заболевания, являющиеся результатом взаимодействий растения и патогена, таких как взаимодействия маиса и Exserohilum turcicum. Иными словами, патогены не вызывают заболеваний растений и связанных с ними симптомов заболеваний или, в качестве альтернативы, симптомы заболевания, вызванные патогеном, сводятся к минимуму или уменьшаются.Disease resistance (such as northern leaf spot resistance) is a characteristic of plants where disease symptoms resulting from plant-pathogen interactions such as maize and Exserohilum turcicum interactions are eliminated, minimized, reduced in the plant. In other words, pathogens do not cause plant diseases and associated disease symptoms or, alternatively, disease symptoms caused by the pathogen are minimized or reduced.

Локус представляет собой положение на хромосоме, где локализован ген или маркер.A locus is a position on a chromosome where a gene or marker is located.

Устойчивость является относительным термином, указывающим на то, что инфицированное растение характеризуется лучшим здоровьем растения или производит лучший урожай маиса, чем другое, обработанное таким же образом, более восприимчивое растение. Иными словами, условия вызывают сокращение снижения выживаемости маиса, роста и/или урожая у устойчивого растения маиса по сравнению с восприимчивым растением маиса. Специалисту будет понятно, что устойчивость растений маиса к северной пятнистости листьев или патогену, вызывающему ее, может предусматривать спектр более устойчивых или менее устойчивых фенотипов, и может варьировать в зависимости от тяжести инфекции. Однако путем простого наблюдения специалист может определить относительную устойчивость или чувствительность различных растений, линий растений или семейств растений к северной пятнистости листьев, и более того, также будет распознавать фенотипические градации устойчивого. Например, можно использовать визуальную оценку от 1 до 9 для определения уровня устойчивости к северной пятнистости листьев. Более высокий показатель указывает на более высокую устойчивость. Данные следует собирать только при существовании достаточного давления отбора в эксперименте с измерениями. Термины толерантность и устойчивость применяются в данном документе взаимозаменяемо.Resistance is a relative term indicating that an infected plant has better plant health or produces a better maize crop than another similarly treated, more susceptible plant. In other words, the conditions cause a reduction in the decline in maize survival, growth and/or yield in a resistant maize plant compared to a susceptible maize plant. One skilled in the art will appreciate that the resistance of maize plants to northern leaf spot or the pathogen that causes it may involve a spectrum of more resistant or less resistant phenotypes, and may vary depending on the severity of the infection. However, by simple observation, one skilled in the art can determine the relative resistance or susceptibility of various plants, plant lines or plant families to northern leaf spot, and moreover, will also recognize phenotypic gradations of resistant. For example, a visual score of 1 to 9 can be used to determine the level of resistance to northern leaf spot. A higher score indicates higher resilience. Data should only be collected when sufficient selection pressure exists in the measurement experiment. The terms tolerance and resistance are used interchangeably in this document.

Устойчивость может быть только что приобретенная или повышенная. Только что приобретенная или повышенная устойчивость относится к повышенному уровню устойчивости к определенному патогену, широкому спектру патогенов или инфекции, вызванной патогеном(патогенами). Повышенный уровень устойчивости к конкретному патогенному грибу, такому как Et, например, представляет собой повышенную или улучшенную устойчивость к грибам. Варианты осуществления могут обеспечивать усиление или улучшение устойчивости растений к патогенному грибу.Resistance can be newly acquired or increased. Newly acquired or enhanced resistance refers to an increased level of resistance to a particular pathogen, a broad spectrum of pathogens, or infection caused by the pathogen(s). An increased level of resistance to a particular pathogenic fungus, such as Et, for example, is an increased or improved resistance to fungi. Embodiments may provide increased or improved plant resistance to a pathogenic fungus.

I. Редактирование генов.I. Gene editing.

В некоторых вариантах осуществления редактирование генов может быть облегчено посредством индукции двухнитевого разрыва (DSB) в определенном положении в геноме вблизи желаемого изменения. DSB могут быть индуцированы с применением любого доступного средства, индуцирующего DSB, в том числе без ограничения TALEN, мегануклеазы, нуклеазы с цинковыми пальцами, системы Cas9-gRNA (основанные на бактериальных системах CRISPR-Cas) и т.п. В некоторых вариантах введение DSB можно комбинировать с введением матрицы для модификации полинуклеотида.In some embodiments, gene editing can be facilitated by inducing a double strand break (DSB) at a specific position in the genome near the desired change. DSB can be induced using any available DSB inducing agent, including, but not limited to, TALEN, meganucleases, zinc finger nucleases, Cas9-gRNA systems (based on bacterial CRISPR-Cas systems), and the like. In some embodiments, the introduction of DSB can be combined with the introduction of a template for modifying a polynucleotide.

Матрица для модификации полинуклеотида может быть введена в клетку любым способом, известным из уровня, таким как без ограничения способы временного введения, трансфекция, электропорация, микроинъекция, опосредованная частицами доставка, местное применение, опосредованная вискерами доставка, доставка посредством проникающих в клетку пептидов или прямая доставка, опосредованная наночастицами мезопористого диоксида кремния (MSN).The polynucleotide modification template may be introduced into a cell by any method known in the art, such as, without limitation, transient administration, transfection, electroporation, microinjection, particle-mediated delivery, topical application, whisker-mediated delivery, cell-penetrating peptide delivery, or direct delivery. , mediated by mesoporous silica (MSN) nanoparticles.

Матрица для модификации полинуклеотида может быть введена в клетку в виде однонитевой полинуклеотидной молекулы, двухнитевой полинуклеотидной молекулы или как часть кольцевой ДНК (векторной ДНК). Матрица для модификации полинуклеотида также может быть связана с направляющей РНК и/или эндонуклеазой Cas. Связанные ДНК могут обеспечивать совместную локализацию целевой и матричной ДНК, пригодную для редактирования генома и целевой регуляции генома, а также могут быть пригодны для нацеливания на постмитотические клетки, где ожидается, что функция механизма эндогенной гомологичной рекомбинации HR будет сильно снижена (Mali et al. 2013 Nature Methods Vol. 10: 957-963.) Матрица для модификации полинуклеотида может временно присутствовать в клетке, или она может быть введена посредством вирусного репликона.The polynucleotide modification template can be introduced into the cell as a single-stranded polynucleotide molecule, a double-stranded polynucleotide molecule, or as part of a circular DNA (vector DNA). The polynucleotide modification template may also be linked to a guide RNA and/or a Cas endonuclease. Linked DNAs may provide co-localization of target and template DNA suitable for genome editing and targeted genome regulation, and may also be suitable for targeting post-mitotic cells where the function of the endogenous homologous recombination HR mechanism is expected to be greatly reduced (Mali et al. 2013 Nature Methods Vol 10: 957-963.) The polynucleotide modification template may be temporarily present in the cell, or it may be introduced via a viral replicon.

- 7 041676- 7 041676

Модифицированный нуклеотид или редактированный нуклеотид относится к представляющей интерес нуклеотидной последовательности, которая содержит по меньшей мере одно изменение по сравнению с немодифицированной нуклеотидной последовательностью. Такие изменения предусматривают, например, (i) замещение по меньшей мере одного нуклеотида, (ii) делецию по меньшей мере одного нуклеотида, (iii) вставку по меньшей мере одного нуклеотида или (iv) любую комбинацию из (i)-(iii). Редактированная клетка или редактированная растительная клетка относится к клетке, содержащей по меньшей мере одно изменение в геномной последовательности по сравнению с контрольной клеткой или растительной клеткой, которые не включают такое изменение в геномной последовательности.A modified nucleotide or edited nucleotide refers to a nucleotide sequence of interest that contains at least one change compared to an unmodified nucleotide sequence. Such changes include, for example, (i) substitution of at least one nucleotide, (ii) deletion of at least one nucleotide, (iii) insertion of at least one nucleotide, or (iv) any combination of (i)-(iii). An edited cell or edited plant cell refers to a cell containing at least one change in genomic sequence compared to a control cell or plant cell that does not include such a change in genomic sequence.

Используемый в данном документе термин матрица для модификации полинуклеотида или матрица для модификации относится к полинуклеотиду, который содержит по меньшей мере одну модификацию нуклеотида по сравнению с целевой нуклеотидной последовательностью, подлежащей редактированию. Модификация нуклеотида может представлять собой по меньшей мере одну замену, добавление или делецию нуклеотида. Необязательно матрица для модификации полинуклеотида может дополнительно содержать гомологичные нуклеотидные последовательности, фланкирующие по меньшей мере одну нуклеотидную модификацию, где фланкирующие гомологичные нуклеотидные последовательности обеспечивают достаточную гомологию с желаемой нуклеотидной последовательностью, подлежащей редактированию.As used herein, the term polynucleotide modification template or modification template refers to a polynucleotide that contains at least one nucleotide modification relative to the target nucleotide sequence to be edited. A nucleotide modification may be at least one substitution, addition or deletion of a nucleotide. Optionally, the polynucleotide modification template may further comprise homologous nucleotide sequences flanking at least one nucleotide modification, wherein the flanking homologous nucleotide sequences provide sufficient homology to the desired nucleotide sequence to be edited.

Способ редактирования геномной последовательности, комбинирующий DSB и матрицы для модификации, обычно предусматривает предоставление клетке-хозяин средства, индуцирующего DSB, или нуклеиновой кислоты, кодирующей средство, индуцирующее DSB, которое распознает целевую последовательность в хромосомной последовательности, и где средство, индуцирующее DSB, способно индуцировать DSB в геномной последовательности; и предоставление по меньшей мере одной матрицы для модификации полинуклеотида, содержащей по меньшей мере одно изменение нуклеотида по сравнению с нуклеотидной последовательностью, подлежащей редактированию. Эндонуклеаза может быть предоставлена клетке любым способом, известным из уровня техники, например, без ограничения с помощью способов временного введения, трансфекции, микроинъекции и/или местного применения или опосредованно с помощью конструкций для рекомбинации. Эндонуклеаза может быть предоставлена в виде белка или в виде направляющего полинуклеотидного комплекса непосредственно в клетку или опосредованно через конструкции для рекомбинации. Эндонуклеаза может быть введена в клетку временно или может быть включена в геном клетки-хозяина с применением любого способа, известного из уровня техники. В случае системы CRISPR-Cas поглощение эндонуклеазы и/или направляющего полинуклеотида в клетку может быть облегчено с помощью пептида, проникающего в клетки (СРР), как описано в WO2016073433.A method for editing a genomic sequence combining DSB and modification templates typically provides the host cell with a DSB inducing agent or a nucleic acid encoding a DSB inducing agent that recognizes a target sequence in a chromosomal sequence, and wherein the DSB inducing agent is capable of inducing DSB in genomic sequence; and providing at least one polynucleotide modification template containing at least one nucleotide change compared to the nucleotide sequence to be edited. The endonuclease can be provided to the cell by any method known in the art, for example, without limitation, via transient administration, transfection, microinjection, and/or topical application, or indirectly via recombination constructs. The endonuclease can be provided as a protein or as a targeting polynucleotide complex directly into the cell or indirectly via recombination constructs. The endonuclease may be introduced into the cell transiently or may be incorporated into the genome of the host cell using any method known in the art. In the case of a CRISPR-Cas system, the uptake of an endonuclease and/or targeting polynucleotide into a cell can be facilitated by a cell penetrating peptide (CPP) as described in WO2016073433.

Используемый в данном документе термин геномный участок относится к сегменту хромосомы в геноме клетки. В одном варианте осуществления геномный участок включает сегмент хромосомы в геноме растительной клетки, который присутствует на любой стороне целевого сайта или, в качестве альтернативы, также содержит часть целевого сайта. Геномный участок может содержать по меньшей мере 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5-50, 5-55, 5-60, 5-65, 5-70, 5-75, 5-80, 5-85, 5-90, 5-95, 5-100, 5-200, 5-300, 5-400, 5-500, 5-600, 5-700, 5-800, 5-900, 5-1000, 5-1100, 5-1200, 5-1300, 5-1400, 5-1500, 51600, 5-1700, 5-1800, 5-1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5-2500, 5-2600, 5-2700, 5-2800. 52900, 5-3000, 5-3100 или более оснований, так что геномный участок обладает достаточной гомологией, чтобы подвергаться гомологичной рекомбинации с соответствующим участком гомологии.As used herein, the term genomic region refers to a segment of a chromosome in a cell's genome. In one embodiment, the genomic region includes a segment of a chromosome in the plant cell genome that is present on either side of the target site, or alternatively also contains part of the target site. The genomic region may contain at least 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5-50, 5-55, 5-60 , 5-65, 5-70, 5-75, 5-80, 5-85, 5-90, 5-95, 5-100, 5-200, 5-300, 5-400, 5-500, 5 -600, 5-700, 5-800, 5-900, 5-1000, 5-1100, 5-1200, 5-1300, 5-1400, 5-1500, 51600, 5-1700, 5-1800, 5 -1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5-2500, 5-2600, 5-2700, 5-2800. 52900, 5-3000, 5-3100 or more bases, so that the genomic region has sufficient homology to undergo homologous recombination with the corresponding homology region.

TAL-эффекторные нуклеазы (TALEN) являются классом нуклеаз, специфичных для определенных последовательностей, которые можно применять для получения двухнитевых разрывов в конкретных целевых последовательностях в геноме растения или другого организма. (См. Miller et al. (2011) Nature Biotechnology 29:143-148).TAL effector nucleases (TALENs) are a class of sequence-specific nucleases that can be used to generate double-strand breaks at specific target sequences in the genome of a plant or other organism. (See Miller et al. (2011) Nature Biotechnology 29:143-148).

Эндонуклеазы представляют собой ферменты, которые расщепляют фосфодиэфирную связь в цепи полинуклеотида. Эндонуклеазы включают рестрикционные эндонуклеазы, которые расщепляют ДНК в специфических сайтах без повреждения оснований, и мегануклеазы, также известные как хомингэндонуклеазы (НЕазы), которые, как рестрикционные эндонуклеазы, связывают и разрезают специфические сайты распознавания, однако сайты распознавания для мегануклеаз обычно длиннее, около 18 п.о. или больше (заявка на патент PCT/US12/30061, поданная 22 марта 2012 г.). Мегануклеазы были распределены в четыре семейства на основе консервативных мотивов последовательностей, при этом семейства представляют собой семейства LAGLIDADG, GIY-YIG, H-N-H и His-Cys-бокс. Эти мотивы участвуют в координации ионов металлов и гидролизе фосфодиэфирных связей. НЕазы примечательны своими длинными сайтами распознавания и тем, что допускают некоторые полиморфизмы последовательностей в их ДНК-субстратах. Правила номенклатуры мегануклеаз похожи на правила для других рестрикционных эндонуклеаз. Мегануклеазы также характеризуют по приставке F-, I- или PI- для ферментов, кодируемых соответственно автономными ORF, интронами и интеинами. Одна стадия в процессе рекомбинации включает расщепление полинуклеотида в сайте распознавания или рядом с ним. Эту расщепляющую активность можно использовать для получения двухнитевого разрыва. Обзоры сайт-специфических рекомбиназ и их сайтов рестрикции см. в Sauer (1994) Curr Op Biotechnol 5:521-7 и Sadowski, (1993) FASEB 7:760-7. В некоторых примерах рекомбиназы относятся к семействам интеграз или резольваз.Endonucleases are enzymes that cleave the phosphodiester bond in a polynucleotide chain. Endonucleases include restriction endonucleases, which cleave DNA at specific sites without base damage, and meganucleases, also known as homing endonucleases (HEases), which, like restriction endonucleases, bind and cut specific recognition sites, however recognition sites for meganucleases are usually longer, about 18 bp. .O. or more (patent application PCT/US12/30061, filed March 22, 2012). The meganucleases have been classified into four families based on conserved sequence motifs, with the families being the LAGLIDADG, GIY-YIG, H-N-H, and His-Cys-box families. These motifs are involved in the coordination of metal ions and the hydrolysis of phosphodiester bonds. HEases are notable for their long recognition sites and for allowing some sequence polymorphisms in their DNA substrates. The nomenclature rules for meganucleases are similar to those for other restriction endonucleases. Meganucleases are also characterized by the prefix F-, I-, or PI- for enzymes encoded by autonomous ORFs, introns, and inteins, respectively. One step in the recombination process involves cleaving the polynucleotide at or near the recognition site. This splitting activity can be used to produce a double strand break. For reviews of site-specific recombinases and their restriction sites, see Sauer (1994) Curr Op Biotechnol 5:521-7 and Sadowski, (1993) FASEB 7:760-7. In some examples, recombinases belong to the integrase or resolvas families.

- 8 041676- 8 041676

Нуклеазы с цинковыми пальцами (ZFN) представляют собой сконструированные индуцирующие двухнитевый разрыв средства, содержащие ДНК-связывающий домен с цинковыми пальцами и домен индуцирующего двухнитевый разрыв средства. Специфичность сайта распознавания обеспечивается доменом с цинковыми пальцами, который обычно содержит два, три или четыре цинковых пальца, например, имеющих структуру С2Н2, тем не менее известны и были сконструированы другие структуры с цинковыми пальцами. Домены с цинковыми пальцами являются поддающимися конструированию полипептидами, которые специфично связывают выбранную полинуклеотидную последовательность распознавания. ZFN включают сконструированный ДНК-связывающий домен с цинковыми пальцами, связанный с неспецифичным эндонуклеазным доменом, например нуклеазным доменом от эндонуклеазы II типа, таким как FokI. Дополнительные функциональные средства можно присоединять к связывающему домену с цинковыми пальцами, в том числе домены активаторов транскрипции, домены репрессоров транскрипции и метилазы. В некоторых примерах димеризация нуклеазного домена необходима для расщепляющей активности. Каждый цинковый палец распознает три последовательные пары оснований в целевой ДНК. Например, 3-пальцевый домен распознает последовательность из 9 смежных нуклеотидов; при необходимости димеризации нуклеазы используют два набора триплетов цинковых пальцев для связывания последовательности распознавания из 18 нуклеотидов.Zinc finger nucleases (ZFNs) are engineered double-strand break-inducing agents containing a zinc finger DNA-binding domain and a double-strand gap-inducing agent domain. Recognition site specificity is provided by the zinc finger domain, which typically contains two, three or four zinc fingers, eg having the C2H2 structure, however other zinc finger structures are known and constructed. Zinc finger domains are engineerable polypeptides that specifically bind a selected recognition polynucleotide sequence. The ZFNs comprise an engineered zinc finger DNA binding domain associated with a non-specific endonuclease domain, for example a nuclease domain from a type II endonuclease such as FokI. Additional functionalities can be attached to the zinc finger binding domain, including transcriptional activator domains, transcriptional repressor domains, and methylases. In some examples, dimerization of the nuclease domain is required for cleavage activity. Each zinc finger recognizes three consecutive base pairs in the target DNA. For example, a 3-finger domain recognizes a sequence of 9 contiguous nucleotides; if nuclease dimerization is required, two sets of zinc finger triplets are used to bind the 18 nucleotide recognition sequence.

Редактирование генома с использованием средств, индуцирующих DSB, таких как комплексы Cas9gRNA, описано, например, в заявке на патент США US 2015-0082478 А1, WO2015/026886 A1, WO2016007347 и WO201625131, все из которых включены посредством ссылки в данный документ.Genome editing using DSB-inducing agents such as Cas9gRNA complexes is described, for example, in US Patent Application US 2015-0082478 A1, WO2015/026886 A1, WO2016007347 and WO201625131, all of which are incorporated by reference herein.

Термин ген Cas в данном документе относится к гену, который, как правило, соединен, связан или расположен вблизи или рядом с фланкирующими локусами CRISPR в бактериальных системах. Термины ген Cas, CRISPR-ассоциированный (Cas) ген используются в данном документе взаимозаменяемо. Термин эндонуклеаза Cas в данном документе относится к белку или комплексу белков, кодируемых геном Cas. Раскрытая в данном документе эндонуклеаза Cas, если она находится в комплексе с подходящим полинуклеотидным компонентом, способна распознавать, связываться и необязательно разрезать или расщеплять всю или часть определенной целевой последовательности ДНК. Эндонуклеаза Cas, описанная в данном документе, содержит один или несколько нуклеазных доменов. Эндонуклеазы Cas по настоящему изобретению включают таковые, которые имеют HNH или HNH-подобный нуклеазный домен и/или RuvC или RuvC-подобный нуклеазный домен. Эндонуклеаза Cas по настоящему изобретению может включать белок Cas9, белок Cpf1, белок С2с1, белок С2с2, белок С2с3, Cas3, Cas5, Cas7, Cas8, Cas10 или их комплексы.The term Cas gene, as used herein, refers to a gene that is typically fused, linked, or located near or near flanking CRISPR loci in bacterial systems. The terms Cas gene, CRISPR-associated (Cas) gene are used interchangeably herein. The term Cas endonuclease as used herein refers to a protein or complex of proteins encoded by the Cas gene. The Cas endonuclease disclosed herein, when complexed with a suitable polynucleotide component, is capable of recognizing, binding, and optionally cutting or cleaving all or part of a specified target DNA sequence. The Cas endonuclease described herein contains one or more nuclease domains. The Cas endonucleases of the present invention include those having an HNH or HNH-like nuclease domain and/or a RuvC or RuvC-like nuclease domain. The Cas endonuclease of the present invention may include Cas9 protein, Cpf1 protein, C2c1 protein, C2c2 protein, C2c3 protein, Cas3, Cas5, Cas7, Cas8, Cas10, or complexes thereof.

Используемые в данном документе термины комплекс направляющий полинуклеотид/эндонуклеаза Cas, система направляющий полинуклеотид/эндонуклеаза Cas, комплекс направляющий полинуклеотид/Cas, система направляющий полинуклеотид/Cas, система направленной Cas используются взаимозаменяемо в данном документе и относятся к по меньшей мере одному направляющему полинуклеотиду и к по меньшей мере одной эндонуклеазе Cas, которые способны образовывать комплекс, где указанный комплекс направляющий полинуклеотид/эндонуклеаза Cas может направлять эндонуклеазу Cas в целевой сайт ДНК, обеспечивая распознавание, связывание и необязательно разрезание или расщепление (введение однонитевого или двухнитевого разрыва) целевого сайта ДНК эндонуклеазой Cas. Комплекс направляющий полинуклеотид/эндонуклеаза Cas в данном документе может содержать белок(белки) Cas и подходящий(подходящие) полинуклеотидный(полинуклеотидные) компонент(компоненты) любой из четырех известных систем CRISPR (Horvath and Barrangou, 2010, Science 327: 167-170), таких как система CRISPR типа I, II или III. Эндонуклеаза Cas раскручивает ДНК-дуплекс в месте целевой последовательности и необязательно расщепляет по меньшей мере одну нить ДНК, что опосредуется распознаванием целевой последовательности с помощью полинуклеотида (такого как без ограничения crRNA или направляющая РНК), который находится в комплексе с белком Cas. Такое распознавание и разрезание целевой последовательности эндонуклеазой Cas, как правило, происходит, если на 3'-конце целевой последовательности ДНК или вблизи него расположен правильный прилегающий к протоспейсеру мотив (РАМ). В качестве альтернативы, белок Cas согласно данному документу может не обладать активностью расщепления или внесения однонитевого разрыва ДНК, но может продолжать специфически связываться с целевой последовательностью ДНК, находясь в комплексе с подходящим РНК-компонентом. (См. также заявку на патент США US 2015-0082478 А1 и US 2015-0059010 А1, обе из которых включены в данный документ посредством ссылки во всей своей полноте).As used herein, the targeting polynucleotide/Cas endonuclease complex, targeting polynucleotide/Cas endonuclease system, targeting polynucleotide/Cas complex, targeting polynucleotide/Cas system, targeting Cas system are used interchangeably herein and refer to at least one targeting polynucleotide and to at least one Cas endonuclease that is capable of forming a complex, wherein said guide polynucleotide/Cas endonuclease complex can direct the Cas endonuclease to a target DNA site, allowing recognition, binding, and optionally cutting or cleaving (introducing a single-strand or double-strand break) of the target DNA site by Cas endonuclease . The targeting polynucleotide/Cas endonuclease complex herein may comprise the Cas protein(s) and the suitable polynucleotide(s) component(s) of any of the four known CRISPR systems (Horvath and Barrangou, 2010, Science 327: 167-170), such as a type I, II, or III CRISPR system. Cas endonuclease unwinds a DNA duplex at the site of a target sequence and optionally cleaves at least one strand of DNA, which is mediated by recognition of the target sequence by a polynucleotide (such as, but not limited to, crRNA or guide RNA) that is complexed with a Cas protein. Such recognition and cleavage of the target sequence by the Cas endonuclease generally occurs when the correct protospacer adjacent motif (PAM) is located at or near the 3' end of the target DNA sequence. Alternatively, the Cas protein of this document may not have DNA cleavage or nicking activity, but may continue to specifically bind to the target DNA sequence when complexed with a suitable RNA component. (See also US 2015-0082478 A1 and US 2015-0059010 A1, both of which are incorporated herein by reference in their entirety.)

Комплекс направляющий полинуклеотид/эндонуклеаза Cas может расщеплять одну или обе нити целевой последовательности ДНК. Комплекс направляющий полинуклеотид/эндонуклеаза Cas, который может расщеплять обе нити целевой последовательности ДНК, как правило, содержит белок Cas, у которого все его эндонуклеазные домены находятся в функциональном состоянии (например, представляют собой эндонуклеазные домены дикого типа или их варианты, сохраняющие некоторую степень активности или полную активность каждого эндонуклеазного домена). Таким образом, белок Cas дикого типа (например, белок Cas9, раскрытый в данном документе) или его вариант, сохраняющий некоторую степень активности или полную активность каждого эндонуклеазного домена белка Cas, представляют собой подходящий пример эндонуклеазы Cas, которая может расщеплять обе нити целевой последователь- 9 041676 ности ДНК. Белок Cas9, содержащий функциональные нуклеазные домены RuvC и HNH, представляет собой пример белка Cas, который может расщеплять обе нити целевой последовательности ДНК. Комплекс направляющий полинуклеотид/эндонуклеаза Cas, который может расщеплять одну нить целевой последовательности ДНК, может быть охарактеризован в данном документе как обладающий никазной активностью (например, способностью частичного расщепления). Никаза Cas, как правило, содержит один функциональный эндонуклеазный домен, который позволяет Cas расщепить только одну нить (т.е. сделать однонитевой разрыв) целевой последовательности ДНК. Например, никаза Cas9 может содержать (i) мутантный, дисфункциональный домен RuvC и (ii) функциональный домен HNH (например, домен HNH дикого типа). В качестве другого примера никаза Cas9 может содержать (i) функциональный домен RuvC (например, домен RuvC дикого типа) и (ii) мутантный, дисфункциональный домен HNH. Неограничивающие примеры никаз Cas9, подходящих для применения в данном документе, раскрыты в публикации заявки на патент США № 2014/0189896, которая включена в данный документ посредством ссылки.The guide polynucleotide/Cas endonuclease complex can cleave one or both strands of the target DNA sequence. A guide polynucleotide/Cas endonuclease complex that can cleave both strands of the target DNA sequence typically contains a Cas protein in which all of its endonuclease domains are in a functional state (for example, they are wild-type endonuclease domains or variants thereof that retain some degree of activity or total activity of each endonuclease domain). Thus, a wild-type Cas protein (e.g., the Cas9 protein disclosed herein) or a variant thereof that retains some or all of the activity of each endonuclease domain of a Cas protein is a suitable example of a Cas endonuclease that can cleave both strands of the target sequence. 9 041676 DNA. The Cas9 protein containing the functional nuclease domains of RuvC and HNH is an example of a Cas protein that can cleave both strands of a target DNA sequence. A guide polynucleotide/Cas endonuclease complex that can cleave one strand of a target DNA sequence can be characterized herein as having no case activity (eg, partial cleavage ability). Cas nickase typically contains a single functional endonuclease domain that allows Cas to cleave only one strand (ie, make a single strand break) of the target DNA sequence. For example, a Cas9 nickase may contain (i) a mutant, dysfunctional RuvC domain and (ii) a functional HNH domain (eg, a wild-type HNH domain). As another example, the Cas9 nikase may contain (i) a functional RuvC domain (eg, a wild-type RuvC domain) and (ii) a mutant, dysfunctional HNH domain. Non-limiting examples of Cas9 nicases suitable for use herein are disclosed in US Patent Application Publication No. 2014/0189896, which is incorporated herein by reference.

Можно применять пару никаз Cas9 для повышения специфичности нацеливания на ДНК. В целом, это можно осуществлять путем обеспечения двух никаз Cas9, которые за счет того, что они ассоциированы с РНК-компонентами с различными направляющими последовательностями, нацеливаются и образуют однонитевой разрыв в близлежащих последовательностях ДНК на противоположных нитях в участке требуемого нацеливания. Такое близкорасположенное расщепление каждой нити ДНК образует двухнитевый разрыв (т.е. DSB с однонитевыми выступающими концами), который затем распознается как субстрат для негомологичного соединения концов NHEJ (склонное к незавершенному восстановлению, приводящему к мутациям) или гомологичной рекомбинации HR. В данных вариантах осуществления каждый однонитевой разрыв может располагаться, например, на расстоянии по меньшей мере приблизительно 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, или 100 (или любое целое число от 5 до 100) оснований друг от друга. Один или два белка никазы Cas9 согласно данному документу можно применять в паре никаз Cas9. Например, можно применять никазу Cas9 с мутантным доменом RuvC, но функционирующим доменом HNH (т.е. Cas9 HNH+/RuvC-) (например, Cas9 HNH+/RuvC- из Streptococcus pyogenes). Каждая никаза Cas9 (например, Cas9 HNH+/RuvC-) будет нацелена на специфические сайты ДНК, расположенные близко друг от друга (на расстоянии до 100 пар оснований) с применением подходящих РНКкомпонентов согласно данному документу с направляющими последовательностями РНК, нацеливающими каждую никазу на каждый специфический сайт ДНК.A pair of Cas9 nicases can be used to increase the specificity of DNA targeting. In general, this can be done by providing two Cas9 nikases that, by being associated with RNA components with different guide sequences, target and form a single strand break in adjacent DNA sequences on opposite strands at the desired targeting site. This closely spaced cleavage of each DNA strand produces a double strand break (i.e. DSB with single strand overhangs) which is then recognized as a substrate for NHEJ nonhomologous end joining (prone to incomplete repair leading to mutations) or HR homologous recombination. In these embodiments, each single strand break may be spaced, for example, at least about 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, or 100 (or any integer from 5 to 100) bases apart. One or two Cas9 nickase proteins according to this document can be used in a pair of Cas9 nickases. For example, a Cas9 nickase with a mutant RuvC domain but a functioning HNH domain (ie Cas9 HNH+/RuvC-) (eg Cas9 HNH+/RuvC- from Streptococcus pyogenes) can be used. Each Cas9 nickase (e.g., Cas9 HNH+/RuvC-) will target specific DNA sites located close to each other (up to 100 bp apart) using appropriate RNA components according to this document with RNA guide sequences targeting each nickase to each specific DNA site.

Белок Cas может представлять собой часть слитого белка, содержащего один или несколько гетерологичных белковых доменов (например, 1, 2, 3 или более доменов в дополнение к белку Cas). Такой слитый белок может содержать любую дополнительную белковую последовательность и необязательно линкерную последовательность между любыми двумя доменами, как например, между Cas и первым гетерологичным доменом. Примеры белковых доменов, которые могут быть слиты с белком Cas согласно данному документу, включают без ограничений эпитопные метки (например, гистидин [His], V5, FLAG, гемагглютинин вируса гриппа [НА], myc, VSV-G, тиоредоксин [Trx]), репортеры (например, глутатион-5-трансферазу [GST], пероксидазу хрена [HRP], хлорамфеникол-ацетилтрансферазу [CAT], бетагалактозидазу, бета-глюкуронидазу [GUS], люциферазу, зеленый флуоресцентный белок [GFP], HcRed, DsRed, голубой флуоресцентный белок [CFP], желтый флуоресцентный белок [YFP], синий флуоресцентный белок [BFP]) и домены, обладающие одной или несколькими из следующих активностей: метилазная активность, деметилазная активность, активность активации транскрипции (например, VP16 или VP64), активность подавления транскрипции, активность фактора терминации транскрипции, активность модификации гистонов, активность расщепления РНК и активность связывания нуклеиновых кислот. Белок Cas также может быть слит с белком, который связывает молекулы ДНК или другие молекулы, таким как белок связывания мальтозы (МБР), S-tag, ДНК-связывающий домен (DBD) Lex А, ДНКсвязывающий домен GAL4A и VP16 вируса простого герпеса (HSV). См. заявки на патент согласно РСТ PCT/US16/32073, поданную 12 мая 2016 г., и PCT/US16/32028, поданную 12 мая 2016 г. (обе заявки включены в данный документ посредством ссылки), для получения дополнительных примеров белков Cas.The Cas protein may be part of a fusion protein containing one or more heterologous protein domains (eg, 1, 2, 3 or more domains in addition to the Cas protein). Such a fusion protein may contain any additional protein sequence and optionally a linker sequence between any two domains, such as between Cas and the first heterologous domain. Examples of protein domains that can be fused to the Cas protein according to this document include, without limitation, epitope tags (e.g., histidine [His], V5, FLAG, influenza virus hemagglutinin [HA], myc, VSV-G, thioredoxin [Trx]) , reporters (eg, glutathione 5-transferase [GST], horseradish peroxidase [HRP], chloramphenicol acetyltransferase [CAT], betagalactosidase, beta-glucuronidase [GUS], luciferase, green fluorescent protein [GFP], HcRed, DsRed, cyan fluorescent protein [CFP], yellow fluorescent protein [YFP], blue fluorescent protein [BFP]) and domains having one or more of the following activities: methylase activity, demethylase activity, transcription activation activity (e.g. VP16 or VP64), downregulation activity transcription, transcription termination factor activity, histone modification activity, RNA cleavage activity, and nucleic acid binding activity. The Cas protein can also be fused to a protein that binds DNA molecules or other molecules, such as the maltose binding protein (MBP), S-tag, Lex A DNA binding domain (DBD), GAL4A DNA binding domain, and VP16 herpes simplex virus (HSV). ). See PCT patent applications PCT/US16/32073 filed May 12, 2016 and PCT/US16/32028 filed May 12, 2016 (both applications incorporated herein by reference) for additional examples of Cas proteins. .

В определенных вариантах осуществления комплекс направляющий полинуклеотид/эндонуклеаза Cas может связываться с последовательностью целевого сайта ДНК, но не расщепляет ни одну нить в последовательности целевого сайта. Такой комплекс может содержать белок Cas, в котором все его нуклеазные домены являются мутантными, дисфункциональными. Например, в данном документе белок Cas9, который может связываться с последовательностью целевого сайта ДНК, но не расщепляет ни одну нить в последовательности целевого сайта, может содержать как мутантный, дисфункциональный домен RuvC, так и мутантный, дисфункциональный домен HNH. Белок Cas согласно данному документу, который связывает, но не расщепляет целевую последовательность ДНК, можно применять для модуляции экспрессии гена, например, в этом случае белок Cas можно сливать с фактором транскрипции (или его частью) (например, репрессором или активатором, таким как любой из раскрытых в данном документе). В других аспектах инактивированный белок Cas может быть слит с другим белком, обладающим эндонуклеазной активностью, таким как эндонуклеаза Fok I.In certain embodiments, the guide polynucleotide/Cas endonuclease complex can bind to the DNA target site sequence but does not cleave any strand in the target site sequence. Such a complex may contain the Cas protein, in which all of its nuclease domains are mutant and dysfunctional. For example, as used herein, a Cas9 protein that can bind to a DNA target site sequence but does not cleave any strand in the target site sequence may contain both a mutant, dysfunctional RuvC domain and a mutant, dysfunctional HNH domain. A Cas protein according to this document that binds but does not cleave a target DNA sequence can be used to modulate gene expression, for example, in this case, the Cas protein can be fused to a transcription factor (or part thereof) (for example, a repressor or an activator, such as any disclosed in this document). In other aspects, the inactivated Cas protein may be fused to another protein having endonuclease activity, such as the Fok I endonuclease.

- 10 041676- 10 041676

Ген эндонуклеазы Cas в данном документе может кодировать эндонуклеазу Cas9 типа II, такой как без ограничения гены Cas9, перечисленные в SEQ ID NOs:462, 474, 489, 494, 499, 505, и 518WO2007/025097 и включенные в данный документ посредством ссылки. В другом варианте осуществления ген эндонуклеазы Cas представляет собой микробный или оптимизированный ген эндонуклеазы Cas9. Ген эндонуклеазы Cas может быть функционально связан с сигналом внутриядерного нацеливания SV40 выше от участка кодона Cas и двусоставным сигналом внутриядерной локализации VirD2 (Tinland et al. (1992) Proc. Natl. Acad. Sci. USA 89: 7442-6) ниже участка кодона Cas.The Cas endonuclease gene herein may encode a type II Cas9 endonuclease, such as, without limitation, the Cas9 genes listed in SEQ ID NOs: 462, 474, 489, 494, 499, 505, and 518WO2007/025097 and incorporated herein by reference. In another embodiment, the Cas9 endonuclease gene is a microbial or optimized Cas9 endonuclease gene. The Cas endonuclease gene may be operably linked to an SV40 intranuclear targeting signal upstream of the Cas codon site and a bipartite VirD2 intranuclear localization signal (Tinland et al. (1992) Proc. Natl. Acad. Sci. USA 89:7442-6) downstream of the Cas codon site .

Другие эндонуклеазные системы Cas были описаны в заявках на патент согласно РСТ PCT/US16/32073 и PCT/US16/32028, обе заявки включены в данный документ посредством ссылки.Other Cas endonuclease systems have been described in PCT patent applications PCT/US16/32073 and PCT/US16/32028, both applications are incorporated herein by reference.

Cas9 (ранее называемая как Cas5, Csn1 или Csx12) согласно данному документу относится к эндонуклеазе Cas из системы CRISPR типа II, которая образует комплекс с crNucleotide и tracrNucleotide или с направляющим полинуклеотидом для специфического распознавания и расщепления всей или части целевой последовательности ДНК. Белок Cas9 содержит домен нуклеазы RuvC и домен нуклеазы HNH (H-N-H), каждый из которых может расщеплять одну нить ДНК в целевой последовательности (согласованное действие обоих доменов приводит к двухнитевому расщеплению ДНК, тогда как активность одного домена приводит к однонитевому разрыву). В целом, домен RuvC содержит субдомены I, II и III, при этом домен I расположен возле N-конца Cas9, a субдомены II и III расположены в средней части белка, фланкируя HNH-домен (Hsu et al, Cell 157:1262-1278). Система CRISPR типа II включает систему расщепления ДНК, использующую эндонуклеазу Cas9 в комплексе с по меньшей мере одним полинуклеотидным компонентом. Например, Cas9 может находиться в комплексе с РНК CRISPR (crRNA) и трансактивирующей РНК CRISPR (tracrRNA). В другом примере Cas9 может находиться в комплексе с одиночной направляющей РНК.Cas9 (formerly referred to as Cas5, Csn1 or Csx12) as used herein refers to the Cas endonuclease from the type II CRISPR system, which forms a complex with crNucleotide and tracrNucleotide or with a guide polynucleotide to specifically recognize and cleave all or part of a target DNA sequence. The Cas9 protein contains a RuvC nuclease domain and an HNH (H-N-H) nuclease domain, each of which can cleave one strand of DNA in the target sequence (the coordinated action of both domains results in double-stranded DNA cleavage, while the activity of one domain results in a single-strand break). In general, the RuvC domain contains subdomains I, II, and III, with domain I located near the N-terminus of Cas9, and subdomains II and III located in the middle of the protein, flanking the HNH domain (Hsu et al, Cell 157:1262-1278 ). The type II CRISPR system includes a DNA cleavage system using the Cas9 endonuclease in complex with at least one polynucleotide component. For example, Cas9 can be complexed with CRISPR RNA (crRNA) and CRISPR transactivating RNA (tracrRNA). In another example, Cas9 may be complexed with a single guide RNA.

Белок Cas согласно данному документу, такой как Cas9, может содержать гетерологичную последовательность ядерной локализации (NLS). Гетерологичная аминокислотная последовательность NLS согласно данному документу может характеризоваться достаточной эффективностью, например, чтобы привести к накоплению белка Cas в обнаруживаемом количестве в ядре дрожжевой клетки согласно данному документу. NLS содержит одну (одинарный) или несколько (например, двойной) коротких последовательностей (например, имеющих от 2 до 20 остатков) из основных, положительно заряженных остатков (например, лизина и/или аргинина) и может быть расположен в любом месте аминокислотной последовательности Cas, но так, чтобы он располагался на поверхности белка. NLS может быть функционально связан, например, с N-концом или С-концом белка Cas согласно данному документу. С белком Cas могут быть связаны две или более последовательности NLS, например, такие как на обоих N- и C-концах белка Cas. Неограничивающие примеры подходящих последовательностей NLS включают раскрытые в патенте США № 7309576, который включен в данный документ посредством ссылки.A Cas protein of this document, such as Cas9, may contain a heterologous nuclear localization sequence (NLS). The heterologous amino acid sequence of NLS according to this document may be sufficiently effective, for example, to lead to the accumulation of the Cas protein in a detectable amount in the nucleus of the yeast cell according to this document. NLS contains one (single) or several (e.g. double) short sequences (e.g. having 2 to 20 residues) of basic, positively charged residues (e.g. lysine and/or arginine) and can be located anywhere in the Cas amino acid sequence , but so that it is located on the surface of the protein. The NLS may be operably linked to, for example, the N-terminus or C-terminus of the Cas protein as described herein. Two or more NLS sequences can be associated with a Cas protein, such as, for example, at both the N- and C-terminus of the Cas protein. Non-limiting examples of suitable NLS sequences include those disclosed in US Pat. No. 7,309,576, which is incorporated herein by reference.

Эндонуклеаза Cas может содержать модифицированную форму полипептида Cas9. Модифицированная форма полипептида Cas9 может включать изменение аминокислоты (например, делецию, вставку или замену), которое снижает природную нуклеазную активность белка Cas9. Например, в некоторых случаях модифицированная форма белка Cas9 имеет менее 50, менее 40, менее 30, менее 20, менее 10, менее 5 или менее 1% нуклеазной активности соответствующего полипептида Cas9 дикого типа (заявка на патент США US20140068797 A1). В некоторых случаях модифицированная форма полипептида Cas9 не обладает достаточной нуклеазной активностью и называется каталитически инактивированным Cas9 или дезактивированным cas9 (dCas9). Каталитически инактивированные варианты Cas9 включают варианты Cas9, которые содержат мутации в нуклеазных доменах HNH и RuvC. Такие каталитически инактивированные варианты Cas9 способны взаимодействовать с sgRNA и связываться с целевым сайтом in vivo, но не могут расщеплять ни одну из нитей целевой ДНК.The Cas endonuclease may comprise a modified form of the Cas9 polypeptide. A modified form of a Cas9 polypeptide may include an amino acid change (eg, deletion, insertion, or substitution) that reduces the native nuclease activity of the Cas9 protein. For example, in some instances, a modified form of a Cas9 protein has less than 50%, less than 40%, less than 30%, less than 20%, less than 10%, less than 5%, or less than 1% of the nuclease activity of the corresponding wild-type Cas9 polypeptide (US Patent Application US20140068797 A1). In some cases, the modified form of the Cas9 polypeptide does not have sufficient nuclease activity and is referred to as catalytically inactivated Cas9 or deactivated cas9 (dCas9). Catalytically inactivated Cas9 variants include Cas9 variants that contain mutations in the HNH and RuvC nuclease domains. Such catalytically inactivated Cas9 variants are able to interact with sgRNA and bind to the target site in vivo, but cannot cleave any of the target DNA strands.

Каталитически неактивный Cas9 может быть слит с гетерологичной последовательностью (заявка на патент США US20140068797 А1). Подходящие партнеры по слиянию включают без ограничения полипептид, который обеспечивает активность, которая опосредованно увеличивает транскрипцию, воздействуя непосредственно на целевую ДНК или на полипептид (например, гистон или другой ДНКсвязывающий белок), связанный с целевой ДНК. Дополнительные подходящие партнеры по слиянию включают без ограничения полипептид, который обеспечивает метилтрансферазную активность, деметилазную активность, ацетилтрансферазную активность, деацетилазную активность, киназную активность, фосфатазную активность, убиквитинлигазную активность, активность деубиквитинирования, активность аденилирования, активность деаденилирования, активность сумоилирования, активность десумоилирования, активность рибозилирования, активность дерибозилирования, активность миристоилирования или активность демиристоилирования. Другие подходящие партнеры по слиянию включают без ограничения полипептид, который непосредственно обеспечивает повышенную транскрипцию целевой нуклеиновой кислоты (например, активатор транскрипции или его фрагмент, белок или его фрагмент, который рекрутирует активатора транскрипции, низкомолекулярный/чувствительный к лекарственным средствам регулятор транскрипции и т.д.). Каталитически неактивный Cas9 также может быть слит с нуклеазой FokI для образования двухнитевых разрывов (Guilinger et al. Nature Biotechnology, том 32, номер 6, июнь 2014 г.).Catalytically inactive Cas9 can be fused to a heterologous sequence (US Patent Application US20140068797 A1). Suitable fusion partners include, without limitation, a polypeptide that provides an activity that indirectly increases transcription by acting directly on the target DNA or on a polypeptide (eg, a histone or other DNA-binding protein) associated with the target DNA. Additional suitable fusion partners include, without limitation, a polypeptide that provides methyltransferase activity, demethylase activity, acetyltransferase activity, deacetylase activity, kinase activity, phosphatase activity, ubiquitin ligase activity, deubiquitination activity, adenylation activity, deadenylation activity, sumoylation activity, desumoylation activity, ribosylation activity , deribosylation activity, myristoylation activity, or demyristoylation activity. Other suitable fusion partners include, without limitation, a polypeptide that directly provides for increased transcription of the target nucleic acid (e.g., a transcription activator or fragment thereof, a protein or fragment thereof that recruits a transcription activator, a small molecule/drug sensitive transcription regulator, etc. ). Catalytically inactive Cas9 can also be fused to FokI nuclease to form double strand breaks (Guilinger et al. Nature Biotechnology, Volume 32, Number 6, June 2014).

- 11 041676- 11 041676

Термины функциональный фрагмент, фрагмент, который является функционально эквивалентным и функционально эквивалентный фрагмент эндонуклеазы Cas используются в данном документе взаимозаменяемо и относятся к части или подпоследовательности последовательности эндонуклеазы Cas по настоящему изобретению, в которой сохраняется способность распознавать, связывать и необязательно разрезать или расщеплять (вводить одно- или двухнитевый разрыв) целевой сайт.The terms functional fragment, fragment that is functionally equivalent, and functionally equivalent fragment of a Cas endonuclease are used interchangeably herein and refer to a portion or subsequence of the Cas endonuclease sequence of the present invention that retains the ability to recognize, bind, and optionally cut or cleave (administer a single or double strand break) target site.

Термины функциональный вариант, вариант, который является функционально эквивалентным и функционально эквивалентный вариант эндонуклеазы Cas используются в данном документе взаимозаменяемо и относятся к варианту эндонуклеазы Cas по настоящему изобретению, в котором сохраняется способность распознавать, связывать и необязательно разрезать или расщеплять (вводить одно- или двухнитевый разрыв) целевой сайт. Фрагменты и варианты можно получать с помощью способов, таких как сайт-направленный мутагенез и конструирование синтетических последовательностей.The terms functional variant, variant that is functionally equivalent, and functionally equivalent variant of the Cas endonuclease are used interchangeably herein and refer to a variant of the Cas endonuclease of the present invention that retains the ability to recognize, bind, and optionally cut or cleave (introduce a single or double strand break). ) target site. Fragments and variants can be generated using methods such as site-directed mutagenesis and synthetic sequence engineering.

В способах, раскрытых в данном документе, может применяться любая направляемая эндонуклеаза. Такие эндонуклеазы включают без ограничений эндонуклеазы Cas9 и Cpf1. До настоящего времени было описано много эндонуклеаз, которые могут распознавать специфические последовательности РАМ (см., например, Jinek et al. (2012) Science 337 p 816-821, заявки на патент согласно РСТ PCT/US16/32073 и PCT/US16/32028 и Zetsche В et al. 2015. Cell 163, 1013) и расщеплять целевую ДНК в определенных положениях. Понятно, что на основании способов и вариантов осуществления, описанных в данном документе, в которых используется система направляемой Cas, в данной ситуации можно приспособить эти способы, чтобы в них использовалась любая система направляемой эндонуклеазы.Any targetable endonuclease can be used in the methods disclosed herein. Such endonucleases include, without limitation, the Cas9 and Cpf1 endonucleases. So far, many endonucleases have been described that can recognize specific PAM sequences (see, for example, Jinek et al. (2012) Science 337 p 816-821, PCT patent applications PCT/US16/32073 and PCT/US16/32028 and Zetsche B et al 2015 Cell 163, 1013) and cleave the target DNA at certain positions. It will be understood that based on the methods and embodiments described herein that use a targeted Cas system, these methods can be adapted to use any targeted endonuclease system in a given situation.

Используемый в данном документе термин направляющий полинуклеотид относится к полинуклеотидной последовательности, которая может образовывать комплекс с эндонуклеазой Cas и обеспечивает способность эндонуклеазы Cas распознавать, связываться и необязательно расщеплять целевой сайт ДНК. Направляющий полинуклеотид может представлять собой одиночную молекулу или димерную молекулу. Направляющая полинуклеотидная последовательность может представлять собой последовательность РНК, последовательность ДНК или их комбинацию (комбинированная последовательность ДНК-РНК). Необязательно направляющий полинуклеотид может содержать по меньшей мере один нуклеотид, фосфодиэфирную связь или модификацию связи, такую как без ограничения закрытая нуклеиновая кислота (LNA), 5-метил-dC, 2,6-диаминопурин, 2'-фтор-А, 2'-фтор-U, 2'-О-метил-РНК, тиофосфатную связь, связь с молекулой холестерина, связь с молекулой полиэтиленгликоля, связь с молекулой спейсера 18 (цепь гексаэтиленгликоля) или 5'-3'-ковалентную связь, приводящую к циркуляризации. Направляющий полинуклеотид, который содержит только рибонуклеиновые кислоты, также упоминается как направляющая РНК или gRNA (см. также заявку на патент США US 2015-0082478 А1 и US 20150059010 А1, обе из которых полностью включены в данный документ посредством ссылки).As used herein, the term guide polynucleotide refers to a polynucleotide sequence that can form a complex with a Cas endonuclease and allows the Cas endonuclease to recognize, bind to, and optionally cleave a target DNA site. The targeting polynucleotide can be a single molecule or a dimeric molecule. The targeting polynucleotide sequence may be an RNA sequence, a DNA sequence, or a combination thereof (combined DNA-RNA sequence). Optionally, the targeting polynucleotide may contain at least one nucleotide, a phosphodiester bond, or a bond modification such as, but not limited to, a closed nucleic acid (LNA), 5-methyl-dC, 2,6-diaminopurine, 2'-fluoro-A, 2'- fluoro-U, 2'-O-methyl-RNA, a thiophosphate bond, a bond to a cholesterol molecule, a bond to a polyethylene glycol molecule, a bond to a spacer 18 molecule (hexaethylene glycol chain), or a 5'-3'-covalent bond resulting in circularization. A guide polynucleotide that contains only ribonucleic acids is also referred to as a guide RNA or gRNA (see also US 2015-0082478 A1 and US 20150059010 A1, both of which are incorporated herein by reference in their entirety).

Направляющий полинуклеотид может представлять собой димерную молекулу (также называемую дуплексным направляющим полинуклеотидом), содержащую последовательность crNucleotide и последовательность tracrNucleotide. CrNucleotide включает первый домен нуклеотидной последовательности (называемый вариабельным целевым доменом или доменом VT), который может гибридизоваться с нуклеотидной последовательностью в целевой ДНК, и вторую нуклеотидную последовательность (также называемую парной последовательностью для tracr), которая является частью домена распознавания эндонуклеазы (CER). Парная последовательность для tracr может гибридизоваться с tracrNucleotide вдоль участка комплементарности и вместе образовывать домен распознавания эндонуклеазы Cas или домен CER. Домен CER способен взаимодействовать с полипептидом эндонуклеазы Cas. CrNucleotide и tracrNucleotide дуплексного направляющего полинуклеотида могут представлять собой комбинированные последовательности РНК, ДНК и/или РНК-ДНК. В некоторых вариантах осуществления молекулу crNucleotide дуплексного направляющего полинуклеотида называют crDNA (когда она состоит из непрерывного отрезка из ДНК-нуклеотидов), или crRNA (когда она состоит из непрерывного отрезка из РНК-нуклеотидов), или crDNA-RNA (когда она состоит из комбинации ДНК- и РНК-нуклеотидов). Crнуклеотид может содержать фрагмент cRNA, встречающийся в природе у Bacteria и Archaea. Размер фрагмента cRNA, встречающегося в природе у Bacteria и Archaea, который может присутствовать в crNucleotide, раскрытом в данном документе, может варьировать без ограничения в диапазоне 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 или более нуклеотидов. В некоторых вариантах осуществления tracrNucleotide называют tracrRNA (если она состоит из непрерывного отрезка из РНКнуклеотидов), или tracrDNA (если она состоит из непрерывного отрезка из ДНК-нуклеотидов), или tracrDNA-RNA (если она состоит из комбинации ДНК- и РНК-нуклеотидов). В одном варианте осуществления РНК, которая направляет комплекс РНК/эндонуклеаза Cas9, представляет собой дуплексную РНК, содержащую дуплекс crRNA-tracrRNA. tracrRNA (транс-активирующая РНК CRISPR) содержит в направлении 5'-3' (i) последовательность, которая подвергается отжигу с повторяющимся участком CRRPR типа II crRNA и (ii) часть, содержащую структуру стебель-петля (Deltcheva et al., Nature 471: 602607). Дуплексный направляющий полинуклеотид может образовывать комплекс с эндонуклеазой Cas, где указанный комплекс полинуклеотид/эндонуклеаза Cas (также называемый системой направляющий полинуклеотид/эндонуклеаза Cas) может направлять эндонуклеазу Cas в геномный целевой сайт, обеспечивая распознавание, связывание и необязательно разрезание или расщепление (введение однонитевогоThe targeting polynucleotide may be a dimeric molecule (also referred to as a duplex targeting polynucleotide) containing a crNucleotide sequence and a tracrNucleotide sequence. CrNucleotide comprises a first nucleotide sequence domain (referred to as the variable target domain or VT domain) that can hybridize to a nucleotide sequence in the target DNA and a second nucleotide sequence (also referred to as a paired sequence for tracr) that is part of an endonuclease recognition domain (CER). A paired sequence for tracr can hybridize to tracrNucleotide along the complementarity region and together form a Cas endonuclease recognition domain or a CER domain. The CER domain is capable of interacting with the Cas endonuclease polypeptide. The CrNucleotide and tracrNucleotide of the duplex guide polynucleotide may be combined RNA, DNA and/or RNA-DNA sequences. In some embodiments, the duplex guide polynucleotide crNucleotide molecule is referred to as crDNA (when it consists of a continuous stretch of DNA nucleotides), or crRNA (when it consists of a continuous stretch of RNA nucleotides), or crDNA-RNA (when it consists of a combination of DNA - and RNA nucleotides). The crnucleotide may contain a cRNA fragment naturally occurring in Bacteria and Archaea. The size of the naturally occurring cRNA fragment in Bacteria and Archaea that may be present in the crNucleotide disclosed herein may vary without limitation in the range of 2, 3, 4, 5, 6, 7, 8, 9,10, 11, 12 , 13, 14, 15, 16, 17, 18, 19, 20 or more nucleotides. In some embodiments, tracrNucleotide is called tracrRNA (if it consists of a continuous stretch of RNA nucleotides), or tracrDNA (if it consists of a continuous stretch of DNA nucleotides), or tracrDNA-RNA (if it consists of a combination of DNA and RNA nucleotides) . In one embodiment, the RNA that directs the RNA/Cas9 endonuclease complex is a duplex RNA containing a crRNA-tracrRNA duplex. tracrRNA (trans-activating CRISPR RNA) contains in the 5'-3' direction (i) a sequence that undergoes crRNA type II CRRPR repetitive annealing and (ii) a portion containing a stem-loop structure (Deltcheva et al., Nature 471 : 602607). The duplex guide polynucleotide may form a complex with a Cas endonuclease, where said polynucleotide/Cas endonuclease complex (also referred to as the guide polynucleotide/Cas endonuclease system) may direct the Cas endonuclease to a genomic target site, allowing recognition, binding, and optionally cutting or cleaving (introducing a single stranded

- 12 041676 или двухнитевого разрыва) целевого сайта эндонуклеазой Cas. (См. также заявку на патент США US- 12 041676 or double-strand break) of the target site by Cas endonuclease. (See also US Patent Application

2015-0082478 A1, опубликованную 19 марта 2015 г., и US 2015-0059010 A1, обе из которых включены в данный документ посредством ссылки во всей своей полноте).2015-0082478 A1, published March 19, 2015, and US 2015-0059010 A1, both of which are incorporated herein by reference in their entirety).

Одиночный направляющий полинуклеотид может образовывать комплекс с эндонуклеазой Cas, где указанный комплекс полинуклеотид/эндонуклеаза Cas (также называемый системой направляющий полинуклеотид/эндонуклеаза Cas) может направлять эндонуклеазу Cas в геномный целевой сайт, обеспечивая распознавание, связывание и необязательно разрезание или расщепление (введение однонитевого или двухнитевого разрыва) целевого сайта эндонуклеазой Cas. (См. также заявку на патент США US 2015-0082478 A1 и US 2015-0059010 A1, обе из которых включены в данный документ посредством ссылки во всей своей полноте.)A single target polynucleotide can form a complex with a Cas endonuclease, where said polynucleotide/Cas endonuclease complex (also referred to as the target polynucleotide/Cas endonuclease system) can direct the Cas endonuclease to a genomic target site, allowing for recognition, binding, and optionally cutting or cleaving (introducing single or double stranded gap) of the target site by Cas endonuclease. (See also US Patent Application US 2015-0082478 A1 and US 2015-0059010 A1, both of which are incorporated herein by reference in their entirety.)

Термины вариабельный нацеливающий домен или VT-домен используются в данном документе взаимозаменяемо и включают нуклеотидную последовательность, которая может гибридизоваться (является комплементарной) с одной нитью (нуклеотидной последовательностью) целевого сайта двухнитевой ДНК. Процент комплементарности между первым доменом нуклеотидной последовательность (VTдоменом) и целевой последовательностью может составлять по меньшей мере 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 63, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 или 100%. Вариабельный нацеливающий домен может составлять по меньшей мере 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 или 30 нуклеотидов в длину. В некоторых вариантах осуществления вариабельный нацеливающий домен содержит непрерывный отрезок из 12-30 нуклеотидов. Вариабельный нацеливающий домен может состоять из последовательности ДНК, последовательности РНК, модифицированной последовательности ДНК, модифицированной последовательности РНК или любой их комбинации.The terms variable targeting domain or VT domain are used interchangeably herein and include a nucleotide sequence that can hybridize (is complementary) to one strand (nucleotide sequence) of a double-stranded DNA target site. The percent complementarity between the first domain of the nucleotide sequence (VT domain) and the target sequence can be at least 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 63, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 or 100%. The variable targeting domain may be at least 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 or 30 nucleotides in length. In some embodiments, the implementation of the variable targeting domain contains a continuous stretch of 12-30 nucleotides. The variable targeting domain may be composed of a DNA sequence, an RNA sequence, a modified DNA sequence, a modified RNA sequence, or any combination thereof.

Термины домен распознавания эндонуклеазы Cas или CER-домен (направляющего полинуклеотида) используются в данном документе взаимозаменяемо и включают нуклеотидную последовательность, которая взаимодействует с полипептидом эндонуклеазы Cas. CER-домен содержит парную последовательность для tracrNucleotide, за которой следует последовательность tracrNucleotide. CER-домен может состоять из последовательности ДНК, последовательности РНК, модифицированной последовательности ДНК, модифицированной последовательности РНК (см., например, US 2015-0059010 А1, включенный в данный документ по всей своей полноте посредством ссылки) или любой их комбинации.The terms Cas endonuclease recognition domain or CER (guide polynucleotide) domain are used interchangeably herein and include a nucleotide sequence that interacts with a Cas endonuclease polypeptide. The CER domain contains a paired sequence for tracrNucleotide followed by a tracrNucleotide sequence. A CER domain may consist of a DNA sequence, an RNA sequence, a modified DNA sequence, a modified RNA sequence (see, for example, US 2015-0059010 A1, incorporated herein by reference in its entirety), or any combination thereof.

Термины функциональный фрагмент, фрагмент, который является функционально эквивалентным и функционально эквивалентный фрагмент направляющей РНК, crRNA или tracrRNA используются в данном документе взаимозаменяемо и относятся к части или подпоследовательности направляющей РНК, crRNA или tracrRNA соответственно по настоящему изобретению, при этом способность функционировать как направляющая РНК, crRNA или tracrRNA, соответственно, сохраняется.The terms functional fragment, fragment that is functionally equivalent and functionally equivalent guide RNA fragment, crRNA or tracrRNA are used interchangeably herein and refer to a portion or subsequence of the guide RNA, crRNA or tracrRNA, respectively, of the present invention, wherein the ability to function as a guide RNA, crRNA or tracrRNA, respectively, is preserved.

Термины функциональный вариант, вариант, который является функционально эквивалентным и функционально эквивалентный вариант направляющей РНК, crRNA или tracrRNA используются в данном документе взаимозаменяемо и относятся к варианту направляющей РНК, crRNA или tracrRNA соответственно по настоящему изобретению, при этом способность функционировать как направляющая РНК, crRNA или tracrRNA, соответственно, сохраняется.The terms functional variant, variant that is functionally equivalent, and functionally equivalent guide RNA, crRNA, or tracrRNA variant are used interchangeably herein and refer to a guide RNA, crRNA, or tracrRNA variant, respectively, of the present invention, wherein the ability to function as a guide RNA, crRNA, or tracrRNA is accordingly preserved.

Термины одиночная направляющая РНК и sgRNA используются в данном документе взаимозаменяемо и относятся к синтетическому слиянию двух молекул РНК, crRNA (CRISPR РНК), содержащей вариабельный нацеливающий домен (связанный с парной последовательностью для tracr, которая гибридизуется с tracrRNA), слитый с tracrRNA (транс-активирующая РНК CRISPR). Одиночная направляющий РНК может содержать crRNA или фрагмент crRNA и tracrRNA или фрагмент tracrRNA системы CRISPR/Cas II типа, которые могут образовать комплекс с эндонуклеазой Cas II типа, где указанный комплекс направляющая РНК/эндонуклеаза Cas может направлять эндонуклеазу Cas к целевому сайту ДНК, обеспечивая распознавание, связывание и необязательно разрезание или расщепление (введение однонитевого или двухнитевого разрыва) целевого сайта ДНК эндонуклеазой Cas.The terms single guide RNA and sgRNA are used interchangeably herein and refer to the synthetic fusion of two RNA molecules, crRNA (CRISPR RNA), containing a variable targeting domain (linked to a pairing sequence for tracr that hybridizes to tracrRNA), fused to tracrRNA (trans- CRISPR activating RNA). A single guide RNA may contain a crRNA or a fragment of a crRNA and a tracrRNA or a fragment of a tracrRNA of the CRISPR/Cas type II system that can form a complex with a type II Cas endonuclease, where said guide RNA/Cas endonuclease complex can guide the Cas endonuclease to a target DNA site, allowing recognition , binding and optionally cutting or cleaving (introducing a single-strand or double-strand break) of the target DNA site with Cas endonuclease.

Термины комплекс направляющая РНК/эндонуклеаза Cas, система направляющая РНК/эндонуклеаза Cas, комплекс направляющая PHK/Cas, система gRNA/Cas, РНК-направленная эндонуклеаза используются взаимозаменяемо в данном документе и относятся по меньшей мере к одному РНК-компоненту, и по меньшей мере к одной эндонуклеазе Cas, которые способны образовывать комплекс, где указанный комплекс направляющая РНК/эндонуклеаза Cas может направлять эндонуклеазу Cas в целевой сайт ДНК, обеспечивая распознавание, связывание и необязательно разрезание или расщепление (введение однонитевого или двухнитевого разрыва) целевого сайта ДНК эндонуклеазой Cas. Комплекс направляющая РНК/эндонуклеаза Cas в данном документе может содержать белок(белки) Cas и подходящий(подходящие) РНК-компонент (компоненты) любой из четырех известных систем CRISPR (Horvath and Barrangou, 2010, Science 327: 167-170), таких как система CRISPR типа I, II или III. Комплекс направляющая РНК/эндонуклеаза Cas может содержать эндонуклеазу Cas9 типа II и по меньшей мере один РНК-компонент (например, crRNA и tracrRNA или gRNA). (См. также заявку на патент США US 2015-0082478 А1 и US 2015-0059010 А1, обе из которых включены в данный документ посредством ссылки во всей своей полноте).The terms guide RNA/Cas endonuclease complex, guide RNA/Cas endonuclease system, guide RNA/Cas complex, gRNA/Cas system, RNA-directed endonuclease are used interchangeably herein and refer to at least one RNA component, and at least to one Cas endonuclease that are capable of forming a complex, wherein said guide RNA/Cas endonuclease complex can direct the Cas endonuclease to a DNA target site, allowing the Cas endonuclease to recognize, bind, and optionally cut or cleave (introduce a single or double strand break) the target DNA site. The Cas guide RNA/endonuclease complex herein may comprise Cas protein(s) and suitable RNA component(s) of any of the four known CRISPR systems (Horvath and Barrangou, 2010, Science 327: 167-170), such as type I, II, or III CRISPR system. The guide RNA/Cas endonuclease complex may comprise a Cas9 type II endonuclease and at least one RNA component (eg crRNA and tracrRNA or gRNA). (See also US 2015-0082478 A1 and US 2015-0059010 A1, both of which are incorporated herein by reference in their entirety.)

- 13 041676- 13 041676

Направляющий полинуклеотид может быть временно введен в клетку в виде однонитевого полинуклеотида или двухнитевого полинуклеотида с применением любого способа, известного из уровня техники, такого как без ограничения бомбардировка частицами, трансформация Agrobacterium или местные применения. Направляющий полинуклеотид также может быть введен опосредованно в клетку путем введения рекомбинантной молекулы ДНК (с помощью таких способов, как без ограничения бомбардировка частицами или трансформация Agrobacterium), содержащей фрагмент гетерологичной нуклеиновой кислоты, кодирующей направляющий полинуклеотид, функционально связанный со специфическим промотором, который способен транскрибировать направляющую РНК в указанной клетке. Специфический промотор может представлять собой без ограничения промотор РНК-полимеразы III, который обеспечивает транскрипцию РНК с точно определенными немодифицированными 5'- и 3'-концами (DiCarlo et al., Nucleic Acids Res. 41: 4336-4343; Ma et al., Mol. Ther. Nucleic Acids 3:e161), как описано в WO2016025131, включенном в данный документ посредством ссылки во всей своей полноте.The targeting polynucleotide can be temporarily introduced into the cell as a single-stranded polynucleotide or a double-stranded polynucleotide using any method known in the art, such as, but not limited to, particle bombardment, Agrobacterium transformation, or topical applications. A targeting polynucleotide can also be introduced indirectly into a cell by introducing a recombinant DNA molecule (using methods such as, but not limited to, particle bombardment or Agrobacterium transformation) containing a heterologous nucleic acid fragment encoding a targeting polynucleotide operably linked to a specific promoter that is capable of transcribing the targeting polynucleotide. RNA in the specified cell. The specific promoter may be, but is not limited to, an RNA polymerase III promoter that provides transcription of RNA with well-defined, unmodified 5' and 3' ends (DiCarlo et al., Nucleic Acids Res. 41: 4336-4343; Ma et al., Mol. Ther. Nucleic Acids 3:e161) as described in WO2016025131, incorporated herein by reference in its entirety.

Термины целевой сайт, целевая последовательность, последовательность целевого сайта, целевая ДНК, целевой локус, геномный целевой сайт, геномная целевая последовательность, геномный целевой локус и протоспейсер используются в данном документе взаимозаменяемо и относятся к полинуклеотидной последовательности, в том числе без ограничения нуклеотидной последовательности в хромосоме, эписоме или любой другой молекуле ДНК в геноме (включая хромосомную, хлоропластическую, митохондриальную ДНК, плазмидную ДНК) клетки, в которой комплекс направляющий полинуклеотид/эндонуклеаза Cas может распознавать, связывать и необязательно разрезать или расщеплять. Целевой сайт может быть эндогенным сайтом в геноме клетки, или, в качестве альтернативы, целевой сайт может быть гетерологичным по отношению к клетке и, таким образом, не встречаться в природе в геноме клетки, или целевой сайт может находиться в гетерологичном местоположении в геноме по сравнению с тем, в котором он встречается в природе. Используемые в данном документе термины эндогенная целевая последовательность и нативная целевая последовательность используются в данном документе взаимозаменяемо для обозначения целевой последовательности, которая является эндогенной или нативной для генома клетки. Клетки включают без ограничения клетки человека, клетки, отличные от человеческих, клетки животных, бактерий, грибов, насекомых, дрожжей, нетрадиционных видов дрожжей и растительные клетки, а также растения и семена, полученные с помощью способов, описанных в данном документе. Термины искусственный целевой сайт или искусственная целевая последовательность применяются в данном документе взаимозаменяемо и относятся к целевой последовательности, которая была введена в геном клетки. Такая искусственная целевая последовательность может быть идентичной по последовательности по отношению к эндогенной или нативной целевой последовательности в геноме клетки, но локализована в другом положении (т.е. неэндогенном или ненативном положении) в геноме клетки.The terms target site, target sequence, target site sequence, target DNA, target locus, genomic target site, genomic target sequence, genomic target locus, and protospacer are used interchangeably herein and refer to a polynucleotide sequence, including but not limited to a nucleotide sequence in a chromosome , episome or any other DNA molecule in the genome (including chromosomal, chloroplastic, mitochondrial DNA, plasmid DNA) of a cell in which the guide polynucleotide/Cas endonuclease complex can recognize, bind and optionally cut or cleave. The target site may be an endogenous site in the cell's genome, or alternatively, the target site may be heterologous to the cell and thus not naturally occurring in the cell's genome, or the target site may be at a heterologous location in the genome compared to with the one in which it occurs in nature. As used herein, the terms endogenous target sequence and native target sequence are used interchangeably herein to refer to a target sequence that is endogenous or native to the genome of a cell. Cells include, without limitation, human cells, non-human cells, animal cells, bacteria, fungi, insects, yeast, non-traditional yeasts, and plant cells, as well as plants and seeds obtained using the methods described herein. The terms artificial target site or artificial target sequence are used interchangeably herein and refer to a target sequence that has been introduced into the genome of a cell. Such an artificial target sequence may be identical in sequence to an endogenous or native target sequence in the cell's genome, but located at a different position (ie, non-endogenous or non-native position) in the cell's genome.

Термины измененный целевой сайт, измененная целевая последовательность, модифицированный целевой сайт, модифицированная целевая последовательность применяются в данном документе взаимозаменяемо и относятся к целевой последовательности, раскрываемой в данном документе, которая содержит по меньшей мере одно изменение по сравнению с неизмененной целевой последовательностью. Такие изменения предусматривают, например, (i) замещение по меньшей мере одного нуклеотида, (ii) делецию по меньшей мере одного нуклеотида, (iii) вставку по меньшей мере одного нуклеотида или (iv) любую комбинацию из (i)-(iii).The terms altered target site, altered target sequence, modified target site, modified target sequence are used interchangeably herein and refer to a target sequence disclosed herein that contains at least one change compared to an unchanged target sequence. Such changes include, for example, (i) substitution of at least one nucleotide, (ii) deletion of at least one nucleotide, (iii) insertion of at least one nucleotide, or (iv) any combination of (i)-(iii).

Длина последовательности целевой ДНК (целевого сайта) может варьироваться и включает, например, целевые сайты, длина которых составляет по меньшей мере 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или более нуклеотидов. Кроме того, возможно, что целевой сайт может быть палиндромным, то есть последовательность одной нити читается точно так же в обратном направлении на комплементарной нити. Сайт однонитевого разрыва/расщепления может находиться в пределах целевой последовательности, или сайт однонитевого разрыва/расщепления может находиться за пределами целевой последовательности. В другом варианте расщепление может происходить в положениях нуклеотидов непосредственно напротив друг друга с получением разреза с тупыми концами, или, в других случаях, разрезы могут быть несимметрично расположенными с получением однонитевых выступающих концов, также называемых липкими концами, которые могут быть 5'-липкими концами или 3'-липкими концами. Также можно использовать активные варианты геномных целевых сайтов. Такие активные варианты могут содержать последовательность, идентичную на по меньшей мере 65, 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99% или больше данному целевому сайту, при этом активные варианты сохраняют биологическую активность и, следовательно, способны распознаваться и расщепляться эндонуклеазой Cas. Анализы для измерения однонитевого или двухнитевого разрыва целевого сайта эндонуклеазой известны из уровня техники и обычно измеряют общую активность и специфичность средства на ДНК-субстратах, содержащих сайты распознавания.The length of the target DNA sequence (target site) can vary and includes, for example, target sites that are at least 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 or more nucleotides. It is also possible that the target site may be palindromic, meaning that the sequence of one strand reads exactly the same backwards on the complementary strand. The nick/cleavage site may be within the target sequence, or the nick/cleavage site may be outside the target sequence. In another embodiment, cleavage may occur at nucleotide positions directly opposite each other to produce a blunt-ended cut, or, in other cases, the cuts may be asymmetrically spaced to produce single-stranded overhangs, also called cohesive ends, which may be 5' cohesive ends. or 3' sticky ends. You can also use active variants of genomic target sites. Such active variants may contain at least 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or greater sequence identity to the target site, wherein active variants retain biological activity and are therefore able to be recognized and cleaved by Cas endonuclease. Assays for measuring single-strand or double-strand break of an endonuclease target site are known in the art and generally measure the overall activity and specificity of an agent on DNA substrates containing recognition sites.

Прилегающий к протоспейсеру мотив (РАМ) в данном документе относится к короткой нуклеотидной последовательности, прилегающей к целевой последовательности (протоспейсеру), которая распознается (нацеливается) системой направляющий полинуклеотид/эндонуклеаза Cas, описанной в данном документе. Эндонуклеаза Cas может не распознавать успешно последовательность целевой ДНК, если за последовательностью целевой ДНК не следует последовательность РАМ.A protospacer adjacent motif (PAM) as used herein refers to a short nucleotide sequence adjacent to a target sequence (protospacer) that is recognized (targeted) by the Cas guide polynucleotide/endonuclease system described herein. Cas endonuclease may not successfully recognize the target DNA sequence if the target DNA sequence is not followed by a PAM sequence.

- 14 041676- 14 041676

Последовательность и длина РАМ согласно данному документу могут отличаться в зависимости от применяемого белка Cas или комплекса белка Cas. Последовательность РАМ может быть любой длины, но обычно составляет 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 или 20 нуклеотидов в длину.The sequence and length of the PAM according to this document may differ depending on the Cas protein or Cas protein complex used. The PAM sequence can be any length, but is usually 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 or 20 nucleotides in length.

Термины нацеливание, нацеливание на гены и нацеливание на ДНК используются в данном документе взаимозаменяемо. Нацеливание на ДНК согласно данному документу может представлять собой специфическое введение нокаута, редактирования или нокина в определенную последовательность ДНК, расположенную в хромосоме или плазмиде клетки. В целом, нацеливание на ДНК согласно данному документу может осуществляться путем расщепления одной или обеих нитей в специфической последовательности ДНК в клетке с помощью эндонуклеазы, ассоциированной с подходящим полинуклеотидным компонентом. Такое расщепление ДНК, в случае двухнитевого разрыва (DSB), может стимулировать процессы NHEJ или HDR, которые могут приводить к модификациям в целевом сайте.The terms targeting, gene targeting, and DNA targeting are used interchangeably herein. DNA targeting according to this document may be the specific introduction of a knockout, edit, or knockin to a specific DNA sequence located on a chromosome or plasmid of a cell. In general, DNA targeting according to this document can be accomplished by cleaving one or both strands in a specific DNA sequence in a cell with an endonuclease associated with a suitable polynucleotide component. Such DNA cleavage, in the case of a double strand break (DSB), can stimulate NHEJ or HDR processes, which can lead to modifications at the target site.

Способ нацеливания согласно данному документу можно осуществлять таким образом, что в способе подвергаются нацеливанию, например, два или более целевых сайтов ДНК. Такой способ необязательно может быть охарактеризован как мультиплексный способ. В определенных вариантах осуществления нацеливанию в одно и то же время могут подвергаться два, три, четыре, пять, шесть, семь, восемь, девять, десять или более целевых сайтов. Мультиплексный способ, как правило, выполняют с помощью способа нацеливания согласно данному документу, в котором обеспечено множество различных РНКкомпонентов, при этом каждый сконструирован для направления комплекса направляющий полинуклеотид/эндонуклеаза Cas на уникальный целевой сайт ДНК.The method of targeting according to this document can be carried out in such a way that, for example, two or more DNA target sites are targeted in the method. Such a method can optionally be characterized as a multiplex method. In certain embodiments, two, three, four, five, six, seven, eight, nine, ten or more target sites may be targeted at the same time. The multiplex method is typically performed using the targeting method of this document, in which a plurality of different RNA components are provided, each designed to direct the targeting polynucleotide/Cas endonuclease complex to a unique DNA target site.

Термины нокаут, нокаут гена и генный нокаут используются в данном документе взаимозаменяемо. Нокауту согласно данному документу соответствует последовательность ДНК в клетке, которая стала частично или полностью неработоспособной из-за нацеливания белка Cas; причем такая последовательность ДНК до нокаута, например, могла кодировать аминокислотную последовательность или могла обладать регуляторной функцией (например, промоторной). Нокаут может быть произведен путем вставки/делеции (вставки или делеции нуклеотидных оснований в последовательности целевой ДНК за счет NHEJ) или путем специфического удаления последовательности, которая уменьшает или полностью разрушает функцию последовательности в или вблизи целевого сайта.The terms knockout, gene knockout and gene knockout are used interchangeably herein. A knockout according to this document corresponds to a DNA sequence in a cell that has become partially or completely inoperable due to the targeting of the Cas protein; moreover, such a DNA sequence before knockout, for example, could encode an amino acid sequence or could have a regulatory function (for example, a promoter). Knockout can be done by insertion/deletion (insertion or deletion of nucleotide bases in the target DNA sequence by NHEJ) or by specific deletion of a sequence that reduces or completely destroys the function of the sequence at or near the target site.

Система направляющий полинуклеотид/эндонуклеаза Cas может использоваться в комбинации с совместно доставляемой матрицей для модификации полинуклеотида, чтобы обеспечить редактирование (модификацию) геномной нуклеотидной последовательности, представляющей интерес. (См. также заявку на патент США US 2015-0082478 А1 и W02015/026886 А1, обе из которых включены в данный документ посредством ссылки во всей своей полноте).The targeting polynucleotide/Cas endonuclease system can be used in combination with a co-delivered polynucleotide modification template to allow editing (modification) of the genomic nucleotide sequence of interest. (See also US Patent Application US 2015-0082478 A1 and W02015/026886 A1, both of which are incorporated herein by reference in their entirety.)

Термины нокин, нокин гена, генная вставка и генный нокин используются в данном документе взаимозаменяемо. Нокину соответствует замещение или вставка последовательности ДНК в специфическую последовательность ДНК в клетке путем нацеливания с помощью белка Cas (путем HR, где также применяется подходящий донорный полинуклеотид ДНК). Примеры нокинов включают без ограничения специфическую вставку гетерологичной последовательности, кодирующей аминокислоту, в кодирующий участок гена или специфическую вставку элемента регуляции транскрипции в локус гена.The terms knockin, gene knockin, gene insert, and gene knockin are used interchangeably herein. Knockin corresponds to the substitution or insertion of a DNA sequence into a specific DNA sequence in a cell by targeting with the Cas protein (by HR, where a suitable donor DNA polynucleotide is also used). Examples of knockins include, without limitation, specific insertion of a heterologous amino acid coding sequence into a coding region of a gene, or specific insertion of a transcriptional regulatory element into a gene locus.

Различные способы и композиции можно использовать для получения клетки или организма, имеющих полинуклеотид, представляющий интерес, вставленный в целевой сайт для эндонуклеазы Cas. В таких способах можно использовать гомологичную рекомбинацию для обеспечения интеграции полинуклеотида, представляющего интерес, в целевой сайт. В одном из предложенных способов полинуклеотид, представляющий интерес, предоставляется клетке организма в донорной ДНК-конструкции. Используемый в данном документе термин донорная ДНК представляет собой ДНК-конструкцию, которая содержит полинуклеотид, представляющий интерес, подлежащий вставке в целевой сайт эндонуклеазы Cas. Донорная ДНК-конструкция может дополнительно содержать первый и второй участки гомологии, которые фланкируют полинуклеотид, представляющий интерес. Первый и второй участки гомологии донорной ДНК обладают гомологией по отношению к первому и второму участкам генома, соответственно, присутствующим в целевом сайте клетки или организма или фланкирующим его. Под гомологией подразумеваются последовательности ДНК, которые являются подобными. Например, участок гомологии по отношению к участку генома, который находится в донорной ДНК, представляет собой участок ДНК, который имеет последовательность, подобную данному участку генома в клетке или геноме организма. Участок гомологии может иметь любую длину, которая достаточна для обеспечения гомологичной рекомбинации в расщепленном целевом сайте. Например, участок гомологии может содержать по меньшей мере 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5- 50, 5-55, 5-60, 5-65, 5-70, 5-75, 580, 5-85, 5-90, 5-95, 5-100, 5-200, 5-300, 5-400, 5-500, 5-600, 5-700, 5-800, 5-900, 5-1000, 5-1100, 5-1200, 51300, 5-1400, 5-1500, 5-1600, 5-1700, 5-1800, 5-1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5-2500, 52600, 5-2700, 5-2800, 5-2900, 5-3000, 5-3100 или более оснований в длину, так что участок гомологии обладает достаточной гомологией, чтобы подвергаться гомологичной рекомбинации с соответствующим участком генома. Достаточная гомология указывает на то, что две последовательности полинуклеотидов имеют достаточное структурное сходство, чтобы выступать в качестве субстратов для реакции гомо- 15 041676 логичной рекомбинации. Структурное сходство включает общую длину каждого фрагмента полинуклеотида, а также сходство последовательности полинуклеотидов. Сходство последовательностей может быть описано с помощью процентной идентичности последовательностей по всей длине последовательностей, и/или с помощью консервативных участков, содержащих локализованные сходства, такие как смежные нуклеотиды, характеризующиеся 100% идентичностью последовательностей, и процентной идентичностью последовательностей в части длины последовательностей.Various methods and compositions can be used to obtain a cell or organism having a polynucleotide of interest inserted into the target site for the Cas endonuclease. In such methods, homologous recombination can be used to ensure integration of the polynucleotide of interest into the target site. In one proposed method, a polynucleotide of interest is provided to an organism cell in a donor DNA construct. As used herein, the term donor DNA is a DNA construct that contains a polynucleotide of interest to be inserted into the target site of the Cas endonuclease. The donor DNA construct may further comprise first and second homology regions that flank the polynucleotide of interest. The first and second regions of donor DNA homology have homology with respect to the first and second regions of the genome, respectively, present in the target site of the cell or organism or flanking it. By homology is meant DNA sequences that are similar. For example, a region of homology to a region of the genome that is in the donor DNA is a region of DNA that has a similar sequence to that region of the genome in a cell or genome of an organism. The homology region may be of any length that is sufficient to allow homologous recombination at the cleaved target site. For example, a region of homology may contain at least 5-10, 5-15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5-50, 5-55, 5 -60, 5-65, 5-70, 5-75, 580, 5-85, 5-90, 5-95, 5-100, 5-200, 5-300, 5-400, 5-500, 5 -600, 5-700, 5-800, 5-900, 5-1000, 5-1100, 5-1200, 51300, 5-1400, 5-1500, 5-1600, 5-1700, 5-1800, 5 -1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5-2500, 52600, 5-2700, 5-2800, 5-2900, 5-3000, 5-3100 or more bases in length, so that the region of homology has sufficient homology to undergo homologous recombination with the corresponding region of the genome. Sufficient homology indicates that two polynucleotide sequences have sufficient structural similarity to act as substrates for a homologous recombination reaction. Structural similarity includes the overall length of each polynucleotide fragment as well as the sequence similarity of the polynucleotides. Sequence similarity can be described by percent sequence identity over the entire length of the sequences, and/or by conserved regions containing localized similarities, such as contiguous nucleotides having 100% sequence identity and percent sequence identity over the length of the sequences.

Процентная (%) идентичность последовательности относительно контрольной последовательности (рассматриваемой) определяется как процентная доля аминокислотных остатков или нуклеотидов в кандидатной последовательности (запрашиваемой), которые идентичны соответствующим аминокислотным остаткам или нуклеотидам в контрольной последовательности после выравнивания последовательностей и внесения гэпов, при необходимости, для достижения максимальной процентной идентичности последовательности и без учета каких-либо аминокислотных консервативных замен как части идентичности последовательности. Выравнивание в целях определения процентной идентичности последовательности может быть достигнуто различными способами, которые известны специалисту в данной области техники, например с использованием общедоступного компьютерного программного обеспечения, такого как BLAST, BLAST-2. Специалисты в данной области техники могут определить подходящие параметры для выравнивания последовательностей, в том числе любые алгоритмы, необходимые для достижения максимального выравнивания по всей длине сравниваемых последовательностей. Для определения процентной идентичности двух аминокислотных последовательностей или двух последовательностей нуклеиновой кислоты осуществляют выравнивание последовательностей для целей оптимального сравнения. Процентная идентичность двух последовательностей является функцией количества идентичных положений, имеющихся в обеих последовательностях (например, процентная идентичность запрашиваемой последовательности=количество идентичных положений между запрашиваемой последовательностью и рассматриваемой последовательностью/общее количество положений в запрашиваемой последовательности (например, перекрывающиеся положения)х100).Percent (%) sequence identity relative to the control sequence (considered) is defined as the percentage of amino acid residues or nucleotides in the candidate sequence (requested) that are identical to the corresponding amino acid residues or nucleotides in the control sequence after aligning the sequences and introducing gaps, if necessary, to achieve maximum percent sequence identity and without considering any amino acid conservative substitutions as part of the sequence identity. Alignment for purposes of determining percent sequence identity can be achieved in a variety of ways that are known to one of skill in the art, for example using publicly available computer software such as BLAST, BLAST-2. Suitable parameters for sequence alignment can be determined by those skilled in the art, including any algorithms necessary to achieve maximum alignment over the entire length of the compared sequences. To determine the percent identity of two amino acid sequences or two nucleic acid sequences, the sequences are aligned for purposes of optimal comparison. The percent identity of two sequences is a function of the number of identical positions present in both sequences (e.g., percent identity of the requested sequence=number of identical positions between the requested sequence and the sequence in question/total number of positions in the requested sequence (e.g., overlapping positions)x100).

Величина гомологии или идентичности последовательностей, разделенной целевым и донорным полинуклеотидом, может варьировать и включает общие длины и/или участки, характеризующиеся целыми единицами измерения в диапазонах приблизительно 1-20 п.о., 20-50 п.о., 50-100 п.о., 75-150 п.о., 100-250 п.о., 150-300 п.о., 200-400 п.о., 250-500 п.о., 300-600 п.о., 350-750 п.о., 400-800 п.о., 450-900 п.о., 500-1000 п.о., 600-1250 п.о., 700-1500 п.о., 800-1750 п.о., 900-2000 п.о., 1-2,5 т.о., 1,5-3 т.о., 2-4 т.о., 2,5-5 т.о., 3-6 т.о., 3,5-7 т.о., 4-8 т.о., 5-10 т.о., или до и включая общую длину целевого сайта. Такие диапазоны включают каждое целое число в пределах диапазона, например диапазон 1-20 п.о. включает 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 и 20 п.о. Величина гомологии также может быть описана процентной идентичностью последовательности по всей выровненной длине двух полинуклеотидов, которая включает процентную идентичность последовательности, составляющую по меньшей мере приблизительно 50, 55, 60, 65, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 или 100%. Достаточная гомология включает любую комбинацию длины полинуклеотида, общий процент идентичности последовательности, и необязательно консервативных участков смежных нуклеотидов или локальный процент идентичности последовательности, например достаточную гомологию можно описать как область из 75-150 п.о., имеющую по крайней мере 80% идентичность последовательности с участком целевого локуса. Достаточная гомология может также быть описана с помощью предсказанной способности двух полинуклеотидов к специфической гибридизации в условиях высокой жесткости, см., например, Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols (Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.); и Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes (Elsevier, New York).The amount of homology or sequence identity separated by the target and donor polynucleotide can vary and includes total lengths and/or regions characterized by integer units in the ranges of approximately 1-20 bp, 20-50 bp, 50-100 bp .o., 75-150 bp, 100-250 bp, 150-300 bp, 200-400 bp, 250-500 bp, 300-600 bp ., 350-750 bp, 400-800 bp, 450-900 bp, 500-1000 bp, 600-1250 bp, 700-1500 bp, 800-1750 bp, 900-2000 bp, 1-2.5 t.b., 1.5-3 t.b., 2-4 t.b., 2.5-5 t .o., 3-6 kb, 3.5-7 kb, 4-8 kb, 5-10 kb, or up to and including the total length of the target site. Such ranges include every integer within the range, such as the range of 1-20 bp. includes 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 and 20 p.o. The amount of homology can also be described by percent sequence identity over the entire aligned length of two polynucleotides, which includes percent sequence identity of at least about 50, 55, 60, 65, 70, 71, 72, 73, 74, 75, 76, 77 , 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 or 100%. Sufficient homology includes any combination of polynucleotide length, overall percent sequence identity, and optionally conserved regions of contiguous nucleotides or local percent sequence identity, e.g. sufficient homology can be described as a region of 75-150 bp having at least 80% sequence identity with region of the target locus. Sufficient homology can also be described by the predicted ability of two polynucleotides to specifically hybridize under high stringency conditions, see, for example, Sambrook et al., (1989) Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, NY); Current Protocols in Molecular Biology, Ausubel et al., Eds (1994) Current Protocols (Greene Publishing Associates, Inc. and John Wiley & Sons, Inc.); and Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes (Elsevier, New York).

Структурное подобие между данным участком генома и соответствующим участком гомологии, находящимся в донорной ДНК, может представлять любую степень идентичности последовательностей, которая обеспечивает возникновение гомологичной рекомбинации. Например, величина гомологии или идентичности последовательности, разделяемая участком гомологии донорной ДНК и геномным участком генома организма, может представлять собой по меньшей мере 50, 55, 60, 65, 70, 75, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 или 100% идентичности последовательности, так что последовательности подвергаются гомологичной рекомбинацииStructural similarity between a given region of the genome and the corresponding region of homology found in the donor DNA may represent any degree of sequence identity that allows homologous recombination to occur. For example, the amount of homology or sequence identity shared by the homology region of the donor DNA and the genomic region of the organism's genome may be at least 50, 55, 60, 65, 70, 75, 80, 81, 82, 83, 84, 85, 86 , 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, or 100% sequence identity such that sequences undergo homologous recombination

Участок гомологии в донорной ДНК может обладать гомологией с любой последовательностью, фланкирующей целевой сайт. Тогда как в некоторых вариантах осуществления участки гомологии обладают значительной гомологией последовательности по отношению к геномной последовательности, непосредственно фланкирующей целевой сайт, при этом следует учитывать, что участки гомологии могут быть разработаны с обеспечением достаточной гомологии по отношению к участкам, которые, кроме того, могут быть расположены 5'- или 3'- по отношению к целевому сайту. В еще других вариантах осуществления участки гомологии также могут обладать гомологией с фрагментом целевого сайта вместе с нижележащими участками генома. В одном варианте осуществления первый участок гомологии допол- 16 041676 нительно содержит первый фрагмент целевого сайта, а второй участок гомологии содержит второй фрагмент целевого сайта, где первый и второй фрагменты отличаются.A region of homology in the donor DNA may share homology with any sequence flanking the target site. Whereas, in some embodiments, regions of homology have significant sequence homology to the genomic sequence immediately flanking the target site, it should be appreciated that regions of homology can be designed to provide sufficient homology to regions that, in addition, may be located 5'- or 3'- relative to the target site. In still other embodiments, regions of homology may also share homology with a fragment of the target site along with downstream regions of the genome. In one embodiment, the first homology region further comprises a first target site fragment, and the second homology region comprises a second target site fragment, where the first and second fragments are different.

Термин гомологичная рекомбинация, используемый в данном документе, включает обмен фрагментами ДНК между двумя молекулами ДНК на сайтах гомологии. На частоту гомологичной рекомбинации влияет ряд факторов. Различные организмы отличаются в отношении величины гомологичной рекомбинации и относительного соотношения гомологичной и негомологичной рекомбинации. Как правило, длина участка гомологии влияет на частоту событий гомологичной рекомбинации, чем длиннее участок гомологии, тем больше частота. Длина участка гомологии, необходимая для наблюдения гомологичной рекомбинации, также изменяется в зависимости от вида. Во многих случаях применялась гомология по меньшей мере 5 т.о., но гомологичная рекомбинация наблюдалась при гомологии всего лишь 25-50 п.о. См., например, Singer et al. (1982) Cell 31:25-33; Shen and Huang (1986) Genetics 112:441-57; Watt et al. (1985) Proc. Natl. Acad. Sci. USA 82:4768-72, Sugawara and Haber (1992) Mol Cell Biol 12:563-75, Rubnitz and Subramani (1984) Mol Cell Biol 4:2253-8; Ayares et al. (1986) Proc. Natl. Acad. Sci. USA 83:5199-203; Liskay et al. (1987) Genetics 115:161-7.The term homologous recombination as used herein includes the exchange of DNA fragments between two DNA molecules at sites of homology. The frequency of homologous recombination is affected by a number of factors. Different organisms differ in the amount of homologous recombination and the relative ratio of homologous to non-homologous recombination. As a rule, the length of the homology region affects the frequency of homologous recombination events, the longer the homology region, the greater the frequency. The length of the homology region required to observe homologous recombination also varies with species. In many cases homology of at least 5 kb was used, but homologous recombination was observed at only 25-50 bp homology. See, for example, Singer et al. (1982) Cell 31:25-33; Shen and Huang (1986) Genetics 112:441-57; Watt et al. (1985) Proc. Natl. Acad. sci. USA 82:4768-72, Sugawara and Haber (1992) Mol Cell Biol 12:563-75, Rubnitz and Subramani (1984) Mol Cell Biol 4:2253-8; Ayares et al. (1986) Proc. Natl. Acad. sci. USA 83:5199-203; Liskay et al. (1987) Genetics 115:161-7.

Репарация, направляемая гомологией (HDR), представляет собой механизм в клетках для репарации двухнитевых и однонитевых разрывов ДНК. Репарация, направляемая гомологией, включает гомологичную рекомбинацию (HR) и однонитевой отжиг (SSA) (Lieber. 2010 Annu. Rev. Biochem. 79:181-211). Наиболее распространенная форма HDR называется гомологичной рекомбинацией (HR), которая имеет требования в отношении самой длинной гомологии последовательности между донорной и акцепторной ДНК. Другие формы HDR включают однонитевой отжиг (SSA) и репликацию, индуцированную разрывом, и они требуют более короткой гомологии последовательности по сравнению с HR. Репарация, направляемая гомологией, ников (одноцепочечные разрывы) может происходить с помощью механизма, отличного от HDR при двухнитевых разрывах (Davis и Maizels. (2014) PNAS (0027-8424), 111 (10), р. Е924-Е932).Homology-driven repair (HDR) is a mechanism in cells for the repair of double-strand and single-strand DNA breaks. Homology driven repair includes homologous recombination (HR) and single strand annealing (SSA) (Lieber. 2010 Annu. Rev. Biochem. 79:181-211). The most common form of HDR is called homologous recombination (HR), which has a requirement for the longest sequence homology between donor and acceptor DNA. Other forms of HDR include single-strand annealing (SSA) and break-induced replication, and they require shorter sequence homology compared to HR. Homology-driven repair of nicks (single-strand breaks) can occur by a mechanism different from HDR in double-strand breaks (Davis and Maizels. (2014) PNAS (0027-8424), 111(10), p. E924-E932).

Перестройка генома растительной клетки, например, посредством гомологичной рекомбинации (HR), является мощным инструментом для генной инженерии. Гомологичная рекомбинация была продемонстрирована на растениях (Halfter et al. (1992) Mol Gen Genet 231: 186-93) и насекомых (Dray and Gloor, 1997, Genetics 147: 689-99). Гомологичную рекомбинацию также осуществляли в других организмах. Например, по меньшей мере 150-200 п.о. гомологии было необходимо для гомологичной рекомбинации в паразитическом простейшем Leishmania (Papadopoulou and Dumas, (1997) Nucleic Acids Res25:4278-86). В мицеллярном грибе Aspergillus nidulans, замена гена была выполнена с помощью всего 50 п.о. фланкирующей гомологии (Chaveroche et al., (2000) Nucleic Acids Res 28:e97). Нацеленное замещение генов также было продемонстрировано у инфузории Tetrahymena thermophila (Gaertig et al., (1994) Nucleic Acids Res 22:5391-8). У млекопитающих гомологичная рекомбинация была наиболее успешной у мышей с использованием плюрипотентных линий эмбриональных стволовых клеток (ES), которые можно выращивать в культуре, трансформировать, отбирать и вводить в эмбрион мыши (Watson et al., 1992, Recombinant DNA, 2nd Ed., (Scientific American Books distributed by WH Freeman & Co.).Rearranging the plant cell genome, for example through homologous recombination (HR), is a powerful tool for genetic engineering. Homologous recombination has been demonstrated in plants (Halfter et al. (1992) Mol Gen Genet 231: 186-93) and insects (Dray and Gloor, 1997, Genetics 147: 689-99). Homologous recombination has also been carried out in other organisms. For example, at least 150-200 p. homology was necessary for homologous recombination in the parasitic protozoan Leishmania (Papadopoulou and Dumas, (1997) Nucleic Acids Res25:4278-86). In the micelle fungus Aspergillus nidulans, gene replacement was performed with as little as 50 bp. flanking homology (Chaveroche et al., (2000) Nucleic Acids Res 28:e97). Targeted gene replacement has also been demonstrated in the ciliate Tetrahymena thermophila (Gaertig et al., (1994) Nucleic Acids Res 22:5391-8). In mammals, homologous recombination has been most successful in mice using pluripotent embryonic stem (ES) cell lines that can be cultured, transformed, selected, and introduced into the mouse embryo (Watson et al., 1992, Recombinant DNA, 2nd Ed., ( Scientific American Books distributed by W. H. Freeman & Co.).

Механизмы репарации подверженных ошибкам ДНК могут вызывать мутации в сайтах двухнитевых разрывов. Пути репарации с помощью соединения негомологичных концов (NHEJ) являются наиболее распространенными механизмами репарации для соединения разорванных концов вместе (Bleuyard, et al., (2006) DNA Repair 5:1-12). Структурная целостность хромосом, как правило, сохраняется при репарации, но возможны делеции, вставки или другие перестановки. Два конца одного двухнитевого разрыва являются наиболее преобладающими субстратами для NHEJ (Kirik, et al., (2000) EMBO J 19:5562-6), однако, если возникают два различных двухнитевых разрыва, свободные концы из разных разрывов могут связывать и образовывать в результате хромосомные делеции (Siebert and Puchta, (2002) Plant Cell 14:1121-31), или хромосомные транслокации между различными хромосомами (Pacher, et al., (2007) Genetics 175:21-9).Error-prone DNA repair mechanisms can cause mutations at double-strand break sites. Non-homologous end joining (NHEJ) repair pathways are the most common repair mechanisms for joining broken ends together (Bleuyard, et al., (2006) DNA Repair 5:1-12). Structural integrity of chromosomes is usually preserved during repair, but deletions, insertions, or other rearrangements are possible. The two ends of a single double strand break are the most predominant substrates for NHEJ (Kirik, et al., (2000) EMBO J 19:5562-6), however, if two different double strand breaks occur, free ends from different breaks can bind and form as a result chromosomal deletions (Siebert and Puchta, (2002) Plant Cell 14:1121-31), or chromosomal translocations between different chromosomes (Pacher, et al., (2007) Genetics 175:21-9).

Донорную ДНК можно вводить с помощью любого способа, известного из уровня техники. Донорная ДНК может быть обеспечена любым способом трансформации, известным из уровня техники, в том числе, например, опосредованной Agrobacterium трансформацией или бомбардировкой частицами в ходе биобаллистической трансформации. Донорная ДНК может временно присутствовать в клетке, или она может быть введена посредством вирусного репликона. При наличии эндонуклеазы Cas и целевого сайта донорную ДНК вставляют в геном трансформированного растения, (см. руководство).Donor DNA can be administered using any method known in the art. Donor DNA can be provided by any transformation method known in the art, including, for example, Agrobacterium-mediated transformation or particle bombardment during bioballistic transformation. The donor DNA may be temporarily present in the cell, or it may be introduced via a viral replicon. In the presence of the Cas endonuclease and the target site, the donor DNA is inserted into the genome of the transformed plant (see manual).

Описано дальнейшее использование систем направляющая РНК/эндонуклеаза Cas (см. заявку на патент США US 2015-0082478 A1, WO2015/026886 А1, US 2015-0059010 A1, заявку США 62/023246 и заявку США 62/036652, все из которых включены в данный документ посредством ссылки), которые включают без ограничения модификацию или замену представляющих интерес нуклеотидных последовательностей (таких как регуляторные элементы), вставку представляющих интерес полинуклеотидов, нокаут гена, нокин гена, модификацию сайтов сплайсинга и/или введение альтернативных сайтов сплайсинга, модификации нуклеотидных последовательностей, кодирующих белок, представляющий интерес, слияния аминокислот и/или белков и сайленсинг генов путем экспрессии инвертированного повтора в гене, представляющем интерес.Further use of Cas guide RNA/endonuclease systems has been described (see US Patent Application US 2015-0082478 A1, WO2015/026886 A1, US 2015-0059010 A1, US Application 62/023246 and US Application 62/036652, all of which are included in herein by reference), which include, without limitation, modification or substitution of nucleotide sequences of interest (such as regulatory elements), insertion of polynucleotides of interest, gene knockout, gene knockin, modification of splice sites and/or introduction of alternative splice sites, modification of nucleotide sequences, encoding a protein of interest, amino acid and/or protein fusions, and gene silencing by expression of an inverted repeat in the gene of interest.

- 17 041676- 17 041676

II. Способы получения растений маиса с модифицированными нуклеотидными последовательностями Ht 1 и/или NLB18.II. Methods for producing maize plants with modified Ht 1 and/or NLB18 nucleotide sequences.

A. Ht1.A. Ht1.

Картирование QTL, ассоциированного с устойчивостью к северной пятнистости листьев, на хромосоме 2, описано в заявке на патент США US2010095395. Ген Ht1 был клонирован и идентифицирован как предполагаемый ген CC-NB-LRR (суперспираль, нуклеотидсвязывающая, с богатыми лейцином повторами) ген (US 62/242691). Последовательности cDNA Ht1 из PH4GP и PH1W2 (другого источника связанного с устойчивостью аллеля Ht1; заявка на патент США US2010095395) представлены под SEQ ID NO:51 и 53, соответственно, тогда как аминокислотные последовательности, кодирующие полипептиды, представлены под SEQ ID NO:52 и 54 и идентичны на 99,6%. В73 (который обладает связанным с восприимчивостью аллелем) имеет два варианта сплайсинга, и новый вариант экспрессируется на намного более высоком уровне (также называемый в данном документе B73-high), чем известный вариант (также называемый в данном документе B73-low). SEQ ID NO:55 представляет собой последовательность cDNA аллеля B73-high, тогда как аминокислотная последовательность кодируемого полипептида представлена под SEQ ID NO:56. SEQ ID NO:57 представляет собой последовательность cDNA аллеля B73-low, тогда как аминокислотная последовательность кодируемого полипептида представлена под SEQ ID NO:58. Геномная последовательность аллеля PH4GP (устойчивого) представлена в данном документе как SEQ ID NO:59. Домены СС и NB очень похожи между связанным с восприимчивостью аллелем (В73) и связанными с устойчивостью аллелями (из PH4GP и PH1W2), как показано в US 62/242691. Тем не менее, В73 имеет делецию в LRR. Аминокислотная последовательность данного участка в связанных с устойчивостью аллелях Ht1 представлена под SEQ ID NO:60.Mapping of QTL associated with northern leaf spot resistance on chromosome 2 is described in US Patent Application US2010095395. The Ht1 gene was cloned and identified as the putative CC-NB-LRR (supercoiled, nucleotide-binding, leucine-rich repeat) gene (US 62/242691). The Ht1 cDNA sequences from PH4GP and PH1W2 (another source of resistance-associated Ht1 allele; US Patent Application US2010095395) are shown under SEQ ID NO:51 and 53, respectively, while the amino acid sequences encoding the polypeptides are shown under SEQ ID NO:52 and 54 and are 99.6% identical. B73 (which has a susceptibility-associated allele) has two splicing variants and the new variant is expressed at a much higher level (also referred to herein as B73-high) than the known variant (also referred to herein as B73-low). SEQ ID NO:55 is the cDNA sequence of the B73-high allele, while the amino acid sequence of the encoded polypeptide is shown under SEQ ID NO:56. SEQ ID NO:57 is the cDNA sequence of the B73-low allele, while the amino acid sequence of the encoded polypeptide is shown under SEQ ID NO:58. The genomic sequence of the PH4GP (resistant) allele is provided herein as SEQ ID NO:59. The CC and NB domains are very similar between the susceptibility-associated allele (B73) and the resistance-associated alleles (from PH4GP and PH1W2) as shown in US 62/242691. However, B73 has a deletion in the LRR. The amino acid sequence of this region in resistance-associated Ht1 alleles is shown under SEQ ID NO:60.

Способы получения клетки растения маиса с модифицированной нуклеотидной последовательностью Ht1 предусматривают введение двухнитевого разрыва в один или нескольких целевых сайтов в эндогенной последовательности, кодирующей НТ1, в клетке растения маиса, и получение клетки растения маиса, имеющей модифицированную нуклеотидную последовательность Ht1. В одном аспекте способы предусматривают введение двухнитевого разрыва в один или нескольких целевых сайтов в эндогенной последовательности, кодирующей Ht1, в клетке растения маиса, и получение клетки растения маиса, имеющей модифицированную нуклеотидную последовательность Ht1. Способ может дополнительно предусматривать введение матрицы для замены NLB18 в клетку растения маиса, где указанная матрица для замены Ht1 содержит по меньшей мере одно изменение нуклеиновой кислоты по сравнению с эндогенной последовательностью, кодирующей Ht1, и где указанная матрица для замены Ht1 включена в эндогенную последовательность, кодирующую Ht1. Способ может дополнительно предусматривать введение матрицы для замены Ht1 в клетку растения маиса, где указанная матрица для замены Ht1 содержит по меньшей мере одно изменение нуклеиновой кислоты по сравнению с эндогенной последовательностью, кодирующей НТ1, и где указанная матрица для замены Ht1 включена в эндогенную последовательность, кодирующую НТ1. Двухцепочечный разрыв может быть индуцирован с помощью нуклеазы, в том числе без ограничения TALEN, мегануклеазы, нуклеазы с цинковыми пальцами или CRISPRассоциированной нуклеазы. Способ может дополнительно предусматривать выращивание растения маиса из клетки растения маиса, имеющей модифицированную нуклеотидную последовательность Ht1, и при этом растение маиса может проявлять повышенную устойчивость к северной пятнистости листьев.Methods for producing a maize plant cell with a modified Ht1 nucleotide sequence include introducing a double strand break at one or more target sites in an endogenous HT1 coding sequence in a maize plant cell and obtaining a maize plant cell having a modified Ht1 nucleotide sequence. In one aspect, the methods include introducing a double strand break at one or more target sites in an endogenous Ht1 coding sequence in a maize plant cell and obtaining a maize plant cell having a modified Ht1 nucleotide sequence. The method may further comprise introducing an NLB18 replacement template into a maize plant cell, wherein said Ht1 replacement template contains at least one nucleic acid change from an endogenous Ht1 coding sequence, and wherein said Ht1 replacement template is included in an endogenous Ht1 coding sequence. Ht1. The method may further comprise introducing an Ht1 replacement template into a maize plant cell, wherein said Ht1 replacement template contains at least one nucleic acid change from an endogenous HT1 coding sequence, and wherein said Ht1 replacement template is included in an endogenous coding sequence. NT1. The double strand break can be induced by a nuclease, including but not limited to TALEN, meganuclease, zinc finger nuclease, or CRISPR-associated nuclease. The method may further comprise growing a maize plant from a maize plant cell having a modified Ht1 nucleotide sequence, wherein the maize plant may exhibit increased resistance to northern leaf spot.

Нуклеотидная последовательность Ht1, представленная в данном документе, может относиться к промотору Ht1, экзонам, интронам и/или терминаторным последовательностям, как целиком, так и в виде фрагментов.The Ht1 nucleotide sequence provided herein may refer to the Ht1 promoter, exons, introns, and/or terminator sequences, either as a whole or as fragments.

Эндогенная последовательность, кодирующая НТ1 относится к нуклеотидной последовательности, которая присутствует в немодифицированной клетке растения маиса и кодирует полипептид НТ1.An endogenous HT1 coding sequence refers to a nucleotide sequence that is present in an unmodified maize plant cell and encodes an HT1 polypeptide.

Матрица для замены Ht1 представляет собой матрицу для модификации полинуклеотида, содержащую благоприятную версию нуклеотидной последовательности Ht1 (т.е. такую, которая придает повышенную устойчивость к северной пятнистости листьев).The Ht1 replacement template is a polynucleotide modification template containing a favorable version of the Ht1 nucleotide sequence (ie one that confers increased resistance to northern leaf spot).

Растения маиса проявляют повышенную устойчивость к северной пятнистости листьев по сравнению с эквивалентными растениями маиса, в которых отсутствует модифицированная нуклеотидная последовательность Ht1. Эквивалент означает, что растения маиса генетически сходны, за исключением последовательности Ht1.Maize plants show increased resistance to northern leaf spot compared to equivalent maize plants lacking the modified Ht1 nucleotide sequence. Equivalent means that maize plants are genetically similar except for the Ht1 sequence.

В некоторых аспектах модифицированная нуклеотидная последовательность Ht1 предусматривает делецию в промоторе эндогенной последовательности, кодирующей НТ1. В данном случае могут предусматривать применение эндонуклеазы Cas9 и одной или нескольких направляющих РНК. Если применяют две направляющие РНК, первая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:1 [Ht1-TS2], а вторая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:2 [Ht1-TS4]; или первая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:1 [Ht1-TS2], а вторая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:3 [Ht1-ST1-TS1].In some aspects, the modified Ht1 nucleotide sequence provides for a deletion in the promoter of the endogenous sequence encoding HT1. In this case, the use of Cas9 endonuclease and one or more guide RNAs may be envisaged. If two guide RNAs are used, the first guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:1 [Ht1-TS2] and the second guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:2 [Ht1-TS4] ; or the first guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:1 [Ht1-TS2], and the second guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:3 [Ht1-ST1-TS1].

В других аспектах используют матрицу для замены Ht1, которая содержит нуклеотидную последо- 18 041676 вательность Ht1 из PH4GP или ее фрагмент или нуклеотидную последовательность Ht1, которая при введении в клетку растения маиса кодирует полипептид с аминокислотной последовательностью, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична SEQ ID NO:52. В данном случае могут предусматривать применение эндонуклеазы Cas9 и одной или нескольких направляющих РНК. Если применяют две направляющие РНК, первая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:14 [Ht1-TS6], а вторая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:16 [Ht1TS9]; или первая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:15 [Ht1-TS7], а вторая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:17 [Ht1-TS10].In other aspects, an Ht1 replacement template is used that contains an Ht1 nucleotide sequence from PH4GP, or a fragment thereof, or an Ht1 nucleotide sequence that, when introduced into a maize plant cell, encodes a polypeptide with an amino acid sequence that is at least 90, 91, 92, 93, 94, 95, 96, 97, 98 or 99% identical to SEQ ID NO:52. In this case, the use of Cas9 endonuclease and one or more guide RNAs may be envisaged. If two guide RNAs are used, the first guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:14 [Ht1-TS6] and the second guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:16 [Ht1TS9]; or the first guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:15 [Ht1-TS7], and the second guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:17 [Ht1-TS10].

В. NLB18.B. NLB18.

Картирование QTL, ассоциированного с устойчивостью к северной пятнистости листьев, на хромосоме 8, описано в международной заявке на патент WO2011163590. Два протеинкиназа (РК)-подобных гена с высококонсервативными киназными каталитическими доменами были идентифицированы в непосредственной близости и упоминались в международной заявке на патент WO2011163590 как NLB17 и NLB18. NLB18 был подтвержден как ген, обеспечивающий повышенную устойчивость к северной пятнистости листьев (не опубликовано). Последовательности cDNA NLB18 из PH26N и PH99N, двух устойчивых источников, описанных в WO2011163590, представлены под SEQ ID NO:61 и 63, соответственно, тогда как аминокислотные последовательности кодируемых полипептидов представлены под SEQ ID NO:62 и 64. SEQ ID NO:62 и SEQ ID NO:64 идентичны на 92,4%.Mapping of QTL associated with northern leaf spot resistance on chromosome 8 is described in international patent application WO2011163590. Two protein kinase (PK)-like genes with highly conserved kinase catalytic domains have been identified in close proximity and referred to in international patent application WO2011163590 as NLB17 and NLB18. NLB18 has been confirmed as a gene conferring increased resistance to northern leaf spot (unpublished). The NLB18 cDNA sequences from PH26N and PH99N, two stable sources described in WO2011163590, are shown under SEQ ID NO:61 and 63, respectively, while the amino acid sequences of the encoded polypeptides are shown under SEQ ID NO:62 and 64. SEQ ID NO:62 and SEQ ID NO:64 are 92.4% identical.

В данном документе предусматриваются способы получения клетки растения маиса с модифицированной нуклеотидной последовательностью NLB18. Способы предусматривают введение двухнитевого разрыва в один или нескольких целевых сайтов в эндогенной последовательности, кодирующей NLB18, в клетке растения маиса, и получение клетки растения маиса, имеющей модифицированную нуклеотидную последовательность NLB18. Способ может дополнительно предусматривать введение матрицы для замены NLB18 в клетку растения маиса, где указанная матрица для замены NLB18 содержит по меньшей мере одно изменение нуклеиновой кислоты по сравнению с эндогенной последовательностью, кодирующей NLB18, и где указанная матрица для замены NLB18 включена в эндогенную последовательность, кодирующую NLB18. Двухнитевый разрыв может быть выполнен с помощью нуклеазы, такой как без ограничения TALEN, мегануклеаза, нуклеаза с цинковыми пальцами или нуклеаза, ассоциированная с CRISPR. Способ может дополнительно предусматривать выращивание растения маиса из клетки растения маиса, имеющей модифицированную нуклеотидную последовательность NLB18, и при этом растение маиса может проявлять повышенную устойчивость к северной пятнистости листьев.Provided herein are methods for producing a maize plant cell with a modified NLB18 nucleotide sequence. The methods include introducing a double strand break at one or more target sites in an endogenous NLB18 coding sequence in a maize plant cell and obtaining a maize plant cell having a modified NLB18 nucleotide sequence. The method may further comprise introducing an NLB18 replacement template into a maize plant cell, wherein said NLB18 replacement template contains at least one nucleic acid change from an endogenous NLB18 coding sequence, and wherein said NLB18 replacement template is included in an endogenous NLB18 coding sequence. NLB18. The double strand break can be performed with a nuclease such as, but not limited to, TALEN, meganuclease, zinc finger nuclease, or CRISPR associated nuclease. The method may further comprise growing a maize plant from a maize plant cell having a modified NLB18 nucleotide sequence, wherein the maize plant may exhibit increased resistance to northern leaf spot.

Нуклеотидная последовательность NLB18, представленная в данном документе, может относиться к промотору NLB18, экзонам, интронам, терминаторным последовательностям и/или любой другой геномной нуклеотидной последовательности, расположенной в геномном локусе NLB18, как целиком, так и в виде фрагментов.The NLB18 nucleotide sequence provided herein may refer to the NLB18 promoter, exons, introns, terminator sequences, and/or any other genomic nucleotide sequence located at the NLB18 genomic locus, either as a whole or as fragments.

Эндогенная последовательность, кодирующая NLB18 относится к нуклеотидной последовательности, которая присутствует в немодифицированной клетке растения маиса и кодирует полипептид NLB18.An endogenous sequence encoding NLB18 refers to a nucleotide sequence that is present in an unmodified maize plant cell and encodes an NLB18 polypeptide.

Матрица для замены NLB18 представляет собой матрицу для модификации полинуклеотида, содержащую благоприятную версию нуклеотидной последовательности NLB18 (т.е. такую, которая придает повышенную устойчивость к северной пятнистости листьев).The NLB18 replacement template is a polynucleotide modification template containing a favorable version of the NLB18 nucleotide sequence (ie one that confers increased resistance to northern leaf spot).

Растения маиса проявляют повышенную устойчивость к северной пятнистости листьев по сравнению с эквивалентными растениями маиса, в которых отсутствует модифицированная нуклеотидная последовательность NLB18. Эквивалент означает, что растения маиса генетически сходны, за исключением последовательности NLB18.Maize plants show increased resistance to northern leaf spot compared to equivalent maize plants lacking the modified NLB18 nucleotide sequence. Equivalent means that maize plants are genetically similar except for the NLB18 sequence.

В некоторых аспектах модифицированная нуклеотидная последовательность NLB18 содержит модификацию в промоторе эндогенной последовательности, кодирующей NLB18.In some aspects, the modified NLB18 nucleotide sequence comprises a modification in the promoter of the endogenous sequence encoding NLB18.

В других аспектах используют матрицу для замены NLB18, которая содержит нуклеотидную последовательность NLB18 из PH26N или PH99N или нуклеотидную последовательность NLB18, которая при введении в клетку растения маиса кодирует полипептид с аминокислотной последовательностью, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична SEQ ID NO:62 или SEQ ID NO:64. В некоторых аспектах матрица для замены NLB18 содержит SEQ ID NO:70. В некоторых вариантах осуществления применение матрицы для замены NLB может включать применение эндонуклеазы Cas9 и одной или нескольких направляющих РНК. Если применяют две направляющие РНК, первая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:30 [NLB18-TS1], а вторая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:32 [NLB18-TS4]; или первая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:31 [NLB18TS8], а вторая направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:32 [NLB18-TS4].In other aspects, an NLB18 replacement template is used that contains an NLB18 nucleotide sequence of PH26N or PH99N, or an NLB18 nucleotide sequence that, when introduced into a maize plant cell, encodes a polypeptide with an amino acid sequence that is at least 90, 91, 92, 93, 94 , 95, 96, 97, 98 or 99% identical to SEQ ID NO:62 or SEQ ID NO:64. In some aspects, the NLB18 replacement matrix contains SEQ ID NO:70. In some embodiments, the use of an NLB replacement template may include the use of a Cas9 endonuclease and one or more guide RNAs. If two guide RNAs are used, the first guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:30 [NLB18-TS1] and the second guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:32 [NLB18-TS4] ; or the first guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:31 [NLB18TS8] and the second guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:32 [NLB18-TS4].

- 19 041676- 19 041676

III. Способы получения клеток растений маиса с геномным локусом, содержащим нуклеотидные последовательности, которые придают повышенную устойчивость к северной пятнистости листьев.III. Methods for obtaining maize plant cells with a genomic locus containing nucleotide sequences that confer increased resistance to northern leaf spot.

Полинуклеотиды, представляющие интерес, и/или признаки могут быть объединены вместе в сложном локусе признаков, как описано в US 2013/0263324-A1 и в PCT/US13/22891, оба из которых включены в данный документ посредством ссылки.Polynucleotides of interest and/or features can be combined together in a complex feature locus as described in US 2013/0263324-A1 and PCT/US13/22891, both of which are incorporated herein by reference.

В данном документе представлены способы получения клетки растения маиса с геномным локусом, содержащим по меньшей мере одну нуклеотидную последовательность, которая придает повышенную устойчивость к северной пятнистости листьев. Раскрытые способы предусматривают введение двухнитевого разрыва в один или несколько целевых сайтов в геномном локусе клетки растения маиса; введение одной или нескольких нуклеотидных последовательностей, которые придают повышенную устойчивость к северной пятнистости листьев, где каждая нуклеотидная последовательность фланкирована 300-500 п.о. нуклеотидных последовательностей, расположенных 5' или 3' относительно соответствующих целевых сайтов; и получение клетки растения маиса, имеющей геномный локус, содержащий одну или несколько нуклеотидных последовательностей, которые придают повышенную устойчивость к северной пятнистости листьев. Двухнитевый разрыв может быть индуцирован с помощью нуклеазы, такой как без ограничения TALEN, мегануклеаза, нуклеаза с цинковыми пальцами или нуклеаза, ассоциированная с CRISPR. Способ может дополнительно предусматривать выращивание растения маиса из клетки растения маиса, имеющей геномный локус, содержащий по меньшей мере одну нуклеотидную последовательность, которая обеспечивает повышенную устойчивость к северной пятнистости листьев, и при этом растение маиса может проявлять повышенную устойчивость к северной пятнистости листьев.This document provides methods for producing a maize plant cell with a genomic locus containing at least one nucleotide sequence that confers increased resistance to northern leaf spot. The disclosed methods include introducing a double strand break at one or more target sites in the genomic locus of a maize plant cell; the introduction of one or more nucleotide sequences that confer increased resistance to northern leaf spot, where each nucleotide sequence is flanked by 300-500 p. nucleotide sequences located 5' or 3' relative to the respective target sites; and providing a maize plant cell having a genomic locus containing one or more nucleotide sequences that confer increased resistance to northern leaf spot. The double strand break can be induced with a nuclease such as, but not limited to, TALEN, meganuclease, zinc finger nuclease, or CRISPR associated nuclease. The method may further comprise growing a maize plant from a maize plant cell having a genomic locus containing at least one nucleotide sequence that provides increased resistance to northern leaf spot, and wherein the maize plant can exhibit increased resistance to northern leaf spot.

Растения маиса проявляют повышенную устойчивость к северной пятнистости листьев по сравнению с эквивалентными растениями маиса, не имеющими нуклеотидных последовательностей, придающих повышенную устойчивость к северной пятнистости листьев, в геномном локусе, представляющем интерес. Эквивалент означает, что растения маиса генетически сходны, за исключением геномного локуса, представляющего интерес.Maize plants exhibit increased resistance to northern leaf spot compared to equivalent maize plants lacking nucleotide sequences conferring increased resistance to northern leaf spot at the genomic locus of interest. Equivalent means that maize plants are genetically similar except for the genomic locus of interest.

В некоторых аспектах одна или несколько нуклеотидных последовательностей, которые придают повышенную устойчивость к северной пятнистости листьев, включают любое из следующего: Ht1PH4GP, NLB18-PH26N и NLB18-PH99N. Нуклеотидная последовательность Ht1-PH4GP может содержать SEQ ID NO:59 или любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:52, где полипептид придает повышенную устойчивость растению маиса к северной пятнистости листьев. В некоторых аспектах нуклеотидная последовательность Ht1-PH4GP представляет собой SEQ ID NO:65. Нуклеотидная последовательность NLB18-PH26N может содержать любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:64, где полипептид придает повышенную устойчивость растению маиса к северной пятнистости листьев. В некоторых аспектах нуклеотидная последовательность NLB18-PH26N представляет собой SEQ ID NO:70. Нуклеотидная последовательность NLB18-PH99N может содержать любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая на по меньшей мере 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% SEQ ID NO:62, где указанный полипептид придает повышенную устойчивость растению маиса к северной пятнистости листьев.In some aspects, one or more nucleotide sequences that confer increased resistance to northern leaf spot include any of the following: Ht1PH4GP, NLB18-PH26N, and NLB18-PH99N. The Ht1-PH4GP nucleotide sequence may comprise SEQ ID NO:59 or any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% SEQ ID NO:52 wherein the polypeptide confers increased resistance to northern leaf spot in the maize plant. In some aspects, the nucleotide sequence of Ht1-PH4GP is SEQ ID NO:65. The nucleotide sequence of NLB18-PH26N may comprise any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% of SEQ ID NO:64, wherein the polypeptide confers increased resistance to northern leaf spot in the maize plant. In some aspects, the nucleotide sequence of NLB18-PH26N is SEQ ID NO:70. The NLB18-PH99N nucleotide sequence may comprise any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% of SEQ ID NO:62, wherein said polypeptide confers increased resistance to northern leaf spot in a maize plant.

В других аспектах геномный локус, который придает повышенную устойчивость к северной пятнистости листьев, содержит CTL1. В еще других аспектах нуклеотидная последовательность, кодирующая NLB18-PH26N, нацелена на TS8 CTL1; нуклеотидная последовательность, кодирующая NLB18-PH4GP, нацелена на TS10 CTL1; и/или нуклеотидная последовательность, кодирующая NLB18-PH26N, нацелена на TS45 CTL1.In other aspects, the genomic locus that confers increased resistance to northern leaf spot contains CTL1. In still other aspects, the nucleotide sequence encoding NLB18-PH26N is targeted at TS8 CTL1; the nucleotide sequence encoding NLB18-PH4GP targets TS10 CTL1; and/or the nucleotide sequence encoding NLB18-PH26N is targeted at TS45 CTL1.

Описанная в данном документе система направляющий полинуклеотид/эндонуклеаза Cas9 обеспечивает эффективную систему для образования двухнитевых разрывов и позволяет укладывать признаки в сложный локус признаков. Таким образом, в одном аспекте эндонуклеазу Cas9 используют в качестве DSB-индуцирующего средства, и одну или несколько направляющих РНК используют для нацеливания Cas9 на сайты в локусе CTL1. Одна направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:36 [CTL1-TS8]; одна направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:37 [CTL1-TS10], и одна направляющая РНК может содержать вариабельный нацеливающий домен, который комплементарен SEQ ID NO:38 [CTL1-TS45].The guide polynucleotide/Cas9 endonuclease system described herein provides an efficient system for the formation of double strand breaks and allows features to be stacked into a complex feature locus. Thus, in one aspect, Cas9 endonuclease is used as a DSB inducing agent and one or more guide RNAs are used to target Cas9 to sites at the CTL1 locus. One guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:36 [CTL1-TS8]; one guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:37 [CTL1-TS10], and one guide RNA may contain a variable targeting domain that is complementary to SEQ ID NO:38 [CTL1-TS45].

Получение растений маиса с помощью способов, описанных в данном документе, может придавать длительную устойчивость и устойчивость широкого спектра к северной пятнистости листьев и может способствовать селекции растений маиса, устойчивых к северной пятнистости листьев. Например, поскольку нуклеотидные последовательности, которые придают повышенную устойчивость к северной пятнистости листьев, находятся в тесной связи друг с другом (в одном локусе), это приводит к уменьшению количества определенных локусов, которые требуют интрогрессии признака с помощью возвратного скрещивания, и сведению к минимуму нежелательных сцепленных признаков от неэлитных устойчивых доноров.Producing maize plants using the methods described herein can confer long-term and broad spectrum tolerance to northern leaf spot and can promote the breeding of northern leaf spot resistant maize plants. For example, since the nucleotide sequences that confer increased resistance to northern leaf spot are in close association with each other (at the same locus), this results in a reduction in the number of specific loci that require trait introgression by backcrossing and minimization of undesirable linked traits from non-elite stable donors.

- 20 041676- 20 041676

Используемый в данном документе термин гетерологичная в отношении последовательности означает, что последовательность происходит из чужеродного вида или, если она происходит из того же вида, в существенной степени модифицирована по составу и/или местоположению в геноме по сравнению с ее нативной формой в результате преднамеренного вмешательства человека. Например, промотор, функционально связанный с гетерологичным полинуклеотидом, происходит из вида, отличного от вида, из которого получен полинуклеотид, или, если он происходит из того же/аналогичного вида, то один или оба из них являются в значительной степени модифицированными по сравнению с их исходной формой и/или местоположением в геноме, или промотор не является нативным промотором для функционально связанного полинуклеотида.As used herein, the term "heterologous with respect to sequence" means that the sequence originates from a foreign species or, if it originates from the same species, is substantially modified in composition and/or location in the genome compared to its native form as a result of deliberate human intervention. . For example, a promoter operably linked to a heterologous polynucleotide is from a species different from the species from which the polynucleotide is derived, or if it is from the same/similar species, one or both of them are substantially modified from their original form and/or location in the genome, or the promoter is not a native promoter for the operably linked polynucleotide.

IV. Клетки растений маиса, растения и семена.IV. Maize plant cells, plants and seeds.

Маис относится к растению Zea mays L. ssp. mays, который также известен как кукуруза. Использование ZM перед объектом, описанным в данном документе, относится к тому факту, что объект происходит от Zea mays.Maize belongs to the plant Zea mays L. ssp. mays, also known as corn. The use of ZM in front of an object described in this document refers to the fact that the object is derived from Zea mays.

Также предусмотрены растения маиса, клетки растения маиса, части растения маиса и семена, а также зерно маиса, имеющие модифицированные последовательности Ht1 или NLB18, раскрытые в данном документе.Also contemplated are maize plants, maize plant cells, maize plant parts and seeds, and maize grains having the modified Ht1 or NLB18 sequences disclosed herein.

Используемый в данном документе термин растение включает растительные клетки, протопласты растений, тканевые культуры растительных клеток, из которых можно регенерировать растения, растительные каллюсы, скопления растительных клеток и растительные клетки, которые являются интактными в растениях или частях растений, таких как зародыши, пыльца, семяпочки, семена, листья, цветки, зерна, колоски, початки, листовые обвертки, стебли, корни, кончики корней, пыльники и т.п. Предполагается, что зерно означает зрелое семя, полученное коммерческими растениеводами для целей, отличных от выращивания или воспроизводства вида.As used herein, the term plant includes plant cells, plant protoplasts, tissue cultures of plant cells from which plants can be regenerated, plant calluses, aggregations of plant cells, and plant cells that are intact in plants or plant parts such as germs, pollen, ovules. , seeds, leaves, flowers, grains, spikelets, cobs, leaf wrappers, stems, roots, root tips, anthers, etc. Grain is intended to mean mature seed obtained by commercial growers for purposes other than cultivation or reproduction of a species.

V. Направляющие полинуклеотиды.V. Guide polynucleotides.

В данном документе также предусматриваются направляющие полинуклеотиды, содержащие вариабельные нацеливающие домены, комплементарные целевым сайтам в эндогенной последовательности, кодирующей Ht1, эндогенной последовательности, кодирующей NLB18, или геномный локус CTL1. Такие направляющие полинуклеотиды могут представлять собой последовательности РНК, последовательности ДНК или комбинированные последовательности РНК-ДНК. Для Ht1 направляющие полинуклеотиды могут иметь вариабельный нацеливающий домен, комплементарный SEQ ID NO:1, SEQ ID NO:2 или SEQ ID NO:3. Для NLB18 направляющие полинуклеотиды могут иметь вариабельный нацеливающий домен, комплементарный SEQ ID NO:30, SEQ ID NO:31 или SEQ ID NO:32. Для CTL1 направляющие полинуклеотиды могут иметь вариабельный нацеливающий домен, комплементарный SEQ ID NO:36, SEQ ID NO:37 или SEQ ID NO:38.This document also provides guide polynucleotides containing variable targeting domains complementary to target sites in the endogenous Ht1 coding sequence, the endogenous NLB18 coding sequence, or the CTL1 genomic locus. Such guide polynucleotides can be RNA sequences, DNA sequences, or combined RNA-DNA sequences. For Ht1, targeting polynucleotides may have a variable targeting domain complementary to SEQ ID NO:1, SEQ ID NO:2, or SEQ ID NO:3. For NLB18, targeting polynucleotides may have a variable targeting domain complementary to SEQ ID NO:30, SEQ ID NO:31, or SEQ ID NO:32. For CTL1, targeting polynucleotides may have a variable targeting domain complementary to SEQ ID NO:36, SEQ ID NO:37, or SEQ ID NO:38.

ПримерыExamples

Следующие примеры предусмотрены для иллюстрации, а не для ограничения прилагаемой формулы изобретения. Понятно, что примеры и варианты осуществления, описанные в данном документе, предназначены только для иллюстративных целей, и что специалисты в данной области техники поймут, что различные реагенты или параметры можно изменить без отступления от сущности настоящего изобретения или объема прилагаемой формулы изобретения.The following examples are provided to illustrate and not to limit the appended claims. It is understood that the examples and embodiments described herein are for illustrative purposes only, and that those skilled in the art will appreciate that various reagents or parameters may be changed without departing from the spirit of the present invention or the scope of the appended claims.

Пример 1.Example 1

Редактирование гена НТ1 посредством удаления повторяющихся последовательностей в промоторном участке.Editing the HT1 gene by removing repetitive sequences in the promoter region.

Отбор целевого сайта.Target site selection.

Сайт-направленную нуклеазную систему gRNA/Cas9, описанную в WO2015026885, WO20158026887, WO2015026883 и WO2015026886, использовали для редактирования гена Htl в маисе (WO2017066597, который включен в данный документ посредством ссылки). Следующие пары целевых сайтов использовали для делеции повторяющейся последовательности в промоторной области Ht1 PH184C (представленной посредством SEQ ID NO:71): HT1-TS2 и HT1-TS4, а также HT1-TS2 и HT1ST1-TS1. Расположение каждого целевого сайта в геномной последовательности Htl и схематическое изображение результата удаления показаны на фиг. 1, а целевые последовательности перечислены в табл. 1.The site-directed gRNA/Cas9 nuclease system described in WO2015026885, WO20158026887, WO2015026883 and WO2015026886 was used to edit the Htl gene in maize (WO2017066597, which is incorporated herein by reference). The following target site pairs were used to delete a repeat sequence in the Ht1 promoter region of PH184C (represented by SEQ ID NO:71): HT1-TS2 and HT1-TS4, and HT1-TS2 and HT1ST1-TS1. The location of each target site in the Htl genomic sequence and a schematic representation of the result of the deletion are shown in FIG. 1, and the target sequences are listed in table. 1.

Таблица 1. Последовательности промоторных участков геномных целевых сайтов Ht1Table 1. Promoter sequences of Ht1 genomic target sites

Обозначение целевого сайта Designation target site Последовательность геномного целевого сайта маиса Maize genomic target site sequence Последовательность PAM Subsequence PAM Htl-TS2 Htl-TS2 SEQ ID NO:1 SEQID NO:1 TGG TGG Htl-TS4 html-ts4 SEQ ID NO:2 SEQ ID NO:2 AGG AGG Htl-STl-TSl Htl-STl-TSl SEQ ID NO:3 SEQ ID NO:3 TTAGAAA TTAGAAA

- 21 041676- 21 041676

Векторная конструкция Cas9.Cas9 vector design.

Ген Cas9 из Streptococcus pyogenes Ml GAS (SF370) (SEQ ID NO:4) оптимизировали по кодону маиса с помощью стандартных методик, известных из уровня техники, и интрон картофеля ST-LS1 вводили с целью устранения его экспрессии в Е.соП и Agrobacterium. С целью облегчения ядерной локализации белка Cas9 в клетках маиса, на амино-конце открытой рамки считывания Cas9 включали одинарный амино-концевой сигнал внутриядерной локализации вируса обезьян 40 (SV40) (SEQ ID NO:5). Оптимизированный ген Cas9 маиса функционально связывали с убиквитиновым промотором маиса с помощью стандартных методик молекулярной биологии. В дополнение к амино-концевому сигналу внутриядерной локализации SV40, С-терминальный двухсоставной сигнал внутриядерной локализации эндонуклеазы VirD2 Agrobacterium tumefaciens сливали в конце экзона 2. Полученная последовательность представляет собой SEQ ID NO:72, включающую убиквитиновый промотор Zea mays, 5'-UTR гена убиквитина ZM, интрон 1 гена убиквитина ZM, сигнал внутриядерной локализации SV40, экзон 1 Cas9 (ST1), интрон LS1 картофеля, экзон 2 Cas9 (ST1), сигнал внутриядерной локализации эндонуклеазы VirD2 и терминатор pinII.The Cas9 gene from Streptococcus pyogenes Ml GAS (SF370) (SEQ ID NO:4) was codon optimized for maize using standard techniques known in the art, and the potato ST-LS1 intron was introduced to abolish its expression in E. coP and Agrobacterium. To facilitate nuclear localization of the Cas9 protein in maize cells, a single amino-terminal simian virus 40 (SV40) intranuclear localization signal (SEQ ID NO:5) was included at the amino end of the Cas9 open reading frame. The optimized maize Cas9 gene was operably linked to the maize ubiquitin promoter using standard molecular biology techniques. In addition to the SV40 amino-terminal nuclear localization signal, Agrobacterium tumefaciens VirD2 endonuclease C-terminal two-part nuclear localization signal was fused at the end of exon 2. The resulting sequence is SEQ ID NO:72 including the Zea mays ubiquitin promoter, 5'-UTR of the ubiquitin gene ZM, intron 1 of the ZM ubiquitin gene, SV40 intranuclear localization signal, Cas9 exon 1 (ST1), potato LS1 intron, Cas9 exon 2 (ST1), VirD2 endonuclease intranuclear localization signal, and pinII terminator.

Векторная конструкция направляющей РНК.Guide RNA vector design.

С целью направления нуклеазы Cas9 в обозначенные геномные целевые сайты (в табл. 1), промотор U6 полимеразы III (SEQ ID NO:6; см. WO2015026885, WO20158026887, WO2015026883 и WO2015026886) и его родственные терминаторные последовательности U6 полимеразы III (TTTTTTTT) использовали для управления инициацией и терминацией экспрессии gRNA. Вариабельные нацеливающие домены направляющей РНК для редактирования генов НТ 1 идентифицированы как HT1-CR2 и HT1 CR4, которые соответствуют геномным целевым сайтам HT1-TS2, HT1-TS4 и HT1-ST1-CR1 соответствуют HT1-ST1-TS, соответственно. ДНК, кодирующая каждый из вариабельных доменов, нацеливающих нуклеотиды, была клонирована в кассету экспрессии gRNA посредством сайтов BsbI с использованием двухнитевых олиго. Каждая кассета экспрессии направляющей РНК состоит из промотора U6 полимеразы III маиса, функционально связанного с одной из ДНК-версий направляющей РНК (Табл. 2), и затем родственной терминаторной последовательности U6 полимеразы III. ДНК-версия направляющей РНК состоит из соответствующего нуклеотидного вариабельного нацеливающего домена, за которым следует полинуклеотидная последовательность, способная взаимодействовать с эндонуклеазой, индуцирующей двухнитевый разрыв. Кассету экспрессии направляющей РНК для HT1-ST1-CR1 встраивали в кассету экспрессии ST1 Cas9 с помощью стандартных процедур.In order to direct the Cas9 nuclease to the designated genomic target sites (in Table 1), the polymerase III U6 promoter (SEQ ID NO:6; see WO2015026885, WO20158026887, WO2015026883 and WO2015026886) and its related polymerase III U6 terminator sequences (TTTTTTTT) were used to control the initiation and termination of gRNA expression. Variable targeting domains of the HT1 gene editing guide RNA have been identified as HT1-CR2 and HT1CR4, which correspond to the genomic target sites HT1-TS2, HT1-TS4 and HT1-ST1-CR1 correspond to HT1-ST1-TS, respectively. The DNA encoding each of the nucleotide targeting variable domains was cloned into the gRNA expression cassette via BsbI sites using double stranded oligos. Each guide RNA expression cassette consists of a maize U6 polymerase III promoter operably linked to one of the DNA versions of the guide RNA (Table 2) and then a related U6 polymerase III terminator sequence. The DNA version of the guide RNA consists of an appropriate nucleotide variable targeting domain followed by a polynucleotide sequence capable of interacting with a double-strand break-inducing endonuclease. The HT1-ST1-CR1 guide RNA expression cassette was inserted into the ST1 Cas9 expression cassette using standard procedures.

Таблица 2. Кассеты экспрессии направляющей РНКTable 2. Guide RNA expression cassettes

Название Name ДНК-версия направляющей РНК DNA version of guide RNA Htl-CR2 Htl-CR2 SEQ ID NO:7 SEQ ID NO:7 Htl-CR4 Htl-CR4 SEQ ID NO:8 SEQ ID NO:8 Htl-STl-CRl Htl-STl-CRl SEQ ID NO:9 SEQ ID NO:9

Доставка ДНК системы направляющая РНК/эндонуклеаза Cas9 в маис.Delivery of the DNA guide RNA/Cas9 endonuclease system to maize.

Плазмиды, содержащие кассеты экспрессии Cas9 и направляющей РНК, описанные выше, подвергали совместной бомбардировке плазмидами, содержащими селектируемый маркер трансформации NPTII и гены ODP2, контролирующие развитие, усиливающие трансформацию (фактор транскрипции ODP2 с доменами АР2 (отвечающий за развитие семязачатка белок 2)) и Wuschel (20151030-6752 USPSP) в геномы элитных линий маиса. Трансформацию незрелых зародышей маиса можно выполнять с применением любого способа, известного из уровня техники, или способа, описанного ниже.Plasmids containing the expression cassettes of Cas9 and the guide RNA described above were co-bombarded with plasmids containing the selectable transformation marker NPTII and development-enhancing ODP2 genes (ODP2 transcription factor with AP2 domains (responsible for ovule development protein 2)) and Wuschel (20151030-6752 USPSP) into the genomes of elite maize lines. Transformation of immature maize germ can be performed using any method known in the art or the method described below.

В одном способе трансформации початки очищали от листовой обертки, подвергали поверхностной стерилизации в 30-50% отбеливателе Clorox вместе с 0,5% моющего средства Micro в течение 10 мин и ополаскивали дважды стерильной водой. Незрелые зародыши выделяли и помещали рубчиком вниз (щитком вверх), 25 зародышей на планшет, в среду 13224Е на 2-4 ч и затем выравнивали в пределах 2,5см целевой зоны в препарате для бомбардировки.In one transformation method, cobs were stripped of their leaf wrap, surface sterilized in 30-50% Clorox bleach along with 0.5% Micro detergent for 10 minutes, and rinsed twice with sterile water. Immature embryos were isolated and placed rib down (shield up), 25 embryos per plate, on 13224E medium for 2-4 hours and then aligned within a 2.5 cm target zone in the bombardment preparation.

ДНК плазмид приклеивали к 0,6 мкм (средний диаметр) золотым шарикам с применением запатентованной липид-полимерной смеси TransIT®-2020 (№ по кат. MIR 5404, Mirus Bio LLC, Madison, WI 5371). Раствор ДНК готовили с использованием 1 мкг плазмидной ДНК и необязательно другие конструкции готовили для совместной бомбардировки с использованием 10 нг (0,5 мкл) каждой плазмиды. К предварительно смешанной ДНК добавляли 50 мкл подготовленных частиц золота (30 мг/мл) и 1 мкл TransIT®-2020 и осторожно перемешивали. Обеспечивали инкубирование конечной смеси при постоянном перемешивании вихревым способом при низкой скорости в течение 10 мин. После периода осаждения пробирки быстро центрифугировали и удаляли жидкость. Частицы золота осаждали в микроцентрифуге при 10000 об./мин в течение 1 мин и удаляли надосадочную жидкость. Добавляли 120 мкл 100% EtOH и частицы ресуспендировали путем быстрой ультразвуковой обработки. Затем 10 мкл наносили на центр каждого макроносителя и обеспечивали высушивание в течение приблизительно 2 мин перед бомбардировкой, всего десять аликвот отбирали из каждой пробирки с подготовленными частицами/ДНК.Plasmid DNA was glued to 0.6 μm (average diameter) gold beads using the proprietary TransIT®-2020 lipid polymer blend (Cat. No. MIR 5404, Mirus Bio LLC, Madison, WI 5371). A DNA solution was prepared using 1 μg of plasmid DNA and optionally other constructs were prepared for co-bombardment using 10 ng (0.5 μl) of each plasmid. 50 µl of prepared gold particles (30 mg/ml) and 1 µl of TransIT®-2020 were added to the premixed DNA and mixed gently. The final mixture was allowed to incubate with constant vortexing at low speed for 10 minutes. After a settling period, the tubes were rapidly centrifuged and the liquid removed. Gold particles were precipitated in a microcentrifuge at 10,000 rpm for 1 min and the supernatant was removed. 120 μl 100% EtOH was added and the particles were resuspended by rapid sonication. Then 10 μl was applied to the center of each macrocarrier and allowed to dry for approximately 2 minutes before bombardment, a total of ten aliquots were withdrawn from each prepared particle/DNA tube.

Планшеты с образцами бомбардировали с помощью Biolistic PDA-1000/He (Bio-Rad). ЭмбрионыSample plates were bombarded with a Biolistic PDA-1000/He (Bio-Rad). Embryos

- 22 041676 находятся на расстоянии 6 см от макроносителя с зазором 1/8 дюйма между разрывным диском с давлением разрыва 200 фунтов на квадратный дюйм и макроносителем. Все образцы получали однократный выстрел.- 22 041676 are 6 cm from the macro carrier with a 1/8 inch gap between the 200 psi burst pressure disc and the macro carrier. All samples received a single shot.

После бомбардировки эмбрионы инкубовали на бомбардировочной пластине в течение ~ 20 ч, затем переносили в 13266L (среда для отдыха/индукции) на 7-9 дней при значениях температуры в диапазоне 26-30°С. Затем эмбрионы переносили в среду для созревания 289Н на ~ 21 день. Затем зрелые соматические зародыши переносили в среду для прорастания 272G и переносили на свет. Примерно через 1-2 недели для анализа отбирали проростки, содержащие жизнеспособные побеги и корни, и отправляли в теплицу, где их переносили в лотки (эквивалентные 2,5-дюймовому горшку), содержащие почву для горшков. Через 1-2 недели растения переносили в 600 классических горшков (1,6 галлона) и выращивали до зрелости.After bombardment, embryos were incubated on a bombardment plate for ~20 h, then transferred to 13266L (rest/induction medium) for 7-9 days at temperatures ranging from 26-30°C. Embryos were then transferred to 289H maturation medium at ~21 days. Then, mature somatic embryos were transferred to 272G germination medium and exposed to light. After about 1-2 weeks, seedlings containing viable shoots and roots were selected for analysis and sent to the greenhouse where they were transferred to trays (equivalent to a 2.5-inch pot) containing potting soil. After 1-2 weeks, the plants were transferred to 600 classic pots (1.6 gal) and grown to maturity.

Среда.Wednesday.

Среда для бомбардировки (13224Е) содержит 4,0 г/л основных солей N6 (SIGMA С-1416), 1,0 мл/л витаминной смеси Эрикссона (1000Х SIGMA-1511), 0,5 мг/л тиамина-HCl, 190,0 г/л сахарозы, 1,0 мг/л 2,4-D и 2,88 г/л L-пролина (доведенных до объема с помощью D-I H2O после доведения рН до 5,8 с помощью КОН); 6,3 г/л агара Sigma (добавленного после доведения до объема с помощью D-I H2O) и 8,5 мг/л нитрата серебра (добавленного после стерилизации среды и охлаждения до комнатной температуры).Bombardment medium (13224E) contains 4.0 g/l basic N6 salts (SIGMA C-1416), 1.0 ml/l Ericsson's vitamin mixture (1000X SIGMA-1511), 0.5 mg/l thiamine-HCl, 190 0 g/l sucrose, 1.0 mg/l 2,4-D and 2.88 g/l L-proline (brought to volume with DI H 2 O after adjusting the pH to 5.8 with KOH); 6.3 g/l Sigma agar (added after making up to volume with DI H2O) and 8.5 mg/l silver nitrate (added after sterilizing the medium and cooling to room temperature).

Среда для отбора (13266L) содержит 1650 мг/л нитрата аммония, 277,8 мг/л сульфата аммония, 5278 мг/л нитрата калия, хлорид кальция, 407,4 мг/л безводного хлорида кальция, 234,92 мг/л безводного сульфата магния, 410 мг/л безводного фосфата калия, 8 мг/л одноосновной борной кислоты, 8,6 мг/л, сульфата цинка· 7Н2О, 1,28 мг/л йодида калия, 44,54 мг/л сульфата железа-7Н2О, 59,46 мг/л Na2edta-2H2O, 0,025 мг/л хлорида кобальтаФН2О, 0,4 мг/л молибденовой кислоты (натриевая соль/2Н2О, 0,025 мг/л сульфата медш5Н2О, 6 мг/л моногидрата сульфата марганца, 2 мг/л тиамина, 0,6 мл/л b5h микросолей 1000х, 0,4 мл/л витаминов Эрикссона 1000х, 6 мл/л s&h исходного раствора витаминов 100х, 1,98 г/л Lпролина, 3,4 мг/л нитрата серебра, 0,3 г/л казеинового гидролизата (кислоты), 20 г/л сахарозы, 0,6 г/л глюкозы, 0,8 мг/л 2,4-d, 1,2 мг/л дикамбы, б г/л tc агара, 100 мг/л агрибио карбенициллина, 25 мг/л цефотаксима и 150 мг/л генетицина (g418).Sampling medium (13266L) contains 1650 mg/l ammonium nitrate, 277.8 mg/l ammonium sulfate, 5278 mg/l potassium nitrate, calcium chloride, 407.4 mg/l anhydrous calcium chloride, 234.92 mg/l anhydrous magnesium sulfate, 410 mg/l anhydrous potassium phosphate, 8 mg/l monobasic boric acid, 8.6 mg/l, zinc sulfate 7H2O, 1.28 mg/l potassium iodide, 44.54 mg/l iron sulfate-7H 2 O, 59.46 mg / l Na2edta-2H2O, 0.025 mg / l cobalt chloride FN 2 O, 0.4 mg / l molybdic acid (sodium salt / 2H 2 O, 0.025 mg / l copper sulfate 5H 2 O, 6 mg / l manganese sulfate monohydrate, 2 mg/l thiamine, 0.6 ml/l b5h microsalts 1000x, 0.4 ml/l Eriksson vitamins 1000x, 6 ml/l s&h stock solution of vitamins 100x, 1.98 g/l Lproline, 3 .4 mg/l silver nitrate, 0.3 g/l casein hydrolyzate (acid), 20 g/l sucrose, 0.6 g/l glucose, 0.8 mg/l 2,4-d, 1.2 mg /l dicamba, b g/l tc agar, 100 mg/l agribio carbenicillin, 25 mg/l cefotaxime and 150 mg/l geneticin (g418).

Среда для регенерации растений (289Н) содержала 4,3 г/л солей по MS (GIBCO 11117-074), 5,0 мл/л исходного раствора витаминов по MS (0,100 г никотиновой кислоты, 0,02 г/л тиамина-HCL, 0,10 г/л пиридоксина-HCL и 0,40 г/л глицина, доведенных до объема с помощью очищенной D-I H2O) (Murashige and Skoog (1962) Physiol. Plant. 15:473), 100 мг/л миоинозита, 0,5 мг/л зеатина, 60 г/л сахарозы и 1,0 мл/л 0,1 мМ абсцизовой кислоты (доведенных до объема очищенной D-I H2O после доведения рН до 5,6); 8,0 г/л агара Sigma (добавленного после доведения до объема с помощью D-I Н2О), а также 1,0 мг/л индолилуксусной кислоты и 150 мг/л генетицина (G418) (добавленных после стерилизации среды и охлаждения до 60°С).Plant regeneration medium (289H) contained 4.3 g/L MS salts (GIBCO 11117-074), 5.0 mL/L MS vitamin stock solution (0.100 g nicotinic acid, 0.02 g/L thiamine-HCL , 0.10 g/l pyridoxine-HCL and 0.40 g/l glycine, brought to volume with purified DI H 2 O) (Murashige and Skoog (1962) Physiol. Plant. 15:473), 100 mg/l myoinositol, 0.5 mg/l zeatin, 60 g/l sucrose and 1.0 ml/l 0.1 mM abscisic acid (brought to volume with purified DI H2O after adjusting the pH to 5.6); 8.0 g/l Sigma agar (added after making up to volume with DI H 2 O), as well as 1.0 mg/l indoleacetic acid and 150 mg/l geneticin (G418) (added after sterilizing the medium and cooling to 60 °C).

Безгормональная среда (272G) содержала 4,3 г/л солей по MS (GIBCO 11117-074), 5,0 мл/л исходного раствора витаминов по MS (0,100 г/л никотиновой кислоты, 0,02 г/л тиамина-HCl, 0,10 г/л пиридоксина-HCl и 0,40 г/л глицина, доведенных до объема с помощью очищенной D-I H2O), 0,1 г/л миоинозита и 40,0 г/л сахарозы (доведенных до объема с помощью очищенной D-I H2O после доведения рН до 5,6); и 0,5 мг/л IBA и 150 мг/л генетицина (G418) и 6 г/л бактоагара (добавленного после доведения до объема с помощью очищенной D-I H2O), ее стерилизовали и охлаждали до 60°С.Hormone-free medium (272G) contained 4.3 g/L MS salts (GIBCO 11117-074), 5.0 mL/L MS vitamin stock solution (0.100 g/L nicotinic acid, 0.02 g/L thiamine-HCl , 0.10 g/l pyridoxine-HCl and 0.40 g/l glycine, brought to volume with purified DI H2O), 0.1 g/l myoinositol and 40.0 g/l sucrose (brought to volume with purified DI H2O after adjusting the pH to 5.6); and 0.5 mg/l IBA and 150 mg/l geneticin (G418) and 6 g/l bactoagar (added after making up to volume with purified DI H 2 O), it was sterilized and cooled to 60°C.

Скрининг растений Т0 и характеристика трансформанта Для идентификации положительных трансформантов с делецией повторяющихся последовательностей, геномную ДНК выделяли из ткани листьев растений Т0 и проводили ПЦР с использованием мастер-микса Phusion (Thermo Scientific F-581) и праймеров, перечисленных в табл. 3. Расположения праймеров показаны на фиг. 1. Ампликоны получали при расщеплении TS2/TS4 или TS2/ST1-TS1; последовательность (~35 т.о.) между двумя сайтами удаляли, а остальные последовательности объединяли. Получали варианты с делецией с ожидаемым размером продукта.Screening of T0 Plants and Transformant Characterization To identify positive transformants with deletion of repeat sequences, genomic DNA was isolated from leaf tissue of T0 plants and PCR was performed using the Phusion Master Mix (Thermo Scientific F-581) and the primers listed in Table 1. 3. Primer arrangements are shown in FIG. 1. Amplicons were obtained by digesting TS2/TS4 or TS2/ST1-TS1; the sequence (~35 kb) between the two sites was deleted, and the remaining sequences were combined. Received options with a deletion with the expected size of the product.

Секвенирование следующего поколения (NGS) применяли для оценки последовательностей участков границы сплайсинга у положительных трансформантов с делецией. Участки границы сплайсинга амплифицировали с помощью ПЦР посредством мастер-микса для высокоточной ПЦР PHUSION® (Thermo Scientific, F-531). Одни и те же праймеры можно использовать как для делеций CR2/CR4, так и для CR2/ST1-CR1. Праймеры, применяемые в первичной реакции ПЦР, показаны в табл. 3, а праймеры, применяемые во вторичной реакции ПЦР, представлены в SEQ ID NO:12 и SEQ ID NO:13. NNNNNNNN в обратном праймере представляет собой последовательность штрих-кодов, соответствующую местоположению образца на планшете. На фиг. 2А показана последовательность участков границы сплайсинга, полученная при делеции TS2/TSS4; и на фиг. 2В показаны последовательности участков границы сплайсинга, полученные при делеции TS2/ST1-TS1. Краткое описание полученных трансформантов Т0 с делецией представлено в табл. 4.Next generation sequencing (NGS) was used to evaluate the sequences of the splice boundary regions of the deletion positive transformants. Splice boundary regions were amplified by PCR with the PHUSION® High Fidelity PCR Master Mix (Thermo Scientific, F-531). The same primers can be used for both CR2/CR4 and CR2/ST1-CR1 deletions. The primers used in the primary PCR reaction are shown in Table 1. 3 and the primers used in the secondary PCR reaction are shown in SEQ ID NO:12 and SEQ ID NO:13. NNNNNNNN in the reverse primer is a barcode sequence corresponding to the location of the sample on the plate. In FIG. 2A shows the sequence of splicing boundary regions resulting from a TS2/TSS4 deletion; and in FIG. 2B shows sequences of splicing boundary regions obtained from a TS2/ST1-TS1 deletion. A brief description of the resulting T0 transformants with a deletion is presented in Table 1. 4.

- 23 041676- 23 041676

Таблица 3. Праймеры, используемые для скрининга делеции повторяющихся последовательностейTable 3. Primers used to screen for deletion of repeat sequences

Название делеции Name deletions Название праймера Primer name Ориентация праймера Primer orientation Праймер SEQ ID NO: Primer SEQ ID NO: Htl-CR2-CR4 de Htl-CR2-CR4de Htlf3 Htlf3 Прямой Straight SEQ ID NO:10 SEQ ID NO:10 Htlr4v2 Htlr4v2 Обратный Back SEQ ID NO:11 SEQ ID NO:11

Таблица 4. Краткое описание трансформантов Т0 с делециейTable 4. Brief description of deletion T0 transformants

Направляющая guide Количество эмбрионов, подвергшихся бомбардировке Number of embryos bombarded Количество растений ТО, подвергшихся скринингу Number of TO plants screened Количество растений с делецией Number of plants with a deletion CR2/CR4 CR2/CR4 2000 2000 178 178 59 59 CR2/ST1 CR2/ST1 1000 1000 108 108 29 29

Анализ Т1.T1 analysis.

Растения Т0 с повторяющейся последовательностью Ht1 переносили в контролируемую среду. Пыльцу из растений Т0 переносили в рекуррентные родительские растения для получения семян. Растения Т1 подвергали более обширному опредлеению молекулярной характеристики, не только с целью подтвердить, что мутации, наблюдаемые в растении Т0, были стабильно унаследованы, но также и убедиться, что растения Т1 или более позднего поколения были свободны от любых чужеродных элементов ДНК, используемых в процессе трансформации. Во-первых, qPCR выполняли для всех хелперных генов, в том числе Cas9, направляющая РНК, селективный маркер трансформации (NPTII) и гены, усиливающие трансформацию ODP2 и WUS2, чтобы убедиться, что гены отделены от полученных мутантных аллелей. Образцы растений Т1 будут отобраны с использованием анализа секвенирования по Саузерну (SbS), чтобы дополнительно продемонстрировать, что растения не содержат какой-либо чужеродной ДНК.T0 plants with a repetitive Ht1 sequence were transferred to a controlled environment. Pollen from T0 plants was transferred to recurrent parent plants to obtain seeds. T1 plants were subjected to more extensive molecular characterization, not only to confirm that the mutations observed in the T0 plant were stably inherited, but also to ensure that T1 or later generation plants were free of any foreign DNA elements used in the process. transformations. First, qPCR was performed on all helper genes, including Cas9, guide RNA, selective marker of transformation (NPTII), and transformation-enhancing genes ODP2 and WUS2, to ensure that the genes were separated from the resulting mutant alleles. T1 plants will be sampled using Southern Sequencing (SbS) analysis to further demonstrate that the plants do not contain any foreign DNA.

Пример 2.Example 2

Редактирование генов НТ1 посредством замещения аллеля.HT1 gene editing by allele substitution.

Отбои целевого сайта.Target site crashes.

Сайт-направленную нуклеазную систему gRNA/Cas9, описанную в WO2015026885, WO20158026887, WO2015026883 и WO2015026886, использовали для редактирования гена Ht1 путем замещения нативного аллеля связанным с устойчивостью аллелем Ht1 из PH4GP (US2010095395; SEQ ID NO:65). Следующие пары целевых сайтов использовали для удаления всего аллеля Ht1 из линии РН184С (US 8445763), включая предполагаемый промотор, кодирующую последовательность и 1 т.о. 3'-UTR: HT1-TS6 и HT1-TS9, а также HT1-TS7 и HT1-TS10. Расположение каждого целевого сайта и схематическое изображение обмена аллелями показаны на фиг. 3. Целевые последовательности перечислены в табл. 5. Матрицу для репарации ДНК совместно доставляли с плазмидами Cas9 и направляющей РНК.The site-directed gRNA/Cas9 nuclease system described in WO2015026885, WO20158026887, WO2015026883 and WO2015026886 was used to edit the Ht1 gene by replacing the native allele with the resistance-associated Ht1 allele from PH4GP (US2010095395; SEQ ID NO:65). The following target site pairs were used to remove the entire Ht1 allele from the PH184C line (US 8445763), including the putative promoter, coding sequence and 1 kb. 3'-UTR: HT1-TS6 and HT1-TS9, as well as HT1-TS7 and HT1-TS10. The location of each target site and a schematic representation of the allele exchange are shown in FIG. 3. Target sequences are listed in table. 5. DNA repair template co-delivered with Cas9 plasmids and guide RNA.

Таблица 5. Последовательности целевого сайта для аллельного замещения НТ1Table 5. Target site sequences for HT1 allelic substitution

Обозначение целевого сайта Destination site designation Последовательность геномного целевого сайта маиса Maize genomic target site sequence Последовательность PAM Subsequence PAM HT1-TS6 HT1-TS6 SEQ ID NO:14 SEQ ID NO:14 TGG TGG HT1-TS7 HT1-TS7 SEQ ID NO:15 SEQ ID NO:15 CGG CGG HT1-TS9 HT1-TS9 SEQ ID NO:16 SEQ ID NO:16 AGG AGG HT1-TS10 HT1-TS10 SEQ ID NO:17 SEQ ID NO:17 AGG AGG

Векторная конструкция Cas9.Cas9 vector design.

См. пример 1.See example 1.

Векторная конструкция направляющей РНК.Guide RNA vector design.

С целью направления нуклеазы Cas9 в обозначенные геномные целевые сайты (в табл. 4), промотор U6 полимеразы III (SEQ ID NO:6; см. WO2015026885, WO20158026887, WO2015026883 и WO2015026886) и его родственные терминаторные последовательности U6 полимеразы III (TTTTTTTT) использовали для управления инициацией и терминацией экспрессии gRNA. Вариабельные нацеливающие домены направляющей РНК для редактирования генов НТ1 идентифицированы как HT1-CR6, HT1CR7, HT1-CR9 и HT1-CR10, которые соответствуют геномным целевым сайтам HT1-TS6, HT1-TS7, HT1TS9 и HT1-TS10, HT1-TS10, соответственно. Олиго, содержащие ДНК, кодирующую каждый из вариабельных доменов, нацеленных на нуклеотиды, синтезировали и клонированы в кассету экспрессииIn order to direct the Cas9 nuclease to the designated genomic target sites (in Table 4), the polymerase III U6 promoter (SEQ ID NO:6; see WO2015026885, WO20158026887, WO2015026883 and WO2015026886) and its related polymerase III U6 terminator sequences (TTTTTTTT) were used to control the initiation and termination of gRNA expression. HT1 gene editing guide RNA variable targeting domains have been identified as HT1-CR6, HT1CR7, HT1-CR9, and HT1-CR10, which correspond to the genomic target sites HT1-TS6, HT1-TS7, HT1TS9 and HT1-TS10, HT1-TS10, respectively. Oligo containing DNA encoding each of the nucleotide targeting variable domains were synthesized and cloned into an expression cassette.

- 24 041676 gRNA, как описано в примере 1. Каждая кассета экспрессии направляющей РНК состоит из промотора U6 полимеразы III маиса, функционально связанного с одной из ДНК-версий направляющей РНК (табл. 6), и затем родственной терминаторной последовательности U6 полимеразы III. ДНК-версия направляющей РНК состоит из соответствующего нуклеотидного вариабельного нацеливающего домена, за которым следует полинуклеотидная последовательность, способная взаимодействовать с эндонуклеазой, индуцирующей двухнитевый разрыв.- 24 041676 gRNA as described in Example 1. Each guide RNA expression cassette consists of the maize polymerase III U6 promoter operably linked to one of the DNA versions of the guide RNA (Table 6) and then a cognate U6 polymerase III terminator sequence. The DNA version of the guide RNA consists of an appropriate nucleotide variable targeting domain followed by a polynucleotide sequence capable of interacting with a double-strand break-inducing endonuclease.

Таблица 6. Кассеты экспрессии направляющей РНК для обмена аллелей Ht1Table 6. Guide RNA expression cassettes for Ht1 allele exchange

Название Name ДНК-версия направляющей РНК SEQ ID NO: DNA version of guide RNA SEQID NO: HT1-CR6 HT1-CR6 SEQ ID NO:18 SEQ ID NO:18 HT1-CR9 HT1-CR9 SEQ ID NO:19 SEQ ID NO:19 HT1-CR7 HT1-CR7 SEQ ID NO:20 SEQ ID NO:20 HT1-CR10 HT1-CR10 SEQ I D NO:21 SEQ ID NO:21

Векторная конструкция матрицы для репарации.Vector design of matrix for reparation.

Матрица для замещения/замены CR6/CR9 содержит связанный с устойчивостью аллель ZM-HT1(PH4GP) и последовательности гомологии, фланкирующие 5' HT1-TS6 и 3' HT1-TS9; матрица для замещения CR7/CR10 содержит тот же связанный с устойчивостью аллель ZM-HT1-(PH4GP) и последовательности гомологии, фланкирующие 5' HT1-TS7 и 3' HT1-TS11 в линии РН184С. Последовательности плеч гомологии (SEQ ID NO:81-84) синтезировали и затем клонировали с помощью заместительных геномных последовательностей ZM-HT1-(PH4GP) с помощью стандартного бесшовного способа клонирования Гибсона.The CR6/CR9 substitution/replacement template contains the ZM-HT1(PH4GP) resistance-associated allele and homology sequences flanking 5'HT1-TS6 and 3'HT1-TS9; the CR7/CR10 replacement template contains the same resistance-associated ZM-HT1-(PH4GP) allele and homology sequences flanking 5'HT1-TS7 and 3'HT1-TS11 in the PH184C lineage. Homology arm sequences (SEQ ID NOs: 81-84) were synthesized and then cloned with ZM-HT1-(PH4GP) replacement genomic sequences using the standard Gibson seamless cloning method.

Доставка ДНК системы направляющая РНК/эндонуклеаза Cas9 в маис.Delivery of the DNA guide RNA/Cas9 endonuclease system to maize.

Плазмиды, содержащие кассеты экспрессии Cas9, направляющей РНК, а также матрицу для замещения, описанные выше, подвергали совместной бомбардировке плазмидами, содержащими селектируемый маркер трансформации NPTII и гены ODP2, контролирующие развитие, усиливающие трансформацию (фактор транскрипции 0DP2 с доменами АР2 (отвечающий за развитие семязачатка белок 2)) и Wuschel (20151030-6752 USPSP) в геномы элитных линий маиса. Трансформацию незрелых зародышей маиса можно выполнять с применением любого способа, известного из уровня техники, или способа, описанного в примере 1.Plasmids containing Cas9 expression cassettes, guide RNA, and the replacement template described above were co-bombarded with plasmids containing the selectable transformation marker NPTII and developmental-enhancing ODP2 genes (0DP2 transcription factor with AP2 domains (responsible for ovule development). protein 2)) and Wuschel (20151030-6752 USPSP) into the genomes of elite maize lines. Transformation of immature maize germ can be performed using any method known in the art or the method described in Example 1.

Скрининг растений Т0 и характеристика трансформанта.Screening of T0 plants and characterization of the transformant.

Протокол экстракции ДНК из листьев растения Т0 является таким же, как описано в примере 1. Для выявления положительных трансформантов при обмене была выполнена ПЦР с использованием готовой смеси Sigma Extract-N-Amp PCR. ПЦР проводили для анализа участков границы сплайсинга HR1 с использованием пары праймеров Ht1HR1f1/Ht1HR1r1, тогда как первичную ПЦР с парой праймеров Ht1HR2f1 и Ht1HR2r1 комбинировали с вторичной qPCR с аллельной дифференциацией для скрининга участков границы сплайсинга HR2 из-за высокой гомологии предполагаемых отредактированных вариантов и немодифицированной геномной последовательности. Праймеры для первичной ПЦР и праймеры и зонды для 2-ой qPCR перечислены в табл. 7. Тот же анализ, описанный ранее для обмена CR6/CR9, также используется для скрининга трансформантов обмена аллелей CR7/CR10.The protocol for extracting DNA from the leaves of the T0 plant is the same as described in Example 1. PCR was performed using a premixed Sigma Extract-N-Amp PCR to identify positive transformants upon exchange. PCR was performed to analyze HR1 splice boundary regions using primer pair Ht1HR1f1/Ht1HR1r1, while primary PCR with primer pair Ht1HR2f1 and Ht1HR2r1 was combined with secondary qPCR with allelic differentiation to screen for HR2 splice boundary regions due to high homology of putative edited variants and unmodified genomic sequences. Primers for primary PCR and primers and probes for the 2nd qPCR are listed in table. 7. The same assay previously described for CR6/CR9 exchange is also used to screen transformants for CR7/CR10 allele exchange.

Таблица 7. Праймеры, используемые для скрининга вариантов обмена аллелей Ht1Table 7. Primers used to screen for Ht1 allele exchange variants

Название праймера Primer name Ориентация праймера Primer orientation Последовательность праймера для первой ПЦР Primer sequence for the first PCR Участок границы сплайсинга HR1 Plot splicing boundaries HR1 HtlHRlfl HtlHRlfl Прямой Straight SEQ ID NO:22 SEQ ID NO:22 HtlHRlrl HtlHRlrl Обратный Back SEQ ID NO:23 SEQ ID NO:23 Участок границы сплайсинга HR2 Plot splicing boundaries HR2 HtlHR2fl HtlHR2fl Прямой Straight SEQ ID NO:24 SEQ ID NO:24 HtlHR2rl HtlHR2rl Обратный Back SEQ ID NO:25 SEQ ID NO:25 Участок границы сплайсинга HR2 2-ой qPCR Plot splicing boundaries HR2 2nd qPCR hdr2b_f hdr2b_f Прямой Straight SEQ ID NO:26 SEQ ID NO:26 hdr2b_r hdr2b_r Обратный Back SEQ ID NO:27 SEQ ID NO:27 hdr2b_PV hdr2b_PV Зонд Probe 6FAM-SEQ ID NO:28 6FAM-SEQ ID NO:28 hdr2b_PG hdr2b_PG Зонд Probe VIC-SEQ ID NO:29 VIC-SEQ ID NO:29

- 25 041676- 25 041676

Идентифицированные варианты обмена аллелей будут дополнительно молекулярно охарактеризованы, и qPCR будет использоваться для скрининга растений T1 (BCO) на нулевые сегреганты, которые, как ожидается, не содержат плазмидную ДНК, используемую во время инициации трансформации. Секвенирование по Саузерну также будет выполняться для подтверждения нулевых сегрегантных растений. В табл. 8 показано краткое описание результатов Т0, полученных в экспериментах по обмену аллелями. Три растения Т0 были идентифицированы как потенциальные варианты обмена аллелей среди 300 растений Т0, подвергшихся скринингу.The allele exchange variants identified will be further molecularly characterized and qPCR will be used to screen T1 (BCO) plants for null segregants that are not expected to contain the plasmid DNA used during transformation initiation. Southern sequencing will also be performed to confirm null segregant plants. In table. 8 shows a summary of the T0 results obtained from allele exchange experiments. Three T0 plants were identified as potential allele exchange variants among the 300 screened T0 plants.

Таблица 8. Краткое описание результатов скрининга обмена аллелей Т0Table 8. Summary of results of T0 allele exchange screening

Количество ТО, подвергшиеся скринингу Number of TOs screened Количество ТО HR1 Number of maintenance HR1 Количество ТО HR2 Number of maintenance HR2 Количество ТО HR1+HR2 Number of maintenance HR1+HR2 100 100 2 2 2 2 1 1 150 150 13 13 3 3 1 1 50 50 4 4 3 3 1 1

Пример 3.Example 3

Редактирование генов NLB18 посредством замещения аллеля.Editing of NLB18 genes through allele substitution.

Отбор целевого сайта.Target site selection.

Ген ассоциированной с клеточной стенкой киназы (WAK), NLB18, был идентифицирован и подтвержден как ген устойчивости к северной пятнистости листьев (WO2011163590). Ген NLB18 кластеризован с NLB17 на длинном плече хромосомы 8. Гены NLB18 и NLB17 находятся на расстоянии 6,9 т.о. и имеют высокую степень гомологии; таким образом, идентификация уникального целевого сайта для обмена аллелями NLB18 является сложной задачей. Было идентифицировано множество сайтов и протестировано направляющие РНК. Направляющие, которые вырезали только область гена NLB18, а не область гена NLB17, были отобраны для замены аллеля NLB18.The cell wall associated kinase (WAK) gene, NLB18, has been identified and validated as a northern leaf spot resistance gene (WO2011163590). The NLB18 gene is clustered with NLB17 on the long arm of chromosome 8. The NLB18 and NLB17 genes are 6.9 kb apart. and have a high degree of homology; thus, identifying a unique target site for NLB18 allele exchange is challenging. Many sites have been identified and guide RNAs tested. Guides that excised only the NLB18 gene region and not the NLB17 gene region were selected to replace the NLB18 allele.

Сайт-направленную нуклеазную систему gRNA/Cas9, описанную в WO2015026885, WO20158026887, WO2015026883 и WO2015026886, использовали для редактирования гена NLB18. Следующие пары целевых сайтов использовали для удаления всего аллеля NLB18 из линии РН184С, включая потенциальный промотор, кодирующую последовательность и 3'-UTR: NLB18-TS1 и NLB18-TS4, а также NLB18-TS8 и NLB18-TS4. Расположение каждого целевого сайта в локусе NLB18 и схематическое изображение обмена аллелями показаны на фиг. 5. Целевые последовательности перечислены в табл. 9. Удаленный аллель замещен связанным с устойчивостью аллелем NLB18 из PH26N (US 6765132; SEQ ID NO:70); матрицу для репарации ДНК совместно доставляли с плазмидами Cas9 и направляющей РНК.The site-directed gRNA/Cas9 nuclease system described in WO2015026885, WO20158026887, WO2015026883 and WO2015026886 was used to edit the NLB18 gene. The following target site pairs were used to remove the entire NLB18 allele from the PH184C line, including the potential promoter, coding sequence, and 3'UTR: NLB18-TS1 and NLB18-TS4, and NLB18-TS8 and NLB18-TS4. The location of each target site at the NLB18 locus and a schematic representation of the allele exchange are shown in FIG. 5. Target sequences are listed in table. 9. The deleted allele is replaced by the resistance-associated allele NLB18 from PH26N (US 6765132; SEQ ID NO:70); DNA repair template was co-delivered with Cas9 plasmids and guide RNA.

Таблица 9. Последовательности целевого сайта для аллельного замещения NLB18Table 9. Target site sequences for NLB18 allelic substitution

Обозначение целевого сайта Destination site designation Последовательность геномного целевого сайта маиса Maize genomic target site sequence Последовательность PAM Subsequence PAM NLB18-TS1 NLB18-TS1 SEQ ID NO:30 SEQ ID NO:30 TGG TGG NLB18-TS8 NLB18-TS8 SEQ ID NO:31 SEQ ID NO:31 CGG CGG NLB18-TS4 NLB18-TS4 SEQ ID NO:32 SEQ ID NO:32 GGG GGG

Векторная конструкция Cas9.Cas9 vector design.

См. пример 1.See example 1.

Векторная конструкция направляющей РНК.Guide RNA vector design.

С целью направления нуклеазы Cas9 в обозначенные геномные целевые сайты (в табл. 9), промотор U6 полимеразы III (SEQ ID NO:6; см. WO2015026885, WO20158026887, WO2015026883 и WO2015026886) и его родственные терминаторные последовательности U6 полимеразы III (TTTTTTTT) использовали для управления инициацией и терминацией экспрессии gRNA. Вариабельные нацеливающие домены направляющей РНК для гена NLB18 идентифицированы как NLB18-CR1, NLB18-CR8 и NLB18-CR4, которые соответствуют геномным целевым сайтам NLB18-TS1, NLB18-TS8 и NLB18-TS4, соответственно. Олиго, содержащие ДНК, кодирующую каждый из вариабельных доменов, нацеленных на нуклеотиды, были синтезированы и клонированы в кассету экспрессии gRNA, как описано выше в примере 1. Каждая кассета экспрессии направляющей РНК состоит из промотора U6 полимеразы III маиса, функционально связанного с одной из ДНК-версий направляющей РНК (Табл. 10), и затем родственной терминаторной последовательности U6 полимеразы III. ДНК-версия направляющей РНК состоит из соответствующего нуклеотидного вариабельного нацеливающего домена, за которым следует полинуклеотидная последовательность, способная взаимодействовать с эндонуклеазой, индуцирующей двухнитевый разрыв.In order to direct the Cas9 nuclease to the designated genomic target sites (in Table 9), the polymerase III U6 promoter (SEQ ID NO:6; see WO2015026885, WO20158026887, WO2015026883 and WO2015026886) and its related polymerase III U6 terminator sequences (TTTTTTTT) were used to control the initiation and termination of gRNA expression. Variable targeting domains of the guide RNA for the NLB18 gene have been identified as NLB18-CR1, NLB18-CR8, and NLB18-CR4, which correspond to the genomic target sites of NLB18-TS1, NLB18-TS8, and NLB18-TS4, respectively. Oligo containing DNA encoding each of the nucleotide-targeting variable domains were synthesized and cloned into a gRNA expression cassette as described in Example 1 above. Each guide RNA expression cassette consists of the maize polymerase III U6 promoter operably linked to one of the DNA -versions of the guide RNA (Table 10) and then the related U6 polymerase III terminator sequence. The DNA version of the guide RNA consists of an appropriate nucleotide variable targeting domain followed by a polynucleotide sequence capable of interacting with a double-strand break-inducing endonuclease.

- 26 041676- 26 041676

Таблица 10. Кассеты экспрессии направляющей РНК для обмена аллелей NLB18Table 10. Guide RNA expression cassettes for NLB18 allele exchange

Название Name ДНК-версия направляющей РНК SEQ ID NO: DNA version of the guide RNA SEQID NO: NLB18-CR1 NLB18-CR1 SEQ ID NO:33 SEQ ID NO:33 NLB18-CR8 NLB18-CR8 SEQ ID NO:34 SEQ ID NO:34

NLB18-CR4 SEQ ID NO:35NLB18-CR4 SEQ ID NO:35

Векторная конструкция матрицы для замещения.Vector design of a substitution matrix.

Матрицы для замещения/замены NLB18-CR1/CR4 содержат связанный с устойчивостью аллель ZM-NLB18 (из PH26N) и последовательности гомологии, фланкирующие 5' NLB18-TS1 (SEQ ID NO:67) и 3' NLB18-TS4 (SEQ ID NO:68) в РН184С; матрицы для замещения NLB18-CR1/CR4 содержат тот же связанный с устойчивостью аллель ZM-NLB18 (из PH2 6N) и последовательности гомологии, фланкирующие 5' NLB18-TS8 (SEQ ID NO:69) и 3' NLB18-TS4 (SEQ ID NO:68) в РН184С. SEQ ID NO:66 представляет собой нуклеотидную последовательность NLB18 из РН184С, в том числе от 5' NLB18-CR8 по 3' NLB18-CR4. Последовательности плеч гомологии синтезировали с дополнительной последовательностью, содержащей сайты рестрикции; после рестрикционного расщепления их собирали вместе с желаемым связанным с устойчивостью аллелем NLB18 (из PH26N) в остов дрожжей, используя стандартные протоколы сборки для дрожжей in vivo. Плазмиды из объединенных дрожжевых трансформантов реакции сборки извлекали в Е. coli, и плазмиды, прошедшие контроль качества, использовали в качестве матриц для совместной бомбардировки.NLB18-CR1/CR4 substitution/replacement templates contain the resistance-associated ZM-NLB18 allele (from PH26N) and homology sequences flanking 5' NLB18-TS1 (SEQ ID NO:67) and 3' NLB18-TS4 (SEQ ID NO: 68) in RN184C; matrices for NLB18-CR1/CR4 substitution contain the same resistance-associated ZM-NLB18 allele (from PH2 6N) and homology sequences flanking 5' NLB18-TS8 (SEQ ID NO:69) and 3' NLB18-TS4 (SEQ ID NO :68) in PH184C. SEQ ID NO:66 is the nucleotide sequence of NLB18 from PH184C, including 5' NLB18-CR8 to 3' NLB18-CR4. Homology arm sequences were synthesized with an additional sequence containing restriction sites; after restriction digestion, they were assembled together with the desired resistance-associated NLB18 allele (from PH26N) into a yeast backbone using standard in vivo yeast assembly protocols. Plasmids from pooled yeast transformants of the assembly reaction were recovered in E. coli and quality controlled plasmids were used as co-bombardment templates.

Доставка ДНК системы направляющая РНК/эндонуклеаза Cas9 в маис.Delivery of the DNA guide RNA/Cas9 endonuclease system to maize.

Плазмиды, содержащие кассеты экспрессии Cas9, направляющей РНК, а также матрицы для замещения, описанные выше, подвергали бомбардировке плазмидами, содержащими селектируемый маркер трансформации NPTII и гены ODP2, контролирующие развитие, усиливающие трансформацию (фактор транскрипции ODP2 с доменами АР2 (отвечающий за развитие семязачатка белок 2)) и Wuschel (20151030-6752 USPSP) в геномы элитных линий маиса. Трансформацию незрелых зародышей маиса можно выполнять с применением любого способа, известного из уровня техники, или с применением способа, описанного в примере 1.Plasmids containing expression cassettes for Cas9, guide RNA, and substitution templates described above were bombarded with plasmids containing the selectable transformation marker NPTII and developmental-enhancing ODP2 genes (ODP2 transcription factor with AP2 domains (responsible for ovule development protein 2)) and Wuschel (20151030-6752 USPSP) into the genomes of elite maize lines. Transformation of immature maize germ can be performed using any method known in the art or using the method described in Example 1.

Скрининг растений Т0 и характеристика трансформанта.Screening of T0 plants and characterization of the transformant.

Скрининг будет проводиться аналогично экспериментам, описанным ранее.Screening will be carried out similarly to the experiments described earlier.

Пример 4.Example 4

Перемещение связанных с устойчивостью аллелей НТ1 и NLB18 в сложный локус признаков.Movement of resistance-associated HT1 and NLB18 alleles into a complex trait locus.

Отбор целевых сайтов.Selection of target sites.

Геномное окно маиса, простирающееся от ZMO1:13.7MM до ZMO1:16.4MM на хромосоме 1, идентифицировали и разрабатывали для превращения в сложный локус признаков (CTL) 1 (WO2016040030). Три сайта CTL1, TS8, TS10 и TS45 были отобраны для перемещения генов, устойчивых к NLB, NLB18PH26N (SEQ ID NO:70), Ht1-PH4GP (SEQ ID NO:65) и NLB18-PH26N (SEQ ID NO:70) соответственно. В табл. 11 показаны положения генетической карты для целевых сайтов для эндонуклеазы Cas (TS8, TS45, TS10), а на фиг. 6 схематично показано расположение этих сайтов.A maize genomic window extending from ZMO1:13.7MM to ZMO1:16.4MM on chromosome 1 was identified and designed to evolve into complex trait locus (CTL) 1 (WO2016040030). Three sites CTL1, TS8, TS10 and TS45 were selected to translocate the NLB resistance genes NLB18PH26N (SEQ ID NO:70), Ht1-PH4GP (SEQ ID NO:65) and NLB18-PH26N (SEQ ID NO:70) respectively . In table. 11 shows the positions of the genetic map for target sites for the Cas endonuclease (TS8, TS45, TS10) and FIG. 6 schematically shows the location of these sites.

Таблица 11. Целевые сайты для эндонуклеазы Cas в сложном локусе признаков (CTL1) на хромосоме 1 маисаTable 11 Target sites for Cas endonuclease in the complex trait locus (CTL1) on maize chromosome 1

Целевой сайт Target site Последовательность целевого сайта Target site sequence Последовательность PAM Subsequence PAM Генетическое положение PH B73v2 (cM) Genetic position of PH B73v2 (cM) CTL1-TS8 CTL1-TS8 SEQ ID NO:36 SEQ ID NO:36 TGG TGG 52,56 52.56 CTL1-TS45 CTL1-TS45 SEQ ID NO :37 SEQ ID NO :37 AGG AGG 53,66 53.66 CTL1-TS10 CTL1-TS10 SEQ ID NO:38 SEQ ID NO:38 GGG GGG 54,56 54.56

Векторная конструкция Cas9, направляющей РНК и донорной матрицы Ген Cas9 из Streptococcus pyogenes M1 GAS (SF370) оптимизировали по кодону маиса с помощью стандартных методик, известных из уровня техники, и интрон картофеля ST-LS1 вводили с целью устранения его экспрессии в E.coli и Agrobacterium. Для облегчения внутриядерной локализации белка Cas9 в клетках маиса (SV40) одинарный амино-концевой сигнал внутриядерной локализации Simian virus 40 (SEQ ID NO:5) и двухсоставную последовательность сигнала внутриядерной локализации карбоксильного конца эндонуклеазы VirD2 для пограничных участков Т-ДНК Agrobacterium tumefaciens (SEQ ID NO:80) были включены в амино- и карбоксильные концы открытой рамки считывания Cas9 соответственно. SEQ ID NO:73 представляет собой нуклеотидную последовательность, содержащую Cas9, используемую в примере 4; SEQ ID NO:73 содержит экзон 1 (SP) cas9, интрон 2 ST-LS1, экзон 2 (SP) Cas9 и сигнал внутриядерной локализацииVector construct of Cas9, guide RNA and donor template The Cas9 gene from Streptococcus pyogenes M1 GAS (SF370) was codon optimized for maize using standard techniques known in the art, and the potato ST-LS1 intron was introduced to abolish its expression in E. coli and Agrobacterium. To facilitate the intranuclear localization of the Cas9 protein in maize (SV40) cells, a single amino-terminal signal of the intranuclear localization of Simian virus 40 (SEQ ID NO:5) and a two-part signal sequence of the intranuclear localization signal of the carboxyl end of the VirD2 endonuclease for the T-DNA border regions of Agrobacterium tumefaciens (SEQ ID NO:80) were included at the amino and carboxyl ends of the Cas9 open reading frame, respectively. SEQ ID NO:73 is the nucleotide sequence containing Cas9 used in Example 4; SEQ ID NO:73 contains exon 1 (SP) cas9, intron 2 ST-LS1, exon 2 (SP) Cas9 and intranuclear localization signal

- 27 041676- 27 041676

VirD2. (Версия SP Cas9 отличается от версии ST, используемой в предыдущих примерах, в отношении использования кодонов; однако версия SP и версия ST, кодируемые SEQ ID NO:4, идентичны.) Оптимизированной ген Cas9 маиса функционально связывали с убиквитиновым промотором маиса с помощью стандартных методик молекулярной биологии.VirD2. (The SP version of Cas9 differs from the ST version used in previous examples with respect to codon usage; however, the SP version and the ST version encoded by SEQ ID NO:4 are identical.) The optimized maize Cas9 gene was operably linked to the maize ubiquitin promoter using standard techniques. molecular biology.

Промотор U6 полимеразы III маиса (SEQ ID NO:6; см. WO2015026885, WO20158026887, WO2015026883 и WO2015026886) применяли для экспрессии направляющих РНК, которые направляют нуклеазу Cas9 в обозначенные геномные сайты. Кодирующая последовательность направляющей РНК составляла 77 п.о. в длину и содержала вариабельный нацеливающий домен длиной 12-30 п.о. из выбранного целевого сайта генома маиса на 5'-конце терминатора U6 полимеразы III маиса.The maize polymerase III U6 promoter (SEQ ID NO:6; see WO2015026885, WO20158026887, WO2015026883 and WO2015026886) was used to express guide RNAs that direct Cas9 nuclease to designated genomic sites. The guide RNA coding sequence was 77 bp. in length and contained a 12-30 bp variable targeting domain. from the selected target site of the maize genome at the 5' end of the U6 terminator of maize polymerase III.

Для того чтобы эндонуклеаза Cas9 и направляющая РНК образовывали комплекс белок/РНК для обеспечения сайт-специфического расщепления двухнитевой ДНК, эндонуклеаза Cas9 и направляющая РНК должны присутствовать одновременно. Для улучшения их совместной экспрессии и присутствия кассеты экспрессии эндонуклеазы Cas9 и направляющей РНК были соединены в одну ДНКконструкцию. Синтезировали последовательность из 480-490 п. о., содержащую кодирующую последовательность направляющей РНК, вариабельный нацеливающий домен из 12-30 п.о. из выбранного целевого сайта генома маиса и часть U6 промотора. Затем последовательность клонировали в остов, уже имеющий кассету экспрессии cas9 и остальную часть экспрессирующей кассеты gRNA посредством рестрикционных сайтов BstBI/HindIII.In order for Cas9 endonuclease and guide RNA to form a protein/RNA complex to allow site-specific cleavage of double-stranded DNA, Cas9 endonuclease and guide RNA must be present simultaneously. To improve their co-expression and the presence of Cas9 endonuclease expression cassettes and guide RNA were combined into one DNA construct. A 480-490 bp sequence was synthesized containing a guide RNA coding sequence, a 12-30 bp variable targeting domain. from a selected target site in the maize genome and a portion of the U6 promoter. The sequence was then cloned into a backbone already having the cas9 expression cassette and the rest of the gRNA expression cassette via BstBI/HindIII restriction sites.

Перемещающая матрица для CTL1-8CR1 содержит связанный с устойчивостью аллель ZM-NLB18 (из PH26N) (SEQ ID NO:70) и последовательности гомологии, фланкирующие 5' CTL1-TS8 (SEQ ID NO:85) и 3' CTL1-TS8 (SEQ ID NO:86) в РН184С. Перемещающая матрица для CTL1-45CR1 содержит связанный с устойчивостью аллель ZM-NLB18 (из PH26N) (SEQ ID NO:70) и последовательности гомологии, фланкирующие 5' CTL1-TS45 (SEQ ID NO:87) и 3' CTL1-TS45 (SEQ ID NO:88) в РН184С. Перемещающая матрица для CTL1-10CR3 содержит связанный с устойчивостью аллель ZM-HT1 (из PH4GP) (SEQ ID NO:65) и последовательности гомологии, фланкирующие 5' CTL1-TS10 (SEQ ID NO:89) и 3' CTL1-TS10 (SEQ ID NO:90) в РН184С. Синтезировали последовательности плеч гомологии из 300-500 п.о. и затем клонировали с желаемой последовательностью связанного с устойчивостью аллеля с помощью стандартного бесшовного способа клонирования Г ибсона.The transposition template for CTL1-8CR1 contains the resistance-associated ZM-NLB18 allele (from PH26N) (SEQ ID NO:70) and homology sequences flanking 5' CTL1-TS8 (SEQ ID NO:85) and 3' CTL1-TS8 (SEQ ID NO:86) in PH184C. The transposition template for CTL1-45CR1 contains the resistance-associated ZM-NLB18 allele (from PH26N) (SEQ ID NO:70) and homology sequences flanking 5' CTL1-TS45 (SEQ ID NO:87) and 3' CTL1-TS45 (SEQ ID NO:88) in PH184C. The transposition template for CTL1-10CR3 contains the resistance-associated ZM-HT1 allele (from PH4GP) (SEQ ID NO:65) and homology sequences flanking 5' CTL1-TS10 (SEQ ID NO:89) and 3' CTL1-TS10 (SEQ ID NO:90) in PH184C. Sequences of homology arms of 300-500 bp were synthesized. and then cloned with the desired resistance-associated allele sequence using the standard Gibson seamless cloning method.

Плазмиду, содержащую кодон-оптимизированную кассету экспрессии эндонуклеазы Cas9 маиса и кассеты экспрессии направляющей РНК, совместно доставляли с плазмидой, содержащей матрицу ДНК, содержащую NLB18-PH2 6N (Фиг. 7 или фиг. 8) или ZM-HT1 (PH4GP) (Фиг. 9), которые после интеграции генов путем гомологичной рекомбинации (репарации, направляемой гомологией) будут интегрированы в указанном сайте при расщеплении сайтов посредством Cas9.A plasmid containing the codon-optimized maize endonuclease Cas9 expression cassette and guide RNA expression cassette was co-delivered with a plasmid containing a DNA template containing NLB18-PH2 6N (Fig. 7 or Fig. 8) or ZM-HT1 (PH4GP) (Fig. 9), which, after gene integration by homologous recombination (homology-guided repair), will be integrated into the indicated site when the sites are cleaved by Cas9.

Направляющие конструкции РНК-ДНК, нацеленные на различные геномные сайты маиса, и матричные ДНК-конструкции, которые были сконструированы для введения устойчивых генов в целевые сайты для эндонуклеазы Cas посредством гомологичной рекомбинации (репарации, направляемой гомологией), представлены в табл. 12. Такие направляющие РНК, ДНК-конструкции Cas9 и матрицы для репарации ДНК совместно доставлялись в геном элитного маиса (например, РН184С) с помощью процедуры стабильной трансформации, описанной в примере 1.RNA-DNA targeting constructs targeting various maize genomic sites and template DNA constructs that were designed to introduce resistance genes into Cas endonuclease target sites via homologous recombination (homology-driven repair) are shown in Table 1. 12. These guide RNAs, Cas9 DNA constructs, and DNA repair templates were co-delivered into the elite maize (eg, PH184C) genome using the stable transformation procedure described in Example 1.

Таблица 12. Направляющая PHK/Cas9 и матрица для репарации ДНК, применяемые в стабильной трансформации маиса для вставки Ht1-PH4GP или NLB18-PH26N в ZM01 CTL1Table 12. RNA/Cas9 target and DNA repair template used in stable maize transformation to insert Ht1-PH4GP or NLB18-PH26N into ZM01 CTL1

Эксперимент Experiment Направляющая РНК guide RNA SEQ ID NO: SEQ ID NO: Перемещение матричной ДНК Moving matrix DNA SEQ ID NO: SEQ ID NO: CTL1-TS8 CTL1-TS8 ZM-U6:08CR1 ZM-U6:08CR1 74 74 08CR1HR1-NLB18(PH26N) геномная последовательность- 8CR1HR2 08CR1HR1-NLB18(PH26N) genomic subsequence- 8CR1HR2 77 77 CTL1-TS45 CTL1-TS45 ZM-U6:45CR1 ZM-U6:45CR1 75 75 45CR1HR1-NLB18(PH26N) геномная последовательность- 45CR1HR2 45CR1HR1-NLB18(PH26N) genomic subsequence- 45CR1HR2 78 78 CTL1-TS10 CTL1-TS10 ZM-U6:10CR3 ZM-U6:10CR3 76 76 10CR3HR1-HT1 (PH4GP) геномная последовательность10CR3HR2 10CR3HR1-HT1 (PH4GP) genomic sequence10CR3HR2 79 79

Доставка ДНК системы направляющая РНК/эндонуклеаза Cas9 в маис См. пример 1.Delivery of DNA Guide RNA/Cas9 Endonuclease System to Maize See Example 1.

Скрининг растений Т0 и характеристика трансформанта.Screening of T0 plants and characterization of the transformant.

С целью идентифицировать трансформанты с перемещением (положительные трансформанты соIn order to identify transformants with displacement (positive transformants with

- 28 041676 вставкой), геномную ДНК выделяли из ткани листьев растений Т0, и проводили ПЦР участка границы сплайсинга с применением готовой смеси Sigma Extract-N-Amp PCR.- 28 041676 inset), genomic DNA was isolated from leaf tissue of T0 plants, and PCR was performed on the splicing boundary region using the prepared Sigma Extract-N-Amp PCR mixture.

Расположение праймеров показано на фигурах 7, 8 и 9, а последовательности праймеров приведены в табл. 13. ПЦР-скрининг участков границы сплайсинга для трансформантов со вставкой показал три растения Т0 с обоими участками границы сплайсинга HR1 и HR2 для эксперимента CTL1-TS8, четыре растения Т0 с обоими участками границы сплайсинга HR1 и HR2 для эксперимента CTL1-TS10 и четыре растения Т0 с обоими участками границы сплайсинга HR1 и HR2 для эксперимента CTL1-TS45. Идентифицированные растения Т0 будут дополнительно охарактеризованы в следующем поколении.The location of the primers shown in figures 7, 8 and 9, and the sequence of primers are shown in table. 13. PCR screening of splicing margin regions for insert transformants showed three T0 plants with both HR1 and HR2 splicing margins for the CTL1-TS8 experiment, four T0 plants with both HR1 and HR2 splicing margins for the CTL1-TS10 experiment, and four T0 plants with both parts of the splicing boundary HR1 and HR2 for the CTL1-TS45 experiment. The identified T0 plants will be further characterized in the next generation.

Таблица 13. Праймеры, применяемые для скрининга вставки (перемещения) у трансформантаTable 13. Primers used to screen for insertion (transfer) in transformant

Эксперименты Experiments Название праймера Primer name Ориентация праймера Primer orientation Последовательность праймера Primer sequence NLB18-PH26N до CTL1 TS8 NLB18-PH26N up to CTL1 TS8 8HRlfl 8HRlfl Прямой Straight SEQ ID NO:39 SEQ ID NO:39 PH26NPr PH26NPr Обратный Back SEQ ID NO:40 SEQ ID NO:40 PH26NTf PH26NTf Прямой Straight SEQ ID NO:41 SEQ ID NO:41 8HR2rl 8HR2rl Обратный Back SEQ ID NO:42 SEQ ID NO:42 Htl-PH4GP до CTL1 TS10 Htl-PH4GP to CTL1 TS10 lOHRlf loHRlf Прямой Straight SEQ ID NO:43 SEQ ID NO:43 HtlPr HtlPr Обратный Back SEQ ID NO:44 SEQ ID NO:44 HtlTf HtlTf Прямой Straight SEQ ID NO:45 SEQ ID NO:45 10HR2r 10HR2r Обратный Back SEQ ID NO:46 SEQ ID NO:46 NLB18-PH26N до CTL1 TS45 NLB18-PH26N up to CTL1 TS45 45hrlfl 45hrlfl Прямой Straight SEQ ID NO:47 SEQ ID NO:47 PH26NPr PH26NPr Обратный Back SEQ ID NO:48 SEQ ID NO:48 PH26NTf PH26NTf Прямой Straight SEQ ID NO:49 SEQ ID NO:49 45hr2rl 45hr2rl Обратный Back SEQ ID NO:50 SEQ ID NO:50

Скрининг растений Т2 и характеристика трансформанта Растения Т0, содержащие перемещение NLB18 (BC26N) и НТ1 (ED4GP), подвергали обратному скрещиванию с рекуррентными родителями дикого типа для получения семян ВС0 (Т1). Проростки ВС0 были молекулярно охарактеризованы для ПЦР участков границы сплайсинга, чтобы подтвердить вставку в CTL1-TS45 с NLB18 (ВС26) и вставку в CTL1-TS10 с НТ1 (ED4GP), унаследованную для следующего поколения. qPCR для хелперных генов, используемых во время трансформации, также выполняли, чтобы убедиться, что они были отделены от перемещающихся растений, нулевые сегреганты также были подтверждены посредством SbS (секвенирование по Саузерну). Семена от своих растений (BC0F2) садили в поле, проводили анализ зиготности на образцах листьев, соотношение вставок гомозигот:гемизигот:ноль 1:2:1 наблюдали как для CTL1-TS45 с BC26N, так и для CTL1-TS10 с НТ1 (ED4GP) вставкой. Растения также анализировали в отношении экспрессии РНК с применением qRT-PCR после инокуляции NLB. По сравнению с нулевым результатом, как гемизиготы, так и гомозиготы показали устойчивость к инфекции, и экспрессия как NLB18, так и НТ1 была повышена (фиг. 10 и 11).T2 Plant Screening and Transformant Characterization T0 plants containing the NLB18 (BC26N) and HT1 (ED4GP) transposition were backcrossed to wild-type recurrent parents to produce BC0 (T1) seeds. BC0 seedlings were molecularly characterized for PCR splicing boundary regions to confirm insertion in CTL1-TS45 with NLB18 (BC26) and insertion in CTL1-TS10 with HT1 (ED4GP) inherited for the next generation. qPCR for helper genes used during transformation was also performed to ensure they were separated from moving plants, null segregants were also confirmed by SbS (Southern sequencing). Seeds from own plants (BC0F2) were planted in the field, zygosity analysis was performed on leaf samples, a 1:2:1 homozygous:hemizygote:null insertion ratio was observed for both CTL1-TS45 with BC26N and CTL1-TS10 with HT1 (ED4GP) insert. Plants were also analyzed for RNA expression using qRT-PCR after NLB inoculation. Compared to null, both hemizygotes and homozygotes showed resistance to infection, and expression of both NLB18 and HT1 was upregulated (FIGS. 10 and 11).

Трансформанты подвергали тестированию в теплице в отношении эффективности к патогену северной пятнистости листьев (Exserohilum turcicum). Сначала все трнсформанты заражали патогеном, в отношении которого, как известно, гены Ht1 и NLB18 обеспечивают устойчивость. Все положительные трансформанты, определенные с помощью qPCR, были устойчивы к патогену. Результаты приведены в таблицах 14 и 15. Количество растений для каждого трансформанта указано в столбце N, представляющем собой количество исследованных растений. Показатель устойчивости для NLNB находится в диапазоне от 1 до 9, причем 9 характеризует наибольшую устойчивость.The transformants were tested in the greenhouse for efficacy against the northern leaf spot pathogen (Exserohilum turcicum). First, all transformants were infected with a pathogen against which the Ht1 and NLB18 genes are known to confer resistance. All positive transformants determined by qPCR were resistant to the pathogen. The results are shown in tables 14 and 15. The number of plants for each transformant is indicated in column N, representing the number of plants tested. The persistence score for NLNB ranges from 1 to 9, with 9 being the most robust.

Таблица 14. TS10 Ht1-ED4GPTable 14. TS10 Ht1-ED4GP

Зиготность Zygosity Среднее значение NLFBLT Average NLFBLT Станд. ошибка NLFBLT Standard error NLFBLT N N Гомозиготный homozygous 7,3 7.3 0, 1 0, 1 16 16 Гемизиготность Hemizygosity 6, 3 6, 3 о, 1 oh 1 28 28 Ноль Zero 4,9 4.9 о, 1 oh 1 12 12

--

Claims (10)

Таблица 15. TS45 NLB18-BC26NTable 15. TS45 NLB18-BC26N Зиготность Среднее значение NLFBLT Станд. ошибка NLFBLT NZygosity Average NLFBLT Standard error NLFBLT N Гомозиготный 8,5 0, 1 53, 0homozygous 8.5 0, 1 53.0 Гемизиготность 6, 2 0, 1 91,0Hemizygosity 6, 2 0, 1 91.0 Ноль 4,7 о, 1 55, 0Zero 4.7 oh 1 55.0 ФОРМУЛА ИЗОБРЕТЕНИЯCLAIM 1. Способ получения растительной клетки с модифицированной нуклеотидной последовательностью NLB18, где растительная клетка проявляет устойчивость к северной пятнистости листьев, причем способ предусматривает:1. A method for producing a plant cell with a modified NLB18 nucleotide sequence, wherein the plant cell exhibits resistance to northern leaf spot, the method comprising: (a) введение нуклеазой, выбранной из группы, состоящей из TALEN, мегануклеазы, нуклеазы с цинковыми пальцами и нуклеазы, ассоциированной с CRISPR, сайт-специфической модификации в по меньшей мере один целевой сайт эндогенного геномного локуса, кодирующего NLB18 в растительной клетке;(a) introducing, with a nuclease selected from the group consisting of TALEN, a meganuclease, a zinc finger nuclease, and a CRISPR-associated nuclease, a site-specific modification into at least one target site of an endogenous genomic locus encoding NLB18 in a plant cell; (b) получение растительной клетки, имеющей модифицированную нуклеотидную последовательность NLB18; и (c) введение матрицы для замены NLB18 в растительную клетку, где указанная матрица для замены NLB18 содержит по меньшей мере одно изменение нуклеиновой кислоты по сравнению с эндогенным геномным локусом, кодирующим NLB18, и где указанная матрица для замены NLB18 включена в эндогенный геномный локус, кодирующий NLB18;(b) obtaining a plant cell having a modified NLB18 nucleotide sequence; and (c) introducing an NLB18 replacement template into a plant cell, wherein said NLB18 replacement template contains at least one nucleic acid change compared to an endogenous genomic locus encoding NLB18, and where said NLB18 replacement template is incorporated into the endogenous genomic locus, encoding NLB18; где указанная матрица для замены NLB18 включает:where the specified NLB18 replacement matrix includes: (A) любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая по меньшей мере на 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична с SEQ ID NO:64;(A) any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identical to SEQ ID NO:64; (B) любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая по меньшей мере на 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична с SEQ ID NO:62.(B) any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identical to SEQ ID NO:62. 2. Способ по п.1, в котором указанная модифицированная нуклеотидная последовательность NLB18 содержит модификацию в промоторе кодирующей последовательности эндогенного NLB18.2. The method of claim 1, wherein said modified NLB18 nucleotide sequence comprises a modification in the promoter of the endogenous NLB18 coding sequence. 3. Способ по п.1, где указанный способ дополнительно предусматривает выращивание растения из растительной клетки, имеющей модифицированную нуклеотидную последовательность NLB18.3. The method of claim 1, wherein said method further comprises growing a plant from a plant cell having a modified NLB18 nucleotide sequence. 4. Способ по п.3, где указанное растение проявляет повышенную устойчивость к северной пятнистости листьев.4. The method of claim 3, wherein said plant exhibits increased resistance to northern leaf spot. 5. Способ по п.1, где нуклеотидная последовательность содержит SEQ ID NO:70.5. The method according to claim 1, where the nucleotide sequence contains SEQ ID NO:70. 6. Способ по п.1, где указанную сайт-специфическую модификацию индуцируют эндонуклеазой Cas9.6. The method of claim 1, wherein said site-specific modification is induced with Cas9 endonuclease. 7. Способ по п.6, где эндонуклеазу Cas9 направляют с помощью по меньшей мере одной направляющей РНК.7. The method of claim 6 wherein the Cas9 endonuclease is directed by at least one guide RNA. 8. Растительная клетка, полученная с помощью способа по любому из пп.1-7, где указанная растительная клетка содержит:8. Plant cell obtained using the method according to any one of claims 1 to 7, where the specified plant cell contains: (A) любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая по меньшей мере на 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична с SEQ ID NO: 64;(A) any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identical to SEQ ID NO: 64; (B) любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая по меньшей мере на 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична с SEQ ID NO: 62.(B) any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identical to SEQ ID NO: 62. 9. Растение, устойчивое к северной пятнистости листьев, содержащее растительную клетку по п.8, где указанное растение содержит:9. A northern leaf spot resistant plant comprising the plant cell of claim 8, wherein said plant comprises: (A) любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая по меньшей мере на 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична с SEQ ID NO: 64;(A) any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identical to SEQ ID NO: 64; (B) любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая по меньшей мере на 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична с SEQ ID NO: 62.(B) any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identical to SEQ ID NO: 62. 10. Семя, продуцируемое растением по п.9, где указанное семя содержит:10. The seed produced by the plant according to claim 9, where the specified seed contains: (A) любую нуклеотидную последовательность, которая кодирует полипептид, имеющий аминокислотную последовательность, которая по меньшей мере на 90, 91, 92, 93, 94, 95, 96, 97, 98 или 99% идентична с SEQ ID NO: 64;(A) any nucleotide sequence that encodes a polypeptide having an amino acid sequence that is at least 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identical to SEQ ID NO: 64; --
EA201990924 2016-10-13 2017-10-10 BUILDING MAIS RESISTANT TO NORTHERN LEAF SPOT EA041676B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/407,867 2016-10-13

Publications (1)

Publication Number Publication Date
EA041676B1 true EA041676B1 (en) 2022-11-22

Family

ID=

Similar Documents

Publication Publication Date Title
AU2013312352B2 (en) Engineered transgene integration platform (ETIP) for gene targeting and trait stacking
US12012605B2 (en) Generating northern leaf blight resistant maize
US10781455B2 (en) Methodologies and compositions for creating targeted recombination and breaking linkage between traits
WO2017132239A1 (en) Waxy corn
US20250057098A1 (en) Methods and compositions to increase yield through modifications of fea3 genomic locus and associated ligands
US20250066802A1 (en) Modified excisable mon87708 soybean transgenic herbicide resistance locus
US20220030822A1 (en) Inht26 transgenic soybean
US20210123067A1 (en) Compositions and methods for transferring cytoplasmic or nuclear traits or components
CA3188412A1 (en) Inht30 transgenic soybean
US20220033833A1 (en) Compositions and methods for transferring biomolecules to wounded cells
EA041676B1 (en) BUILDING MAIS RESISTANT TO NORTHERN LEAF SPOT