CN104411823A

CN104411823A - 包含具有大范围核酸酶活性的序列的组合物和方法

Info

Publication number: CN104411823A
Application number: CN201380035464.XA
Authority: CN
Inventors: E.伯穆德兹; A.M.西甘; J.恩格里斯; S.C.发科; H.高; L.刘; Z-B.刘; A.安格; S.斯维塔舍夫; J.K.杨
Original assignee: Pioneer Hi Bred International Inc; EI Du Pont de Nemours and Co
Current assignee: Pioneer Hi Bred International Inc; EIDP Inc
Priority date: 2012-05-04
Filing date: 2013-05-01
Publication date: 2015-03-11
Also published as: US9909110B2; US9499827B2; US20140223606A1; US20190040372A1; US20180142223A1; US20170022488A1; RU2014148769A; US20150184173A1; BR112014027468A2; WO2013166113A1; CA2872096A1; US10150956B2

Abstract

本发明提供了包含具有大范围核酸酶活性的多核苷酸和多肽的组合物和方法。另外提供了具有大范围核酸酶序列的核酸构建体、酵母、植物、植物细胞、外植体、种子和谷物。提供了使用所述大范围核酸酶序列的各种方法。此类方法包括用于制备在宽泛的温度范围具有提高的活性的大范围核酸酶的方法、用于制备包含具有提高的活性的大范围核酸酶的酵母、植物、植物细胞、外植体或种子的方法。

Description

包含具有大范围核酸酶活性的序列的组合物和方法

本申请要求提交于2012年5月4日的美国临时申请61/642470和提交于2012年8月16日的美国临时申请61/683765的权益；两者的全文以引用方式并入本文。

技术领域

本发明涉及分子生物学领域。更具体地，本发明涉及具有大范围核酸酶活性的序列。

背景技术

通过重组DNA技术，很容易将外源DNA序列插入生物体的基因组，从而改变所述生物体的表型。最常用的植物转化方法是农杆菌感染法和基因枪粒子轰击法，其中转基因以随机模式和不可预知的拷贝数整合至植物基因组中。因此，研究人员正在努力控制植物中的转基因整合。

已经使用了位点特异性整合技术(采用了位置特异性整合系统以及其它类型的整合系统)以在多个生物体中生成目的基因的靶向插入。

其它插入和修饰DNA序列的方法涉及通过导入两翼为与基因组靶标同源的序列的转基因DNA序列的同源DNA重组。美国专利5,527,695描述了用DNA序列(靶向真核生物DNA的预先确定的序列)转化真核细胞。通过使用选择性标记(作为被导入的DNA序列中的一部分)鉴定经转化的细胞。

虽然两种系统已经提供了对于目的序列的靶向插入可用的技术，但仍然存在对便于精确改造植物或酵母基因组的核酸酶的需求。此外，存在对于具有增大的、能在很宽的温度范围内引入双链断裂的大范围核酸酶的需求。

发明内容

提供了包含具有大范围核酸酶活性的多核苷酸和多肽的组合物和方法。还提供了包含编码变体大范围核酸酶的多核苷酸的组合物，所述变体大范围核酸酶包含至少一个氨基酸修饰，其中所述变体大范围核酸酶提高了活性。另外提供了具有大范围核酸酶序列的核酸构建体、酵母、植物、植物细胞、外植体、种子和谷物。

提供了使用所述大范围核酸酶序列的各种方法。此类方法包括用于提高细胞、酵母、植物细胞、植物外植体或种子中的大范围核酸酶活性。还提供了允许各种大范围核酸酶多核苷酸和变体及其片段在很宽的温度范围内在酵母或植物细胞中表达的方法和组合物。此类方法和组合物应用于制备具有改善的大范围核酸酶活性的酵母、植物细胞、植物和外植体。

因此在第一实施例中，本发明涉及分离的或重组的多核苷酸，其包含编码大范围核酸酶多肽的核苷酸序列，所述多肽包含：a)在对应于SEQID NO：1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346、348、以及它们的组合；或b)具有(a)的任何氨基酸修饰中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44个的氨基酸序列。

在其它实施例中，本发明涉及本公开的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，其与SEQ ID NO：1具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的序列同一性。

在另一个实施例中，本发明涉及实施例1的分离的或重组的多核苷酸和其对应的多肽，其中所述至少一个氨基酸修饰包括：a)在对应于SEQID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；b)在对应于SEQ IDNO：1中氨基酸位置12的位置处的组氨酸(H)；c)在对应于SEQ IDNO：1中氨基酸位置16的位置处的异亮氨酸(I)；d)在对应于SEQ IDNO：1中氨基酸位置22的位置处的半胱氨酸(C)；e)在对应于SEQ IDNO：1中氨基酸位置23的位置处的亮氨酸(L)；f)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；g)在对应于SEQ ID NO：1中氨基酸位置36的位置处的天冬酰胺(N)；h)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；i)在对应于SEQ ID NO：1中氨基酸位置50的位置处的精氨酸(R)或赖氨酸(K)；j)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；k)在对应于SEQ ID NO：1中氨基酸位置58的位置处的异亮氨酸(I)；l)在对应于SEQ ID NO：1中氨基酸位置59的位置处的组氨酸(H)或丙氨酸(A)；m)在对应于SEQ IDNO：1中氨基酸位置62的位置处的缬氨酸(V)；n)在对应于SEQ IDNO：1中氨基酸位置71的位置处的赖氨酸(K)；o)在对应于SEQ IDNO：1中氨基酸位置72的位置处的苏氨酸(T)；p)在对应于SEQ IDNO：1中氨基酸位置73的位置处的丙氨酸(A)；q)在对应于SEQ IDNO：1中氨基酸位置80的位置处的精氨酸(R)；r)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；s)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；t)在对应于SEQ ID NO：1中氨基酸位置86的位置处的天冬氨酸(D)；u)在对应于SEQ ID NO：1中氨基酸位置91的位置处的异亮氨酸(I)；v)在对应于SEQ ID NO：1中氨基酸位置95的位置处的异亮氨酸(I)；w)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；x)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；y)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；z)在对应于SEQ ID NO：1中氨基酸位置114的位置处的脯氨酸(P)；aa)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；bb)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；cc)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；dd)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；ee)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；ff)在对应于SEQ ID NO：1中氨基酸位置128的位置处的半胱氨酸(C)；gg)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；hh)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；ii)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；jj)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；kk)在对应于SEQ ID NO：1中氨基酸位置153的位置处的亮氨酸(L)或甲硫氨酸(M)；ll)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；mm)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；nn)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；oo)在对应于SEQ ID NO：1中氨基酸位置162的位置处的酪氨酸(Y)；pp)在对应于SEQ ID NO：1中氨基酸位置163的位置处的精氨酸(R)；qq)在对应于SEQ ID NO：1中氨基酸位置164的位置处的组氨酸(H)；rr)在对应于SEQ ID NO：1中氨基酸位置165的位置处的亮氨酸(L)；ss)在对应于SEQ ID NO：1中氨基酸位置166的位置处的精氨酸(R)；tt)在对应于SEQ ID NO：1中氨基酸位置167的位置处的组氨酸(H)；uu)在对应于SEQ ID NO：1中氨基酸位置168的位置处的脯氨酸(P)；vv)在对应于SEQ ID NO：1中氨基酸位置169的位置处的丙氨酸(A)；ww)在对应于SEQ ID NO：1中氨基酸位置170的位置处的脯氨酸(P)；xx)在对应于SEQ ID NO：1中氨基酸位置171的位置处的组氨酸(H)；yy)在对应于SEQ ID NO：1中氨基酸位置172的位置处的脯氨酸(P)；zz)在对应于SEQ ID NO：1中氨基酸位置173的位置处的精氨酸(R)；aaa)在对应于SEQ ID NO：1中氨基酸位置174的位置处的亮氨酸(L)；bbb)在对应于SEQ ID NO：1中氨基酸位置175的位置处的脯氨酸(P)；ccc)在对应于SEQ ID NO：1中氨基酸位置176的位置处的谷氨酸(Q)；ddd)在对应于SEQ ID NO：1中氨基酸位置177的位置处的丙氨酸(A)；eee)在对应于SEQ ID NO：1中氨基酸位置178的位置处的精氨酸(R)；fff)在对应于SEQ ID NO：1中氨基酸位置179的位置处的缬氨酸(V)；ggg)在对应于SEQ ID NO：1中氨基酸位置180的位置处的谷氨酸(Q)；hhh)在对应于SEQ ID NO：1中氨基酸位置182的位置处的缬氨酸(V)；iii)在对应于SEQ ID NO：1中氨基酸位置183的位置处的脯氨酸(P)；jjj)在对应于SEQ ID NO：1中氨基酸位置184的位置处的赖氨酸(K)；kkk)在对应于SEQ ID NO：1中氨基酸位置185的位置处的苏氨酸(T)或组氨酸(H)；lll)在对应于SEQ ID NO：1中氨基酸位置186的位置处的丝氨酸(S)；mmm)在对应于SEQ ID NO：1中氨基酸位置187的位置处的谷氨酸(E)；nnn)在对应于SEQ ID NO：1中氨基酸位置188的位置处的亮氨酸(L)；ooo)在对应于SEQ ID NO：1中氨基酸位置189的位置处的谷氨酸(E)；ppp)在对应于SEQ ID NO：1中氨基酸位置190的位置处的谷氨酸(Q)；qqq)在对应于SEQ ID NO：1中氨基酸位置191的位置处的亮氨酸(L)；rrr)在对应于SEQ ID NO：1中氨基酸位置194的位置处的脯氨酸(P)；sss)在对应于SEQ ID NO：1中氨基酸位置195的位置处的赖氨酸(K)；ttt)在对应于SEQ ID NO：1中氨基酸位置196的位置处的丝氨酸(S)；uuu)在对应于SEQ ID NO：1中氨基酸位置197的位置处的苯丙氨酸(F)；vvv)在对应于SEQ ID NO：1中氨基酸位置200的位置处的异亮氨酸(I)；www)在对应于SEQ ID NO：1中氨基酸位置203的位置处的缬氨酸(V)；xxx)在对应于SEQ ID NO：1中氨基酸位置204的位置处的亮氨酸(L)；yyy)在对应于SEQ ID NO：1中氨基酸位置209的位置处的半胱氨酸(C)；zzz)在对应于SEQ ID NO：1中氨基酸位置222的位置处的亮氨酸(L)；aaaa)在对应于SEQ ID NO：1中氨基酸位置232的位置处的异亮氨酸(I)；bbbb)在对应于SEQ ID NO：1中氨基酸位置236的位置处的丝氨酸(S)；cccc)在对应于SEQ ID NO：1中氨基酸位置237的R位置处的亮氨酸(L)或精氨酸(R)；dddd)在对应于SEQ ID NO：1中氨基酸位置246的位置处的组氨酸(H)；eeee)在对应于SEQ ID NO：1中氨基酸位置254的位置处的异亮氨酸(I)；ffff)在对应于SEQ ID NO：1中氨基酸位置258的位置处的丝氨酸(S)；gggg)在对应于SEQ ID NO：1中氨基酸位置267的位置处的精氨酸(R)；hhhh)在对应于SEQ ID NO：1中氨基酸位置278的位置处的异亮氨酸(I)；iiii)在对应于SEQ ID NO：1中氨基酸位置281的位置处的酪氨酸(Y)；jjjj)在对应于SEQ ID NO：1中氨基酸位置282的位置处的苯丙氨酸(F)；kkkk)在对应于SEQ IDNO：1中氨基酸位置289的位置处的苏氨酸(T)；llll)在对应于SEQ IDNO：1中氨基酸位置308的位置处的甘氨酸(G)；mmmm)在对应于SEQID NO：1中氨基酸位置311的位置处的精氨酸(R)；nnnn)在对应于SEQID NO：1中氨基酸位置312的位置处的丙氨酸(A)；oooo)在对应于SEQID NO：1中氨基酸位置316的位置处的丙氨酸(A)；pppp)在对应于SEQID NO：1中氨基酸位置318的位置处的精氨酸(R)；qqqq)在对应于SEQID NO：1中氨基酸位置334的位置处的丙氨酸(A)；rrrr)在对应于SEQID NO：1中氨基酸位置339的位置处的苯丙氨酸(F)；ssss)在对应于SEQ ID NO：1中氨基酸位置340的位置处的甘氨酸(G)或亮氨酸(L)；tttt)在对应于SEQ ID NO：1中氨基酸位置342的位置处的丝氨酸(S)；uuuu)在对应于SEQ ID NO：1中氨基酸位置345的位置处的天冬酰胺(N)；vvvv)在对应于SEQ ID NO：1中氨基酸位置346的位置处的天冬酰胺(N)；wwww)在对应于SEQ ID NO：1中氨基酸位置348的位置处的天冬酰胺(N)；或xxxx)a)至wwww)的任何组合。

在另一个实施例中，本发明涉及实施例1的分离的或重组的多核苷酸和其对应的多肽，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽还包含至少一种本文所述的氨基酸修饰，诸如表5A-5C、表9A-9D、表10A-10C、表11、表12、表13、表14A-B和表15中所示的那些以及任何已知的I-Cre1型修饰、以及它们的任何组合。

在另一个实施例中，本发明涉及分离的或重组的多核苷酸和其对应的多肽，其中所述核苷酸序列编码大范围核酸酶多肽，其选自SEQ IDNO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、403、430、431、432和433。

在另一个实施例中，本发明涉及本公开的分离的或重组的多核苷酸和其对应的多肽，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽能够识别并切开大范围核酸酶识别序列，所述大范围核酸酶识别序列选自SEQ ID NO：2、SEQ ID NO：85、SEQ ID NO：269、SEQ ID NO：281、SEQID NO：331、SEQ ID NO：358、SEQ ID NO：390、SEQ ID NO：423或SEQ IDNO：424。

在另一个实施例中，本发明涉及本公开的分离的或重组的多核苷酸和其对应的多肽，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性。所述对照大范围核酸酶可选自SEQ ID NO：1、SEQ IDNO：86、SEQ ID NO：250、SEQ ID NO：270、SEQ ID NO：271、SEQ IDNO：282、SEQ ID NO：283、SEQ ID NO：329、SEQ ID NO：356、SEQ IDNO：389、SEQ ID NO：429或SEQ ID NO：435或任何I-CreI型大范围核酸酶。提高的大范围核酸酶的活性可以通过任何测量大范围核酸酶活性的方法来证实，包括但不限于a)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时酵母测定分数更高；或b)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时目标位点突变率更高；或c)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时体外切割更高；或d)那些方法的任何组合。此外，可在宽泛的温度范围测量提高的活性，诸如温度包括16℃、24℃、28℃、30℃或37℃以及在16℃至37℃之间的温度。

在另一个实施例中，本发明涉及分离的或重组的多核苷酸，其还包括编码N-末端核转运肽的核苷酸序列和/或编码C-末端组氨酸标签的核苷酸序列。

在另一个实施例中，本发明涉及重组DNA构建体，其包含本公开的分离的或重组的多核苷酸。所述重组DNA构建体可还包含可操作地连接至所述多核苷酸的启动子。所述启动子相对于所述重组的多核苷酸可以为异源的。

在另一个实施例中，本发明涉及包含本公开的重组构建体的细胞、植物细胞、酵母细胞、植物、酵母或种子。所述植物细胞可以为单子叶植物或双子叶植物细胞。所述单子叶植物细胞可来自玉米、小麦、稻、大麦、甜菜、高粱或裸麦。所述双子叶植物细胞可来自大豆、芸苔属植物(Brassica)、向日葵、棉花或苜蓿。

在另一个实施例中，本发明涉及包含本公开的重组构建体的植物以及得自此类植物的种子或植物提取物、外植体。

在另一个实施例中，本发明涉及制备大范围核酸酶的方法，所述大范围核酸酶在一定温度范围具有提高的活性，所述方法包括：

a)通过在对应于SEQ ID NO：1的位置的氨基酸位置处修饰至少一个氨基酸来制备大范围核酸酶变体，所述SEQ ID NO：1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346、348、以及它们的组合；以及

b)选择来自步骤a)的所述大范围核酸酶变体，并且筛选能够在16℃至37℃之间并包括16℃和37℃的温度范围内裂解DNA目标序列的所述大范围核酸酶变体。

在另一个实施例中，本发明涉及制备大范围核酸酶的方法，所述大范围核酸酶在与对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性，所述方法包括：

b)选择来自步骤a)的所述大范围核酸酶变体，并且筛选在与对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性的所述变体。

在另一个实施例中，本发明涉及在酵母或植物细胞的基因组中导入双链断裂的方法，所述方法包括：

a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物或酵母细胞与大范围核酸酶多肽变体接触，所述大范围核酸酶多肽选自SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402和403，其中所述大范围核酸酶变体能够在所述识别位点诱导双链断裂；以及

b)选择来自a)的酵母或植物细胞，并且针对所述识别序列的任何修饰筛选所述酵母或植物细胞。

在另一个实施例中，本发明涉及将目的多核苷酸整合至植物或酵母细胞的基因组中的识别位点的方法，所述方法包括：

a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物或酵母细胞与下列物质接触：

(i)大范围核酸酶多肽变体，其选自SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402和403，

其中所述大范围核酸酶变体能够在所述识别位点诱导双链断裂；和

(ii)包含目的多核苷酸的DNA片段；

b)选择至少一种植物或酵母细胞，其包含在所述识别位点整合的目的多核苷酸盒。

在另一个实施例中，本发明涉及分离的或重组的多核苷酸以及其对应的多肽，其编码大范围核酸酶多肽，所述多肽包含在对应于SEQ ID NO：1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQID NO：1的位置选自位置16、22、50、56、59、71、81、103、121、153、185、209、222、246、258、281、308、316、345、346、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：2的大范围核酸酶目标位点。

在另一个实施例中，本发明涉及编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：86的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：86的位置选自位置2、12、16、22、23、36、43、50、56、58、59、72、73、81、86、91、95、103、113、114、120、121、124、128、129、131、151、153、200、204、209、232、236、237、246、254、258、267、281、308、311、312、316、319、334、339、340、342、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：85的大范围核酸酶目标位点。

在另一个实施例中，本发明涉及编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：270的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：270的位置选自位置16、22、50、71、185、246、258、316、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：269的大范围核酸酶目标位点。

在另一个实施例中，本发明涉及编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：329的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：329的位置选自位置12、32、50、56、80、105、124、129、131、153、185、311、316、318、340、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：328的大范围核酸酶目标位点。

在另一个实施例中，本发明涉及编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：356的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：356的位置选自位置12、24、36、50、56、62、73、80、124、129、147、182、203、237、252、311、316、318、340、348、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：355的大范围核酸酶目标位点。

在另一个实施例中，本发明涉及编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：389的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：389的位置选自位置12、50、56、124、129、131、153、211、237、311、316、和位置318、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ IDNO：388的大范围核酸酶目标位点。

在另一个实施例中，本发明涉及编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：429的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：429的位置选自位置16、22、50、71、185、246、258、316、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：423的大范围核酸酶目标位点。

附图说明和序列表

根据以下的详细描述和附图以及序列清单，可以更全面地理解本发明，以下的详细描述和附图以及序列清单形成本申请的一部分。序列描述以及所附序列表遵循37 C.F.R.§§1.8211.825示出的专利申请中核苷酸和氨基酸序列公开的规定。序列描述包含如37 C.F.R.§§1.8211.825中规定的针对每种氨基酸的三字母代码，其以引用方式并入本文。

图1提供了I-CreI大范围核酸酶(SEQ ID NO：3)与来自各个物种的相关的大范围核酸酶(SEQ ID NO：4-13)的氨基酸比对。加框显示了共享同一性的氨基酸残基。

图2显示了表示用于测定酵母中大范围核酸酶活性的酵母筛选系统的图表。对应于酵母Ade2编码序列的最初1000个核苷酸(Ade25’片段)和酵母Ade2编码序列的最后1011个核苷酸(Ade23’片段)的基因片段被包括酵母ura3基因(Ura3)和针对I-SceI的大范围核酸酶识别位点的片段分开。

图3显示了用于定量大范围核酸酶活性的酵母菌落的数值刻度与相应的白色分段。由于分段表型是大范围核酸酶活性的定性测量，采用了0-4的数字打分系统。0分表明没有观察到白色分段(没有大范围核酸酶切割)；4分表明完全白色菌落(识别位点的完全切割)；1-3分表明中间白色分段表型(和中间程度的识别位点切割)。

图4显示了大范围核酸酶表达质粒pVER8134。

图5提供了亲本LIG3-4(LIG3-4.pro，SEQ ID NO：1)和LIG3-4大范围核酸酶变体(表1A，SEQ ID NO：14-38)的氨基酸比对。在图5中列出的大范围核酸酶的名称对应于表1A中的名称，但包括“.pro”表明这是一个蛋白比对。

图6A-C显示了在0、25、50和75分钟，由实时聚合酶链反应(PCR)的三次重复平均的、亲本LIG3-4和LIG3-4大范围核酸酶变体(B65＝LIG3-4(B65)；hit15＝LIG3-4(15)；hit7＝LIG3-4(7))裂解质粒DNA底物的百分比。在23℃观察到(A)％的裂解。在28℃观察到(B)％的裂解。在37℃观察到(C)％的裂解。

图7显示了在50分钟，由实时聚合酶链反应(PCR)的三次重复平均的、亲本LIG3-4和LIG3-4大范围核酸酶变体(B65＝LIG3-4(B65)；hit15＝LIG3-4(15)；hit7＝LIG3-4(7))裂解基因组DNA底物的百分比。在23℃观察到(A)％的裂解。在28℃观察到(B)％的裂解。在37℃观察到(C)％的裂解。

图8A显示了用于确认UBI：moPAT：PinII盒整合至内源性LIG3-4识别位点的长片段聚合酶链反应(PCR)的方框图。图8B显示了在所述识别位点发生整合的情况下，在来自四个事件的愈伤组织上长片段聚合酶链反应(PCR)的结果。图8B-左显示了在HR1侧使用基因组引物(HRR1)和moPAT引物(mopatR2)的长连接片段聚合酶链反应(PCR)；图8B-右显示了在HR2侧(mopatF2/HR2R2)的长连接片段聚合酶链反应(PCR)。引物组mopatF2/HR2R2扩增了4kb片段，其跨越从moPAT基因穿过UBI内含子、UBI启动子和HR2序列至相邻基因组区。引物组HRR1/mopatR2扩增了2.2kb的片段，其跨越从moPAT基因穿过HR1至相邻基因组区。这两个长聚合酶链反应(PCR)产物的大小表明所述供体基因盒完美整合至LIG3-4识别位点。在来自愈伤组织事件之一T0和T1植物中获得了插入序列。

图9A-9D提供了亲本MHP77和MHP77大范围核酸酶变体的氨基酸比对。显示了在与亲本大范围核酸酶MHP77进行比较时，所述大范围核酸酶变体的氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相同。

图10A-10C提供了亲本MHP14和MHP14大范围核酸酶变体的氨基酸比对。显示了在与亲本大范围核酸酶MHP14进行比较时，所述大范围核酸酶变体的氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相同。

图11提供了亲本MHP107和MHP107大范围核酸酶变体的氨基酸比对。显示了在与亲本大范围核酸酶进行比较时，所述大范围核酸酶变体的氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相同。

图12提供了亲本ZM6.3和ZM6.3大范围核酸酶变体的氨基酸比对。显示了在与亲本大范围核酸酶进行比较时，所述大范围核酸酶变体的氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相同。

图13提供了亲本ZM6.22v2和ZM6.22v2大范围核酸酶变体的氨基酸比对。显示了在与亲本大范围核酸酶进行比较时，所述大范围核酸酶变体的氨基酸修饰。A(-)指出变体和亲本大范围核酸酶的氨基酸残基相同。

图14提供了LIG3-4和多个大范围核酸酶的氨基酸比对。显示了和SEQ ID NO：1不同的氨基酸修饰。A(-)指出大范围核酸酶的氨基酸残基与LIG3-4大范围核酸酶(SEQ ID NO：1)相同。

图15 A)显示了一些大范围核酸酶(其包含接头多肽将两个的重新工程化的I-CreI单体连成单个氨基链)的氨基酸比对。B)显示了一些变体(MHP14(10)、MHP77(L9-01)和亲本(LIG3-4、MHP14、MHP77)大范围核酸酶的百分比同一性。

图16显示了所述大范围核酸酶的结构因子。

序列

SEQ ID NO：1是单链LIG3-4大范围核酸酶融合多肽的氨基酸序列。

SEQ ID NO：2是LIG3-4识别序列的核苷酸序列。

SEQ ID NO：3是I-CreI大范围核酸酶单体的氨基酸序列。

SEQ ID NO：4是gi_18654305的氨基酸序列。

SEQ ID NO：5是gi_108773071的氨基酸序列。

SEQ ID NO：6是gi_108773352的氨基酸序列。

SEQ ID NO：7是gi_108796958的氨基酸序列。

SEQ ID NO：8是gi_12667512的氨基酸序列。

SEQ ID NO：9是gi_18654311的氨基酸序列。

SEQ ID NO：10是gi_150406493的氨基酸序列。

SEQ ID NO：11是gi_110225678的氨基酸序列。

SEQ ID NO：12是gi_11467050的氨基酸序列。

SEQ ID NO：13是gi_18654162的氨基酸序列。

SEQ ID NO：14是LIG3-4大范围核酸酶的氨基酸序列。

表1A：亲本和大范围核酸酶变体的SEQ ID NO：(NT＝核苷酸序列； AA＝氨基酸序列)列表。

SEQ ID NO：39是LIG3-4的植物最优化的核苷酸序列，其包含核定位信号和内含子。

SEQ ID NO：66是MN031引物的核苷酸序列。

SEQ ID NO：67是MN022引物的核苷酸序列。

SEQ ID NO：68是质粒pVER8134的核苷酸序列。

SEQ ID NO：69是核定位信号的核苷酸序列。

SEQ ID NO：70是核定位信号的氨基酸序列。

SEQ ID NO：71是6X组氨酸标签的氨基酸序列。

SEQ ID NO：72是玉米中核定位信号的核苷酸序列。

SEQ ID NO：73是带有核定位信号和内含子的LIG3-4(7)大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：74是带有核定位信号和内含子的LIG3-4(15)大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：75是带有核定位信号和内含子的LIG3-4(B65)大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：76是质粒PHP46961的核苷酸序列。

SEQ ID NO：77是LIG3-4(HR1)的核苷酸序列。

SEQ ID NO：78是LIG3-4(HR2)的核苷酸序列。

SEQ ID NO：79是LIG3-4目标位点qPCR探针的核苷酸序列。

SEQ ID NO：80是Lig3-4_正向引物的核苷酸序列。

SEQ ID NO：81是Lig3-4_反向引物的核苷酸序列。

SEQ ID NO：82是酵母ade2的核苷酸序列。

SEQ ID NO：83是酵母ade2的核苷酸编码序列。

SEQ ID NO：84是质粒pHD1327的核苷酸序列。

SEQ ID NO：85是MHP77识别位点的核苷酸序列。

SEQ ID NO：86是MHP77大范围核酸酶的氨基酸序列。

SEQ ID NO：250是MHP77.3大范围核酸酶的氨基酸序列。

SEQ ID NO：251是MHP77.3(L9-02)大范围核酸酶的氨基酸序列。

SEQ ID NO：252是MHP77.3(L9-11)大范围核酸酶的氨基酸序列。

SEQ ID NO：253是MHP77.3(L9-12)大范围核酸酶的氨基酸序列。

SEQ ID NO：254是MHP77的植物最优化的核苷酸序列，其包含核定位信号并且不含内含子。

SEQ ID NO：255是MHP77.3大范围核酸酶MHP77的植物最优化的核苷酸序列，其包含核定位信号并且不含内含子。

SEQ ID NO：256是MHP77(L9-02)大范围核酸酶的植物最优化的核苷酸序列，其包含核定位信号和内含子。

SEQ ID NO：257是MHP77(L9-11)大范围核酸酶的植物最优化的核苷酸序列，其包含核定位信号和内含子。

SEQ ID NO：258是MHP77(L9-12)大范围核酸酶的植物最优化的核苷酸序列，其包含核定位信号和内含子。

SEQ ID NO：259是MHP77.3(L9-02)大范围核酸酶的植物最优化的核苷酸序列，其包含核定位信号和内含子。

SEQ ID NO：260是MHP77.3(L9-11)大范围核酸酶的植物最优化的核苷酸序列，其包含核定位信号和内含子。

SEQ ID NO：261是MHP77.3(L9-12)大范围核酸酶的植物最优化的核苷酸序列，其包含核定位信号和内含子。

SEQ ID NO：262是MHP77.3(15)大范围核酸酶的氨基酸序列。

SEQ ID NO：263是MHP77.3(15)大范围核酸酶的植物最优化的核苷酸序列，其包含核定位信号和内含子。

SEQ ID NO：264是MHP77HR1的核苷酸序列。

SEQ ID NO：265是MHP77HR2的核苷酸序列。

SEQ ID NO：266是MHP77目标位点qPCR探针的核苷酸序列。

SEQ ID NO：267是MHP77_正向引物的核苷酸序列。

SEQ ID NO：268是MHP77_反向引物的核苷酸序列。

SEQ ID NO：269是MS26识别位点的核苷酸序列。

SEQ ID NO：270是MS26+大范围核酸酶的氨基酸序列。

SEQ ID NO：271是MS26++大范围核酸酶的氨基酸序列。

SEQ ID NO：272是MS26+(7)大范围核酸酶的氨基酸序列。

SEQ ID NO：273是MS26+(15)大范围核酸酶的氨基酸序列。

SEQ ID NO：274是MS26+(B65)大范围核酸酶的氨基酸序列。

SEQ ID NO：275是MS26++(15)大范围核酸酶的氨基酸序列。

SEQ ID NO：276是MS26+并且没有内含子的植物最优化的核苷酸序列。

SEQ ID NO：419是MS26+(7)并且没有内含子的植物最优化的核苷酸序列。

SEQ ID NO：277是MS26+(15)并且没有内含子的植物最优化的核苷酸序列。

SEQ ID NO：278是MS26+(B65)并且没有内含子的植物最优化的核苷酸序列。

SEQ ID NO：279是MS26++并且没有内含子的植物最优化的核苷酸序列。

SEQ ID NO：280是MS26++(15)并且没有内含子的植物最优化的核苷酸序列。

SEQ ID NO：281是MHP14识别位点的核苷酸序列。

表1B：亲本和大范围核酸酶变体的SEQ ID NO：(NT＝核苷酸序列； AA＝氨基酸序列)的列表。

SEQ ID NO：315是MHP14+(04)大范围核酸酶的氨基酸序列。

SEQ ID NO：316是MHP14+(06)大范围核酸酶的氨基酸序列。

SEQ ID NO：317是MHP14+(08)大范围核酸酶的氨基酸序列。

SEQ ID NO：318是MHP14+(12)大范围核酸酶的氨基酸序列。

SEQ ID NO：319是MHP14+(14)大范围核酸酶的氨基酸序列。

SEQ ID NO：320是MHP14+(15)大范围核酸酶的氨基酸序列。

SEQ ID NO：321是MHP14和内含子的植物最优化的核苷酸序列。

SEQ ID NO：322是MHP14+(04)和内含子的植物最优化的核苷酸序列。

SEQ ID NO：323是MHP14+(06)和内含子的植物最优化的核苷酸序列。

SEQ ID NO：324是MHP14+(08)和内含子的植物最优化的核苷酸序列。

SEQ ID NO：325是MHP14+(12)和内含子的植物最优化的核苷酸序列。

SEQ ID NO：326是MHP14+(14)和内含子的植物最优化的核苷酸序列。

SEQ ID NO：327是MHP14+(15)和内含子的植物最优化的核苷酸序列。

SEQ ID NO：328是MHP107识别位点的核苷酸序列。

表1C：亲本和大范围核酸酶变体的SEQ ID NO：(NT＝核苷酸序列； AA＝氨基酸序列)列表。

SEQ ID NO：355是ZM6.3识别位点的核苷酸序列。

表1D：亲本和大范围核酸酶变体的SEQ ID NO：(NT＝核苷酸序列； AA＝氨基酸序列)列表。

SEQ ID NO：388是ZM6.22v2识别位点的核苷酸序列。

表1E：亲本和大范围核酸酶变体的SEQ ID NO：(NT＝核苷酸序列； AA＝氨基酸序列)列表。

SEQ ID NO：419是不带内含子的MS26+(7)大范围核酸酶变体的核苷酸序列。

SEQ ID NO：420是LIG3-4、MHP14、MHP77的接头多肽的核苷酸序列。

SEQ ID NO：421是MHP14(10)的接头多肽的核苷酸序列。

SEQ ID NO：422是MHP77(L9-01)的接头多肽的核苷酸序列。

SEQ ID NO：423是大豆基因组中TS21识别位点的核苷酸序列。

SEQ ID NO：424是大豆基因组中TS14识别位点的核苷酸序列。

SEQ ID NO：425是带有核定位信号和内含子的TS21大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：426是带有核定位信号和内含子的TS21(7)大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：427是带有核定位信号和内含子的TS21(15)大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：428是带有核定位信号和内含子的TS21(B65)大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：429是TS21大范围核酸酶的氨基酸序列。

SEQ ID NO：430是TS21(7)大范围核酸酶的氨基酸序列。

SEQ ID NO：431是TS21(15)大范围核酸酶的氨基酸序列。

SEQ ID NO：432是TS21(B65)大范围核酸酶的氨基酸序列。

SEQ ID NO：433是带有核定位信号和内含子的TS14大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：434是带有核定位信号和内含子的TS14(15)大范围核酸酶的植物最优化的核苷酸序列。

SEQ ID NO：435是TS14大范围核酸酶的氨基酸序列。

SEQ ID NO：436是TS14(15)大范围核酸酶的氨基酸序列。

具体实施方式

现将结合附图在下文中更全面地描述本发明，其中示出了本发明的一些而非全部实施例。实际上，这些发明可以许多不同的形式来体现，并且不应理解为受本文所示实施例的限制；相反，提供这些实施例以使本公开满足适用的法律要求。类似的数字在全文中指代类似的元件。

这些发明所属领域的技术人员应当理解，本文所示发明的许多修改形式和其他实施例具有前述说明和相关附图中所示教导的有益效果。因此，应当了解，本发明不受所公开的具体实施例的限制，并且修改形式和其他实施例也旨在被包括在所附权利要求的范围内。虽然本文采用了具体术语，但是这些术语仅以一般性和描述性意义使用而不是为了进行限制。

说明书中提到的所有公布和专利申请指示了本发明适合的本领域技术人员的水平。所有公布和专利申请在相同程度上全文以引用方式并入本文，如同每个单独的公布或专利申请被特定地和个别地指示全文以引用方式并入本文。

除非上下文另外明确规定，否则如本文和所附权利要求书中所用的单数形式“一个”、“一种”以及“所述”包括复数涵义。因此，例如，提及“植物”包括多个此类植物；提及“细胞”包括一个或多个细胞和本领域技术人员已知的它们的等同物，等等。

除非另外指明，本文所用的所有技术和科学术语具有与本发明所属领域普通技术人员一般理解相同的含义。虽然与本文所述的那些方法和材料相似或等同的任何方法和材料可用于本发明的测试实践，但本文描述了合适的材料和方法的具体示例。

在本公开的上下文中使用了若干术语和缩写。提供了如下定义。

I.综述：

提供了包含具有大范围核酸酶活性的多核苷酸和多肽的组合物和方法。另外提供了具有提高的大范围核酸酶活性的组合物和使用方法。还提供了具有大范围核酸酶序列的核酸构建体、酵母、植物、植物细胞、外植体、种子和谷物。这些方法和组合物采用的核酸内切酶能够在酵母细胞、植物、植物细胞或种子的DNA片段内或在基因组内的识别序列处诱导双链断裂。

II.组合物

如本文所用，“分离的”多核苷酸或多肽，或其生物活性部分，是实质上或基本上不含在天然存在环境中伴随所述多核苷酸或蛋白质(共存)或与其相互作用的组分。因此，分离的或经纯化的多核苷酸或多肽基本上不含其他细胞物质、或当通过重组体技术生产时的培养基、或基本上不含通过化学合成时的化学前体或其他化学物质。最理想地，“分离的”多核苷酸不含多核苷酸所来源于的生物的基因组DNA中天然地存在于所述多核苷酸两翼(即，位于所述多核苷酸的5′和3′端)的序列(最理想地蛋白编码序列)。例如，在不同的实施例中，所述分离的多核苷酸可包含少于多核苷酸所来源的细胞的基因组DNA中天然地存在于所述多核苷酸两翼约5kb、4kb、3kb、2kb、1kb、0.5kb、或0.1kb的多核苷酸。基本上不含细胞物质的多肽包括制备的具有少于约30％、20％、10％、5％或1％(按干重计)的污染多肽的多肽。当重组生产本发明的多肽或其生物活性部分时，最佳的培养基提供少于约30％、20％、10％、5％、或1％(按干重计)的化学前体或非受关注蛋白的化学品。

如本文所用，当核酸或多肽为人工制成的或工程化得到、或来源于人工或工程化的蛋白或核酸时，它们是“重组的”。例如，插入载体或任何其它异源位置，例如重组生物的基因组中，使得它不与通常侧接天然存在的多核苷酸的核苷酸序列相关联的多核苷酸为重组的多核苷酸。在体外或体内从重组的多核苷酸表达的多肽是重组多肽的示例。同样地，天然不存在的多核苷酸序列，例如天然存在的基因的变体为重组序列。

“亚序列”或“片段”是整条序列的任一部分。

术语“目标位点”、“目标序列”、“基因组目标位点”和“基因组目标序列”本文可互换使用，是指在植物细胞或酵母细胞的基因组中的多核苷酸序列，其包含用于双链断裂诱导剂的识别序列。

如本文所用，术语“识别序列”是指在植物细胞基因组中被内切核酸酶诱导双链断裂处的DNA序列。术语“识别序列”、“识别位点”、“内切核酸酶识别位点”、“大范围核酸酶识别序列”和“大范围核酸酶识别位点”本文可互换使用。所述识别位点可以为植物基因组中的内源性位点，或者，所述识别位点可以为对植物异源性的并因此不是基因组中天然存在的，或与其天然存在的位置相比所述识别位点可见于异源性的基因组位置。如本文所用，术语“内源性的识别位点”是指对于植物基因组是内源性的或原生的内切核酸酶识别位点，并且其位于植物基因组中该识别位点的内源性的或原生的位置。识别位点的长度可以是变化的，并且包括例如核苷酸长度为至少4、6、8、10、12、14、16、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70或更长的识别位点。还有可能所述识别位点可以是回文序列，也就是说，在一条链上的序列阅读与互补链的相反方向上相同。切口/裂解位点可以在识别序列内，或切口/裂解位点可以在识别序列之外。在另一个变体中，可在紧接彼此相对的核苷酸位置进行裂解以产生钝端切口，或者在其他情况下，切口可以交错排列以产生单链突出端，也被称为“粘性末端”，其可为5′突出端或3′突出端。

在一个实施例中，内切核酸酶的识别序列包括玉米的LIG3-4(SEQ IDNO：2)、MHP77(SEQ ID NO：85)、MS26(SEQ ID NO：269)、MHP14(SEQ ID NO：281)、MP107(SEQ ID NO：328)、ZM6.3(SEQ IDNO：355)和/或ZM6.22V2(SEQ ID NO：388)识别位点，和/或大豆的TS21(SEQ ID NO：423)和/或TS14(SEQ ID NO：424)识别位点。

识别(序列)的活性变体和片段可包含与给定识别序列至少65％、70％、75％、80％、81％、82％、83％、84％85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性，其中活性变体保持了生物活性并从而能够被内切核酸酶识别和裂解。

“人工目标序列”是被导入植物基因组中的目标序列。此类人工目标序列可与植物基因组中的内源性或原生目标序列序列相同，但位于植物基因组中的不同位置(即非内源性或原生的位置)。

术语“内源性目标序列”和“原生目标序列”本文可互换使用，是指植物基因组内源性或原生的目标序列，并在植物基因组中目标序列的内源性或原生的位置处。

“改变的目标序列”是指在与未改变的目标序列进行比较时，包含至少一种改变的目标序列。此类“改变”包括，例如：(i)替换至少一个核苷酸，(ii)缺失至少一个核苷酸，(iii)插入至少一个核苷酸，或(iv)(i)-(iii)的任何组合。

如本文所用术语“双链断裂诱导剂”是指在目标序列中产生双链断裂的任何核酸酶。在目标序列或其它DNA中产生双链断裂在本文是指“切割”或“裂解”目标序列或其它DNA。

“内切核酸酶”是指在多核苷酸链内裂解磷酸二酯键的酶。

内切核酸酶包括在特定位点裂解DNA而不损坏碱基的限制内切核酸酶。限制内切核酸酶包括I型、II型、III型和IV型内切核酸酶，其还包括亚型。在I型和III型系统中，甲基化酶和限制活性同时包含在单个复合物中。

I型和III型限制内切核酸酶识别特异性的识别位点，但通常在距离识别位点的可变位置处(其能够距离识别位点上百碱基对)裂解。在II型系统中限制活性与任何甲基化酶活性无关，并且裂解通常在识别位点内或与之接近的特定位点处进行。大多数II型酶切割回文序列，然而IIa型酶识别非回文识别位点并且在识别位点之外裂解，IIb型酶在识别位点之外的两个位点切割序列两次，IIs型酶识别非对称识别位点并且在距离识别位点约1-20个核苷酸的限定距离处的一侧裂解。IV型限制酶靶向甲基化的DNA。在例如REBASE数据库(网页rebase.neb.com；Roberts等人，(2003)Nucleic Acids Res 31：418-20)，Roberts等人，(2003)Nucleic Acids Res31：1805-12和Belfort等人，(2002)in Mobile DNA II，761-783页，编辑Craigie等人，(ASM Press，Washington，DC)中对限制酶进行了进一步描述和分类。

“工程化的内切核酸酶”是指从其原生形式经过工程化以特异性识别并且在期望的识别位点中诱导双链断裂的内切核酸酶。因此，工程化的内切核酸酶可来源于原生的、天然存在的内切核酸酶或可被人工创建或合成。所述内切核酸酶的修饰可少至一个核苷酸。在一些实施例中，工程化的内切核酸酶在识别位点内诱导双链断裂，其中所述识别位点不是已被原生(非工程化的或非修饰的)内切核酸酶所识别的序列。在识别位点或其它DNA内产生双链断裂在本文是指在识别位点或其它DNA内“切割”或“裂解”。

“大范围核酸酶”是指归巢内切核酸酶，其类似于限制内切核酸酶，在特定识别位点结合并且切割，然而对于大范围核酸酶的识别位点通常更长，约18bp或更长。在本发明的一些实施例中，已将大范围核酸酶工程化(或修饰)以切割特异性内源性识别位点，其中所述内源性目标序列在被工程化的双链断裂诱导剂切割之前不是被原生(非过程化或非修饰的)内切核酸酶所识别的序列。

“大范围核酸酶多肽”是指具有大范围核酸酶活性并且因此能够在所述识别序列中产生双链断裂的多肽。

基于保守序列基序将大范围核酸酶分成四个家族，这些家族是LAGLIDADG、GIY-YIG、H-N-H和His-Cys框家族。这些基序参与了金属离子的配位和磷酸二酯键的水解。HE酶由于其长识别位点以及容忍其DNA底物中的一些序列多态性而著名。对于大范围核酸酶的命名惯例与其它限制内切核酸酶的惯例相似。大范围核酸酶也通过前缀F-、I-或PI-来表征，分别针对由自立式开放阅读框、内含子和内含肽编码的酶。例如，来自酿酒酵母(Saccharomyces cerevisiae)的内含子-、内含肽-、和独立式基因编码大范围核酸酶被分别命名为I-SceI、PI-SceI和F-SceII。大范围核酸酶结构域、结构和功能是已知的，参见例如，Guhan和Muniyappa(2003)Crit Rev Biochem Mol Biol 38：199-248；Lucas等人，(2001)Nucleic AcidsRes 29：960-9；Jurica和Stoddard，(1999)Cell Mol Life Sci 55：1304-26；Stoddard，(2006)Q Rev Biophys 38：49-95；和Moure等人，(2002)NatStruct Biol 9：764。在一些示例中，使用了天然存在的变体和/或大范围核酸酶的工程化的衍生物。修改动力学、辅因子相互作用、表达、最优化条件和/或识别位点特异性、以及活性筛选的方法是已知的，参见例如，Epinat等人，(2003)Nucleic Acids Res 31：2952-62；Chevalier等人，(2002)Mol Cell 10：895-905；Gimble等人，(2003)Mol Biol 334：993-1008；Seligman等人，(2002)Nucleic Acids Res 30：3870-9；Sussman等人，(2004)J Mol Biol 342：31-41；Rosen等人，(2006)Nucleic Acids Res34：4791-800；Chames等人，(2005)Nucleic Acids Res 33：e178；Smith等人，(2006)Nucleic Acids Res 34：e149；Gruen等人，(2002)NucleicAcids Res 30：e29；Chen和Zhao，(2005)Nucleic Acids Res 33：e154；WO2005105989；WO2003078619；WO2006097854；WO2006097853；WO2006097784；和WO2004031346。

本文可使用任何大范围核酸酶，包括但不限于I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、PI-PspI、F-SceI、F-SceII、F-SuvI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NcIIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp6803I、I-SthPhiJP、I-SthphiST3P、I-SthphiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MtuI、PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、PI-TliII、或它们的任一活性变体或片段。在具体的实施例中，经工程化的内切核酸酶来源于I-Cre-I，其具有如SEQ ID NO：15、21或26所示的或其活性变体或片段的序列。

TAL效应子核酸酶是序列特异性核酸酶的新类，其能够在植物或其它生物体的基因组中的特定目标位点处生成双链断裂。TAL效应子核酸酶是将原生或工程化的转录因子样(TAL)效应子或其功能部件与内切核酸酶(诸如，例如FokI)融合而成的。独特的模块化的TAL效应子DNA结合结构域使得蛋白的设计具有潜在的任何给定的DNA识别特异性。因此，TAL效应子核酸酶的DNA结合结构域能被工程化以识别特定DNA目标位点，并且因此能用于在期望的目标序列处产生双链断裂。参见WO2010/079430；Morbitzer等人(2010)PNAS 10.1073/pnas.1013133107；Scholze & Boch(2010)Virulence 1：428-432；Christian等人Genetics(2010)186：757-761；Li等人(2010)Nuc.Acids Res.(2010)doi：10.1093/nar/gkq704；和Miller等人(2011)Nature Biotechnology29：143-148；所有这些文献以引用方式并入本文。

如本文所用，术语“大范围核酸酶活性”是指大范围核酸酶在期望的识别序列处切割并且因此保持诱导双链断裂活性的能力。

大范围核酸酶活性的测定方法是已知的，大体测量总体活性和在包含所述识别位点的DNA底物上的大范围核酸酶的特异性。例如，使用如本文所述的酵母筛选测定法测量大范围核酸酶活性。带有功能性Ade2基因的酵母细胞是白色的，而缺乏Ade2功能的那些由于在腺嘌呤生物合成途径早期积累代谢物表现出红色的色素沉着，导致如图2和3中显示的带有白色分段的红色菌落。白色分段的程度，有时延伸至整个菌落，表明了大范围核酸酶切割活性的量。由于分段表型是大范围核酸酶活性的定性测量，采用了0-4的数字打分系统。如图3所示，0分表明没有观察到白色分段(没有大范围核酸酶切割)；4分表明完全白色菌落(识别位点的完全切割)；1-3分表明中间白色分段表型(和中间程度的识别位点切割)。如本文所述也可体外测量大范围核酸酶活性。简而言之，在37℃、28℃和23℃，在包含所述大范围核酸酶识别位点的质粒DNA上进行时程消化，能通过实时聚合酶链反应(PCR)测定每个样品的％消化或大范围核酸酶识别位点的损耗(表明了大范围核酸酶活性)。此外，在植物中能通过测定目标位点(TS)突变率来测量大范围核酸酶活性。目标位点突变率定义为：(带有目标位点修饰的事件数量/事件总数)*100％。

“提高了”或“增大了”活性本文互换使用。在通过本文所述任一活性测定法进行测定时，“提高了”或“增大了”大范围核酸酶活性包括亲本大范围核酸酶多肽的活性在任何统计意义上的显著性提高。

能通过编码内切核酸酶的多核苷酸提供所述大范围核酸酶。相比于天然存在的多核苷酸序列，此类编码内切核酸酶的多核苷酸可被修饰以替换在植物中具有更高使用频率的密码子。例如，相比于天然存在的多核苷酸序列，编码所述大范围核酸酶的多核苷酸可被修饰以替换在玉米或大豆植物中具有更高使用频率的密码子。

提供了各种方法和组合物，其采用具有大范围核酸酶活性的多核苷酸和多肽。

在一个实施例中，本发明涉及分离的或重组的多核苷酸，其包含编码大范围核酸酶多肽的核苷酸序列，所述多肽包含：a)在对应于SEQ IDNO：1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346、348、以及它们的组合；或b)具有(a)的任何氨基酸修饰的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44个的氨基酸序列。

在另一个实施例中，本发明涉及本公开的分离的或重组的多核苷酸和其对应的多肽，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽还包含至少一种本文所述的氨基酸修饰，诸如在图5A-5C、图9A-9D、图10A-10C、图11、图12、图13、图14A-B、图15中所示的那些以及任何已知的I-Crel型修饰、以及它们的任何组合。

还提供了方法和组合物，其采用在与适当对照进行比较时具有提高的大范围核酸酶活性的多核苷酸和多肽。此类大范围核酸酶多肽包括如SEQID NO：14-38(LIG3-4变体)、SEQ ID NO：87-167(MHP77变体，SEQ IDNO：251、252、253、262(MHP77.3变体)、SEQ ID NO：272-275(MS26+变体)，SEQ ID NO：284-298(MHP14变体)，SEQ ID NO：315-320(MHP14+变体)、SEQ ID NO：330-341(MH107变体)、SEQ ID NO：357-371(ZM6.3变体)、SEQ ID NO：390-403(ZM6.22V2变体)或SEQ IDNO：430-432的任何之一所示的那些以及它们的生物活性变体。还提供了编码这些各种多肽及其活性变体的多核苷酸。

术语蛋白“变体”旨在表示来源于所述蛋白(被称为亲本蛋白)通过缺失(即，在5′和/或3′末端截短)和/或在亲本蛋白中的一个或多个内部位点缺失或加入一个或多个氨基酸和/或在亲本蛋白中的一个或多个位点替换一个或多个氨基酸。如本文所用，“亲本”多核苷酸、多肽(蛋白)可分别得自人工操纵或来自包含天然存在的核苷酸序列或氨基酸序列的原生蛋白。涵盖的蛋白变体是有生物活性的，它们能持续具有亲本蛋白的期望的生物活性，即具有大范围核酸酶活性。此类变体可得自例如遗传多态性或得自人工操纵。

术语“大范围核酸酶变体”是指具有大范围核酸酶活性的蛋白变体。大范围核酸酶变体来源于亲本大范围核酸酶，其中所述大范围核酸酶变体在与亲本大范围核酸酶多肽进行比较时包含至少一个氨基酸修饰。

本发明的大范围核酸酶多肽变体包括如SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、262、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、315、316、317、318、319、320、330、331、332、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、403、430、431、432或433的任何之一所示的那些以及它们的生物活性变体和片段。还提供了编码这些各种多肽及其活性变体和片段的多核苷酸。

在实例3-23中所鉴定的氨基酸修饰中的任何一个可转移至亲本大范围核酸酶以创建大范围核酸酶变体。可通过本文所述的方法，针对提高的活性来筛选这些大范围核酸酶。

本发明的一个实施例涉及将至少一个氨基酸修饰转移至亲本大范围核酸酶从而提高所述亲本大范围核酸酶的活性，所述氨基酸修饰选自Y12至H、G19至S或A、Q50至K或R、F54至I、D56至L、V105至A、E124至R、V129至A、I132至V或T、D153至M或L、V316至A或I319至V。另一个实施例涉及将1、2、3、4、5、6、7、8、9、10、11或12个基酸修饰转移至亲本大范围核酸酶从而提高所述亲本大范围核酸酶的活性，所述氨基酸修饰选自Y12至H、G19至S或A、Q50至K或R、F54至I、D56至L、V105至A、E124至R、V129至A、I132至V或T、D153至M或L、V316至A或I319至V。

本文所述的修饰中的任何一个可与其它已知的I-CreI型大范围核酸酶的修饰进行组合。

如本文所用，相对于编码重组蛋白的重组的多核苷酸，术语“修饰”是指相对于参考或对照序列，在重组蛋白序列中一个氨基酸残基的任一插入、缺失或替换。

“变体”旨在表示基本上类似的序列。对于多核苷酸，保守变体包括那些因为遗传密码的简并性、编码本发明的大范围核酸酶多肽之一的氨基酸序列的序列。诸如这些天然存在的变体可以使用熟知的分子生物学技术(例如使用如下文所述的聚合酶链反应(PCR)、和杂交技术)进行鉴定。变体多核苷酸还包括合成来源的多核苷酸，诸如例如通过使用定点诱变或基因合成产生的那些(多核苷酸)，但其仍然编码大范围核酸酶多肽。

还提供了大范围核酸酶(即大范围核酸酶变体)的生物活性变体。大范围核酸酶变体是大范围核酸酶多肽的生物活性变体(以及编码相同(变体)的多核苷酸)，与对照大范围核酸酶的多肽具有至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、95.5％、95.7％、95.9％、96％、96.3％、96.5％、96.9％、97％、97.3％、97.5％、97.9％、98％、98.3％、98.5％、98.9％、99％、99.3％、99.5％、99.6％或更高的序列同一性，其中所述活性变体保持了在期望的识别位点处切割的能力。例如，本文所述的大范围核酸酶变体的任一个可以从亲本内切核酸酶序列进行修饰，并且设计来在所述亲本大范围核酸酶的相同的识别位点处进行识别和诱导双链断裂。因此在一些实施例中，所述大范围核酸酶变体在与亲本大范围核酸酶进行比较时包含至少一个氨基酸修饰，并且具有在与对应的亲本大范围核酸酶识别序列相同的识别序列处诱导双链断裂的特异性。

“对照大范围核酸酶”或“参考大范围核酸酶”可互换使用，是指与大范围核酸酶进行比较的任一大范围核酸酶。对照大范围核酸酶可包括但不限于亲本或对应的大范围核酸酶或任何野生型I-Crel型大范围核酸酶。

当聚合物的给定单体组分(氨基酸残基、结合的核苷酸等)的位置对应于所选择的参考多肽或多核苷酸中相同残基位置时，氨基酸或核苷酸聚合物的编号，诸如本发明的大范围核酸酶的任何之一，对应于所选择的氨基酸聚合物或核酸的编号。

还提供了大范围核酸酶多肽的生物活性变体(以及编码相同(变体)的多核苷酸)，其与SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、262、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、315、316、317、318、319、320、330、331、332、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、403、430、431、432或433或参考任何通过序列比对确定的本文所公开的大范围核酸酶多肽的任何之一的多肽具有至少约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、95.5％、95.7％、95.9％、96％、96.3％、96.5％、96.9％、97％、97.3％、97.5％、97.9％、98％、98.3％、98.5％、98.9％、99％、99.3％、99.5％、99.6％或更高的序列同一性。

在一个实施例中本发明的大范围核酸酶变体包含接头多肽，其中所述接头多肽包括：a)SEQ ID NO：420；b)SEQ ID NO：421；c)SEQ IDNO：422；或d)由在对应于SEQ ID NO：1的位置156至193的位置处的任何可能的氨基酸组成的氨基酸序列。还应当理解这些接头序列可被同时连接I-Cre型单体的其他接头序列所替换，而仍使得单个大范围核酸酶能在目标序列处提供双链断裂。

如本文所用，“目的基因组区”是期望用于导入目的多核苷酸或目的性状的植物基因组中的染色体片段。目的基因组区可包括，例如，一个或多个目的多核苷酸。一般来讲，本发明的目的基因组区包括0-15cM(厘摩)的染色体片段。

如本文所用，在目的基因组区内的“目的多核苷酸”是所述目的基因组区的任一编码和/或非编码部分，包括但不限于转基因、原生基因、突变基因以及遗传标记，诸如，例如单核苷酸多态性(SNP)和简单序列重复(SSR)标记。

如本文所用，“物理连接的”、“物理连锁的”、和“遗传连锁的”用于指相同DNA分子或染色体部分的任何两个或更多个基因、转基因、原生基因、突变基因、改变、目标位点、标记等。

序列比较

以下术语被用于描述在两种或更多种多核苷酸或多肽之间的序列关系：(a)“参考序列”，(b)“比对窗口”，(c)“序列同一性”，和(d)“序列同一性百分比”。

(a)如本文所用，“参考序列”是用作序列比对基准的定义序列。参考序列可以是指定序列的一部分或全部；例如，全长cDNA或基因序列，或全长cDNA或基因序列或蛋白序列的片段。

(b)如本文所用，“比对窗口”比较参考序列和多肽序列的连续的指定片段，其中在所述比对窗口中的多肽序列与参考序列(不包含插入或缺失)相比可以包含插入或缺失(即间隙)，以获得两段多肽之间的最大匹配。一般来讲，比对窗口的长度为至少5、10、15、或20个邻接氨基酸，或可为30、40、50、100个或者更长。本领域的技术人员懂得为了避免由于在多肽序列中包含空位导致的它与参考序列的高度相似，通常导入空位罚分并从匹配数目中减去空位罚分。

用于比对的序列比对方法是本领域熟知的。因此，能使用数学算法测定任意两个序列之间的序列同一性百分比。此类数学算法的非限制性实例是Myers和Miller(1988)CABIOS 4：11-17的算法；Smith等人(1981)Adv.Appl.Math.2：482的局部比对算法；Needleman和Wunsch(1970)J.Mol.Biol.48：443-453的全局比对算法；Pearson和Lipman(1988)Proc.Natl.Acad.Sci.85：2444-2448的局部搜寻比对方法；Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 872264的算法，由Karlin和Altschul改进(1993)Proc.Natl.Acad.Sci.USA 90：5873-5877。能利用计算机实施这些数学算法，以比对序列、测定序列同一性。此类具体实施包括但不限于：在PC/Gene程序中的CLUSTAL(可得自Intelligenetics，Mountain View，California)；ALIGN程序(版本2.0)和GCG Wisconsin Genetics SoftwarePackage，版本10(可自Accelrys Inc.，9685Scranton Road，San Diego，California，USA获得)中的GAP、BESTFIT、BLAST、FASTA和TFASTA。能够使用默认参数进行使用这些程序的比对。以下文献很好地描述了CLUSTAL程序：Higgins等人(1988)Gene 73：237-244(1988)；Higgins等人(1989)CABIOS 5：151-153；Corpet等人(1988)NucleicAcids Res.16：10881-90；Huang等人(1992)CABIOS 8：155-65；以及Pearson等人(1994)Meth.Mol.Biol.24：307-331。ALIGN程序基于Myers和Miller(1988，同上)的算法。当比对氨基酸序列时，PAM120权重残基表、空位长度罚分12、以及空位罚分4能与ALIGN程序一起使用。Altschul等人(1990)J.Mol.Biol.215：403的BLAST程序基于Karlin和Altschul的算法(1990，同上)。可使用BLASTN程序进行BLAST核苷酸搜索，得分＝100，字长＝12，以获取与编码本发明的蛋白质的核苷酸序列同源的核苷酸序列。可使用BLASTX程序进行BLAST搜索，得分＝50，字长＝3，以获取与本发明的蛋白或多肽多肽同源的氨基酸序列。可使用默认参数进行BLASTP蛋白搜索。参见blast.ncbi.nlm.nih.gov/Blast.cgi。

可使用LASARGENE生物信息学计算套件(DNASTAR Inc.，Madison，WI)的Megalign程序或使用Vector生物信息学计算套件(Invitrogen，Carlsbad，CA)的AlignX程序进行序列比对和相似度百分比计算。用带默认参数(空位罚分＝10，空位长度罚分＝10)的Clustal比对方法(Higgins和Sharp，CABIOS 5：151-153(1989))进行序列的多重比对。用Clustal方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE＝1、空位罚分＝3、窗口＝5和DIAGONALS SAVED＝5。就核酸而言，这些参数为空位罚分＝10，空位长度罚分＝10，KTUPLE＝2，空位罚分＝5，窗口＝4，和DIAGONALS SAVED＝4。氨基酸或核苷酸序列的“主要部分”包含足够的多肽的氨基酸序列或基因的核苷酸序列以提供该多肽或基因的推定鉴定，所述序列可由本领域技术人员来人工评估，或使用计算机自动化的序列比较和鉴定工具进行评估，所述工具使用算法如BLAST(Altschul，S.F.等人，J.Mol.Biol.215：403-410(1993))和Gapped Blast(Altschul，S.F.等人，Nucleic Acids Res.25：3389-3402(1997))。BLASTN是指针对核苷酸序列数据库比较核苷酸查询序列的BLAST程序。

“基因”是指能够表达特定蛋白质的核酸片段，其包括编码序列前的调控序列(5′非编码序列)和编码序列后的调控序列(3′非编码序列)。“天然基因”指自然状态下与其自身的调控序列一起的基因。“嵌合基因”或“重组表达构建体”(可互换使用)是指非原生基因的任何基因，其包含非天然同时存在的调控和编码序列。因此，嵌合基因可包含源自不同来源的调控序列和编码序列，或者源自相同来源、但排列方式与天然存在的排列方式不同的调控序列和编码序列。“内源性基因”指在生物体基因组中处于其天然位置的天然基因。“外来基因”是指正常情况下不存在于宿主生物中的基因，它通过基因转移导入宿主生物内。外来基因可以包含插入到非天然生物体内的天然基因或嵌合基因。“转基因”是已通过转化方法导入基因组内的基因。

“编码序列”指编码特定氨基酸序列的DNA序列。“调控序列”指位于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列)，并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。

“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的趋异度。因此，本发明涉及包含编码本文示出的氨基酸序列的全部或主要部分的核苷酸序列的任何核酸片段。技术人员非常了解特定宿主细胞在使用核苷酸密码子来确定给定氨基酸时所表现出的“密码子偏好性”。因此，当合成核酸片段用于提高宿主细胞中的表达时，希望设计该核酸片段使得其密码子使用频率接近宿主细胞使用的优选密码子的频率。

如本文所用，涉及两种多核苷酸或多肽序列时的“序列同一性”或“同一性”是指两序列中的残基当在指定比较窗口中比对最大匹配时是相同的。已经认识到当序列同一性百分比用于蛋白质时，不同的残基位置常常存在保守氨基酸取代的差异，其中氨基酸残基被取代为具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基。当序列出现保守取代差异时，可上调序列同一性百分比进行纠正以保持取代的保守性质。存在此类保守取代差异的序列被称为具有“序列相似性”或“相似性”。进行此类调整的方法为本领域的技术人员所熟知。通常这涉及给一个保守取代评分为部分而不是完全错配，因此提高序列同一性百分比。因此例如其中一个相同氨基酸得分为1，而非保守取代得分为零，保守取代得分介于零和1之间。例如在程序PC/GENE(Intelligenetics，Mountain View，California)中进行保守取代的得分计算。

如本文所用，“序列同一性百分比”是指通过在比较窗口中比较两个比对序列而测定的值，其中比较窗口中的多核苷酸或多肽序列部分与参考序列(参考序列不包括添加或删除)相比可包括添加或删除(即间隙)以达到两序列的最佳比对效果。所述百分比的计算方法是，统计相同的核酸碱基或氨基酸残基在两段序列中同时出现的位置的数量以得到匹配位置数，将此匹配位置数除以比对窗口中的总位置数，再将结果乘以100，从而得到序列同一性百分比。

多核苷酸构建体

本文提供了包含所述大范围核酸酶或其任一活性变体或片段的多核苷酸或核酸分子。本文可互换使用术语“多核苷酸”、“多核苷酸序列”、“核酸序列”和“核酸片段”。这些术语涵盖核苷酸序及类似的范围。术语“多核苷酸”的使用并非旨在将本发明限制为包含DNA的多核苷酸。本领域的一般技术人员将认识到，多核苷酸可包括核糖核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合。此类脱氧核苷酸和核糖核苷酸包括天然存在的分子和合成类似物。本发明所述多核苷酸也涵盖所有形式的序列，包括但不限于单链形式、双链形式、发夹结构、茎环结构等。

还提供了包含大范围核酸酶变体的重组的多核苷酸。术语“重组的多核苷酸”、“重组核苷酸”、“重组DNA”和“重组DNA构建体”本文互换使用。重组构建体包含人工的或异源的核酸序列的组合例如非天然共存的调控和编码序列。例如，转移盒可包含限制位点和目的异源多核苷酸。在其它实施例中，重组构建体可包含来源于不同来源的调控序列和编码序列，或来源于相同来源但以不同于天然存在的方式排列的调控序列和编码序列。此类构建体可独自使用或与载体组合使用。如果使用载体，则载体的选择取决于用以转化宿主细胞的方法，该宿主细胞是本领域的技术人员所熟知的。例如可以使用质粒载体。技术人员熟知为了成功地转化、筛选和繁殖包括本文提供的任何分离的核酸片段的宿主细胞，必须存在于载体上的遗传因子。技术人员还将认识到，不同的独立转化事件将导致不同水平和模式的表达(Jones等人，EMBO J.4：2411-2418(1985)；DeAlmeida等人，Mol.Gen.Genetics 218：78-86(1989))，因此为了获得显示期望的表达水平和模式的细胞系必须筛选多个事件。这种筛选可通过DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白表达的免疫印迹分析或表型分析等完成。

在表达盒中可提供本文所公开的大范围核酸酶多核苷酸用于在目的植物中表达。所述盒可包括5′和3′调控序列，其可操作地连接至大范围核酸酶多核苷酸或其活性变体或片段。“可操作地连接”旨在表示两个或更多个元件之间的功能性连接。例如，目的多核苷酸和调控序列(即一个启动子)之间的可操作的连接为允许该目的多核苷酸的表达的功能性连接。可操作地连接的元件可以是连续的或不连续的。当用于指两个蛋白质编码区的连接时，“可操作地连接”意指所述编码区处于同一阅读框。所述盒可附加地包含至少一个将被转化到生物体中的附加基因。作为另外一种选择，能通过多个表达盒提供附加基因。这样的表达框具有多个限制性位点和/或重组位点，用以将大范围核酸酶多核苷酸或其活性变体或片段插入至使其处于所述调控区的转录调控之下的位置。所述表达盒可附加地包含选择性标记基因。

所述表达盒可包括在转录的5′-3′方向中，转录和翻译起始区(即启动子)、大范围核酸酶多核苷酸或其活性变体或片段、以及在植物中起作用的转录和翻译终止区(即终止区)。所述调控区(即，启动子、转录调控区和翻译终止区)和/或大范围核酸酶多核苷酸或其活性变体或片段可以对于宿主细胞或彼此是原生的/类似的。另选的，所述调控区和/或大范围核酸酶多核苷酸或其活性变体或片段可以对于对于宿主细胞或彼此是异源的。

本文在序列方面所用的“异源”是指，源自外来物种的序列，或者，如果源自相同物种，则为通过蓄意的人为干预而从其天然形式在组成和/或基因组基因座方面受到充分修饰的序列。例如，可操作地连接至异源多核苷酸的一个启动子所来自的物种，不同于所述多核苷酸所来源自的物种；或者，如果二者来自相同的/类似的物种，则二者之一或二者均为从其原始形式和/或基因组基因座经过充分修饰的，或者所述启动子并非针对可操作地连接的多核苷酸的天然启动子。

虽然使用异源启动子表达所述序列是最佳的，也可以使用原生的启动子序列。此类构建体可改变植物或植物细胞中大范围核酸酶多核苷酸的表达水平。因此，可改变所述植物或植物细胞的表型。

所述终止区可以与转录起始区是原生的，可以与可操作地链接的大范围核酸酶多核苷酸或其活性变体或片段是原生的，可以与植物宿主是原生的，或可来源对于所述启动子、所述大范围核酸酶多核苷酸或其活性片段或变体、或其任何组合是另一个源(即，外源的或异源的)。使用方便的终止区得自根癌农杆菌(A.tumefaciens)的Ti质粒，诸如章鱼碱合成酶和胭脂碱合成酶终止区。还可参见Guerineau等人(1991)Mol.Gen.Genet.262：141-144；Proudfoot(1991)Cell 64：671-674；Sanfacon等人(1991)Genes Dev.5：141-149；Mogen等人(1990)Plant Cell 2：1261-1272；Munroe等人(1990)Gene 91：151-158；Ballas等人(1989)Nucleic Acids Res.17：7891-7903；以及Joshi等人(1987)Nucleic Acids Res.15：9627-9639。

在适当情况下，可对多核苷酸进行优化以提高其在转化过的植物中的表达。即，能够使用植物优选的密码子合成多核苷酸用于改善表达。参见例如，Campbell和Gowri(1990)Plant Physiol.92：1-11针对宿主优选的密码子使用的讨论。本领域有合成植物优选基因的方法可用。参见例如，美国专利5,380,831和5,436,391，以及Murray等人(1989)Nucleic Acids Res.17：477-498，以引用方式并入本文。

在细胞宿主中促进基因表达的附加序列的修改形式是已知的。这些序列包括消除编码伪聚腺苷酸化信号的序列、外显子-内含子接合位点信号的序列、转座子样重复序列、和其他此类对基因表达不利的特征明显的序列。就一个给定的细胞宿主而言，可以将所述序列的G-C含量调节至平均水平，所述平均水平通过参考宿主细胞中表达的已知基因进行计算。当可能的时候，修饰所述序列以避免经推测可能发生的mRNA发夹二级结构。

所述表达盒可附加地包含5′前导序列。此类前导序列能够促进翻译。翻译前导序列是本领域已知的，包括：小核糖核酸病毒前导序列，例如EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein等人(1989)Proc.Natl.Acad.Sci.USA 86：6126-6130)；马铃薯Y病毒前导序列，例如，TEV前导序列(烟草蚀纹病毒)(Gallie等人(1995)Gene 165(2)：233-238)、MDMV前导序列(玉米矮小花叶病毒)(Virology 154：9-20)、以及人免疫球蛋白重链结合蛋白(BiP)(Macejak等人(1991)Nature 353：90-94)；非翻译前导序列，来自苜蓿花叶病毒的外壳蛋白mRNA(AMVRNA 4)(Jobling等人(1987)Nature 325：622-625)；烟草花叶病毒前导序列(TMV)(Gallie等人(1989)in Molecular Biology of RNA，ed.Cech(Liss，New York)，pp.237-256)；和玉米褪绿斑驳病毒前导序列(MCMV)(Lommel等人(1991)Virology81：382-385。还可参见Della-Cioppa等人(1987)Plant Physiol.84：965-968。

在制备表达盒的过程中，可操作多个DNA片段以在正确方向上，以及，如果适当的话，在正确阅读框中提供DNA序列。为了这一目的，可使用衔接子或接头以接合DNA片段，或者使用其他操作方法提供方便的限制位点以移除冗余DNA、移除限制位点等。为了这一目的，可使用体外诱变、引物修复、限制性酶切、退火、再取代，例如转换和颠换。

可使用多个启动子表达本文所公开的各种大范围核酸酶序列，包括目的多核苷酸序列的原生启动子。可基于期望结果选择启动子。此类启动子包括，例如，针对在植物中表达的组成型、组织优选的或其他启动子。

组成型启动子包括例如，Rsyn7启动子和在WO 99/43838和美国专利6,072,050中公开的其他组成型启动子的核心启动子；核心CaMV 35S启动子(Odell等人(1985)Nature 313：810-812)；稻肌动蛋白启动子(McElroy等人(1990)Plant Cell 2：163-171)；泛素启动子(Christensen等人(1989)Plant Mol.Biol.12：619-632和Christensen等人(1992)PlantMol.Biol.，18：675-689)；pEMU(Last等人(1991)Theor.Appl.Genet.81：581-588)；MAS(Velten等人(1984)EMBO J.3：2723-2730)；ALS启动子(美国专利5,659,026)等。其它组成型启动子包括例如，美国专利5,608,149；5,608,144；5,604,121；5,569,597；5,466,785；5,399,680；5,268,463；5,608,142；和6,177,611中的讨论的那些(启动子)。

组织优选的启动子可用于靶向增强在特定植物组织内的大范围核酸酶的表达。组织优先的启动子包括在Yamamoto等人.(1997)Plant J.12(2)：255-265；Kawamata等人(1997)Plant Cell Physlot.38(7)：792-803；Hansen等人(1997)Mol.Gen Genet.254(3)：337-343；Russell等人(1997)Transgenic Res.6(2)：157-168；Rinehart等人(1996)PlantPhysiol.112(3)：1331-1341；Van Camp等人(1996)Plant Physiol.112(2)：525-535；Canevascini等人(1996)Plant Physiol.112(2)：513-524；Yamamoto等人(1994)Plant Cell Physiol.35(5)：773-778；Lam(1994)Results Probl.Cell Differ.20：181-196；Orozco等人(1993)PlantMol Biol.23(6)：1129-1138；Matsuoka等人(1993)Proc Natl.Acad.Sci.USA 90(20)：9586-9590；以及Guevara-Garcia等人(1993)Plant J.4(3)：495-505中描述的那些。如果需要的话，可修饰这样的启动子以进行弱表达。

叶优选的启动子是本领域已知的。参见例如，Yamamoto等人(1997)Plant J.12(2)：255-265；Kwon等人(1994)Plant Physiol.105：357-67；Yamamoto等人(1994)Plant Cell Physiol.35(5)：773-778；Gotor等人(1993)Plant J.3：509-18；Orozco等人(1993)Plant Mol.Biol.23(6)：1129-1138；以及Matsuoka等人(1993)Proc.Natl.Acad.Sci.USA90(20)：9586-9590。

可使用合成启动子来表达大范围核酸酶序列或其生物活性变体和片段。

表达盒也可包含选择性标记基因，用于选择转化过的细胞。利用选择性标记基因以选择转化过的细胞或组织。标记基因包括编码抗生素抗性的基因，诸如那些编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因，以及赋予除草化合物抗性的基因，除草化合物诸如草甘膦、草胺磷铵、溴苯腈、磺脲类药物、麦草畏、和2，4-二氯苯氧乙酸(2，4-D)。附加的可选择的标记包括表型标记诸如β-半乳糖苷酶，和荧光蛋白诸如绿色荧光蛋白(GFP)(Su等人(2004)BiotechnolBioeng 85：610-9和Fetter等人(2004)Plant Cell 16：215-28)、蓝绿色荧光蛋白(CYP)(Bolte等人(2004)J.Cell Science 117：943-54和Kato等人(2002)PlantPhysiol 129：913-42)、以及黄色荧光蛋白(来自Evrogen的PhiYFP^TM，参见Bolte等人(2004)J.Cell Science 117：943-54)。关于其他选择性标记，一般参见Yarranton(1992)Curr.Opin.Biotech.3：506-511；Christopherson等人(1992)Proc.Natl.Acad.Sci.USA 89：6314-6318；Yao等人(1992)Cell 71：63-72；Reznikoff(1992)Mol.Microbiol.6：2419-2422；Barkley等人(1980)The Operon，177-220页；Hu等人(1987)Cell48：555-566；Brown等人(1987)Cell 49：603-612；Figge等人(1988)Cell 52：713-722；Deuschle等人(1989)Proc.Natl.Acad.Aci.USA 86：5400-5404；Fuerst等人(1989)Proc.Natl.Acad.Sci.USA 86：2549-2553；Deuschle等人(1990)Science 248：480-483；Gossen(1993)博士学位论文，University of Heidelberg；Reines等人(1993)Proc.Natl.Acad.Sci.USA90：1917-1921；Labow等人(1990)Mol.Cell.Biol.10：3343-3356；Zambretti等人(1992)Proc.Natl.Acad.Sci.USA 89：3952-3956；Baim等人(1991)Proc.Natl.Acad.Sci.USA 88：5072-5076；Wyborski等人(1991)Nucleic Acids Res.19：4647-4653；Hillenand-Wissman(1989)Topics Mol.Struc.Biol.10：143-162；Degenkolb等人(1991)Antimicrob.AgentsChemother.35：1591-1595；Kleinschnidt等人(1988)Biochemistry 27：1094-1104；Bonin(1993)博士学位论文，University of Heidelberg；Gossen等人(1992)Proc.Natl.Acad.Sci.USA 89：5547-5551；Oliva等人(1992)Antimicrob.Agents Chemother.36：913-919；Hlavka等人(1985)Handbookof Experimental Pharmacology，第78卷(Springer-Verlag，Berlin)；Gill等人(1988)Nature 334：721-724。此类公开以引用方式并入本文。上文的选择性标记基因列表并不意味是限制性的。本发明能使用任何选择性标记基因。

导入的方法

可通过任何本领域已知的方法导入所述大范围核酸酶。例如，提供了在其基因组中具有所述识别位点的细胞、酵母或植物。所述大范围核酸酶可以为瞬时表达的或所述多肽本身可以为直接提供给细胞的。另选地，能够表达所述大范围核酸酶的核苷酸序列可以稳定地整合进植物的基因组。在对应的识别位点和所述大范围核酸酶存在下，可将供体DNA插入至被转化的植物基因组。另选地，可通过将转化的植物有性杂交将不同的组分集合在一起。因此编码大范围核酸酶和/或目标位点的序列可彼此有性杂交以允许该系统的每个组分存在于单个植物中。所述大范围核酸酶可在组成型或诱导型启动子的控制下。此类目的启动子在本文其它地方进一步详细讨论。

可使用各种方法将目的序列，诸如本发明的大范围核酸酶的任一个，导入植物或植物部分。“导入”旨在表示将多核苷酸或多肽呈现至植物、植物细胞或植物部分的方式使得所述序列进入到植物细胞的内部。本发明的方法不依赖于将序列导入植物或植物部分的特定方法，只要使多核苷酸或多肽进入植物的至少一个细胞的内部即可。用于将核苷酸或多肽导入植物的方法是本领域已知的，包括但不限于稳定转化方法、瞬时转化方法、和病毒介导的方法。

“稳定转化”旨在表示将核苷酸构建体导入植物并整合进植物基因组中，并且能够由其后代继承。“瞬时转化”旨在表示多核苷酸被引入植物并且不整合进该植物的基因组中或者多肽被引入植物中。

转化规程以及用于将多肽或多核苷酸序列导入植物内的规程可以根据被作为转化目标的植物或植物细胞的类型，例如单子叶植物或双子叶植物而改变。将多肽和多核苷酸导入植物细胞的合适方法包括显微注射(Crossway等人，(1986)Biotechniques 4：320-334)、电穿孔(Riggs等人(1986)Proc.Natl.Acad.Sci.USA 83：5602-5606，农杆菌属菌介导的转化(美国专利5,563,055和美国专利5,981,840)，直接基因转移(Paszkowski等人.(1984)EMBO J.3：2717-2722)、以及微粒加速(参见例如，美国专利4,945,050；美国专利5,879,918；美国专利5,886,244；和5,932,782；Tomes等人，(1995)Plant Cell，Tissue，and Organ Culture：FundamentalMethods，ed.Gamborg和Phillips(Springer-Verlag，Berlin)；McCabe等人，(1988)Biotechnology 6：923-926)；和Lecl transformation(WO00/28058)。也参见Weissinger等人(1988)Ann.Rev.Genet.22：421-477；Sanford等人，(1987)Particulate Science and Technology 5：27-37(洋葱)；Christou等人，(1988)Plant Physiol.87：671-674(大豆)；McCabe等人，(1988)Bio/Technology 6：923-926(大豆)；Finer和McMullen(1991)In Vitro Cell Dev.Biol.27P：175-182(大豆)；Singh等人，(1998)Theor.Appl.Genet.96：319-324(大豆)；Datta等人，(1990)Biotechnology 8：736-740(水稻)；Klein等人，(1988)Proc.Natl.Acad.Sci.USA 85：4305-4309(玉米)；Klein等人，(1988)Biotechnology 6：559-563(玉米)；美国专利5,240,855；5,322,783；和5,324,646；Klein等人，(1988)Plant Physiol.91：440-444(玉米)；Fromm等人，(1990)Biotechnology 8：833-839(玉米)；Hooykaas-VanSlogteren等人，(1984)Nature(London)311：763-764；美国专利5,736,369(谷物)；Bytebier等人，(1987)Proc.Natl.Acad.Sci.USA84：5345-5349(百合科(Liliaceae))；De Wet等人，(1985)TheExperimental Manipulation of Ovule Tissues，编辑Chapman等人，(Longman，New York)，第197-209页(花粉)；Kaeppler等人，(1990)Plant Cell Reports 9：415-418以及Kaeppler等人(1992)Theor.Appl.Genet.84：560-566(颈须介导的转化)；D′Halluin等人，(1992)Plant Cell 4：1495-1505(电穿孔)；Li等人，(1993)Plant Cell Reports12：250-255以及Christou和Ford(1995)Annals of Botany 75：407-413(水稻)；Osjoda等人(1996)Nature Biotechnology 14：745-750(经由根癌农杆菌(Agrobacterium tumefaciens)的玉米)；所有这些文献以引用方式并入本文。

在具体的实施例中，可使用多种瞬时转化方法将所述大范围核酸酶序列或其活性变体或片段提供至酵母细胞或植物。此类瞬时转化方法包括但不限于将大范围核酸酶蛋白或其活性变体以及片段直接导入酵母细胞或植物。此类方法包括例如显微注射或微粒轰击法。参见例如Crossway等人(1986)Mol Gen.Genet.202：179-185；Nomura等人(1986)Plant Sci.44：53-58；Hepler等人(1994)Proc.Natl.Acad.Sci.91：2176-2180和Hush等人(1994)The Journal of Cell Science 107：775-784，所有文献以引用方式并入本文。

在其它实施例中，可通过将植物与病毒或病毒核酸接触操作将本发明的多核苷酸导入酵母细胞或植物。一般来讲，这样的方法包括将本发明的核苷酸构建体掺入DNA或RNA分子内。已经认识到可以初始合成大范围核酸酶序列作为病毒的多聚蛋白的一部分，其随后可通过体内或体外蛋白水解进行处理以产生期望的重组蛋白。此外，已经认识到本发明的启动子也包括用于病毒RNA聚合酶转录的启动子。涉及病毒DNA或RNA分子的用于将多核苷酸导入植物内并且表达其中编码的蛋白的方法是本领域已知的。参见例如美国专利5,889,191、5,889,190、5,866,785、5,589,367、5,316,931、以及Porta等人(1996)Molecular Biotechnology5：209-221；该参考文献以引用方式并入本文。

用于在植物基因组的特定位置定向插入多核苷酸的方法是本领域中已知的。在一个实施方案中，多核苷酸在期望的基因组位置的插入利用位点特异性重组系统实现。参见例如WO99/25821、WO99/25854、WO99/25840、WO99/25855、和WO99/25853，它们均以引用方式并入本文。简而言之，本发明的多核苷酸被包含在转移盒中，其侧翼与两个非重组产生的重组位点相连。所述转移盒被导入植物中，所述植物的基因组中已稳定地掺入了一个目标位点，所述目标位点的两翼是对应于转移盒的所述位点的两个非重组产生的重组位点。提供了适当的重组酶，并且所述转移盒被整合至所述目标位点。目的多核苷酸从而被整合至所述植物基因组的特定染色体位置。靶向多核苷酸的其它方法如WO 2009/114321(以引用方式并入本文)中所示，其描述了具体地在玉米基因组中生成“定制的”大范围核酸酶以修饰植物基因组。也参见，Gao等人(2010)Plant Journal1：176-187。

已经被转化的细胞可根据常规方法生长为植物。参见例如McCormick等人(1986)Plant Cell Reports 5：81-84。然后可培养这些植物，并用相同的或不同的转化过的植物进行授粉，具有期望表型特征的组成型表达的所得到的子代被鉴定。可以生长两代或多代以保证所希望的表型特征的表达稳定地保持和遗传，然后收获种子以保证所希望的表型特征的表达已经实现。以这种方式，本发明提供了转化的种子(也称为“转基因种子”)，所述转化的种子具有稳定地掺入至其基因组中的本发明的多核苷酸，例如所述实施方案的表达盒。

检测方法

提供了检测大范围核酸酶多肽或其活性变体或片段。此类方法包括分析植物组织以检测此类多肽或编码相同(多肽)的多核苷酸。所述检测方法能直接测定大范围核酸酶多肽或多核苷酸的存在，或所述检测方法能通过测定表达该序列的细胞、酵母、植物、植物细胞或植物外植体的表型来直接测定所述序列。

在其它实施例中，在植物组织中可通过检测编码各种大范围核酸酶多肽或其活性变体和片段的任一个的多核苷酸的存在检测所述大范围核酸酶多肽或其活性变体或片段。在一个实施例中，所述检测方法包括使用聚合酶链反应(PCR)扩增测定植物组织。

如本文所用，“引物”是分离的多核苷酸，其通过核酸杂交与互补目标DNA链退火在引物和所述目标DNA链之间以形成杂交体，然后通过聚合酶，例如DNA聚合酶，沿着所述目标DNA链延伸。本发明的引物对是指其用于通过聚合酶链反应(PCR)或其他常规核酸扩增方法扩增目的多核苷酸。“PCR”或“聚合酶链反应”是用于扩增特定DNA片段的技术(参见美国专利4,683,195和4,800,159；其以引用方式并入本文)。

如本文其他地方所述，探针和引物有足够的核苷酸长度以结合目标DNA序列并且特异性检测和/或鉴定编码大范围核酸酶多肽或其活性变体或片段的多核苷酸。已经认识到可通过操作者确定杂交条件或反应条件以获得这种结果。所述长度可以是可用于所选择的检测方法的足够长度的任何长度。此类探针和引物能在高严格性杂交条件下特异性杂交至目标序列。根据本发明的实施例，探针和引物可与目标序列具有连续的核苷酸的完全序列同一性，虽然可通过常规方法设计与目标DNA序列不同并且保持了特异性检测和/或鉴定目标DNA序列的能力的探针。因此，探针和引物可与目标多核苷酸共有约80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高的序列同一性或互补性。

在例如，Molecular Cloning：A Laboratory Manual，2.sup.nd版，卷1-3，编辑Sambrook等人，Cold Spring Harbor Laboratory Press，Cold SpringHarbor，N.Y.1989(hereinafter，“Sambrook等人，1989”)；CurrentProtocols in Molecular Biology，ed.Ausubel等人，Greene Publishing andWiley-Interscience，New York，1992(定期更新)(在下文，“Ausubel等人，1992”)；和Innis等人，PCR Protocols：A Guide to Methods andApplications，Academic Press：San Diego，1990中描述了制备和使用探针和引物的方法。聚合酶链反应(PCR)引物对可来源于已知的序列，例如，通过使用旨在用于该目的的计算机程序，诸如在Vector NTI version 10(Invitrogen)中的PCR引物分析工具；PrimerSelect(DNASTAR Inc.，Madison，Wis.)；和Primer(Version 0.5.COPYRGT.，1991，WhiteheadInstitute for Biomedical Research，Cambridge，Mass.)。另外，可使用对于本领域技术人员已知的准则目视扫描所述序列和手动鉴定引物。

鉴定大范围核酸酶变体的方法。

可使用各种方法鉴定另外的大范围核酸酶变体。除了其用于如，例如Ausubel、Berger和Sambrook所示的标准克隆方法以生成另外的具有期望的属性大范围核酸酶多核苷酸和多肽，任选地使用本发明的多核苷酸作为底物用于多种多样性生成程序，例如，突变、重组和递归重组反应，可使用多种多样性生成规程。可单独和/或组合使用所述程序以产生多核苷酸或多核苷酸组的一个或多个变体，以及所编码蛋白的变体。单独地和集体地，这些程序提供了稳固的、广泛的应用方法以生成多样化的多核苷酸和多核苷酸组(包括，例如多核苷酸文库)，用于例如多核苷酸、蛋白、途径、细胞和/或生物体的工程化或快速进化使其带有新的和/或改善的特性。改变序列的方法可导致例如，单个核苷酸替换、多个核苷酸替换以及核酸序列区域的插入或缺失。

虽然为清楚起见在随后的讨论过程中进行了区分和分类，但应当理解为，这些技术往往并不互相排斥。实际上，各种方法可单独或组合使用、并行或串联使用以获得各种不同的序列变体。

在应用于多核苷酸时，术语“多元化”和“多样性”是指生成亲本多核苷酸的多个修饰的形式，或多个亲本多核苷酸。在多核苷酸编码一种多肽的情况下，所述多核苷酸的核苷酸序列的多样性可导致其对应编码的多肽的多样性，例如编码多个多肽变体的多核苷酸的各种不同的组。在本发明的一些实施例中，这种序列多样性的利用是通过针对带有期望的功能属性的变体(例如，编码具有增强的功能特性的大范围核酸酶的多核苷酸)来筛选/选择多样化的多核苷酸的文库。

任一本文所述多样性生成程序的结果可以为生成一个或多个多核苷酸，可以选择或筛选编码具有或赋予期望的属性的蛋白的多核苷酸。在通过本文的，或换句话讲技术人员可用的一个或多个方法进行多元化后，针对期望的活性或属性(例如变化的Km、使用替代的辅因子、提高的Kcat等)选择生成的任何多核苷酸。这可包括鉴定任何能被检测的活性，例如，通过本领域的任何测定法，以自动化的或可自动化的形式。例如，可通过测定大范围核酸酶活性来检测修饰的大范围核酸酶多肽。在本文其他地方描述了测量此类活性的测定法。可对多种相关的(或甚至不相关的)属性以串行或并行方式进行评估，由从业人员酌情决定。

对多种多样性生成程序，包括家族改组，和生成编码多个酶结构域的修饰的核酸序列的方法的描述存在与下列出版物和本文引用的参考文献中：Soong N.等人(2000)Nat Genet 25(4)：436-39；Stemmer等人(1999)Tumor Targeting 4：1-4；Ness等人(1999)Nature Biotechnology17：893-896；Chang等人(1999)Nature Biotechnology 17：793-797；Minshulland Stemmer(1999)Current Opinion in Chemical Biology 3：284-290；Christians等人(1999)Nature Biotechnology 17：259-264；Crameri等人(1998)Nature 391：288-291；Crameri等人(1997)Nature Biotechnology15：436-438；Zhang等人(1997)Proc.Natl.Acad.Sci.USA 94：4504-4509；Patten等人(1997)Current Opinion in Biotechnology 8：724-733；Crameri等人(1996)Nature Medictne 2：100-103；Crameri等人(1996)NatureBiotechnology 14：315-319；Gates等人(1996)Journal of Molecular Biology255：373-386；Stemmer(1996)“Sexual PCR and Assembly PCR”In：TheEncyclopedia of Molecular Biology.VCH Publishers，New York.447-457页；Crameri and Stemmer(1995)Bio Techniques 18：194-195；Stemmer等人(1995)Gene：164：49-53；Stemmer(1995)Science 270：1510；Stemmer(1995)Bio/Technology 13：549-553；Stemmer(1994)Nature 370：389-391；以及Stemmer(1994)Proc.Natl.Acad.Sci.USA 91：10747-10751。还可参见WO2008/073877和US 20070204369，两者其全文以引用方式并入本文。

生成多样性的突变方法包括，例如，定点诱变(Ling等人(1997)Anal Biochem.254(2)：157-178；Dale等人(1996)Methods Mol.Biol.57：369-374；Smith(1985)Ann.Rev.Genet.19：423-462；Botstein &Shortle(1985)Science 229：1193-1201；Carter(1986)Biochem.J.237：1-7；和Kunkel(1987)Nucleic Acids & Molecular Biology(Eckstein，F.andLilley，D.M.J.eds.，Springer Verlag，Berlin))；使用含尿嘧啶的模板诱变(Kunkel(1985)Proc.Natl.Acad.Sci.USA 82：488-492；Kunkel等人(1987)Methods in Enzymol.154，367-382；he Bass等人(1988)Science242：240-245)；寡核苷酸指导的诱变(Methods in Enzymol.100：468-500(1983)；Methods in Enzymol.154：329-350(1987)；Zoller & Smith(1982)Nucleic Acids Res.10：6487-6500；Zoller & Smith(1983)Methodsin Enzymol.100：468-500；和Zoller & Smith(1987)Methods in Enzymol.154：329-350)；硫代磷酸酯修饰的DNA诱变(Taylor等人(1985)Nucl.Acids Res.13：8749-8764；Taylor等人(1985)Nucl.Acids Res.13：8765-8787(1985)；Nakamaye & Eckstein(1986)Nucl.Acids Res.14：9679-9698；Sayers等人(1988)Nucl.Acids Res.16：791-802；和Sayers等人(1988)Nucl.Acids Res.16：803-814)；利用缺口双链DNA诱变(Kramer等人(1984)Nucl.Acids Res.12：9441-9456；Kramer & Fritz(1987)Methods inEnzymol.154：350-367；Kramer等人(1988)Nucl.Acids Res.16：7207；和Fritz等人(1988)Nucl.Acids Res.16：6987-6999)。

另外合适的方法包括但不限于点错配修复(Kramer等人(1984)Cell38：879-887)、使用修复缺陷型宿主品系的诱变(Carter等人(1985)Nucl.Acids Res.13：4431-4443；和Carter(1987)Methods in Enzymol.154：382-403)、缺失诱变(Eghtedarzadeh & Henikoff(1986)Nucl.Acids Res.14：5115)、限制选择和限制纯化(Wells等人(1986)Phil.Trans.R.Soc.Lond.A 317：415-423)、通过全基因合成的诱变(Nambiar等人(1984)Science223：1299-1301；Sakamar和Khorana(1988)Nucl.Acids Res.14：6361-6372；Wells等人(1985)Gene 34：315-323；和等人(1985)Nucl.Acids Res.13：3305-3316)、以及双链断裂修复(Mandecki(1986)；Arnold(1993)Current Opinion in Biotechnology4：450-455 and Proc.Natl.Acad.Sci.USA，83：7177-7181)。许多上述方法的更多细节可见于Methodsin Enzymology 154卷，其也描述了针对各种诱变方法的故障排除问题可用的对照。

关于各种多样性生成方法的更多细节可见于下列美国专利、PCT公开和EPO公开：美国专利5,605,793、美国专利5,811,238、美国专利5,830,721、美国专利5,834,252、美国专利5,837,458、WO 95/22625、WO96/33207、WO 97/20078、WO 97/35966、WO 99/41402、WO 99/41383、WO 99/41369、WO 99/41368、EP 752008、EP 0932670、WO 99/23107、WO 99/21979、WO 98/31837、WO 98/27230、WO 98/13487、WO00/00632、WO 00/09679、WO 98/42832、WO 99/29902、WO 98/41653、WO 98/41622、WO 98/42727、WO 00/18906、WO 00/04190、WO00/42561、WO 00/42559、WO 00/42560、WO 01/23401、和PCT/US01/06775。还可参见WO20074303，以引用方式并入本文。

简而言之，若干不同通用类别的序列修饰方法，诸如突变、重组等，适用于本发明并且如例如上述参考中所示。即，在所述序列的连接之前或在连接步骤之后，可通过任何数量的上述规程来改变组分核酸序列以生成修饰的基因融合构建体。下文举例说明了针对本发明的上下文中的多样性生成的优选形式的一些不同类型，包括例如，某些基于重组的多样性生成形式。

可通过上述参考文献中讨论的多种技术的任一个进行核酸体外重组，包括例如，将要重组的核酸用DNA酶消化，之后是连接和/或PCR组装核酸。例如，可使用有性PCR诱变，其中所述DNA分子的随机(或伪随机或甚至非随机)片段和之后是体外重组(基于DNA分子与不同但相关联的DNA序列之间的序列相似性)，之后是通过在聚合酶链反应中延伸将交叉固定。在若干上述参考文献中描述了这个方法和许多方法变体，例如在Stemmer(1994)Proc.Natl.Acad.Sci.USA 91：10747-10751中。

相似地，可在体内递归重组核酸，例如，通过允许重组发生在细胞中的核酸之间。许多此类体内重组形式如上述提到的参考文献所述。此类形式任选地提供了在目的核酸之间直接重组，或提供了在包含目的核酸的载体、病毒、质粒等以及其他形式之间的重组。有关此类程序的细节可见于上文提到的参考文献中。

也可使用全基因组重组方法，其中将细胞或其他生物体的整个基因组重组，任选地包括以及基因组重组混合物掺加期望的文库部件(例如，对应于本发明的途径的基因)。这些方法有许多应用，包括目标基因的同一性未知的那些。关于此类方法的细节可见于例如WO 98/31837和PCT/US99/15972。因此，用于重组、递归重组和全基因组重组的这些方法和技术的任一个可用于生成本发明的修饰的核酸序列和/或修饰的基因融合构建体。

也可使用合成重组方法，其中对应于目的靶标的寡核苷酸被合成并且在聚合酶链反应(PCR)或连接反应中重新组装，所述反应包括对应于多于一种亲本核酸的寡核苷酸，从而生成新的重组的核酸。可通过标准核苷酸添加方法，或例如通过三核苷酸合成方法制备寡核苷酸。有关此类方法的细节可见于上文提到的参考文献，包括，例如WO 00/42561、WO01/23401、WO 00/42560和WO 00/42559。

重组的计算机方法可能会受到影响，其中计算机中使用遗传算法以重组对应于同源的(或甚至非同源的)核酸的序列字符串。通过合成核酸(其对应于重组序列)将所得的重组序列字符串任选地转变为核酸，例如，与寡核苷酸合成/基因重新组装技术相一致。这个方法可生成随机的、部分随机的或设计的变种。在WO 00/42560和WO 00/42559中描述了有关计算机重组的许多细节，包括在计算机系统中使用了遗传算法、遗传运算子等，混合了对应的核酸(和/或蛋白)的生成，以及设计的核酸和/或蛋白的组合(例如，基于交叉位点选择)，以及设计的、伪随机或随机重组方法。

可类似地使用许多获得天然多样性的方法，例如通过将各种不同的核酸或核酸片段与单链模板杂交，之后通过聚合和/或连接以再生全长序列，任选地之后通过降解所述模板并且回收所得的修饰的核酸。在一种方法中采用了单链模板，来源于基因组文库的片段群体与对应于相反链的部分或通常约全长ssDNA或RNA退火。然后通过核酸酶去除未杂交的片段末端、聚合以填补此类片段之间空位以及后续的单链连接来介导来自这个群体的复杂嵌合基因的组装。所述亲本多核苷酸链可通过消化(例如，如果包含RNA或尿嘧啶)、在变性条件下磁力分离(如果标记的方式有利于此类分离)和其他可用的分离/纯化方法而去除。另选地，所述亲本链任选地与嵌合链共纯化并且在后续筛选和处理步骤过程中被去除。关于这种方法的更多细节可见于，例如PCT/US01/06775。

在另一个方法中，单链分子被转变为双链DNA(dsDNA)，并且所述dsDNA分子通过配体介导的结合固定在固体支撑物上。在分离了未固定的DNA后，所选择的DNA分子从支撑物上释放并被导入合适的宿主细胞以生成文库，其富集了杂交至所述探针的序列以这种方法制备的文库提供了合适的底物，使用本文所述的任一程序进一步多样化。

任何前述一般性重组形式可以以反复的方式来实施(例如，突变/重组或其他多样性生成方法的一个或多个循环，任选地之后是一种或多种选择方法)，生成重组核酸的更加多样性的组。

也已提出诱变采用多核苷酸链终止方法(参见例如，美国专利5,965,408和上述参考文献)，并且可应用于本发明。在这个方法中，在存在或不存在基因特异性引物的情况下，将双链DNA(对应于共享序列相似性区域的一个或多个基因)混合并变性。然后在聚合酶和链终止试剂(例如，紫外线、γ或X-射线辐射；溴化乙锭或其它嵌入剂；DNA结合蛋白，诸如单链结合蛋白、转录激活因子或组蛋白；多环芳烃类；三价铬或三价铬盐；或由快速热循环介导的简略聚合；等)的存在下将单链多核苷酸退火并温育，导致产生部分双链分子。然后将所述部分双链分子(例如包含部分延伸的链的)变性并在后续的复制或部分复制轮次中重新退火，产生的多核苷酸共享不同程度的序列相似性并且相对于DNA分子的起始群体是多样化的。任选地，可在所述方法的一个或多个阶段扩增所述产物或产物的部分组。通过链终止方法(诸如上述的那些)制备的多核苷酸对于任何其它所述重组形式是合适的底物。

也可使用在Ostermeier等人(1999)Nature Biotech 17：1205中所述的名为“渐增切割法产生杂和酶”(“ITCHY”)的重组方法在核酸或核酸群体中生成多样性。这个方法也可用于生成变体的起始文库，其可任选地被用作一个或多个体外或体内重组方法的底物。还可参见，Ostermeier等人(1999)Proc.Natl.Acad.Sci.USA，96：3562-67；Ostermeier等人(1999)，Biological and Medicinal Chem istry 7：2139-44。

可优选采用突变方法(其导致各个核苷酸或邻接的或非邻接的核苷酸组的改变)将核苷酸多样性导乳本发明的核酸序列和/或基因融合构建体。许多诱变方法可见于上文引用的参考文献；有关诱变方法的另外的细节可见于下文，其也可应用于本发明。

例如，错误倾向聚合酶链反应(PCR)可用于生成核酸变体。使用这种技术，在DNA聚合酶的拷贝保真性低的条件下进行聚合酶链反应(PCR)，使得沿着所述聚合酶链反应(PCR)产物的整个长度获得了很高的点突变率。此类技术的例子可见于上述参考文献和例如，Leung等人(1989)Technique 1：11-15和Caldwell等人(1992)PCR MethodsApplic.2：28-33中。相似的，在方法中可使用装配聚合酶链反应(PCR)，其涉及从小DNA片段的混合物组装聚合酶链反应(PCR)产物。在相同的反应混合物中可平行地进行大量不同的聚合酶链反应(PCR)反应，一个反应的产物引发另一个反应。

可使用寡核苷酸定向诱变以在目的核酸序列中导入位点特异性突变。此类技术的示例可见于上述参考文献和例如，Reidhaar-Olson等人(1988)Science 241：53-57中。相似的，在方法中可使用盒诱变，其用不同于原生序列的合成寡核苷酸盒替换了一小段区域的双链DNA分子。所述寡核苷酸可包含，例如，完全和/或部分随机化的原生序列。

递归集合诱变是使用针对蛋白诱变的算法以生成各种不同的表型相关的突变体的群体(其成员在氨基酸序列上不同)的方法。该方法使用反馈机制以监控连续轮次的组合盒诱变。该方法的示例可见于Arkin & Youvan(1992)Proc.Natl.Acad.Sci.USA 89：7811-7815。

可使用指数集合诱变以生成具有高百分比的独特的功能性突变体组合文库。在目的序列中残基的小基团被平行地随机化以在每个改变的位置处识别导致功能性蛋白的氨基酸。此类程序的示例可见于Delegrave & Youvan(1993)Biotechnology Research 11：1548-1552。

可使用体内诱变，通过例如，在一个或多个DNA修复途径中带有突变的大肠杆菌(E.coli)菌株中传播DNA，在任何克隆的目的DNA中生成随机突变。这些“增变基因”菌株较野生型亲本具有更高的随机突变率。在这些菌株之一中传播所述DNA会最终在DNA内生成随机突变。此类程序在上文提到的参考文献中有所描述。

其它在基因组(例如细菌、真菌、动物植物基因组)中导入多样性的方法可与前述的和/或参考的方法一起使用。例如，除了上述方法外，已经提出了制备适用于转化多种物种的核酸多聚体的技术(参见例如，美国专利5,756,316和上述参考文献)。用此类多聚体转化合适的宿主提供了一种针对DNA多元化的核酸多样性来源(例如通过如上文所指出的体内重组方法)，所述多聚体由相对于彼此不同的基因组成(例如，来源于天然的多样性或通过应用定点诱变、易错聚合酶链反应(PCR)、通过致突变细菌菌株的通道等等)。

另选地，可将共享部分序列相似性区域的多个单体多核苷酸转化进宿主物种并被宿主细胞体内重组。可使用后续轮次的细胞分裂生成文库，其成员包括单一、均一化群体或单体多核苷酸组。另选地，可通过标准技术回收所述单体核酸，例如，聚合酶链反应(PCR)和/或克隆，并且以任一重组形式(包括上文所述递归从组形式)重组。

已经描述了生成多物种表达文库的方法(除了上文提到的参考文献，参见例如，美国专利5,783,431和美国专利5,824,485)，并且已经提出了将其用于鉴定目的蛋白活性(除了上文提到的参考文献，参见美国专利5,958,672)。一般来讲，多物种表达文库包括包含来自多个物种或品系的cDNA或基因组序列(可操作地连接至合适的调控序列、在表达盒中)的文库。所述cDNA和/或基因组序列任选地是随机连接的以另外增强多样性。所述载体可以为适用于在多余一种宿主生物体物种(例如，细菌物种，真核细胞)中转化和表达的穿梭载体。在一些情况下，由于对序列(编码目的蛋白或杂交至目的核酸)进行了预选择，所述文库是有偏差的。任何此类文库可作为本文所述任一方法的底物。

前述的程序主要涉及提高核酸和/或编码的蛋白质的多样性。然而，在许多情况下，并非所有的多样性都有用，例如功能性，并且仅有助于提高变体的背景，所述变体必须经过筛选或选择以鉴定少数有利变体。在一些应用中，希望在多元化(例如通过基于重组的诱变程序)，或在以其他方式使底物偏向编码功能性产物的核酸之前对文库(例如，扩增的文库、基因组文库、cDNA文库、标准化的文库)或其他底物核酸分子进行预选择或预筛选。例如，就抗体工程而言，有可能在通过任一所述方法进行操纵之前利用体内重组事件将多样性生成方法偏向具有功能性抗原结合位点的抗体。例如，在按照任一本文所述方法进行多样化之前，可扩增来源于B细胞cDNA文库的重组CDR并组装为框架区域(例如，Jirholt等人(1998)Gene 215：471)。

可将文库偏置向编码具有期望的酶活性的蛋白的核酸。例如，在鉴定来自文库、表现出指定活性的变体后，可使用任何已知的用于导入DNA改变的方法诱变所述变体。然后针对期望的活性对包含所述诱变的同源物的文库进行筛选，所述活性可与初始指定的活性相同或不同。美国专利5,939,250提出了此类程序的一个示例。可通过本领域任何已知方法鉴定期望的活性。例如，WO 99/10539提出通过将来自基因文库的提取物与得自代谢丰富的细胞的组分混合、鉴定表现出期望活性的组合来筛选基因文库。还已经提出(例如，WO 98/58085)可通过在文库的样品中插入生物活性底物、使用荧光分析仪(例如，流式细胞仪、CCD、荧光计或分光光度计)来检测对应于期望活性的产物的生物活性荧光来鉴定具有期望活性的克隆。

文库也可被偏置向具有指定特性(例如，杂交至所选择的核酸探针)的核酸。例如，应用WO 99/10539提出可以下列方式从基因组DNA序列中鉴定编码期望活性(例如，酶活性，例如：脂肪酶、酯酶、蛋白酶、糖苷酶、糖基转移酶、磷酸酶、激酶、加氧酶、过氧化物酶、水解酶、水合酶、腈水解酶、转氨酶、酰胺酶或酰化酶)的多核苷酸。间给来自一组基因组DNA的单链DNA分子与配体偶联的探针杂交。所述基因组DNA可来源于养殖的或非养殖的微生物体，或来自环境样本。另选地，所述基因组DNA可来源于多细胞生物体或由其衍生的组织。之前从或不从捕获介质上释放或通过本领域已知的各种各样的其他策略，第二链合成可直接从捕获物中所用的杂交探针进行。另选地，如上所述，所述分离的单链的基因组DNA群体可以为片段化而不进一步克隆并且直接用于，例如，基于重组的方法(其使用单链模板)。

生成核酸和多肽的“非随机”方法可见于WO 00/46344。将这些方法，包括提议的非随机多核苷酸重新组装和位点饱和诱变方法应用至本发明为好。在例如，Arkin和Youvan(1992)Biotechnology 10：297-300；Reidhaar-Olson等人(1991)Methods Enzymol.208：564-86；Lim和Sauer(1991)J.Mol.Biol.219：359-76；Breyer和Sauer(1989)J.Biol.Chem.264：13355-60)；和美国专利5,830,650和5,798,208，EP专利0527809B1中也描述了使用掺杂的或简并的寡核苷酸的随机或半随机诱变。

很容易理解，也可在多样化之前使用任何前述的适用于富集文库的技术来筛选通过多样性生成方法制备的产物或产物的文库。可递归地或组合地实施任一前述的方法以改变核酸，例如编码大范围核酸酶的多核苷酸。

前述参考文献提供了许多突变的形式，包括重组、递归重组和组合或带有其他诱变形式的重组，以及这些形式的许多修饰。不管所用的多样性生成形式，可将本发明的核酸(彼此，或与相关的(或甚至不相关的)序列)重组以制备用于基因融合构建体和本发明的改性的基因融合构建体的重组核酸的各种不同的组，包括，例如同源核酸以及对应的多肽的组。

用于生成修饰的多核苷酸的许多前述的方法学生成了亲本序列或序列的大量各种不同的变体。在一些实施例中，修饰技术(例如，一些基因改组的形式)被用于生成变体文库，然后筛选修饰的多核苷酸或编码一些期望的功能属性(例如提高大范围核酸酶活性)的改性多核苷酸组。

为了方便和高通量，通常期望在微生物(例如诸如大肠杆菌(E.coli)的细菌)体中筛选/选择期望的改性核酸。另一方面，在最终目标是生成用于在植物系统中表达的改性核酸的情况下，在植物细胞或植物中筛选可以为优选的。

在本发明的一些优选的实例中通过筛选表达单独的或作为基因融合构建体一部分的不同改性核酸宿主细胞组提高生产能力。可将任何显示显著活性的组进行去卷积以鉴定表达期望活性的单个变体。

在高通量测定在，有可能在一天筛选最多至数千个不同的变体。例如，微升板的每个孔可用于运行一个独立的测定，或者，如果要观察浓度或温育时间效应，每5-10个孔可测试单个变体。

除了流体方法，如上所述，有可能简单地让细胞生长在培养基平板上来筛选期望的酶功能或代谢功能。该方法提供了一种简单并且高通量的筛选方法。

针对测试系统中可用的溶液相化学已经开发了多个熟知的机器人系统。这些系统包括类似由Takeda Chemical Industries，LTD.(Osaka，Japan)开发的自动化合成设备的自动化工作站，和许多利用机械臂的机器人系统(Zymate II，Zymark Corporation，Hopkinton，MA.；Orca，Hewlett-Packard，Palo Alto，CA)，其模拟科学家进行的手动合成操作。上述设备的任一个适用于本发明的应用。这些设备的本质和具体实施的修改(如果有的话)使得它们能如本文讨论的、参照对于相关领域的技术人员显而易见的整合系统进行操作。

高通量筛选系统可商购获得(参见，例如，Zymark Corp.，Hopkinton，MA；Air Technical Industries，Mentor，OH；Beckman Instruments，Inc.Fullerton，CA；Precision Systems，Inc.，Natick，MA等)。这些系统通常自动化整个的流程，包括全部的样品和试剂移液、液体的分配、定时孵育、以及最终在适合该检测的检测器中对微孔板的读数。这些可配置的系统提供了高通量和快速启动以及高度的灵活度和用户定制化。

此类系统的制造商提供了针对各种高通量设备的详细规程。因此，例如，Zymark Corp.提供技术公告描述了用于检测基因转录的调节、配体结合等的筛选系统。试剂操纵的微流体方法也已被例如，Caliper Technologies(Mountain View，CA)开发。

酵母和植物

提供了本文所公开的具有所述大范围核酸酶序列的酵母、植物、植物细胞、种子和谷物。在具体实施例中，所述酵母、植物和/或植物部分稳定地掺入了至少一种本文所公开的异源大范围核酸酶多肽或其活性变体或片段。因此，提供了酵母、植物、植物细胞和种子，其包含至少一种异源大范围核酸酶序列，所述序列为SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、262、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、315、316、317、318、319、320、330、331、332、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402或403的任何一个或本文所公开的其他变体(诸如在实例3-23中的那些)或所述大范围核酸酶序列的生物活性片段和/或变体的任何一个。在具体实施例中，所述大范围核酸酶序列的特征在于具有大范围核酸酶活性。

在具体实施例中，植物或植物部分中的异源多核苷酸可操作地连接至组成型的、组织优选的或用于在植物中表达的其他启动子。

所述酵母、植物、植物细胞和种子可包含任一本文提供的识别序列。例如，所述识别位点可选自LIG3-4(SEQ ID NO：2)、MHP77(SEQ IDNO：85)、MS26(SEQ ID NO：269)、MHP14(SEQ ID NO：281)、MP107(SEQ ID NO：328)、ZM6.3(SEQ ID NO：355)、ZM6.22V2(SEQ IDNO：388)、TS21(SEQ ID NO：423)和/或TS14(SEQ ID NO：424)识别序列或其活性变体。

如本文所用，术语植物包括植物细胞、植物原生质体、从其中再生植物的植物细胞组织培养物、植物愈伤组织、植物，植物丛生物、以及在植物或植物部分中完整的植物细胞如胚芽、花粉、胚珠、种子、叶片、花、仁、穗、芯、壳、茎、根、根尖、花药等。谷物旨在表示商业化种植者出于栽培或繁殖物种之外的目的生产的成熟种子。再生植物的子代、变体和突变体也包括在本发明的范围内，前提条件是这些部分包含导入的多核苷酸。

本文提供的转化的植物或转化的植物细胞是指其遗传改变，诸如转化，已被目的基因影响，或来自这种改性的植物或细胞的后代并包含这种改性的植物或植物细胞。“转基因”是已通过转化方法导入基因组内的基因。因此，“转基因植物”是指包含转基因的植物，不论是通过转化或通过育种将转基因引入特定植物的；因此，该定义涵盖了最初转化的植物的后代。“对照”或“对照植物”或“对照植物细胞”为测量受试植物或植物细胞的表型变化提供了基准点。对照植物或植物细胞可包括例如：(a)野生型植物或细胞，即，与用于遗传改性生成受试植物或细胞的起始材料具有相同基因型的；(b)与起始材料具有相同基因型、但用空构建体转化了的植物或细胞(即，用不表达转基因的构建体，诸如包含标记基因的构建体)；(c)为受试植物或植物细胞子代中的非转化的分离体的植物或植物细胞；(d)与受试植物或植物细胞遗传上相同、但未暴露于将导致转基因表达的条件或刺激的植物或植物细胞；或(e)处于构建体不表达条件下的受试植物或植物细胞自身。

经转化以表达本文提供的大范围核酸酶的植物细胞可长成完整植物。从单个植物原生质体转化体或从多种经转化的外植体再生、发育和培育植物是本领域所熟知的。参见例如McCormick等人(1986)Plant Cell Reports5：81-84；Weissbach和Weissbach，In：Methods for Plant MolecularBiology，(编辑)，Academic Press，Inc.San Diego，Calif.，(1988)。该再生和生长方法通常包括如下步骤：选择转化的细胞、培养这些单独化的细胞通过胚发育的通常阶段以及通过生根小植物阶段。转基因胚以及种子以类似的方式再生。随后将所得的转基因的生根小苗种植在诸如土壤之类的合适植物生长培养基中。优选地，将再生的植物进行自花授粉以产生纯合的转基因植物。或者，将得自再生植物的花粉与农学上重要的品系的产生种子的植物进行杂交。相反，将来自这些重要品系的植物用于给再生植物授粉。可以生长两代或多代以保证所希望的表型特征的表达稳定地保持和遗传，然后收获种子以保证所希望的表型特征的表达已经实现。这样，本文介绍的组合物提供了转化的种子(也被称为“转基因种子”)，其具有本文提供的稳定地掺入在其基因组中的多核苷酸(例如目标位点)。

本文所公开的大范围核酸酶序列及其活性变体和片段可被用于转化任何植物物种，包括但不限于单子叶植物和双子叶植物。目的植物种类的例子包括但不限于玉米(Zea mays)、芸苔属植物(例如油菜(B.napus)、芜菁(B.rapa)、芥菜(B.juncea))，尤其是那些用作种子油源的芸苔属植物物种、苜蓿(Medicago sativa)、稻(Oryza sativa)、黑麦(Secalecereale)、高粱(蜀黍(Sorghum bicolor)、南非蜀黍(Sorghumvulgar))、小米(例如珍珠粟(Pennisetum glaucum)、黄米(Panicummiliaceum)、粟(Setaria italica)、龙爪稷(Eleusine coracana))、向日葵(Helian因此annuus)、红花(Carthamus tinctorius)、小麦(Triticumaestivum)、大豆(Glycine max)、烟草属植物(Nicotiana tabacum)、马铃薯(Solanum tuberosum)、花生(Arachis hypogaea)、棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯(Ipomoea batatus)、木薯(Manihot esculenta)、咖啡(Coffea属物种)、椰子(Cocos nucifera)、菠萝(Ananas comosus)、柑橘(Citrus属物种)、可可(Theobroma cacao)、茶(Camellia sinensis)、香蕉(Musa属物种)、鳄梨(Persea americana)、无花果(Ficus casica)、番石榴(Psidium guajava)、芒果(Mangifera indica)、橄榄(Olea europaea)、番木瓜果(Carica papaya)、腰果(Anacardium occidentale)、澳大利亚坚果(Macadamia integrifolia)、杏(Prunus amygdalus)、甜菜(Betavulgaris)、甘蔗(Saccharum属物种)、燕麦、大麦、蔬菜、观赏植物、和针叶树。

蔬菜包括西红柿(Lycopersicon esculentum)、莴苣(例如叶用莴苣(Lactuca sativa))、菜豆(Phaseolus vulgaris)、利马豆(Phaseoluslimensis)、豌豆(香豌豆属物种(Lathyrus spp.))、和黄瓜属(Cucumis)物种如黄瓜(C.sativus)、香瓜(C.cantalupensis)和甜瓜(C.melo)。观赏植物包括杜鹃花(Rhododendron属物种)、八仙花(Macrophyllahydrangea)、木槿(Hibiscus rosasanensis)、蔷薇(Rosa属物种)、郁金香(Tulipa属物种)、水仙花(Narcissus)属物种、矮牵牛花(Petuniahybrida)、康乃馨(Dian因此caryophyllus)、一品红(Euphorbiapulcherrima)、和菊花。

实施本发明时可使用的针叶树包括例如松树如火炬松(Pinus taeda)、沼泽松(Pinus elliotii)、北美黄松(Pinus ponderosa)、黑松(Pinuscontorta)、和辐射松(Pinus radiata)；花旗松(Pseudotsuga menziesii)；异叶铁杉(Tsuga canadensis)；北美云杉(Picea glauca)；红杉(Sequoiasempervirens)；真冷杉如银枞(Abies amabilis)和香脂冷杉(Abiesbalsamea)；和雪松诸如西岸红雪松(Thuja plicata)和阿拉斯加黄桧(Chamaecyparis nootkatensis)，以及杨树和桉树。在具体的实施例中，本发明的植物为作物植物(例如，玉米、苜蓿、向日葵、芸苔属植物、大豆、红花、豌豆、高粱、小麦、粟、烟草属植物等)。在其它实施例中，玉米和大豆植物是最佳的，在另外的实施例中玉米植物是最佳的。

其他目的植物包括提供所关注种子的谷物植物、油料种子植物和豆科植物。目的种子包括谷物种子，诸如玉米、小麦、大麦、稻、高粱、黑麦等。油料种子植物包括棉花、大豆、红花、向日葵、芸苔属植物、玉米、苜蓿、棕榈、椰子等。豆科植物包括菜豆和豌豆。菜豆包括瓜尔胶、刺槐豆胶、胡芦巴、大豆、花园豆、豇豆、绿豆、利马豆、蚕豆、扁豆、鹰嘴豆等。

本文所公开的组合物和方法的非限制性例子如下述：

1.一种分离的或重组的多核苷酸，其包含编码大范围核酸酶多肽的核苷酸序列，所述多肽包含：

a)在对应于SEQ ID NO：1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346、348、以及它们的组合；或

b)具有(a)的任何氨基酸修饰中的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44个的氨基酸序列。

2.根据实施例1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：1具有至少80％、81，％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％的序列同一性的大范围核酸酶多肽。

3.根据实施例1所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包含：

a)在对应于SEQ ID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；

b)在对应于SEQ ID NO：1中氨基酸位置12的位置处的组氨酸(H)；

c)在对应于SEQ ID NO：1中氨基酸位置16的位置处的异亮氨酸(I)；

d)在对应于SEQ ID NO：1中氨基酸位置22的位置处的半胱氨酸(C)；

e)在对应于SEQ ID NO：1中氨基酸位置23的位置处的亮氨酸(L)；

f)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；

g)在对应于SEQ ID NO：1中氨基酸位置36的位置处的天冬酰胺(N)；

h)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；

i)在对应于SEQ ID NO：1中氨基酸位置50的位置处的精氨酸(R)或赖氨酸(K)；

j)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；

k)在对应于SEQ ID NO：1中氨基酸位置58的位置处的异亮氨酸(I)；

l)在对应于SEQ ID NO：1中氨基酸位置59的位置处的组氨酸(H)或丙氨酸(A)；

m)在对应于SEQ ID NO：1中氨基酸位置62的位置处的缬氨酸(V)

n)在对应于SEQ ID NO：1中氨基酸位置71的位置处的赖氨酸(K)；

o)在对应于SEQ ID NO：1中氨基酸位置72的位置处的苏氨酸(T)；

p)在对应于SEQ ID NO：1中氨基酸位置73的位置处的丙氨酸(A)；

q)在对应于SEQ ID NO：1中氨基酸位置80的位置处的精氨酸(R)；

r)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；

s)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；

t)在对应于SEQ ID NO：1中氨基酸位置86的位置处的天冬氨酸(D)；

u)在对应于SEQ ID NO：1中氨基酸位置91的位置处的异亮氨酸(I)；

v)在对应于SEQ ID NO：1中氨基酸位置95的位置处的异亮氨酸(I)；

w)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；

x)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；

y)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；

z)在对应于SEQ ID NO：1中氨基酸位置114的位置处的脯氨酸(P)；

aa)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；

bb)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；

cc)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；

dd)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；

ee)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；

ff)在对应于SEQ ID NO：1中氨基酸位置128的位置处的半胱氨酸(C)；

gg)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；

hh)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；

ii)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；

jj)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；

kk)在对应于SEQ ID NO：1中氨基酸位置153的位置处的亮氨酸(L)或甲硫氨酸(M)；

ll)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；

mm)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；

nn)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；

oo)在对应于SEQ ID NO：1中氨基酸位置162的位置处的酪氨酸(Y)；

pp)在对应于SEQ ID NO：1中氨基酸位置163的位置处的精氨酸(R)；

qq)在对应于SEQ ID NO：1中氨基酸位置164的位置处的组氨酸(H)；

rr)在对应于SEQ ID NO：1中氨基酸位置165的位置处的亮氨酸(L)；

ss)在对应于SEQ ID NO：1中氨基酸位置166的位置处的精氨酸(R)；

tt)在对应于SEQ ID NO：1中氨基酸位置167的位置处的组氨酸(H)；

uu)在对应于SEQ ID NO：1中氨基酸位置168的位置处的脯氨酸(P)；

vv)在对应于SEQ ID NO：1中氨基酸位置169的位置处的丙氨酸(A)；

ww)在对应于SEQ ID NO：1中氨基酸位置170的位置处的脯氨酸(P)；

xx)在对应于SEQ ID NO：1中氨基酸位置171的位置处的组氨酸(H)；

yy)在对应于SEQ ID NO：1中氨基酸位置172的位置处的脯氨酸(P)；

zz)在对应于SEQ ID NO：1中氨基酸位置173的位置处的精氨酸(R)；

aaa)在对应于SEQ ID NO：1中氨基酸位置174的位置处的亮氨酸(L)；

bbb)在对应于SEQ ID NO：1中氨基酸位置175的位置处的脯氨酸(P)；

ccc)在对应于SEQ ID NO：1中氨基酸位置176的位置处的谷氨酰胺(Q)；

ddd)在对应于SEQ ID NO：1中氨基酸位置177的位置处的丙氨酸(A)；

eee)在对应于SEQ ID NO：1中氨基酸位置178的位置处的精氨酸(R)；

fff)在对应于SEQ ID NO：1中氨基酸位置179的位置处的缬氨酸(V)；

ggg)在对应于SEQ ID NO：1中氨基酸位置180的位置处的谷氨酰胺(Q)；

hhh)在对应于SEQ ID NO：1中氨基酸位置182的位置处的缬氨酸(V)；

iii)在对应于SEQ ID NO：1中氨基酸位置183的位置处的脯氨酸(P)；

jjj)在对应于SEQ ID NO：1中氨基酸位置184的位置处的赖氨酸(K)；

kkk)在对应于SEQ ID NO：1中氨基酸位置185的位置处的苏氨酸(T)或组氨酸(H)；

lll)在对应于SEQ ID NO：1中氨基酸位置186的位置处的丝氨酸(S)；

mmm)在对应于SEQ ID NO：1中氨基酸位置187的位置处的谷氨酸(E)；

nnn)在对应于SEQ ID NO：1中氨基酸位置188的位置处的亮氨酸(L)；

ooo)在对应于SEQ ID NO：1中氨基酸位置189的位置处的谷氨酸(E)；

PPP)在对应于SEQ ID NO：1中氨基酸位置190的位置处的谷氨酰胺(Q)；

qqq)在对应于SEQ ID NO：1中氨基酸位置191的位置处的亮氨酸(L)；

rrr)在对应于SEQ ID NO：1中氨基酸位置194的位置处的脯氨酸(P)；

sss)在对应于SEQ ID NO：1中氨基酸位置195的位置处的赖氨酸(K)；

ttt)在对应于SEQ ID NO：1中氨基酸位置196的位置处的丝氨酸(S)；

uuu)在对应于SEQ ID NO：1中氨基酸位置197的位置处的苯丙氨酸(F)；

vvv)在对应于SEQ ID NO：1中氨基酸位置200的位置处的异亮氨酸(I)；

www)在对应于SEQ ID NO：1中氨基酸位置203的位置处的缬氨酸(V)；

xxx)在对应于SEQ ID NO：1中氨基酸位置204的位置处的亮氨酸(L)；

yyy)在对应于SEQ ID NO：1中氨基酸位置209的位置处的半胱氨酸(C)；

zzz)在对应于SEQ ID NO：1中氨基酸位置222的位置处的亮氨酸(L)；

aaaa)在对应于SEQ ID NO：1中氨基酸位置232的位置处的异亮氨酸(I)；

bbbb)在对应于SEQ ID NO：1中氨基酸位置236的位置处的丝氨酸(S)；

cccc)在对应于SEQ ID NO：1中氨基酸位置237的位置处的亮氨酸(L)或精氨酸(R)；

dddd)在对应于SEQ ID NO：1中氨基酸位置246的位置处的组氨酸(H)；

eeee)在对应于SEQ ID NO：1中氨基酸位置254的位置处的异亮氨酸(I)；

ffff)在对应于SEQ ID NO：1中氨基酸位置258的位置处的丝氨酸(S)；

gggg)在对应于SEQ ID NO：1中氨基酸位置267的位置处的精氨酸(R)；

hhhh)在对应于SEQ ID NO：1中氨基酸位置278的位置处的异亮氨酸(I)；

iiii)在对应于SEQ ID NO：1中氨基酸位置281的位置处的酪氨酸(Y)；

jjjj)在对应于SEQ ID NO：1中氨基酸位置282的位置处的苯丙氨酸(F)；

kkkk)在对应于SEQ ID NO：1中氨基酸位置289的位置处的苏氨酸(T)；

llll)在对应于SEQ ID NO：1中氨基酸位置308的位置处的甘氨酸(G)；

mmmm)在对应于SEQ ID NO：1中氨基酸位置311的位置处的精氨酸(R)；

nnnn)在对应于SEQ ID NO：1中氨基酸位置312的位置处的丙氨酸(A)；

oooo)在对应于SEQ ID NO：1中氨基酸位置316的位置处的丙氨酸(A)；

PPPP)在对应于SEQ ID NO：1中氨基酸位置318的位置处的精氨酸(R)；

qqqq)在对应于SEQ ID NO：1中氨基酸位置334的位置处的丙氨酸(A)；

rrrr)在对应于SEQ ID NO：1中氨基酸位置339的位置处的苯丙氨酸(F)；

ssss)在对应于SEQ ID NO：1中氨基酸位置340的位置处的甘氨酸(G)或亮氨酸(L)；

tttt)在对应于SEQ ID NO：1中氨基酸位置342的位置处的丝氨酸(S)；

uuuu)在对应于SEQ ID NO：1中氨基酸位置345的位置处的天冬酰胺(N)；

vvvv)在对应于SEQ ID NO：1中氨基酸位置346的位置处的天冬酰胺(N)；

wwww)在对应于SEQ ID NO：1中氨基酸位置348的位置处的天冬酰胺(N)；或

xxxx)a)至wwww)的任何组合。

根据实施例1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽还包含：

a)在对应于SEQ ID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；

b)在对应于SEQ ID NO：1中氨基酸位置12的位置处的组氨酸(H)；

d)在对应于SEQ ID NO：1中氨基酸位置19的位置处的丝氨酸(S)或丙氨酸(A)；

e)在对应于SEQ ID NO：1中氨基酸位置22的位置处的半胱氨酸(C)；

f)在对应于SEQ ID NO：1中氨基酸位置23的位置处的亮氨酸(L)；

g)在对应于SEQ ID NO：1中氨基酸位置24的位置处的甲硫氨酸(M)；

h)在对应于SEQ ID NO：1中氨基酸位置28的位置处的精氨酸(R)或丙氨酸(A)；

i)在对应于SEQ ID NO：1中氨基酸位置30的位置处的精氨酸(R)、丙氨酸(A)、谷氨酰胺(Q)、半胱氨酸(C)、甘氨酸(G)、丝氨酸(S)、苏氨酸(T)、亮氨酸(L)、谷氨酸(E)或脯氨酸(P)；

j)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；

k)在对应于SEQ ID NO：1中氨基酸位置32的位置处的精氨酸(R)、丙氨酸(A)、赖氨酸(K)、谷氨酰胺(Q)、甘氨酸(G)或亮氨酸(L)；

l)在对应于SEQ ID NO：1中氨基酸位置36的位置处的天冬酰胺(N)；

m)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；

n)在对应于SEQ ID NO：1中氨基酸位置50的位置处的精氨酸(R)或赖氨酸(K)；

o)在对应于SEQ ID NO：1中氨基酸位置54的位置处的异亮氨酸(I)或亮氨酸(L)；

p)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；

q)在对应于SEQ ID NO：1中氨基酸位置57的位置处的谷氨酸(E)；

r)在对应于SEQ ID NO：1中氨基酸位置58的位置处的异亮氨酸(I)；

s)在对应于SEQ ID NO：1中氨基酸位置59的位置处的组氨酸(H)或丙氨酸(A)；

t)在对应于SEQ ID NO：1中氨基酸位置62的位置处的缬氨酸(V)；

u)在对应于SEQ ID NO：1中氨基酸位置71的位置处的赖氨酸(K)；

v)在对应于SEQ ID NO：1中氨基酸位置72的位置处的苏氨酸(T)；

w)在对应于SEQ ID NO：1中氨基酸位置73的位置处的丙氨酸(A)；

x)在对应于SEQ ID NO：1中氨基酸位置79的位置处的甘氨酸(G)；

y)在对应于SEQ ID NO：1中氨基酸位置80的位置处的精氨酸(R)；

z)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；

aa)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；

bb)在对应于SEQ ID NO：1中氨基酸位置86的位置处的天冬氨酸(D)；

cc)在对应于SEQ ID NO：1中氨基酸位置87的位置处的亮氨酸(L)；

dd)在对应于SEQ ID NO：1中氨基酸位置91的位置处的异亮氨酸(I)；

ee)在对应于SEQ ID NO：1中氨基酸位置95的位置处的异亮氨酸(I)；

ff)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；

gg)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；

hh)在对应于SEQ ID NO：1中氨基酸位置105的位置处的丙氨酸(A)；

ii)在对应于SEQ ID NO：1中氨基酸位置111的位置处的精氨酸(R)；

jj)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；

kk)在对应于SEQ ID NO：1中氨基酸位置114的位置处的脯氨酸(P)；

ll)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；

mm)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；

nn)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；

oo)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；

pp)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；

qq)在对应于SEQ ID NO：1中氨基酸位置128的位置处的半胱氨酸(C)；

rr)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；

ss)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；

tt)在对应于SEQ ID NO：1中氨基酸位置132的位置处的缬氨酸(V)；

uu)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；

vv)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；

ww)在对应于SEQ ID NO：1中氨基酸位置153的位置处的亮氨酸(L)或甲硫氨酸(M)；

xx)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；

yy)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；

zz)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；

aaa)在对应于SEQ ID NO：1中氨基酸位置162的位置处的酪氨酸(Y)；

bbb)在对应于SEQ ID NO：1中氨基酸位置163的位置处的精氨酸(R)；

ccc)在对应于SEQ ID NO：1中氨基酸位置164的位置处的组氨酸(H)；

ddd)在对应于SEQ ID NO：1中氨基酸位置165的位置处的亮氨酸(L)；

eee)在对应于SEQ ID NO：1中氨基酸位置166的位置处的精氨酸(R)；

fff)在对应于SEQ ID NO：1中氨基酸位置167的位置处的组氨酸(H)；

ggg)在对应于SEQ ID NO：1中氨基酸位置168的位置处的脯氨酸(P)；

hhh)在对应于SEQ ID NO：1中氨基酸位置169的位置处的丙氨酸(A)；

iii)在对应于SEQ ID NO：1中氨基酸位置170的位置处的脯氨酸(P)；

jjj)在对应于SEQ ID NO：1中氨基酸位置171的位置处的组氨酸(H)；

kkk)在对应于SEQ ID NO：1中氨基酸位置172的位置处的脯氨酸(P)；

lll)在对应于SEQ ID NO：1中氨基酸位置173的位置处的精氨酸(R)；

mmm)在对应于SEQ ID NO：1中氨基酸位置174的位置处的亮氨酸(L)；

nnn)在对应于SEQ ID NO：1中氨基酸位置175的位置处的脯氨酸(P)；

ooo)在对应于SEQ ID NO：1中氨基酸位置176的位置处的谷氨酰胺(Q)；

ppp)在对应于SEQ ID NO：1中氨基酸位置177的位置处的丙氨酸(A)；

qqq)在对应于SEQ ID NO：1中氨基酸位置178的位置处的精氨酸(R)；

rrr)在对应于SEQ ID NO：1中氨基酸位置179的位置处的缬氨酸(V)；

sss)在对应于SEQ ID NO：1中氨基酸位置180的位置处的谷氨酰胺(Q)；

ttt)在对应于SEQ ID NO：1中氨基酸位置182的位置处的缬氨酸(V)；

uuu)在对应于SEQ ID NO：1中氨基酸位置183的位置处的脯氨酸(P)；

vvv)在对应于SEQ ID NO：1中氨基酸位置184的位置处的赖氨酸(K)；

www)在对应于SEQ ID NO：1中氨基酸位置185的位置处的苏氨酸(T)或组氨酸(H)；

xxx)在对应于SEQ ID NO：1中氨基酸位置186的位置处的丝氨酸(S)；

yyy)在对应于SEQ ID NO：1中氨基酸位置187的位置处的谷氨酸(E)；

zzz)在对应于SEQ ID NO：1中氨基酸位置188的位置处的亮氨酸(L)；

aaaa)在对应于SEQ ID NO：1中氨基酸位置189的位置处的谷氨酸(E)；

bbbb)在对应于SEQ ID NO：1中氨基酸位置190的位置处的谷氨酰胺(Q)；

cccc)在对应于SEQ ID NO：1中氨基酸位置191的位置处的亮氨酸(L)；

dddd)在对应于SEQ ID NO：1中氨基酸位置192的位置处的氨基酸缺失；

eeee)在对应于SEQ ID NO：1中氨基酸位置194的位置处的脯氨酸(P)；

ffff)在对应于SEQ ID NO：1中氨基酸位置195的位置处的赖氨酸(K)；

gggg)在对应于SEQ ID NO：1中氨基酸位置196的位置处的丝氨酸(S)；

hhhh)在对应于SEQ ID NO：1中氨基酸位置197的位置处的苯丙氨酸(F)；

iiii)在对应于SEQ ID NO：1中氨基酸位置200的位置处的异亮氨酸(I)；

jjjj)在对应于SEQ ID NO：1中氨基酸位置203的位置处的缬氨酸(V)；

kkkk)在对应于SEQ ID NO：1中氨基酸位置204的位置处的亮氨酸(L)；

llll)在对应于SEQ ID NO：1中氨基酸位置206的位置处的丙氨酸(A)或丝氨酸(S)；

mmmm)在对应于SEQ ID NO：1中氨基酸位置209的位置处的半胱氨酸(C)；

nnnn)在对应于SEQ ID NO：1中氨基酸位置222的位置处的亮氨酸(L)；

oooo)在对应于SEQ ID NO：1中氨基酸位置211的位置处的甲硫氨酸(M)；

pppp)在对应于SEQ ID NO：1中氨基酸位置232的位置处的异亮氨酸(I)；

qqqq)在对应于SEQ ID NO：1中氨基酸位置236的位置处的丝氨酸(S)；

rrrr)在对应于SEQ ID NO：1中氨基酸位置237的位置处的亮氨酸(L)或精氨酸(R)；

ssss)在对应于SEQ ID NO：1中氨基酸位置241的位置处的异亮氨酸(I)或亮氨酸(L)；

tttt)在对应于SEQ ID NO：1中氨基酸位置244的位置处的谷氨酸(E)；

uuuu)在对应于SEQ ID NO：1中氨基酸位置246的位置处的组氨酸(H)；

vvvv)在对应于SEQ ID NO：1中氨基酸位置253的位置处的天冬氨酸(D)或组氨酸(H)；

wwww)在对应于SEQ ID NO：1中氨基酸位置254的位置处的异亮氨酸(I)；

xxxx)在对应于SEQ ID NO：1中氨基酸位置258的位置处的丝氨酸(S)；

yyyy)在对应于SEQ ID NO：1中氨基酸位置267的位置处的精氨酸(R)；

zzzz)在对应于SEQ ID NO：1中氨基酸位置278的位置处的异亮氨酸(I)；

aaaaa)在对应于SEQ ID NO：1中氨基酸位置281的位置处的酪氨酸(Y)；

bbbbb)在对应于SEQ ID NO：1中氨基酸位置282的位置处的苯丙氨酸(F)；

ccccc)在对应于SEQ ID NO：1中氨基酸位置289的位置处的苏氨酸(T)；

ddddd)在对应于SEQ ID NO：1中氨基酸位置292的位置处的丙氨酸(A)；

eeeee)在对应于SEQ ID NO：1中氨基酸位置308的位置处的甘氨酸(G)；

fffff)在对应于SEQ ID NO：1中氨基酸位置311的位置处的精氨酸(R)；

ggggg)在对应于SEQ ID NO：1中氨基酸位置312的位置处的丙氨酸(A)；

hhhhh)在对应于SEQ ID NO：1中氨基酸位置316的位置处的丙氨酸(A)；

iiiii)在对应于SEQ ID NO：1中氨基酸位置318的位置处的精氨酸(R)；

jjjjj)在对应于SEQ ID NO：1中氨基酸位置319的位置处的缬氨酸(V)；

kkkkk)在对应于SEQ ID NO：1中氨基酸位置334的位置处的丙氨酸(A)；

lllll)在对应于SEQ ID NO：1中氨基酸位置339的位置处的苯丙氨酸(F)；

mmmmm)在对应于SEQ ID NO：1中氨基酸位置340的位置处的甘氨酸(G)或亮氨酸(L)；

nnnnn)在对应于SEQ ID NO：1中氨基酸位置342的位置处的丝氨酸(S)；

ooooo)在对应于SEQ ID NO：1中氨基酸位置345的位置处的天冬酰胺(N)；

ppppp)在对应于SEQ ID NO：1中氨基酸位置346的位置处的天冬酰胺(N)；或

qqqqq)在对应于SEQ ID NO：1中氨基酸位置348的位置处的天冬酰胺(N)；或

rrrrr)a)至qqqqq)的任何组合。

5.根据实施例1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：14、15、16、17、18、19、20、21、22、23，24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、403、430、431、432和433。

6.根据实施例1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽能够识别和裂解大范围核酸酶识别序列，所述大范围核酸酶识别序列选自SEQ IDNO：2(LIG3-4)、SEQ ID NO：85(MHP77)、SEQ ID NO：269(MS26)、SEQ ID NO：281(MHP14)、SEQ ID NO：331(MP107)、SEQ ID NO：358(ZM6.3)、SEQ ID NO：390(ZM6.22v2)、SEQ ID NO：423或SEQ ID NO：424。

7.根据实施例1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性。

8.根据实施例7所述的分离的或重组的多核苷酸，其中所述对照大范围核酸酶选自SEQ ID NO：1(LIG3-4)、SEQ ID NO：86(MHP77)、SEQ ID NO：250(MHP77.3)、SEQ ID NO：270(MS26+)、SEQ ID NO：271、SEQ ID NO：282(MHP14)、SEQID NO：283(MHP14+)、SEQ ID NO：329(MP107)、SEQ IDNO：356(ZM6.3)、SEQ ID NO：389(ZM6.22v2)、SEQ IDNO：429或SEQ ID NO：435。

9.根据实施例7所述的分离的或重组的多核苷酸，其中所述提高的大范围核酸酶活性的证据是：

a)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的酵母测定得分；或

b)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的目标位点突变率；或

c)在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时更高的体外切割；或

d)(a)、(b)和(c)的任何组合。

10.根据实施例1所述的分离的或重组的多核苷酸，其还包含编码N-末端核转运肽的核苷酸序列。

11.根据实施例1所述的分离的或重组的多核苷酸，其还包含编码C-末端组氨酸标签的核苷酸序列。

12.根据实施例7所述的分离的或重组的多核苷酸，其中所述提高的大范围核酸酶活性是在16℃、24℃、28℃、30℃或37℃下测定的。

13.一种重组DNA构建体，其包含实施例1所述的分离的或重组的多核苷酸。

14.根据实施例13所述的重组DNA构建体，其还包含可操作地连接至所述多核苷酸的启动子。

15.根据实施例14所述的重组DNA构建体，其中所述启动子相对于所述多核苷酸是异源的，或所述启动子相对于所述多核苷酸是同源的。

16.一种细胞，其包含至少一种实施例1所述的多核苷酸或实施例13所述的重组DNA构建体，其中所述多核苷酸对于所述细胞是异源的。

17.根据实施例16所述的细胞，其中所述细胞是酵母细胞。

18.根据实施例16所述的细胞，其中所述细胞是植物细胞。

19.根据实施例16所述的细胞，其中所述多核苷酸或所述重组DNA构建体稳定地掺入至所述植物细胞的基因组中。

20.根据实施例16所述的细胞，其中所述多核苷酸或所述重组DNA构建体稳定地掺入至所述植物细胞的叶绿体基因组中。

21.根据实施例18所述的细胞，其中所述植物细胞来自单子叶植物。

22.根据实施例21所述的细胞，其中所述单子叶植物为玉米、小麦、稻、大麦、甘蔗、高粱或黑麦。

23.根据实施例18所述的细胞，其中所述植物细胞来自双子叶植物。

24.根据实施例23所述的细胞，其中所述双子叶植物为大豆、芸苔属植物(Brassica)、向日葵、棉花或苜蓿。

25.一种植物，其包含实施例18所述的植物细胞。

26.一种植物外植体，其包含实施例18所述的植物细胞。

27.根据实施例26所述的植物、所述外植体或所述植物细胞，其中所述植物、外植体或植物细胞在与相同物种、品系或品种的植物、外植体或植物细胞(不包含至少一种实施例1所述的多核苷酸)进行比较时表现出提高的大范围核酸酶活性。

28.一种转基因种子，其由实施例25所述的植物产生。

29.一种具有大范围核酸酶活性的分离的多肽，所述多肽包含：

30.根据实施例29所述的分离的多肽，其中所述多肽与SEQ ID NO：1具有至少80％的序列同一性。

31.根据实施例29所述的分离的多肽，其中所述至少一个氨基酸修饰包括：

a)在对应于SEQ ID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；

b)在对应于SEQ ID NO：1中氨基酸位置12的位置处的组氨酸(H)；

e)在对应于SEQ ID NO：1中氨基酸位置23的位置处的亮氨酸(L)；

f)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；

h)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；

j)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；

m)在对应于SEQ ID NO：1中氨基酸位置62的位置处的缬氨酸(V)；

n)在对应于SEQ ID NO：1中氨基酸位置71的位置处的赖氨酸(K)；

o)在对应于SEQ ID NO：1中氨基酸位置72的位置处的苏氨酸(T)；

p)在对应于SEQ ID NO：1中氨基酸位置73的位置处的丙氨酸(A)；

q)在对应于SEQ ID NO：1中氨基酸位置80的位置处的精氨酸(R)；

r)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；

s)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；

w)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；

x)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；

y)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；

z)在对应于SEQ ID NO：1中氨基酸位置114的位置处的脯氨酸(P)；

aa)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；

bb)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；

cc)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；

dd)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；

ee)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；

gg)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；

hh)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；

ii)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；

jj)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；

ll)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；

mm)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；

nn)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；

oo)在对应于SEQ ID NO：1中氨基酸位置162的位置处的酪氨酸(Y)；

pp)在对应于SEQ ID NO：1中氨基酸位置163的位置处的精氨酸(R)；

qq)在对应于SEQ ID NO：1中氨基酸位置164的位置处的组氨酸(H)；

rr)在对应于SEQ ID NO：1中氨基酸位置165的位置处的亮氨酸(L)；

ss)在对应于SEQ ID NO：1中氨基酸位置166的位置处的精氨酸(R)；

tt)在对应于SEQ ID NO：1中氨基酸位置167的位置处的组氨酸(H)；

uu)在对应于SEQ ID NO：1中氨基酸位置168的位置处的脯氨酸(P)；

vv)在对应于SEQ ID NO：1中氨基酸位置169的位置处的丙氨酸(A)；

ww)在对应于SEQ ID NO：1中氨基酸位置170的位置处的脯氨酸(P)；

xx)在对应于SEQ ID NO：1中氨基酸位置171的位置处的组氨酸(H)；

yy)在对应于SEQ ID NO：1中氨基酸位置172的位置处的脯氨酸(P)；

zz)在对应于SEQ ID NO：1中氨基酸位置173的位置处的精氨酸(R)；

xxxx)a)至wwww)的任何组合。

32.根据实施例29所述的分离的多肽，其中所述多肽还包含：

a)在对应于SEQ ID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；

b)在对应于SEQ ID NO：1中氨基酸位置12的位置处的组氨酸(H)；

f)在对应于SEQ ID NO：1中氨基酸位置23的位置处的亮氨酸(L)；

j)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；

m)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；

p)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；

q)在对应于SEQ ID NO：1中氨基酸位置57的位置处的谷氨酸(E)；

t)在对应于SEQ ID NO：1中氨基酸位置62的位置处的缬氨酸(V)；

u)在对应于SEQ ID NO：1中氨基酸位置71的位置处的赖氨酸(K)；

v)在对应于SEQ ID NO：1中氨基酸位置72的位置处的苏氨酸(T)；

w)在对应于SEQ ID NO：1中氨基酸位置73的位置处的丙氨酸(A)；

x)在对应于SEQ ID NO：1中氨基酸位置79的位置处的甘氨酸；

y)在对应于SEQ ID NO：1中氨基酸位置80的位置处的精氨酸(R)；

z)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；

aa)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；

cc)在对应于SEQ ID NO：1中氨基酸位置87的位置处的亮氨酸(L)；

ff)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；

gg)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；

hh)在对应于SEQ ID NO：1中氨基酸位置105的位置处的丙氨酸(A)；

ii)在对应于SEQ ID NO：1中氨基酸位置111的位置处的精氨酸(R)；

jj)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；

kk)在对应于SEQ ID NO；1中氨基酸位置114的位置处的脯氨酸(P)；

ll)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；

mm)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；

nn)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；

oo)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；

pp)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；

rr)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；

ss)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；

tt)在对应于SEQ ID NO：1中氨基酸位置132的位置处的缬氨酸(V)；

uu)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；

vv)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；

xx)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；

yy)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；

zz)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；

rrrrr)a)至qqqqq)的任何组合。

33.根据实施例29所述的分离的多肽，其选自SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、430、431、432和433。

34.根据实施例29所述的分离的多肽，其中所述多肽能够识别和裂解大范围核酸酶识别位点，所述大范围核酸酶识别位点选自SEQ IDNO：2(LIG3-4)、SEQ ID NO：85(MHP77)、SEQ ID NO：269(MS26)、SEQ ID NO：281(MHP14)、SEQ ID NO：331(MP107)、SEQ ID NO：358(ZM6.3)、SEQ ID NO：390(ZM6.22v2)、SEQ ID NO：423或SEQ ID NO：424。

35.根据实施例29所述的分离的多肽，其中所述多肽在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性。

36.根据实施例29所述的分离的多肽，其中所述对照大范围核酸酶选自SEQ ID NO：1(LIG3-4)、SEQ ID NO：86(MHP77)、SEQ IDNO：250(MHP77.3)、SEQ ID NO：270(MS26+)、SEQ IDNO：271、SEQ ID NO：282(MHP14)、SEQ ID NO：283(MHP14+)、SEQ ID NO：329(MP107)、SEQ ID NO：356(ZM6.3)、SEQ ID NO：389(ZM6.22v2)、SEQ ID NO：429或SEQ ID NO：435。

37.根据实施例29所述的分离的多肽，其中所述提高的大范围核酸酶活性的证据是：

d)(a)、(b)和(c)的任何组合。

38.一种组合物，其包含至少一种或多种实施例29所述的多肽。

39.一个制备大范围核酸酶的方法，所述大范围核酸酶在一定温度范围内具有提高的活性，所述方法包括：

a)通过在对应于SEQ ID NO：1的位置的氨基酸位置处修饰至少一个氨基酸来制备大范围核酸酶变体，所述SEQ ID NO：1的位置选自位置2、12、16、22、23、31、36、43、50、56、58、59、62、71、72、73、80、81、82、86、91、95、98、103、113、114、116、117、118、121、124、128、129、131、147、151、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、194、195、196、197、200、203、204、209、222、232、236、237、246、254、258、267、278、281、282、289、308、311、312、316、318、319、334、339、340、342、345、346348、以及它们的组合；以及

40.根据实施例39所述的方法，其中所述温度的范围包括：

a)16℃；

b)18℃；

c)20℃；

d)24℃；

e)28℃；

f)30℃；

g)37℃；或

h)a)、b)、c)、d)、e)、f)、h)、g)和g)的任何组合。

41.一种制备大范围核酸酶的方法，所述大范围核酸酶在与对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性，所述方法包括：

42.根据实施例41所述的方法，其中所述提高的大范围核酸酶活性的证据是：

d)(a)、(b)和(c)的任何组合。

43.根据实施例所述的分离的或重组的多核苷酸1，其中所述大范围核酸酶多肽包含接头多肽，其中所述接头多肽包括：

a)SEQ ID NO：420；

b)SEQ ID NO：421；

c)SEQ ID NO：422；或

d)由在对应于SEQ ID NO：1的位置156至193的位置处的任何可能的氨基酸组成的氨基酸序列。

44.一种组合物，其包含至少一种或多种实施例1所述的多核苷酸。

45.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：1的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：1的位置选自位置16、22、50、56、59、71、81、103、121、153、185、209、222、246、258、281、308、316、345、346、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：2的大范围核酸酶目标位点。

46.根据实施例45所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：1具有至少80％的序列同一性的大范围核酸酶多肽。

47.根据实施例45所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图5A-5C中所示氨基酸修饰中的任何一个。

48.根据实施例45所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37和38。

49.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：86的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：86的位置选自位置2、12、16、22、23、36、43、50、56、58、59、72、73、81、86、91、95、103、113、114、120、121、124、128、129、131、151、153、200、204、209、232、236、237、246、254、258、267、281、308、311、312、316、319、334、339、340、342、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：85的大范围核酸酶目标位点。

50.根据实施例49所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：86具有至少80％的序列同一性的大范围核酸酶多肽。

51.根据实施例49所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图9A-9D中所示氨基酸修饰中的任何一个。

52.根据实施例49所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252和253。

53.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：270的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：270的位置选自位置16、22、50、71、185、246、258、316、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：269的大范围核酸酶目标位点。

54.根据实施例53所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：272、273、274和275。

55.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：282的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：282的位置选自位置12、16、22、31、50、56、59、62、81、98、103、105、116、118、121、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、258、281、308、312、316、319、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ IDNO：281的大范围核酸酶目标位点。

56.根据实施例55所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：282具有至少80％的序列同一性的大范围核酸酶多肽。

57.根据实施例55所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图10A-10C中所示氨基酸修饰中的任何一个。

58.根据实施例55所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：284、285、286、287、288、289、290、291、292、293、294、295、296、297和298。

59.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：329的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：329的位置选自位置12、32、50、56、80、105、124、129、131、153、185、311、316、318、340、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：328的大范围核酸酶目标位点。

60.根据实施例59所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：329具有至少80％的序列同一性的大范围核酸酶多肽。

61.根据实施例59所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图11中所示氨基酸修饰中的任何一个。

62.根据实施例59所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：330、331、332、333、334、335、336、337、338、339、340和341。

63.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：356的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：356的位置选自位置12、24、36、50、56、62、73、80、124、129、147、182、203、237、252、311、316、318、340、348、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：355的大范围核酸酶目标位点。

64.根据实施例63所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：356具有至少80％的序列同一性的大范围核酸酶多肽。

65.根据实施例63所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图12中所示氨基酸修饰中的任何一个。

66.根据实施例63所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：357、358、359、360、361、362、363、364、365、366、367、368、369、370、和371。

67.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：389的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：389的位置选自位置12、50、56、124、129、131、153、211、237、311、316、和位置318、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：388的大范围核酸酶目标位点。

68.根据实施例67所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：389具有至少80％的序列同一性的大范围核酸酶多肽。

69.根据实施例67所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图13中所示氨基酸修饰中的任何一个。

70.根据实施例67所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：390、391、392、393、394、395、396、397、398、399、400、401、402和403。

72.酵母、植物、植物细胞、外植体或种子，其包含由实施例36-42所述的方法创建的大范围核酸酶。

73.一种在酵母或植物细胞的基因组中导入双链断裂的方法，所述方法包括：

a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物或酵母细胞与大范围核酸酶多肽变体接触，所述大范围核酸酶多肽选自SEQ ID NO：14、15、16、17、18、19、20、21、22、23，24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402和403，其中所述大范围核酸酶变体能够在所述识别位点诱导双链断裂；以及

74.一种将目的多核苷酸整合至植物或酵母细胞的基因组中的识别位点的方法，所述方法包括：

(i)大范围核酸酶多肽变体，其选自SEQ ID NO：14、15、16、17、18、19、20、21、22、23，24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402和403，其中所述大范围核酸酶变体能够在所述识别位点诱导双链断裂；和

(ii)包含目的多核苷酸的DNA片段；

75.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：429的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：429的位置选自位置16、22、50、71、185、246、258、316、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：423的大范围核酸酶目标位点。

76.根据实施例75所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：430、431和432。

77.一种分离的或重组的多核苷酸，其编码SEQ ID NO：436的大范围核酸酶多肽，其中所述多肽能够识别和裂解包含SEQ ID NO：424的大范围核酸酶目标位点。

实验

实例1

玉米幼胚的转化

可通过各种已知在植物中有效的方法完成转化，包括颗粒介导的递送、农杆菌-介导的转化、PEG-介导的递送和电穿孔。

a.颗粒介导的递送

使用颗粒递送转化玉米幼胚如下进行。培养基配方沿循以下。

给穗去皮，表面在30％Clorox漂白剂加0.5％Micro洗涤剂中消毒20分钟，然后用无菌水漂洗两次。将幼胚分离并放置胚轴一侧向下(子叶盘一侧向上)，每板25个胚，在560Y培养基上培养4小时，然后对准2.5cm的目标区域准备轰击。另选地，在如上所述轰击之前在26℃置于560Y上4小时，在此之前在将分离的胚放置在560L(诱导培养基)上、在黑暗条件下从26℃至37℃的温度范围内放置8至24小时。

使用标准分子生物学技术构建包含双链断裂诱导剂和供体DNA的质粒，与包含发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白2)；US20090328252 A1)和Wushel(US2011/0167516)的质粒联合轰击。

如下述使用水溶性阳离子类脂Tfx^TM-50(Cat#E1811，Promega，Madison，WI，USA)将所述质粒和目的DNA沉淀至0.6μm(平均直径r)的金球剂上。使用1g的质粒DNA和任选地用于联合轰击的其它构建体，诸如每种50ng(0.51)的包含发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白2)；US20090328252 A1)和Wushel的质粒，在冰上制备DNA溶液。为了预混合DNA，将20μl制备的金颗粒(15mg/ml)和5LTfx-50加入水中并小心混合。在微量离心机中以10,000rpm离心1分钟将金颗粒制成球剂，去除上清液。用100ml的100％乙醇小心漂洗所得的球剂而不使球剂重悬，然后小心去除乙醇漂洗液。加入1051的100％乙醇，通过短暂超声处理使所述颗粒重悬。然后，将10μl点在每个大载体的中心，在轰击前使其干燥约2分钟。

另选地，使用氯化钙(CaCl₂)沉淀方法，通过将100μl制备的钨球剂溶液、在Tris EDTA缓冲液中的10μl(1μg)DNA(1μg总DNA)、100μl2.5M CaCl2和10μl 0.1M亚精胺混合，将所述质粒和目的DNA沉淀在1.1μm(平均直径)的钨球剂上。将每一试剂顺次加入钨粒悬浮液，并混合。将最终的混合物短暂超声处理并且使其在持续涡旋下温育10分钟。在沉淀期后，将所述管短暂离心，去除液体，然后将所述颗粒用500ml 100％乙醇洗涤，之后是30秒离心。再一次，去除液体，然后将105μl 100％乙醇加入最终的钨颗粒球剂。针对粒子枪轰击，将所述钨/DNA颗粒短暂超声处理。将10μl的钨/DNA颗粒点在每个大载体的中央，然后在轰击前使点上的颗粒干燥约2分钟。

用Biorad氦气枪以#4水平轰击样品平板。所有的样品以450PSI接收一枪，带有取自每管制备的颗粒/DNA的总共十等份试样。

在轰击后，所述胚在560P(维持培养基)上、在26℃至37℃的温度范围温育12至48小时，然后放置在26℃。在5至7天后，将所述胚转移至包含3mg/升双丙氨磷的560R选择培养基，在26℃每2周继代培养一次。在选择后约10周，将选择-抗性愈伤组织转移至288J培养基以引发植物再生。在体细胞胚成熟(2-4周)后，将良好发育的体细胞胚转移至用于发芽的培养基，转移至有光照的培养室。约7-10天后，将发育中的幼苗转移至试管中不含激素的272V培养基培养7-10天直到幼苗良好建成。然后将植物转移插入包含栽培土的单位空间(相当于2.5″罐)，在生长室生长1周，随后在温室生长额外1-2周，然后转移至Classic 600罐(1.6加仑)并生长至成熟。监控植物并针对转化效率、和/或再生能力的修饰来打分。

诱导培养基(560L)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson’s维生素Mix(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、20.0g/l蔗糖、1.0mg/l 2，4-D、和2.88g/l L-脯氨酸(在用KOH调节至pH 5.8后用D-I H2O补齐体积)；2.0g/l固化剂(在用D-I H2O补齐体积之后添加)；和8.5mg/l硝酸银(在培养基灭菌并冷却至室温后添加)。

维持培养基(560P)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/lEriksson’s维生素Mix(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、30.0g/l蔗糖、2.0mg/l 2，4-D、和0.69g/l L-脯氨酸(在用KOH调节至pH 5.8后用D-I H2O补齐体积)；3.0g/l固化剂(在用D-I H2O补齐体积之后添加)；和0.85mg/l硝酸银(在培养基灭菌并冷却至室温后添加)。

轰击培养基(560Y)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson’s维生素Mix(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、120.0g/l蔗糖、1.0mg/l 2，4-D、和2.88g/l L-脯氨酸(在用KOH调节至pH 5.8后用D-I H2O补齐体积)；2.0g/l固化剂(在用D-I H2O补齐体积之后添加)；和8.5mg/l硝酸银(在培养基灭菌并冷却至室温后添加)。

Selection诱导培养基(560R)包含4.0g/l N6基础盐(SIGMA C-1416)、1.0ml/l Eriksson’s维生素Mix(1000X SIGMA-1511)、0.5mg/l盐酸硫胺素、30.0g/l蔗糖、和2.0mg/l 2，4-D(在用KOH调节至pH 5.8后用D-I H2O补齐体积)；3.0g/l固化剂(在用D-I H2O补齐体积之后添加)；和0.85mg/l硝酸银以及3.0mg/l双丙氨磷(在培养基灭菌并冷却至室温后添加)。

植物再生培养基(288J)包含4.3g/l MS盐(GIBCO 11117-074)、5.0ml/l MS维生素原液(0.100g烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆醇、和0.40g/l甘氨酸，用D-I H2O补齐体积)(Murashige和Skoog(1962)Physiol.Plant.15：473)、100mg/l肌醇、0.5mg/l玉米素、60g/l蔗糖、和1.0ml/l的0.1mM脱落酸(在调节至pH 5.6后用D-I H2O补齐体积)；3.0g/l固化剂(在用D-I H2O补齐体积之后添加)；和1.0mg/l吲哚乙酸以及3.0mg/l双丙氨磷(在培养基灭菌并冷却至60℃后添加)。

无激素培养基(272V包含4.3g/l MS盐(GIBCO 11117-074)，5.0ml/lMS维生素原液(0.100g烟酸、0.02g/l盐酸硫胺素、0.10g/l盐酸吡哆醇、和0.40g/l甘氨酸，用D-I H2O补齐体积)、0.1g/l肌醇和40.0g/l蔗糖(在调节至pH 5.6后用D-I H2O补齐体积)；和6g/l细菌培养用琼脂(用D-I H2O补齐体积后添加)、灭菌并冷却至60℃。

b.农杆菌介导的转化

农杆菌介导的转化基本上如Djukanovic等人.(2006)Plant Biotech J4：345-57所述进行。简而言之，从灭菌过的内核解剖出10-12天大的幼胚(大小为0.8-2.5mm)并放置在液体培养基上(4.0g/L N6基础盐(SigmaC-1416)、1.0ml/L Eriksson′s维生素Mix(Sigma E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2，4-D、0.690g/L L-脯氨酸、68.5g/L蔗糖、36.0g/L葡萄糖、pH 5.2)。在胚芽搜集之后，用浓度为0.35-0.45OD550的1ml农杆菌替换所述培养基。在室温将玉米胚芽与农杆菌温育5分钟，然后将所述混合物倒入培养基平板，其包含4.0g/L N6基础盐(Sigma C-1416)、1.0ml/LEriksson′s维生素Mix(Sigma E-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2，4-D、0.690g/L L-脯氨酸、30.0g/L蔗糖、0.85mg/L硝酸银、0.1nM乙酰丁香酮、和3.0g/L固化剂，pH 5.8。将胚芽轴朝下在20℃、黑暗中温育3天，然后在28℃、黑暗中温育4天，然后转移至新培养基平板，其包含4.0g/L N6基础盐(Sigma C-1416)、1.0ml/L Eriksson′s维生素Mix(SigmaE-1511)、1.0mg/L盐酸硫胺素、1.5mg/L 2，4-D、0.69g/L L-脯氨酸、30.0g/L蔗糖、0.5g/L MES缓冲液、0.85mg/L硝酸银、3.0mg/L双丙氨磷、100mg/L羧苄青霉素和6.0g/L琼脂，pH 5.8。每三周对培养继代培养直至鉴定出转基因事件。通过将少量组织转移至再生培养基(4.3g/L MS盐(Gibco 11117)、5.0ml/L MS维生素原液、100mg/L肌醇、0.1μM ABA、1mg/L IAA、0.5mg/L玉米素、60.0g/L蔗糖、1.5mg/L双丙氨磷、100mg/L羧苄青霉素、3.0g/L固化剂、pH 5.6)，并且在28℃、黑暗中温育两周来诱导体细胞胚胎形成。将带有可见芽和根的所有材料转移至培养基，其包含4.3g/L MS盐(Gibco 11117)、5.0ml/L MS维生素原液、100mg/L肌醇、40.0g/L蔗糖、1.5g/L固化剂、pH 5.6，并且在28℃、人工光照下温育。一周后，将幼苗移入包含相同培养基的玻璃试管，生长直至它们被取样和/或被移植到土壤中。

实例2

BBM增强转化的瞬时表达

可修改转化规程的参数以确保BBM活性是瞬时的。一个此类方法涉及以允许转录和表达的方式来沉淀包含BBM的质粒，但排除了后续的DNA释放，例如通过化学PEI。

在一个实例中，将所述BBM质粒沉淀在带有PEI的金颗粒上，而使用标准氯化钙方法将要整合的转基因表达盒(UBI：：moPAT～GFPm：：PinII；moPAT是玉米最优化的PAT基因)沉淀在金颗粒上。

简而言之，用PEI涂覆金颗粒如下。首先，清洗所述金颗粒。在微量离心管中称量35mg金颗粒，平均直径(A.S.I.#162-0010)1.0，加入1.2ml无水乙醇并涡旋1分钟。将离心管在室温温育15分钟，然后使用微型离心机在4℃、高速离心15分钟。弃去上清液，加入新鲜的1.2ml等份试样的乙醇(EtOH)，涡旋一分钟，离心一分钟，再次弃去上清液(这个操作重复两次)。加入新鲜的1.2ml等份试样的乙醇，将这个悬浮液(乙醇中的金颗粒)在-20℃保存数周。为了用聚乙烯亚胺(PEI；Sigma#P3143)涂覆颗粒，将250μl洗过的金颗粒/乙醇混合物离心并弃去乙醇。将所述颗粒在100μl ddH2O中洗涤一次以去除残余的乙醇，加入250μl的0.25mM PEI，之后是脉冲超声处理所述颗粒，然后将所述离心管放入干冰/乙醇浴中以瞬间冻结所述悬浮液，然后将冻结的悬浮液冻干过夜。在此刻，可将干燥、包被的颗粒在-80℃保存至少3周。在使用之前，用250μl等分式样的2.5mM HEPES缓冲液、pH 7.1，以1x脉冲超声处理将所述颗粒漂洗3次，然后在每次离心前快速涡旋。然后将所述颗粒悬浮于终体积250μl的HEPES缓冲液。在附接DNA之前，将25μl等分式样的颗粒加入新管。为了附接未涂覆的DNA，用脉冲超声处理所述颗粒，然后加入1μg的DNA(在5μl水中)，之后是用Pipetteman通过上下吸移几次来混合并且温育10分钟。短暂旋转所述颗粒(即10秒)，去除所述上清液，加入60μl乙醇。将带有PEI沉淀的DNA-1的颗粒在60μl的乙醇中清洗两次。将所述颗粒离心，弃去上清液，将所述颗粒重悬浮在45μl水中。为了附接第二种DNA(DNA-2)，沉淀采用了TFX-50。将45μl的颗粒/DNA-1悬浮液短暂超声处理，然后加入5μl的100ng/μl的DNA-2和2.5μl的TFX-50。将所述溶液置于旋转摇动器10分钟，以10,000g离心1分钟。去除上清液，将所述颗粒重悬于60μl的乙醇。将所述溶液点在大载体上，然后使用PDS-1000的标准规程，将已经依次附接了DNA-1和DNA-2的金颗粒递送到10DAPHi-II幼胚的盾片细胞。针对这个实验，所述DNA-1质粒包含UBI：：RFP：：pinII表达盒，DNA-2包含UBI：：CFP：：pinII表达盒。轰击两天后，当许多红蓝细胞出现在幼胚表面时就观察到了CFP和RFP荧光标记的瞬时表达。然后将所述培养置于非选择培养基上，使其在对稳定集落评分之前生长3周。在这个3周期后，观察到10个多细胞的、稳定表达的蓝色集落，相比之下只有一个红色集落。这表明可使用PEI沉淀以有效导入DNA用于瞬时表达，同时大大降低PEI导入的DNA的整合并且因此降低RFP表达转基因事件的恢复。这样，可使用PEI沉淀以递送BBM和/或WUS2的瞬时表达。

例如，使用PEI将所述颗粒首先涂覆上UBI：：BBM：：pinII，然后使用TFX-50涂覆上UBI：：moPAT～YFP，然后轰击计入幼胚表面的盾片细胞。PEI介导的沉淀在幼胚的表面产生高频的瞬时表达的细胞和极低频率的稳定转化子的恢复(相对于TFX-50方法)。因此，期望PEI沉淀的BBM盒瞬时表达并且刺激在所述组织的被轰击表面(即盾片细胞表面)胚胎生成的爆发生长，但这个质粒不会整合。期望从Ca++/金颗粒释放的PAT～GFP质粒整合并且表达选择性标记，其频率导致基本上改善了转基因事件的恢复。作为对照处理，将包含UBI：：GUS：：pinII(而不是BBM)的PEI沉淀颗粒与PAT～GFP/Ca++颗粒混合。来自两种处理的幼胚被移入包含3mg/l双丙氨磷的培养基。6-8周后，期望相对于对照处理(PEI/GUS)，在PEI/BBM处理中会观察到高得多频率的GFP+、双丙氨磷抗性的愈伤组织。

作为一种替代方法，将BBM质粒沉淀在带有PEI的金颗粒上，然后导入幼胚表面的盾片细胞中，随后BBM基因的瞬时表达引发了胚胎发生生长的快速增殖。在这个诱导生长期间，采用针对玉米的标准方法用农杆菌处理所述外植体(参见实例1)，T-DNA递送至细胞中导入转基因表达盒诸如UBI：：moPAT～GFPm：：pinII。在共培养后，允许在普通培养基上回收外植体，然后移到包含3mg/l双丙氨磷的培养基上。6-8周后，期望相对于对照处理(PEI/GUS)，在PEI/BBM处理中会观察到高得多频率的GFP+、双丙氨磷抗性的愈伤组织。

可以期望通过瞬时表达BBM和/或WUS2多核苷酸产物以“快速启动”愈伤组织生长。这可通过递送BBM和WUS25′-加帽的多腺苷化的RNA、包含BBM和WUS2DNA的表达盒、或BBM和/或WUS2蛋白来实现。所有这些分子可利用基因枪进行输送。例如使用Ambion’s mMessagemMachine试剂盒可以很容易制备5′-加帽的多腺苷化的BBM和/或WUS2RNA。RNA与DNA共递送，所述DNA包含目的多核苷酸和用于选择/筛选的标记，诸如Ubi：：moPAT～GFPm：：PinII。期望接收了所述RNA的细胞会立即开始更快地分裂并且这些细胞的大部分将整合所述农艺基因。这些事件可以进一步被验证作为是转基因的克隆集落，因为它们还会表达PAT～GFP融合蛋白(并且因此会在适当的光照下显示绿色荧光)。然后从这些胚芽再生的植物可针对所述目的多核苷酸的存在进行筛选。

实例3

DNA改组以创建LIG3-4大范围核酸酶的变体

A.LIG3-4大范围核酸酶和LIG3-4识别序列

选择包含LIG3-4识别序列的内源性玉米基因组目标位点(SEQ IDNO：2)用于设计定制的双链断裂诱导剂。所述LIG3-4识别序列是22bp的多核苷酸，其具有下述序列：ATATACCTCACACGTACGCGTA(SEQ IDNO：2)。

如美国专利公开2009-0133152A1中所述，修饰野生型I-CreI大范围核酸酶(SEQ ID NO：3)以制备设计来识别LIG3-4识别序列的LIG3-4大范围核酸酶。野生型I-CreI大范围核酸酶是同型二聚体。为了识别LIG3-4识别序列，对每个单体制备了不同的替换并且针对每个单体，编码序列连接了接头序列以制备单链融合多肽(LIG3-4，SEQ ID NO：1)。

B.创建LIG3-4大范围核酸酶变体

通过基因改组方法创建LIG3-4大范围核酸酶变体。基因改组是一种迭代过程，其由名为“轮次”的离散循环组成。每个轮次是亲本选择、文库构建、基因评估和命中选择的循环。来自一个轮次的最佳命中称为下一轮次的亲本基因。

LIG3-4大范围核酸酶优化的第一相是设计来导入存在于天然存在的大范围核酸酶蛋白的氨基酸替换。基于LIG3-4蛋白模板(SEQ ID NO：1)制备改组的基因变体文库，所用技术包括家族改组、单基因改组、回交、半合成和合成改组(Zhang J-H等人(1997)Proc Natl Acad Sci 94，4504-4509；Crameri等人(1998)Nature 391：288-291；Ness等人(2002)NatBiotech 20：1251-1255)。文库是基于系统发育的序列多样性、随机诱变，结构特征部基于蛋白数据银行中的I-CreI晶体结构(PDB；www.pdb.org/pdb/home/home.do)。图1中显示了若干大范围核酸酶蛋白(SEQ ID NO：4-13)，包括I-CreI(SEQ ID NO：3)的系统发育多样性。多样性被定义为存在于蛋白组内的、在所有蛋白不包含相同氨基酸的任何位置处的氨基酸。

所述改组方法导致生成带有氨基酸修饰重组的LIG3-4变体，非预期的氨基酸修饰是由于诱变聚合酶链反应(PCR)、缺失和插入(SEQ IDNO：14-38)。SEQ ID NO：40-65)中显示了用于在酵母中表达这些大范围核酸酶的对应的DNA序列。

实例4

用于鉴定具有提高的活性的大范围核酸酶变体的酵母筛选系统。

生成酵母筛选菌株作为用于鉴定大范围核酸酶变体的宿主。将酵母Ade2基因(Genetika 1987Jul-23(7)：1141-8)(SEQ ID NO：82)用作可见标记以及图2中描绘的方案中的选择。对应于Ade2编码序列的最前1000个核苷酸(SEQ ID NO：83)(Ade25’片段)和Ade2编码序列的最后1011个核苷酸(Ade23’片段)的基因片段被包括酵母ura3基因和大范围核酸酶识别位点的片段断开。使用了在图2中描绘的构建体的三种型式。质粒pHD1327(SEQ ID NO：84)包括ZM6.3、ZM6.22、MHP42、MHP107和LIG3-4识别位点。pVER8145包括LIG3-4识别位点，而pVER8189包括MHP14、MHP77和LIG3-4识别位点。在Ade25’片段和Ade23’片段之间有305个核苷酸的序列重复。用所得的构建体替换酵母菌株BY4247的Ade2基因(15号染色体核苷酸位置566193-564480)。所得的酵母筛选菌株VER8145、VER8189和HD1327可表征为BY4742MATa his3deltalleu2delta0 lys2delta0 ura3delta0Gal2+)。如果大范围核酸酶切割发生在重复序列之间，可发生同源重组，产生官能的Ade2基因。

官能的Ade2基因的生成可被用作选择：在酵母细胞在不含腺嘌呤的培养基上生长时，只有具有官能的Ade2基因的那些能够生长。

官能的Ade2基因的生成也可被用于筛选。带有功能性Ade2基因的酵母细胞是白色的，而缺乏Ade2功能的那些由于在腺嘌呤生物合成途径早期积累代谢物表现出红色的色素沉着，导致如图2和3中显示的带有白色分段的红色菌落。白色分段的程度，有时延伸至整个菌落，表明了大范围核酸酶切割活性的量。由于分段表型是大范围核酸酶活性的定性测量，采用了0-4的数字打分系统。如图3所示，0分表明没有观察到白色分段(没有大范围核酸酶切割)；4分表明完全白色菌落(识别位点的完全切割)；1-3分表明中间白色分段表型(和中间程度的识别位点切割)。

实例5

大范围核酸酶表达质粒

使用质粒p415GAL1(ATCC；Nucleic Acids Res.1994Dec 25；22(25)：5767-8)构建大范围核酸酶表达质粒。使用引物MN031(SEQ IDNO：66)和MN022(SEQ ID NO：67)PCR扩增LIG3-4编码序列并作为XbaI-XhoI限制片段插入p415GAL1。所得构建体(pVER8134；SEQ IDNO：68)显示于图4。所述大范围核酸酶表达质粒包含着丝粒复制起点和用于在酵母中生长的leu2营养标记，以及F1复制起点和用于在大肠杆菌(E.coli)中生长的氨苄青霉素抗生素抗性基因。所述大范围核酸酶表达盒由半乳糖诱导的GAL1启动子和CYC1终止子组成。所述大范围核酸酶编码序列之前是核定位信号(SEQ ID NO：69)，其编码9个氨基酸的氨基末端(MAPKKKRKV，SEQ ID NO：70)和羧基末端6X组氨酸标签(SEQ IDNO：71)以助于蛋白纯化。

通过将LIG3-4大范围核酸酶(pVER8134的核苷酸位置500-1549，SEQ ID NO：68)与大范围核酸酶变体交换来构建类似的大范围核酸酶表达质粒。

实例6

转化酵母筛选菌株(YSS)并对酵母中大范围核酸酶活性进行筛选

如实例5中所述，将改组的大范围核酸酶文库(其包含大范围核酸酶变体)插入表达载体pVER8134，并通过下列步骤转化进包含对应的大范围核酸酶识别位点(实例3)的酵母筛选菌株。

用所述酵母筛选菌株的单菌落接种3mL选择培养基的培养物，在30℃生长过夜。在第二天，用2ml的过夜培养物启动50ml YPD培养物(MPBiomedical)，在30℃生长过夜。在第二天，通过4000rpm离心收集细胞。将所述细胞重悬于100ml冰水并再次离心。然后在1.2M山梨醇中清洗所述细胞，之后在30℃用2ml的10mM Tris pH 8.0、1mM EDTA、100mM乙酸锂、10mM DTT、0.6M山梨醇摇动处理30分钟。通过离心回收所述细胞，在40ml 1.2M山梨醇中清洗并最终重悬于250微升1.2M山梨醇。在冰上将50微升等分式样转移至试管。加入最多至5微升的DNA(100-500纳克)。在冰上将所述悬浮液转移至0.2cm电穿孔比色杯。以1.5kV、200ohms、25microF(脉冲时间5毫秒)的脉冲充电进行电穿孔。加入1mL YPD培养基(MP Biomedical)，在30℃使细胞复苏1-2小时。将细胞离心，重悬于100uL 1M山梨醇并接种至不含亮氨酸并且包含2％半乳糖的选择培养基上。将所得的酵母菌落在各种温度(范围从22至37℃)温育7-10天。来源于它的I-CreI和大范围核酸酶在或高于37℃具有最大活性。在从22至37℃的温度范围进行筛选，以便观察在较低温度下活性的提高，这与某些生物系统有关(例如植物细胞、植物细胞培养物等)。在出现红/白分段表型时，观察到了大范围核酸酶活性的指示。将具有超过亲本大范围核酸酶的增大的白色分段(表明菌落表达的大范围核酸酶具有提高的大范围核酸酶活性)、也被称作“命中”和有时全白的菌落分离用于进一步分析。

将这些潜在的“命中”生长在液体培养基中以提高细胞密度。提取DNA并用于转化大肠杆菌(E.coli)。从大肠杆菌(E.coli)培养物提取质粒DNA。如上所述，将对应与所述潜在的“命中”的质粒DNA再次转化酵母筛选菌株。

如果在包含所述大范围核酸酶变体的酵母细胞中白色分段表型提高(在与包含所述亲本大范围核酸酶的酵母进行比较时)得到重复，所述变体被宣布为“确认命中”。测定大范围核酸酶编码序列用于确认命中。每个确认命中代表一种大范围核酸酶变体，并且在各种温度下基于实例4中所述0-4级分到一个大范围核酸酶活性得分。

表2显示了在22℃和30℃、带有2％半乳糖测定的酵母筛选菌株VER8145中LIG3-4和LIG3-4大范围核酸酶变体的活性。得分为0表明没有观察到白色分段(没有切割表明没有大范围核酸酶活性)；得分为4表明完全白色菌落(识别位点的完全切割表明很高的大范围核酸酶活性)；得分为1-3表明中间白色分段表型(和中间程度的识别位点切割)，是表示中间大范围核酸酶活性。

表2.在22℃和30℃测定的酵母筛选菌株中LIG3-4和LIG3-4大范围核酸酶变体的活性。

在图5A-5C中显示了所述LIG3-4变体相对于所述LIG3-4亲本(LIG3-4.pro)的比对。

各种测定条件指示了大范围核酸酶活性，允许通过活性对所述改组变体进行精确排名。观察到了大范围核酸酶活性的大的提高(高分)。一些变体甚至在22℃的低温观察到所述识别位点的完全切割。这非常显著，因为对于I-Cre型大范围核酸酶最佳温度是37℃，而对于某些生物系统(例如植物细胞培养物)是在22-25℃的范围内。因此，在与亲本I-Cre型大范围核酸酶进行比较时，这些能够在低温切割的大范围核酸酶变体更适合于在植物系统中良好运作。

表3A和3B表示LIG3-4变体相对于LIG3-4亲本大范围核酸酶的氨基酸修饰。

表3A：LIG3-4变体相对于LIG3-4的氨基酸修饰。

表3B(上接表3A)：

实例7

大肠杆菌(E.coli)中制备大范围核酸酶蛋白

为了进一步确认和定量大范围核酸酶变体的活性，在大肠杆菌(E.coli)中制备大范围核酸酶蛋白并在包含所述大范围核酸酶识别位点的质粒或玉米基因组DNA上经受体外切割测定。从锚定了所述大范围核酸酶变体的酵母菌株提取总DNA。PCR扩增所述大范围核酸酶编码序列并将其插入表达载体pQE80(QIAgen)。将所得的质粒转化进大肠杆菌(E.coli)菌株BL21(Stratagene)，生长在包含100ppm羧苄青霉素的LB培养基上。从固体培养基制备细胞悬浮液并用于接种50ml 2xYT培养基的培养物(其包含100ppm羧苄青霉素)，光密度值0.2。所述培养物生长在37℃。当光密度到达0.8，通过添加IPTG诱导蛋白表达。间温度调节至20℃，将所述培养物另外培养2小时。通过离心收集大肠杆菌(E.coli)细胞，重悬于缓冲液1(50mM Tris pH8、500mM NaCl、10mM imidizole)，并且通过超声处理裂解。细胞碎片通过离心去除。将上清液转移至加载有0.5ml Nickel-NTA Superflow树脂(QIAgen)的一次性柱上。用4ml缓冲液2(50mMTris pH8、500mM NaCl、60mM imidizole)洗柱。用0.6ml缓冲液4(50mM Tris pH8、500mM NaCl、400mM imidizole)将纯化的大范围核酸酶洗脱。将大范围核酸酶蛋白转移至Vivaspin500超滤离心管。用包含50％甘油、0.5mM二硫苏糖醇的SAB缓冲液(25mM Tris pH8、100mM NaCl、10mM MgCl₂、5mM EDTA)进行缓冲液交换和浓缩。回收终体积约0.1ml的纯化的大范围核酸酶蛋白溶液。加入牛血清白蛋白至100微克/毫升的终浓度。

实例8

大范围核酸酶活性的体外测定

如实例7所述分离大范围核酸酶蛋白。通过计算然后与已知浓度的系列稀释样品的条带强度进行比较，在Nu-PAGE(聚丙烯凝胶电泳)凝胶(Life Technologies)上可视地测定蛋白浓度。使用Hoechst染料荧光计测定法测定DNA浓度。在37℃、28℃、和23℃，用25nM的纯化的大范围核酸酶蛋白、和终体积为80ul的消化缓冲液(100mM Tris-HCl(pH 7.9)/100mM NaCl/10mM MgCl₂/1mM DTT/5mM EDTA)中的0.25nM的线状质粒底物，在包含所述大范围核酸酶识别位点的质粒DNA上进行时程消化。在0、25、50、75分钟取20μl的时间点，用等体积的终止缓冲液(100mMTris-HCl、pH 8.0/600mM NaCl/2％SDS/100mM EDTA/1mg蛋白酶K/ml)在50℃温育30-45分钟来终止，使用Qiagen PCR纯化柱按照制造商的说明进行纯化。为了对每个样品消化或大范围核酸酶识别位点损耗的％进行定量，采用跨大范围核酸酶识别位点的TaqMan测定、在1μl经纯化的质粒DNA(在水中稀释50倍)上进行实时PCR。相对于内部对照TaqMan测定，通过ΔΔCt方法计算大范围核酸酶识别位点的损耗。将0分钟时间点或空白对照用作校准物。在37℃、28℃和23℃、采用6.07ug的玉米基因组DNA和终体积为80ul的16nM经纯化的大范围核酸酶蛋白，进行基因组DNA的定时消化。50分钟后，如上所述停止消化反应，通过苯酚/氯仿提取进行纯化，在0.2M NaCl的存在下用乙醇沉淀。将沉淀的基因组DNA用70％乙醇洗两次，干燥，重悬于34μl的水中。对于质粒底物，通过如上所述的实时PCR对每个样品的消化百分比进行定量，不同的是通过实时PCR对1μl未稀释的基因组DNA进行测定。由于已经阐明I-CreI内切核酸酶对低于37℃的温度敏感(Wang，J.，Kim，H.，Yuan，X.和Herrin，D.(1997)Nucleic Acids Res.25，3767-3776.)，在37℃、28℃和23℃进行体外测定以估计I-CreI来源的亲本大范围核酸酶和其变体的裂解活性。

LIG3-4和LIG3-4变体的体外大范围核酸酶活性

在包含LIG3-4识别位点的质粒DNA上，LIG3-4(B65)是最具活性的变体，其在23℃保持裂解活性，而对于LIG3-4如果有的话很少，对于LIG3-4(7)和LIG3-4(15)仅检测到有轻微裂解(图6A)。在28℃，hit15和hit 7分别获得66％和50％的裂解，在75分钟后对于LIG3-4仅检测到轻微的裂解(图6B)。在37℃，hit7显示出与LIG3-4类似的裂解活性，而hit15和B65裂解质粒底物更快速并且到达更大的程度(图6C)。基于质粒DNA裂解，所有的改组变体比带有B65的LIG3-4活性更高，之后在活性方法是hit15，然后是hit7。这些数据紧密地模拟了在酵母测定中的观察。

当监控基因组DNA裂解时，在质粒DNA上建立的活性排名是保守的。在23℃，B65保持了显著的活性，裂解了其基因组底物的69％(图7A)。在28℃，对于LIG3-4没有检测到裂解活性，而B65、hit15和hit7分别获得94％、33％和24％的裂解(图7B)。在37℃，LIG3-4在LIG3-4基因组识别位点处表现出47％的裂解，而B65、hit15和hit7分别获得99％、92％和76％的裂解(图7C)。同样，来自玉米基因组DNA的体外切割的数据与酵母测定中的观察相符。

实例9

分析玉米中LIG3-4变体的大范围核酸酶活性

如实例3中所述创建LIG3-4变体，并且通过粒子枪转化和农杆菌介导的转化导入玉米。

三个LIG3-4变体：LIG3-4(B65)(SEQ ID NO：27)、LIG3-4(15)(SEQ ID NO：15)和LIG3-4(7)(SEQ ID NO：14)在酵母中显示出提高的大范围核酸酶活性(实例3)并且在体外测定中显示出提高的活性(实例8，图6-7)，并针对其在玉米中的活性进行进一步的体内测试。

A.用于通过同源重组进行转基因整合的大范围核酸酶基因和修复(供体)DNA的植物表达载体的载体构建

编码所述大范围核酸酶的基因经过密码子最优化用于在玉米中使用标准分子生物学技术表达。所得的植物最优化的核苷酸序列还补充了编码SV40核定位信号的DNA序列(SEQ ID NO：72)，并且进一步修饰：通过将马铃薯ST-LS1内含子添加至第一单体的编码序列以消除其在大肠杆菌(E.coli)和农杆菌中的表达。进一步测试所得的LIG3-4变体，LIG3-4(7)(SEQ ID NO：73)、LIG3-4(15)(SEQ ID NO：74)和LIG3-4(B65)(SEQ ID NO：75)在玉米中的活性(体内)。

使用标准分子生物学技术构建载体，其包含用于合适的大范围核酸酶的表达盒。对于每一个大范围核酸酶，将植物表达载体(其包含编码所述大范围核酸酶基因之一的多核苷酸)可操作地连接至玉米组成型启动子。

为了实现位点特异性DNA插入，除了所述识别位点和所述大范围核酸酶，在细胞中还必须同时存在包含目的基因的修复DNA(供体DNA)。使用标准分子生物学技术构建载体PHP46961(SEQ ID NO：76)(其包含编码工程化的大范围核酸酶变体LIG3-4(15)的多核苷酸)和供体DNA。构建类似的载体PHP46949或PHP47257，其分别包含LIG3-4B(65)或LIG3-4(17)大范围核酸酶。所述供体DNA包含抗除草剂性基因(MoPAT，其编码草胺膦乙酰转移酶)，被用作转化的选择标记，并且两翼为两个同源重组片段LIG3-4HR1(SEQ ID NO：77)和LIG3-4HR2(SEQID NO：78)，其为所述大范围核酸酶识别位点两翼的约1kb长的基因组DNA序列。也包括包含LIG3-4的载体(PHP43914，如针对PHP46961所述进行制备)作为对照。

另外将所述LIG3-4变体’表达盒共整合至LBA4404用于农杆菌递送。对于LIG3-4(B65)、LIG3-4(15)和LIG3-4(7)载体名分别为PHP47331、PHP47332和PHP47517。

来自玉米可转化品系的玉米幼胚9-12DAP(授粉后天数，大小约1.5-2.0mm)被用于通过轰击的基因转化(实例1和实例2)。在26℃下，将所述幼胚置于560Y培养基上4小时，或者，在轰击之前将幼胚置于560Y上，在此之前将幼胚在26℃至37℃的温度范围温育8至24小时。通过联合轰击将发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白2)；US20090328252A1)和Wushel包括在实验中(实例2)。用载体PHP43914、PHP46949、PHP46961和PHP47257转化玉米幼胚。

来自玉米可转化品系的玉米幼胚9-12DAP(授粉后天数，大小约1.5-2.0mm)被用于通过农杆菌的基因转化。在此次感染中不包括发育基因ODP2或Wushel。用载体PHP47731、PHP47732和PHP47517转化玉米幼胚。

B.玉米中LIG3-4变体的大范围核酸酶活性

为了检查在与LIG3-4进行比较时玉米中所述LIG3-4变体是否显示出提高的大范围核酸酶活性，用质粒DNA(包含每种变体或对照)轰击约2000个玉米幼胚。在轰击后，将胚在28℃、560P(维持培养基)上温育，然后用双丙氨膦除草剂进行选择。LIG3-4和LIG3-4变体供体载体(PHP43914、PHP46949、PHP46961和PHP47257)的成功递送赋予了双丙氨磷抗除草剂性，被用于通过在包含除草剂的培养基上选择愈伤组织来鉴定推定的事件。针对内源性LIG3-4识别位点的修饰，对再生自稳定转化子的愈伤组织和/或植物进行筛选。

采用实时PCR(qPCR)，通过测量目标位点的拷贝数，针对在大范围核酸酶目标位点(其包含所述识别位点)处的修饰对除草剂抗性事件进行筛选。所述目标位点的两个拷贝表明两个等位基因都是野生型并且在所述识别位点没有发生修饰。如果通过qPCR仅检测到所述目标位点的一个拷贝，这意味着在由LIG3-4或其改组变体生成的双链断裂的修复过程中，所述目标位点的一个等位基因发生变化，而所述目标位点的缺失(空或0)是两个等位基因都被修饰的结果。由于愈伤组织样品的嵌合实质，所述拷贝数也可在1和2之间。用于LIG3-4目标位点的qPCR的探针序列是ATACCTCACACGTACGCG(SEQ ID NO：79)，所述LIG3-4_正向引物是GATTTACGCACCTGCTGGGA(SEQ ID NO：80)，LIG3-4_反向引物是CTGAGCTGTATTCCCGCGCA(SEQ ID NO：81)。所述扩增子大约为100bp。

针对提高的大范围核酸酶活性，对带有目标位点拷贝数0、1或在1和2之间的转基因事件进一步分析。通过测量所述目标位点(TS)突变率来测定所述大范围核酸酶活性。目标位点突变率被定义为：(带有目标位点修饰的事件数量/事件总数)*100％。对于LIG3-4大范围核酸酶，TS突变率为6％(表4)。使用恢复的事件数除以被轰击胚的总数来计算事件恢复率(表4)，可表明大范围核酸酶是否具有某些毒性效应。表4显示了在轰击和6-8周的抗生素选择后，不同LIG3-4变体的效应。在与亲本LIG3-4大范围核酸酶进行比较时，大范围核酸酶变体LIG3-4(7)和LIG3-4(15)都产生了显著更高的突变频率，这与在酵母测定和体外DNA切割测定中的观察相符。LIG3-4(B65)也产生比亲本LIG3-4更高的突变频率，但没有其他LIG3-4变体高。LIG3-4(65)的事件恢复速率表明，这可能是由于毒性与非常活性的大范围核酸酶相关联。

表4：

通过在植物组织中、源自基因轰击转化的目标位点突变率(TS突变率)，测定LIG3-4和LIG3-4大范围核酸酶变体的活性。

大范围核酸酶	事件恢复率	TS突变率	插入
				LIG3-4	17％	6％	是
LIG3-4(7)	13％	29％	是
				LIG3-4(15)	15％	54％	是
LIG3-4(B65)	3％	21％	是

表5：

通过在植物组织中、源自农杆菌转化的目标位点突变率(TS突变率)，测定LIG3-4和LIG3-4大范围核酸酶变体的活性。

大范围核酸酶	事件恢复率	突变率	插入
				LIG3-4	～20％	1-3％	无
LIG3-4(7)	19％	15％	是
				LIG3-4(15)	11％	34％	是
LIG3-4(B65)	9％	74％	是

表5表明在与对照非变体LIG3-4(TS突变率1至3％)进行比较时，所有三种大范围核酸酶变体(LIG3-4(7)、LIG3-4(15)和LIG3-4(B65)显示出提高的大范围核酸酶活性(TS突变率分别为15％、34％和74％)。当通过农杆菌转化生成植物组织时，观察到大范围核酸酶活性的最高提高(表5)。这些数据与使用这些变体在酵母和体外切割测定中获得的数据非常相符。

当经由农杆菌介导的转化将所述大范围核酸酶和基因递送构建体导入时，转基因事件的恢复有非常小的减少(在与表4进行比较时在表5中更高的事件恢复率)。这可能是由于这样的事实，即通过该方法被递送至植物细胞核的DNA更少。

针对来自供体DNA(PHP43914，PHP46949，PHP46961，PHP47257；PHP47331，PHP47332，和PHP47517的agro)在LIG3-4识别位点整合的转基因盒，也通过连接PCR来筛选玉米愈伤组织，所选择的愈伤组织事件再生为T0植物(图8)。当整合发生时，例如所述通体序列被整合在识别位点处，When integration occurred，例如the donor sequence wasintegrated at the识别位点，插入被标明为“Yes”。当没有整合发生时，插入被标明为“no”(表4和5)。通过例子轰击递送每个LIG3-4变体就观察到转基因靶向至LIG3-4基因座(表4：当通过农杆菌介导的转化导入时，每个LIG34变体能转基因整合在目标位点，而亲本LIG34不能(对于变体插入为YES，对于LIG3-4为NO；表5)。

实例10

创建MHP77和MHP77.3大范围核酸酶变体

A.MHP77 & MHP77.3大范围核酸酶和MHP 77识别位点

选择包含MHP77识别位点(SEQ ID NO：85)内源性玉米基因组目标位点用于设计定制的双链断裂诱导剂。所述MHP77识别位点是在1号染色体上的22bp的多核苷酸，具有以下序列：

(SEQ ID NO：85)GGGCGGTATGTATGTCATACTA

修饰野生型I-CreI大范围核酸酶(SEQ ID NO：3)以制备两种工程化的大范围核酸酶：MHP77(SEQ ID NO：86)和MHP77.3(SEQ IDNO：250)，其设计来识别所述MHP77识别序列。在美国专利申请公开US2007/0117128A1中已经描述了定制大范围核酸酶的设计。

B.MHP77和MHP77.3大范围核酸酶变体

通过基因改组方法，以类似如何创建LIG3-4变体以及在实例3中所述的方式创建MHP77大范围核酸酶的变体。这涉及导入存在于天然存在的大范围核酸酶蛋白的和先前在LIG3-4变体中鉴定的以及随机突变的氨基酸修饰。所述改组方法使得生成带有氨基酸修饰的重组的MHP77变体，非预期的氨基酸修饰是由于诱变PCR、缺失和插入(SEQ ID NO：86-167)。

通过将相同的氨基酸修饰(突变)引入MHP77(L9-02)、MHP77(L9-11)、或MHP77(L9-12)，创建了MHP77.3大范围核酸酶的三个变体，因此创建了MHP77.3(L9-02)(SEQ ID NO：251)、MHP77.3(L9-11)(SEQ ID NO：252)和MHP77.3(L9-12)(SEQ ID NO：253)。MHP77.3(15)(SEQ ID NO：262)包含针对LIG3-4(15)所述的完全相同的核苷酸/氨基酸修饰。通过标准分子生物学技术将所述氨基酸修饰导入MHP773。

C.酵母中的MHP77大范围核酸酶变体活性

在酵母系统中确认了总共79个MHP77变体具有提高的活性(如实例6中所述)。跨温度范围观察到了提高的活性：24℃、28℃、30℃和3737℃，如表6中所述。得分为0表明没有观察到白色分段(没有切割表明没有大范围核酸酶活性)；得分为4表明完全白色菌落(识别位点的完全切割表明很高的大范围核酸酶活性)；得分为1-3表明中间白色分段表型(和中间程度的识别位点切割)，是表示中间大范围核酸酶活性。

表6：在不同温度下测定的酵母筛选菌株中的MHP77大范围核酸酶变体的活性。

#变体	24℃	28℃	30℃	37℃
					MHP77	0	0	0	0
MHP77(L15-31)	X	4	4	4
					MHP77(L16-11)	4	4	4	4
MHP77(L16-09)	2.5	4	4	4
					MHP77(L16-04)	2	4	4	4
MHP77(L16-19)	2	4	4	4

MHP77(L16-17)	3	3.5	4	4
					MHP77(L16-23)	1	3.5	4	4
MHP77(L15-34)	1	3.5	4	4
					MHP77(L15-40)	0.5	3.5	4	4
MHP77(L15-39)	0.5	3.5	4	4
					MHP77(L15-45)	0.5	3	4	4
MHP77(L15-29)	0.5	2.5	4	4
					MHP77(L15-06)	0	2	4	4
MHP77(L16-08)	1	3	3.5	4
					MHP77(L16-05)	1	3	3.5	4
MHP77(L16-02)	0.5	2.5	3.5	4
					MHP77(L16-24)	0	2.5	3.5	4
MHP77(L16-21)	0	2.5	3.5	4
					MHP77(L16-14)	0	2.5	3.5	4
MHP77(L16-18)	0.5	2	3.5	4
					MHP77(L15-27)	0	2	3.5	4
MHP77(L9-02)	0	2	3	4
					MHP77(L16-12)	0	2	3	4
MHP77(L16-01)	0	2	3	4
					MHP77(L15-05)	0	2	3	4
MHP77(L15-24)	0	2	3	4
					MHP77(L16-06)	0	1	3	4
MHP77(L16-15)	0	1	3	4
					MHP77(L15-33)	0	1	3	4
MHP77(L16-03)	0	2	2.5	4
					MHP77(L15-47)	0	0	2.5	4
MHP77(L15-46)	0	0	2.5	4
					MHP77(L9-12)	0	1	2	4
MHP77(L16-16)	0	1	2	4
					MHP77(L15-10)	0	1	2	4
MHP77(L9-03)	0	0.5	2	4
					MHP77(L15-20)	0	0.5	2	4
MHP77(L15-28)	0	0	2	4
					MHP77(L15-21)	0	0	2	4
MHP77(L15-13)	0	0	2	4
					MHP77(L9-04)	0	0	1	4
MHP77(L15-18)	0	0	1	4
					MHP77(L18-01)	X	0	0	4
MHP77(L17-12)	X	0	0	4
					MHP77(L17-01)	X	0	0	4
MHP77(L15-03)	0	0.5	2	3.5
					MHP77(L15-11)	0	0.5	1	3.5
MHP77(L18-12)	X	0	1	3.5
					MHP77(L15-15)	0	0	1	3.5

MHP77(L15-12)	0	0	1	3.5
					MHP77(L9-1)*	0	1	2	3
MHP77(L9-9)	0	0	1	3
					MHP77(L9-11)	0	0	1	3
MHP77(L9-10)	0	0	1	3
					MHP77(L15-02)	0	0	1	3
MHP77(L15-08)	0	0	0.5	3
					MHP77(L16-07)	0	0	0	3
MHP77(L15-35)	0	0	0	2.5
					MHP77(L13-12)	0	0	0	2.5
MHP77(L113-01)	0	0	0	2.5
					MHP77(L9-06)	0	0.5	0.5	2
MHP77(L15-42)	0	0	0	2
					MHP77(L15-41)	0	0	0	2
MHP77(L15-36)	0	0	0	2
					MHP77(L15-30)	0	0	0	2
MHP77(L112-03a)	0	0	0	2
					MHP77(L73-02a)	0	0	0	1.5
MHP77(L13-10B1)	0	0	0	1.5
					MHP77(L72-08a)	X	0	0	1
MHP77(L72-09a)	0	0	0	1
					MHP77(L72-01a)	0	0	0	1
MHP77(L13-08a)	0	0	0	1
					MHP77(L13-06)	0	0	0	1
MHP77(L13-02)	0	0	0	1
					MHP77(L13-01a)	0	0	0	1
MHP77(L73-05a)	0	0	0	0.5
					MHP77(L15-43)	0	0	0	0.5
MHP77(L13-04)	0	0	0	0.5
					MHP77(L13-11)	0	0	0	0.5
MHP77(L15-23)	0	0	0	0
					MHP77(L15-16)	0	0	0	0

观察到了大范围核酸酶活性的大的提高(高分)。观察到了一些变体对识别位点的完全切割，甚至在22℃的低温下(参见MHP77(L16-11)表6)。

图9A-9D显示了MHP77变体相对于MHP77亲本大范围核酸酶的氨基酸修饰。A(-)表明所述氨基酸与MHP77参考序列相同。

实例11

玉米中MHP77和MHP77.3大范围核酸酶变体的分析

将编码MHP77和MHP77.3工程化的大范围核酸酶(实例10)的基因优化用于在植物中表达。为了在玉米细胞中有更好的性能，所述工程化的大范围核酸酶表达盒包含玉米密码子优化的核苷酸序列。所述大范围核酸酶基因序列还补充了编码SV40核定位信号的DNA序列，产生植物最优化的序列：SEQ ID NO：254(针对MHP77)和SEQ ID NO：255(针对MHP77.3)。玉米泛素启动子和马铃薯蛋白酶抑制剂II基因终止子序列完成了内切酶基因的设计。

对于MHP77和MHP77.3变体的植物最优化的核苷酸序列是MHP77(L9-02)(SEQ ID NO：256)、MHP77(L9-11)(SEQ ID NO：257)、MHP77(L9-12)(SEQ ID NO：258)、MHP77.3(L9-02)(SEQ IDNO：259)、MHP77.3(L9-11)(SEQ ID NO：260)以及MHP77.3(L9-12)(SEQ ID NO 261)和MHP77(15)(SEQ ID NO：263)。

为了实现位点特异性DNA插入，除了所述识别位点和所述大范围核酸酶，在细胞中还必须同时存在包含目的基因的修复DNA(供体DNA)。载体类似于实例9中所述的PHP46961(SEQ ID NO：76)，但包含多核苷酸，其编码大范围核酸酶变体MHP77(L9-11)、MHP77(L9-12)、MHP77(L9-02)、MHP77.3(L9-11)、MHP77.3(L9-12)、MHP77.3(L9-02)、或MHP77.3(15)；使用标准分子生物学技术构建供体DNA。这些载体被称为PHP53132、PHP53134、PHP53136、PHP53133、PHP53135、PHP53137和PHP50239。所述供体DNA包含抗除草剂性基因用作转化的选择标记。抗除草剂性基因MoPAT编码草胺膦乙酰转移酶，两翼为两个同源重组片段：MHP77HR1(SEQ ID NO：264)和MHP77HR2(SEQ ID NO：265)，其为所述大范围核酸酶识别位点两翼的约1kb长的基因组DNA序列。

来自玉米可转化品系的玉米幼胚9-12DAP(授粉后天数，大小约1.5-2.0mm)被用于通过轰击的基因转化(实例1和实例2)。在26℃下，将所述幼胚置于560Y培养基上4小时，或者，在轰击之前将幼胚置于560Y上，在此之前将幼胚在26℃至37℃的温度范围温育8至24小时。通过联合轰击将发育基因ODP2(AP2结构域转录因子ODP2(胚珠发育蛋白2)；US20090328252A1)和Wushel包括在实验中(实例2)。用载体PHP53132、PHP53134、PHP53136、PHP53133、PHP53135、PHP53137，和PHP50239转化玉米幼胚。

B.玉米中MHP77和MHP77.3变体的大范围核酸酶活性

为了检查在与MHP77和MHP77.3进行比较时所述MHP77和MHP77.3大范围核酸酶变体是否提高了大范围核酸酶活性，用每种变体或对照质粒DNA轰击约2000个玉米幼胚。在轰击后，将胚在28℃、560P(维持培养基)上温育，然后用除草剂(双丙氨膦)进行选择。MHP77、MHP77.3变体供体载体(PHP45970、PHP50238、PHP53132、PHP53134、PHP53136、PHP53133、PHP53135、PHP53137，或PHP50239)的成功递送赋予了双丙氨磷抗除草剂性，被用于通过在包含除草剂的培养基上选择愈伤组织来鉴定推定的事件。使用标准培养物从稳定转化子再生愈伤组织和/或植物，并且针对内源性MHP77识别位点的修饰来筛选再生条件。

如实例9中所述，针对目标位点(包含MHP77识别位点)处的修饰，通过使用qPCR测量目标位点拷贝数来筛选除草剂抗性事件。用于MHP77目标位点的qPCR的探针序列是ACTAATTCAAGTGATGGACAAA(SEQID NO：266)，所述MHP77_正向引物是TCCTTAGGGCGGTATGTATGTCA(SEQ ID NO：267)，MHP77_反向引物是CATCGGTCAAAAAACACATAAACTTT(SEQ ID NO：268)。所述扩增子约为100bp。

目标位点突变率(TS突变率，表7)间接测量了所述大范围核酸酶活性。表7显示了在轰击和6-8周抗生素选择后，不同的MHP77的改组变体和改组大范围核酸酶的效应。表7表明在与MHP77大范围核酸酶进行比较时，MHP77大范围核酸酶的所有三种改组变体更有活性。在与MHP77(对照)进行比较时，改组的MHP77大范围核酸酶提高的活性还导致恢复事件的减少。

表7：

通过在植物组织中、源自基因轰击转化的目标位点突变率(TS突变率)，测定MHP77和MHP77大范围核酸酶变体的活性。

大范围核酸酶	事件恢复率	TS突变率	插入
				MHP77(对照)	21％	1％	无
MHP77L9-11	11％	4％	无
				MHP77L9-12	9％	17％	是
MHP77L9-02	3％	6％	无

表8：

通过在植物组织中、源自农杆菌转化的目标位点突变率(TS突变率)，测定MHP77.3和MHP77.3大范围核酸酶变体的活性。

大范围核酸酶	转化率	突变率	插入
				MHP77.3	14％	11％	无
MHP77.3(15)	13％	22％	是
				MHP77.3L9-11	9％	35％	是
MHP77.3L9-12	3％	19％	是
				MHP77.3L9-02	2％	5％	无

表8表明在与非变体MHP77.3大范围核酸酶进行比较时，MHP77.3大范围核酸酶的所有四种改组变体更具活性。在与MHP77进行比较时，一些但并非全部改组的MHP77大范围核酸酶活性提高导致恢复事件的减少。

针对来自供体DNA(PHP45970、PHP50238、PHP53132、PHP53134、PHP53136、PHP53133、PHP53135、PHP53137，和PHP50239)在MHP77识别位点整合的转基因盒，也通过连接PCR来筛选玉米愈伤组织，所选择的愈伤组织事件再生为T0植物。当整合发生时，例如所述供体序列被整合至所述识别位点，插入(表7和8)被标明为“Yes”。当整合没有发生时，插入被标明为“no”。

实例12

MS26大范围核酸酶变体的创制

A.MS26+& MS26++大范围核酸酶和MS26识别位点

选择包含MS26识别位点(SEQ ID NO：269)的内源性玉米基因组目标位点用于定制的双链断裂诱导剂的设计。所述MHP26识别位点是22bp的多核苷酸，具有以下序列：

(SEQ ID NO：269)gatggtgacgtacgtgccctac

对野生型I-CreI大范围核酸酶(SEQ ID NO：3)进行修饰以制备两种工程化的大范围核酸酶，MHP26+(SEQ ID NO：270)和MHP26++(SEQ IDNO：271)，其设计来识别所述MHP26识别序列。在美国专利申请公开US2007/0117128 A1中已经描述了定制大范围核酸酶的设计。

B.MS26大范围核酸酶变体

如实例6和9中所述，将LIG3-4变体导入酵母和玉米，在与非变体LIG3-4大范围核酸酶进行比较时，显示出显著更高的大范围核酸酶活性。在与所述亲本LIG3-4(表2和图5)进行比较时，这些LIG3-4变体表征为特定的氨基酸修饰。为了测试这些氨基酸修饰(和对应的核苷酸修饰)是否也能提高MS26+大范围核酸酶的活性，将LIG3-4(7)、LIG3-4(15)和Lig3-4(B65)所述的完全相同的核苷酸/氨基酸修饰通过标准分子生物学技术导入MS26+，得到下列三种MS26+变体：MS26+(7)(SEQ IDNO：272)、MS26+(15)(SEQ ID NO：273)和MS26(B65)(SEQ IDNO：274)变体。

相似地，对所述MS26++核苷酸/氨基酸序列进行优化以包括LIG3-4(15)的核苷酸/氨基酸修饰，得到MS26++(15)大范围核酸酶变体(SEQ ID NO：275)。

实例13

玉米中MS26+和MS26++变体的大范围核酸酶活性分析

将编码MHP26+和MHP26++工程化的大范围核酸酶的基因优化用于在植物中表达。为了在玉米细胞中有更好的性能，所述工程化的大范围核酸酶表达盒包含玉米密码子优化的核苷酸序列。所述大范围核酸酶序列还补充了编码SV40核定位信号的DNA序列(SEQ ID NO：34)，得到植物最优化的序列：SEQ ID NO：276(针对MHP26+)和SEQ ID NO：279(针对MS26++)。玉米泛素启动子和马铃薯蛋白酶抑制剂II基因终止子序列完成了内切酶基因的设计。针对MS26+和MS26++大范围核酸酶变体的植物最优化的序列分别是SEQ ID NO：419、277-279和SEQ ID NO：280。

将MS26+变体的编码部分导入测试载体PHP51583，其包含一个狭槽用于通过泛素启动子驱动大范围核酸酶、两个标记基因(MoPAT和DsRed，也在泛素启动子的控制下)的融合、和卡那霉素抗性基因。

如实例1中所述，通过基因枪轰击将所得的构建体递送至玉米幼胚的盾片细胞。通过联合轰击也递送了发育基因(BBM和WUS)(实例1和2)。

B.玉米中MS26+变体的大范围核酸酶活性

收集转基因事件的愈伤组织，提取总基因组DNA用作模板以扩增约1kb的DNA片段，其包含所述Ms26识别位点。通过用BsiWI限制核酸酶消化所述片段(其切割预期的Ms26识别位点)来估计MS26识别位点(目标位点突变率)的突变频率。基于剩余的(未切割的)片段的百分比(其表明在所述目标位点处的突变)计算突变的频率。带有至少50％的未消化片段的事件指示在发育的第一阶段至少有一个等位基因被切割，并且因此指示了突变。与LIG3-4(实例9)的情况不同，在与亲本MS26+进行比较时，没有观察到MS26+变体的恢复事件频率的降低。与Ms26+大范围核酸酶相比，所有三种MS26+变体产生更高的突变频率(表9)。在Ms26+(B65)和Ms26+(7)显示出大范围核酸酶活性适度提高(分别为3倍和4倍提高)时，Ms26+(15)显示出活性约10倍提高(表9)。

表9：

通过在植物组织中的目标位点突变率(TS突变率)，测定MS26+和 MS26+大范围核酸酶变体的活性。

大范围核酸酶	分析的事件数量	TS突变率
			MS26+	282	2％
MS26+(7)	191	9％
			MS26+(15)	227	25％
MS26+(B65)	176	7％

在与MS26(7％)进行比较时，将与LIG3-4(15)相同的氨基酸修饰(突变)导入MS26++(15)导致大范围核酸酶活性的急剧提高，测量的MS26++的％突变率为44％(表10)。这个数据指出所有分析的事件的几乎半数在所述Ms26识别位点带有突变。

表10：

实例14

创建MHP和MHP14+大范围核酸酶变体

A.MHP14 & MHP14+大范围核酸酶和MHP14识别位点

选择包含MHP14识别位点(SEQ ID NO：281)的内源性玉米基因组目标位点用于设计定制的双链断裂诱导剂。所述MHP14识别位点是定位的22bp多核苷酸，具有以下序列：

(SEQ ID NO：281)caaacagattcacgtcagattt

修饰野生型型I-CreI大范围核酸酶以制备工程化的大范围核酸酶MHP14(SEQ ID NO：282)和MHP14+(SEQ ID NO：283)，其设计来识别所述MHP14识别序列。在美国专利申请公开US 2007/0117128 A1中已经描述了定制大范围核酸酶的设计。

B.MHP14和MHP14+大范围核酸酶变体

通过基因改组方法，以类似如何创建LIG3-4变体以及在实例3中所述的方式创建MHP14大范围核酸酶的变体。这涉及导入存在于天然存在的大范围核酸酶蛋白的和先前在LIG3-4变体中鉴定的以及随机突变的氨基酸修饰。所述改组方法使得生成带有氨基酸修饰的重组的MHP14变体，非预期的氨基酸修饰是由于诱变PCR、缺失和插入(SEQ ID NO：284-298)。

对应的DNA序列是SEQ ID NO：300-314。

将来自五个MHP14变体，MHP14(04)、MHP14(06)、MHP14(08)、MHP14(12)和MHP14(14)的突变导入MHP14+，得到MHP14+(04)(SEQ ID NO：315)、MHP14+(06)(SEQ ID NO：316)、MHP14+(08)(SEQ ID NO：317)、MHP14+(12)(SEQ ID NO：318)、MHP14+(14)(SEQ ID NO：319)。通过将来自LIG3-4(15)的G19S突变导入MHP14+生成一个另外的变体，得到MHP14+(15)(SEQ IDNO：320)。通过标准分子生物学技术将这些突变导入MHP14+。

实例15

分析酵母和玉米中MHP14和MHP14+变体的大范围核酸酶活性

在酵母系统中确认了总共15个MHP14变体具有提高的活性(如实例6中所述)。跨温度范围观察到了提高的活性：28℃、34℃、和37℃、如表11中所示。

表11：在不同温度下测定的酵母筛选菌株中的MHP14大范围核酸酶变体的活性。

大范围核酸酶	28℃	34℃	37℃
				MHP14	0	2	2
MHP14(L14-07)	0.5		4
				MHP14(01)	0	3	3
MHP14(06)	0	3.5	3.5
				MHP14(L14-04)	0		3
MHP14(08)	1	4	4
				MHP14(07)	0.5	2.5	2.5
MHP14(03)	0.5	3	3

MHP14(04)	2	x	x
				MHP14(02)	2	4	4
MHP14(13)	1	4	3.5
				MHP14(L14-03)	0		3
MHP14(14)	1	4	4
				MHP14(09)	2	4	4
MHP14(12)	1.5	4	4
				MHP14(10)	1	4	4

观察到大范围核酸酶活性的大幅提高(高分)。

图10A-10C显示了MHP14变体大范围核酸酶相对于MHP14亲本大范围核酸酶的氨基酸修饰。A(-)表明所述氨基酸与MHP14相同。

表12显示了来自五个MHP14+变体的活性筛选的结果。

表12：在不同温度下测定的酵母筛选菌株中的MHP14+大范围核酸酶变体的活性。

大范围核酸酶	28℃	37℃
			MHP14	0	2
MHP14+(04)	2	X
			MHP14+(06)	0	4
MHP14+(08)	1	4
			MHP14+(12)	2	4
MHP14+(14)	1	4
			MHP14+(15)	-	-

在与MHP14大范围核酸酶进行比较时，所有MHP14+变体在37℃筛选的酵母测定中显示出更高活性(表12)。甚至在28℃的更低温度进行测定时，变体MHP14+(04)、MHP14+(08)、MHP14+(12)和MHP14+(14)显示出提高的活性(表12.)

将编码MHP14和MHP14+大范围核酸酶变体的基因优化用于在植物中表达。为了在玉米细胞中有更好的性能，所述工程化的大范围核酸酶表达盒包含玉米密码子优化的核苷酸序列。所述大范围核酸酶基因序列还补充了编码SV40核定位信号的DNA序列，产生植物最优化的序列：SEQ IDNO：321-327。玉米泛素启动子和马铃薯蛋白酶抑制剂II基因终止子序列完成了内切酶基因的设计。

如针对Ms26+和Ms26++变体(Example 12)所述进行植物中MHP14+变体的大范围核酸酶活性的测试和分析，结果显示于表13。

表13：

通过在植物组织中的目标位点突变率(TS突变率)，测定玉米中 MHP14和MHP14+大范围核酸酶变体的活性。

大范围核酸酶	分析的事件数量	TS突变率
			MHP14	192	13％
MHP14+(04)	192	38％
			MHP14+(06)	192	7％
MHP14+(08)	192	25％
			MHP14+(12)	192	47％
MHP14+(14)	192	39％
			MHP14+(15)	192	20％

两个变体MHP14+(04)和MHP14+(08)，虽然表现更高的活性，但也显示出相当高水平的毒性。在与MHP14进行比较时，MHP14+06在毒性和活性上均未显示差异。两个变体MHP14+(12)和MHP14+(14)，表现很高水平的活性而未提高毒性。MHP14+(15)变体显示出活性的温和提高，毒性没有提高(表13)。

实例16

DNA改组以创建MP107大范围核酸酶的变体

选择包含MP107识别序列(SEQ ID NO：328)的内源性玉米基因组目标位点用于设计定制的双链断裂诱导剂。所述MP107识别位点是22bp的多核苷酸，具有下述序列：

ctagtatacgtgagagaccttg(SEQ ID NO：328)。

如实例3所述制备工程化的MP107大范围核酸酶(SEQ IDNO：329)。

如实例3所述，MP107大范围核酸酶优化的第一相是设计来将氨基酸修饰导入所述MP107大范围核酸酶。文库是基于先前在LIG3-4、MHP14和MHP77变体中鉴定的具有提高活性的突变的导入(而创建的)。

所述改组方法导致生成带有氨基酸修饰重组的变体，非预期的氨基酸突变是由于诱变PCR、缺失和插入(SEQ ID NO：330-341)。对应的核苷酸序列显示于SEQ ID NO：343-354。

在酵母系统中确认了总共6个MHP107变体具有提高的活性(如实例6中所述)。跨温度范围观察到了提高的活性：28℃、30℃、和37℃、如表14中所示。

表14：在不同温度下测定的酵母筛选菌株中的MP107大范围核酸酶变体的活性。

大范围核酸酶	28℃	30℃	37℃
				MHP107	0	0	0
MHP107(D1)	0	0	0
				MHP107(D5)		0.5	1.5
MHP107(D3)		0.5	2
				MHP107(D2)		0	0
MHP107(C6)	0.5	1	3
				MHP107(C4)		0	0
MHP107(D4)		0	2
				MHP107(C5)		0	1
MHP107(C1)	2	3	4
				MHP107(C2)		0	0
MHP107(D6)	0	0	0
				MHP107(C3)		0	0

图11显示了MP107变体相对于亲本MP107大范围核酸酶的氨基酸修饰。A(-)表明所述氨基酸与MP107相同。

实例17

DNA改组以创建Zm6.3大范围核酸酶的变体

选择包含Zm6.3识别序列(SEQ ID NO：355)的内源性玉米基因组目标位点用于设计定制的双链断裂诱导剂。所述Zm6.3识别位点是22bp的多核苷酸，具有下述序列：caggctctcgtaaatgcgcctg(SEQ ID NO：355)。

如实例3所述制备工程化的Zm6.3大范围核酸酶(SEQ IDNO：356)。

如实例3所述，Zm6.3大范围核酸酶优化的第一相是设计来将氨基酸修饰导入所述Zm6.3大范围核酸酶。文库是基于先前在LIG3-4、MHP14和MHP77变体中鉴定的具有提高活性的突变的导入(而创建的)。

所述改组方法导致生成带有氨基酸修饰重组的变体，非预期的氨基酸突变是由于诱变PCR、缺失和插入(SEQ ID NO：357-371)。对应的核苷酸序列显示于SEQ ID NO：373-387。

在酵母系统中确认了总共15个Zm6.3变体具有提高的活性(如实例6中所述)。跨温度范围观察到了提高的活性：28℃、30℃、和37℃，如表15中所示。

表15：在不同温度下测定的酵母筛选菌株中的Zm6.3大范围核酸酶变体的活性。

大范围核酸酶	28℃	30℃	37℃
				ZM6.3	0	0.5	2
ZM6.3(4)	1	2	4
				ZM6.3(3)	0	0	2
ZM6.3(5)	0.5	1	4
				ZM6.3(H2)	2	2	4
ZM6.3(H3)	2	2	4
				ZM6.3(1)	1	1.5	4
ZM6.3(G4)	2	2.5	4
				ZM6.3(G1)	4	4	4
ZM6.3(G5)	0	0	2
				ZM6.3(G2)	2.5	4	4
ZM6.3(H1)	4	4	4
				ZM6.3(G6)	4	4	4
ZM6.3(G3)	2	2.5	4
				ZM6.3(H6)	4	4	4
ZM6.3(H5)	4	4	4

图12显示了Zm6.3变体相对于Zm6.3亲本大范围核酸酶的氨基酸修饰。A(-)表明所述氨基酸与Zm6.3相同。

实例18

DNA改组以创建Zm6.22v2大范围核酸酶的变体

选择包含Zm6.22v2识别序列(SEQ ID NO：388)的内源性玉米基因组目标位点用于设计定制的双链断裂诱导剂。所述Zm6.22v2识别位点是22bp的多核苷酸，具有下述序列：attgctctctcacatactttta(SEQ IDNO：388)。

如实例3所述，制备工程化的Zm6.22v2大范围核酸酶(SEQ IDNO：389)。

如实例3所述，Zm6.22v2大范围核酸酶优化的第一相是设计来将氨基酸修饰导入所述Zm6.22v2大范围核酸酶。文库是基于先前在LIG3-4、MHP14和MHP77变体中鉴定的具有提高活性的突变的导入(而创建的)。

所述改组方法导致生成带有氨基酸修饰重组的变体，非预期的氨基酸突变是由于诱变PCR、缺失和插入(SEQ ID NO：390-403)。对应的核苷酸序列显示于SEQ ID NO：405-418。

在酵母系统中确认了总共13个ZM6.22v2变体具有提高的活性(如实例6中所述)。跨温度范围观察到了提高的活性：28℃、30℃、和37℃，如表16中所示。

表16：在不同温度下测定的酵母筛选菌株中的ZM6.22v2大范围核酸酶变体的活性。

大范围核酸酶	28℃	30℃	37℃
				ZM6.22v2	0	0	1
ZM6.22v2(I2)	1	2	x
				ZM6.22v2(J5)		0.5	4
ZM6.22v2(J8)		1	3
				ZM6.22v2(J3)		0.5	3
ZM6.22v2(J4)		0.5	3.5
				ZM6.22v2(J7)		0.5	3
ZM6.22v2(I6)	0.5	1	2
				ZM6.22v2(I4)	0	0	3
ZM6.22v2(I3)	0	0	2
				ZM6.22v2(I5)	0	0	0
ZM6.22v2(J2)		0	2
				ZM6.22v2(I9)		0	2
ZM6.22v2(I7)		0	2

ZM6.22v2(I8)		0.5	2.5
				ZM6.22v2	0	0	1
ZM6.22v2(I2)	1	2	x
				ZM6.22v2(J5)		0.5	4
ZM6.22v2(J8)		1	3

图13显示了Zm6.22v2变体相对于Zm6.22v2亲本大范围核酸酶的氨基酸修饰。A(-)表明所述氨基酸与Zm6.22v2相同。

实例19

使用不同的氨基酸接头序列以创建具有提高活性的大范围核酸酶。

如在实例3中所讨论的，所有大范围核酸酶变体包含接头多肽，其将两个再工程化的I-CreI单体连接成氨基酸单链。

如实例中所述创建大范围核酸酶变体MHP14(10)(SEQ IDNO：292)和MHP77(L9-01)(SEQ ID NO：92)。与这些大范围核酸酶变体对应的亲本大范围核酸酶中的接头序列进行比较时，其特征在于具有不同的接头序列(图15A)。在MHP14(10)中，在接头E160的第二个密码子处发生移框，所述阅读框在S193(所述接头的最后一个残基)处恢复。在MHP77(01L9-)中，在接头W159的第一个密码子处发生移框，所述阅读框在L198处恢复。因此所述连接的二聚体的第二单元的最前4个氨基酸被改变了。这些数据表明可构建具有各种不同接头序列、同时仍获得提高的大范围核酸酶活性的大范围核酸酶变体。

LIG3-4(SEQ ID NO：1)\MHP14(SEQ ID NO：282)、MHP14(10)(SEQ ID NO：292)、MHP77(SEQ ID NO：86)和MHP77(L9-01)(SEQID NO：92)的整个氨基酸序列的比对(图15B)揭示了低至80.8％的百分比同一性。从而，创建的大范围核酸酶变体具有提高的大范围核酸酶活性，同时与亲本大范围核酸酶仅有80％的相似性。

实例20

鉴定大范围核酸酶的结构基序中的氨基酸修饰。

使用I-CreI大范围核酸酶二聚体的三维结构模型(Chevalier BS，Monnat Jr RJ，Stoddard BL Nat.Struct.Biol.(2001)8p.312)对负责提高大范围核酸酶活性的氨基酸修饰的物理位置进行分析。如图16中所示，对若干大范围核酸酶变体的观察发现在α螺旋-1位置12、16和19中的氨基酸修饰与提高的活性相关联。α螺旋-1涵盖了SEQ ID NO：1中亚单位数1上氨基酸8至19和亚单位数2上氨基酸195至206。另外，如图16中所示，对若干大范围核酸酶变体的观察发现在α螺旋-5位置121、124、129、131和132中的氨基酸修饰与提高的活性相关联。α螺旋-5涵盖了SEQ ID NO：1中亚单位数1上氨基酸120-135和亚单位数2上氨基酸307至322。我们预测在α螺旋-1和α螺旋-5中另外的氨基酸修饰具有导致活性提高超过对应的参考大范围核酸酶的潜力。

实例21

将至少一个氨基酸修饰转移至其它的大范围核酸酶以创建具有提高活性的大范围核酸酶变体。

如实例3-19中所述，可将实例3-19中鉴定的氨基酸修饰的任何一个转移至亲本大范围核酸酶以创建具有提高活性的大范围核酸酶变体。图14列出了具有提高活性的I-CreI型大范围核酸酶变体的子集。可将这些氨基酸修饰的任何一个组合以创建具有提高活性的新变体。

本发明的一个实施例是将至少一个氨基酸修饰转移至亲本大范围核酸酶从而提高所述亲本大范围核酸酶的活性，所述氨基酸修饰选自Y12至H、G19至S或A、Q50至K或R、F54至I、D56至L、V105至A、E124至R、V129至A、I132至V或T、D153至M或L、V316至A或I319至V。

实例22

饱和诱变以创建具有提高活性的大范围核酸酶变体。

可在实例3-21中所示的任一处氨基酸修饰位置进行饱和诱变。饱和诱变会导致生成一组大范围核酸酶，其中一个氨基酸位置被所有可能的氨基酸之一所替换。然后如上所述针对提高的活性对该大范围核酸酶组进行分析，结果鉴定出针对一个氨基酸位置的会导致提高所述亲本大范围核酸酶活性提高的多种可能的修饰。

实例23

创建和分析大豆中的TS21和TS14大范围核酸酶变体

A.TS21和TS14识别位点和大范围核酸酶

选择包含TS21识别序列(SEQ ID NO：423)或TS14识别序列(SEQID NO：424)的内源性大豆基因组目标位点用于设计定制的双链断裂诱导剂。提交于2012年3月22日的美国专利申请13/427138中已经描述了所述大豆基因组目标位点和定制的TS21和TS14大范围核酸酶的设计，该文件全文以引用方式并入。

B.TS21和TS14大范围核酸酶变体

为了测试LIG3-4氨基酸修饰(和对应的核苷酸修饰)是否也能提高大豆TS21大范围核酸酶和TS14大范围核酸酶的活性，将LIG3-4(7)、LIG3-4(15)和Lig3-4(B65)(表1A)所述的完全相同的核苷酸/氨基酸修饰通过标准分子生物学技术导入TS21大范围核酸酶(SEQ ID NO：425和429)和TS14大范围核酸酶(SEQ ID NO：433和435)，得到下列三种TS21大范围核酸酶变体和一种TS14大范围核酸酶变体：TS21(7)(SEQID NO：426和430)、TS21(15)(SEQ ID NO：427和431)、TS21(B65)(SEQ ID NO：428和432)和TS14(15)(SEQ ID NO：434和436)变体。

C.分析大豆中TS21和TS14变体的大范围核酸酶活性

优化编码TS21和TS14大范围核酸酶变体的基因用于在植物中表达。为了在大豆中有更好的性能，所述工程化的大范围核酸酶表达盒包含植物密码子优化的核苷酸序列。通过如美国专利申请13/427138中所述的相同方法制备针对这些大豆变体的植物表达载体。使用大豆泛素启动子和马铃薯蛋白酶抑制剂II基因终止子序列来控制大范围核酸酶在大豆中的表达。美国专利申请13/427138中描述了用于大豆转化、qPCR和针对TS21和TS14目标位点的基因组PCR测定的方法。使用TS21和TS14识别序列特异性的qPCR测定来鉴定序列变化。通过qPCR测定分析所有的抗潮霉素的大豆转基因事件。由DNA裂解和修复形成的大范围核酸酶目标序列的改变，导致所述大范围核酸酶目标位点的拷贝数从野生型大豆基因组的两个拷贝减少到转基因事件中的一个或0个拷贝。从TS21和TS14目标位点的qPCR分析，表明在大多数阳性转基因事件中所述目标位点的拷贝数减半，显示在大豆基因组中所述识别位点的一个等位基因被大范围核酸酶切割/DNA修复机制所破坏。如表17中所示，在与亲本TS21大范围核酸酶(8.7％)进行比较时，将与LIG3-4变体相同的氨基酸修饰(突变)导入TS21大范围核酸酶导致TS21目标位点突变率的大幅提高：TS21(7)大范围核酸酶变体(32.1％)和对于TS21(15)大范围核酸酶变体(17.2％)，对于TS21(B65)大范围核酸酶变体为温和提高。如表18中所示，将LIG3-4(15)突变导入TS14大范围核酸酶导致TS14目标位点突变率从对于亲本TS14大范围核酸酶的16％下降至对于TS14(15)大范围核酸酶变体的4％突变率。

表17：

在大豆中通过目标位点qPCR命中率(TS突变率)测定的TS21大范围核酸酶变体的活性

大范围核酸酶	分析的事件数量	TS突变率
			TS21	184	8.7％
TS21(7)	187	32.1％
			TS21(15)	192	17.2％
TS21(B65)	134	12.7％

表18：

在大豆中通过目标位点qPCR命中率(TS突变率)测定的TS14大范围核酸酶变体的活性

大范围核酸酶	分析的事件数量	TS突变率
			TS14	183	16％
TS14(15)	192	4％

Claims

2.根据权利要求1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：1具有至少80％的序列同一性的大范围核酸酶多肽。

3.根据权利要求1所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括：

a)在对应于SEQ ID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；

b)在对应于SEQ ID NO：1中氨基酸位置12的位置处的组氨酸(H)；

e)在对应于SEQ ID NO：1中氨基酸位置23的位置处的亮氨酸(L)；

f)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；

h)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；

j)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；

m)在对应于SEQ ID NO：1中氨基酸位置62的位置处的缬氨酸(V)；

n)在对应于SEQ ID NO：1中氨基酸位置71的位置处的赖氨酸(K)；

o)在对应于SEQ ID NO：1中氨基酸位置72的位置处的苏氨酸(T)；

p)在对应于SEQ ID NO：1中氨基酸位置73的位置处的丙氨酸(A)；

q)在对应于SEQ ID NO：1中氨基酸位置80的位置处的精氨酸(R)；

r)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；

s)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；

w)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；

x)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；

y)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；

z)在对应于SEQ ID NO：1中氨基酸位置114的位置处的脯氨酸(P)；

aa)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；

bb)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；

cc)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；

dd)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；

ee)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；

ff)在对应于SEQ ID NO：1中氨基酸位置128的位置处的半胱氨酸(C)：

gg)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；

hh)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；

ii)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；

jj)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；

11)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；

mm)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；

nn)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；

oo)在对应于SEQ ID NO：1中氨基酸位置162的位置处的酪氨酸(Y)；

pp)在对应于SEQ ID NO：1中氨基酸位置163的位置处的精氨酸(R)；

qq)在对应于SEQ ID NO：1中氨基酸位置164的位置处的组氨酸(H)；

rr)在对应于SEQ ID NO：1中氨基酸位置165的位置处的亮氨酸(L)；

ss)在对应于SEQ ID NO：1中氨基酸位置166的位置处的精氨酸(R)；

tt)在对应于SEQ ID NO：1中氨基酸位置167的位置处的组氨酸(H)；

uu)在对应于SEQ ID NO：1中氨基酸位置168的位置处的脯氨酸(P)；

w)在对应于SEQ ID NO：1中氨基酸位置169的位置处的丙氨酸(A)；

ww)在对应于SEQ ID NO：1中氨基酸位置170的位置处的脯氨酸(P)；

xx)在对应于SEQ ID NO：1中氨基酸位置171的位置处的组氨酸(H)；

yy)在对应于SEQ ID NO：1中氨基酸位置172的位置处的脯氨酸(P)；

zz)在对应于SEQ ID NO：1中氨基酸位置173的位置处的精氨酸(R)；

xxxx)a)至wwww)的任何组合。

4.根据权利要求1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽还包含：

a)在对应于SEQ ID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；

b)在对应于SEQ ID NO：1中氨基酸位置12的位置处的组氨酸(H)；

f)在对应于SEQ ID NO：1中氨基酸位置23的位置处的亮氨酸(L)；

j)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；

m)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；

p)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；

q)在对应于SEQ ID NO：1中氨基酸位置57的位置处的谷氨酸(E)；

t)在对应于SEQ ID NO：1中氨基酸位置62的位置处的缬氨酸(V)；

u)在对应于SEQ ID NO：1中氨基酸位置71的位置处的赖氨酸(K)；

v)在对应于SEQ ID NO：1中氨基酸位置72的位置处的苏氨酸(T)；

w)在对应于SEQ ID NO：1中氨基酸位置73的位置处的丙氨酸(A)；

x)在对应于SEQ ID NO：1中氨基酸位置79的位置处的甘氨酸(G)；

y)在对应于SEQ ID NO：1中氨基酸位置80的位置处的精氨酸(R)；

z)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；

aa)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；

cc)在对应于SEQ ID NO：1中氨基酸位置87的位置处的亮氨酸(L)；

ff)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；

gg)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；

hh)在对应于SEQ ID NO：1中氨基酸位置105的位置处的丙氨酸(A)；

ii)在对应于SEQ ID NO：1中氨基酸位置111的位置处的精氨酸(R)；

jj)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；

kk)在对应于SEQ ID NO：1中氨基酸位置114的位置处的脯氨酸(P)；

ll)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；

mm)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；

nn)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；

oo)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；

pp)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；

rr)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；

ss)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；

tt)在对应于SEQ ID NO：1中氨基酸位置132的位置处的缬氨酸(V)；

uu)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；

vv)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；

xx)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；

yy)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；

zz)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；

www)在对应于SEQ ID NO：1中氨基酸位置185的位置处的苏氨酸(T)或组氨酸(H)：

rrrrr)a)至qqqqq)的任何组合。

5.根据权利要求1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、403、430、431、432和433。

6.根据权利要求1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽能够识别和裂解大范围核酸酶识别序列，所述大范围核酸酶识别序列选自SEQ ID NO：2、SEQ IDNO：85、SEQ ID NO：269、SEQ ID NO：281、SEQ ID NO：331、SEQ IDNO：358、SEQ ID NO：390、SEQ ID NO：423或SEQ ID NO：424。

7.根据权利要求1所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，其中所述多肽在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性。

8.根据权利要求7所述的分离的或重组的多核苷酸，其中所述对照大范围核酸酶选自SEQ ID NO：1、SEQ ID NO：86、SEQ ID NO：250、SEQ IDNO：270、SEQ ID NO：271、SEQ ID NO：282、SEQ ID NO：283、SEQ IDNO：329、SEQ ID NO：356、SEQ ID NO：389、SEQ ID NO：429或SEQ IDNO：435。

9.根据权利要求7所述的分离的或重组的多核苷酸，其中所述提高的大范围核酸酶活性的证据是：

d)(a)、(b)和(c)的任何组合。

10.根据权利要求1所述的分离的或重组的多核苷酸，其还包含编码N-末端核转运肽的核苷酸序列。

11.根据权利要求1所述的分离的或重组的多核苷酸，其还包含编码C-末端组氨酸标签的核苷酸序列。

12.根据权利要求7所述的分离的或重组的多核苷酸，其中所述提高的大范围核酸酶活性是在16℃、24℃、28℃、30℃或37℃下测定的。

13.一种重组DNA构建体，其包含权利要求1所述的分离的或重组的多核苷酸。

14.根据权利要求13所述的重组DNA构建体，其还包含可操作地连接至所述多核苷酸的启动子。

15.根据权利要求14所述的重组DNA构建体，其中所述启动子相对于所述多核苷酸是异源的，或所述启动子相对于所述多核苷酸是同源的。

16.一种细胞，其包含至少一种权利要求1所述的多核苷酸或权利要求13所述的重组DNA构建体，其中所述多核苷酸对于所述细胞是异源的。

17.根据权利要求16所述的细胞，其中所述细胞是酵母细胞。

18.根据权利要求16所述的细胞，其中所述细胞是植物细胞。

19.根据权利要求16所述的细胞，其中所述多核苷酸或所述重组DNA构建体稳定地掺入至所述植物细胞的基因组中。

20.根据权利要求16所述的细胞，其中所述多核苷酸或所述重组DNA构建体稳定地掺入至所述植物细胞的叶绿体基因组中。

21.根据权利要求18所述的细胞，其中所述植物细胞来自单子叶植物。

22.根据权利要求21所述的细胞，其中所述单子叶植物为玉米、小麦、稻、大麦、甘蔗、高粱或黑麦。

23.根据权利要求18所述的细胞，其中所述植物细胞来自双子叶植物。

24.根据权利要求23所述的细胞，其中所述双子叶植物为大豆、芸苔属植物(Brassica)、向日葵、棉花或苜蓿。

25.一种植物，其包含权利要求18所述的植物细胞。

26.一种植物外植体，其包含权利要求18所述的植物细胞。

27.根据权利要求26所述的植物、外植体或植物细胞，其中所述植物、外植体或植物细胞在与不包含至少一种权利要求1所述的多核苷酸的相同物种、品系或品种的植物、外植体或植物细胞进行比较时表现出提高的大范围核酸酶活性。

28.一种转基因种子，其由权利要求25所述的植物产生。

30.根据权利要求29所述的分离的多肽，其中所述多肽与SEQ ID NO：1具有至少80％的序列同一性。

31.根据权利要求29所述的分离的多肽，其中所述至少一个氨基酸修饰包括：

a)在对应于SEQ ID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；

b)在对应于SEQ ID NO：1中氨基酸位置12的位置处的组氨酸(H)；

e)在对应于SEQ ID NO：1中氨基酸位置23的位置处的亮氨酸(L)；

f)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；

h)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；

j)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；

m)在对应于SEQ ID NO：1中氨基酸位置62的位置处的缬氨酸(V)；

n)在对应于SEQ ID NO：1中氨基酸位置71的位置处的赖氨酸(K)；

o)在对应于SEQ ID NO：1中氨基酸位置72的位置处的苏氨酸(T)；

p)在对应于SEQ ID NO：1中氨基酸位置73的位置处的丙氨酸(A)；

q)在对应于SEQ ID NO：1中氨基酸位置80的位置处的精氨酸(R)；

r)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；

s)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；

w)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；

x)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；

y)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；

z)在对应于SEQ ID NO：1中氨基酸位置114的位置处的脯氨酸(P)；

aa)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；

bb)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；

cc)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；

dd)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；

ee)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；

gg)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；

hh)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；

ii)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；

jj)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；

ll)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；

mm)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；

nn)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；

oo)在对应于SEQ ID NO：1中氨基酸位置162的位置处的酪氨酸(Y)；

pp)在对应于SEQ ID NO：1中氨基酸位置163的位置处的精氨酸(R)；

qq)在对应于SEQ ID NO：1中氨基酸位置164的位置处的组氨酸(H)；

rr)在对应于SEQ ID NO：1中氨基酸位置165的位置处的亮氨酸(L)；

ss)在对应于SEQ ID NO：1中氨基酸位置166的位置处的精氨酸(R)；

tt)在对应于SEQ ID NO：1中氨基酸位置167的位置处的组氨酸(H)；

uu)在对应于SEQ ID NO：1中氨基酸位置168的位置处的脯氨酸(P)；

vv)在对应于SEQ ID NO：1中氨基酸位置169的位置处的丙氨酸(A)；

ww)在对应于SEQ ID NO：1中氨基酸位置170的位置处的脯氨酸(P)；

xx)在对应于SEQ ID NO：1中氨基酸位置171的位置处的组氨酸(H)；

yy)在对应于SEQ ID NO：1中氨基酸位置172的位置处的脯氨酸(P)；

zz)在对应于SEQ ID NO：1中氨基酸位置173的位置处的精氨酸(R)；

xxxx)a)至wwww)的任何组合。

32.根据权利要求29所述的分离的多肽，其中所述多肽还包含：

a)在对应于SEQ ID NO：1中氨基酸位置2的位置处的天冬氨酸(D)；

b)在对应于SEQ ID NO：1中氨基酸位置12的位置处的组氨酸(H)；

f)在对应于SEQ ID NO：1中氨基酸位置23的位置处的亮氨酸(L)；

j)在对应于SEQ ID NO：1中氨基酸位置31的位置处的精氨酸(R)；

m)在对应于SEQ ID NO：1中氨基酸位置43的位置处的亮氨酸(L)；

p)在对应于SEQ ID NO：1中氨基酸位置56的位置处的亮氨酸(L)；

q)在对应于SEQ ID NO：1中氨基酸位置57的位置处的谷氨酸(E)；

t)在对应于SEQ ID NO：1中氨基酸位置62的位置处的缬氨酸(V)；

u)在对应于SEQ ID NO：1中氨基酸位置71的位置处的赖氨酸(K)；

v)在对应于SEQ ID NO：1中氨基酸位置72的位置处的苏氨酸(T)；

w)在对应于SEQ ID NO：1中氨基酸位置73的位置处的丙氨酸(A)；

x)在对应于SEQ ID NO：1中氨基酸位置79的位置处的甘氨酸(G)；

y)在对应于SEQ ID NO：1中氨基酸位置80的位置处的精氨酸(R)；

z)在对应于SEQ ID NO：1中氨基酸位置81的位置处的赖氨酸(K)；

aa)在对应于SEQ ID NO：1中氨基酸位置82的位置处的精氨酸(R)；

cc)在对应于SEQ ID NO：1中氨基酸位置87的位置处的亮氨酸(L)；

ff)在对应于SEQ ID NO：1中氨基酸位置98的位置处的精氨酸(R)；

gg)在对应于SEQ ID NO：1中氨基酸位置103的位置处的缬氨酸(V)；

hh)在对应于SEQ ID NO：1中氨基酸位置105的位置处的丙氨酸(A)；

ii)在对应于SEQ ID NO：1中氨基酸位置111的位置处的精氨酸(R)；

jj)在对应于SEQ ID NO：1中氨基酸位置113的位置处的丝氨酸(S)；

kk)在对应于SEQ ID NO：1中氨基酸位置114的位置处的脯氨酸(P)；

ll)在对应于SEQ ID NO：1中氨基酸位置116的位置处的精氨酸(R)；

mm)在对应于SEQ ID NO：1中氨基酸位置117的位置处的甘氨酸(G)；

nn)在对应于SEQ ID NO：1中氨基酸位置118的位置处的苏氨酸(T)；

oo)在对应于SEQ ID NO：1中氨基酸位置121的位置处的甘氨酸(G)；

pp)在对应于SEQ ID NO：1中氨基酸位置124的位置处的精氨酸(R)；

rr)在对应于SEQ ID NO：1中氨基酸位置129的位置处的丙氨酸(A)；

ss)在对应于SEQ ID NO：1中氨基酸位置131的位置处的精氨酸(R)；

tt)在对应于SEQ ID NO：1中氨基酸位置132的位置处的缬氨酸(V)；

uu)在对应于SEQ ID NO：1中氨基酸位置147的位置处的丝氨酸(S)；

vv)在对应于SEQ ID NO：1中氨基酸位置151的位置处的丙氨酸(A)；

xx)在对应于SEQ ID NO：1中氨基酸位置159的位置处的色氨酸(W)；

yy)在对应于SEQ ID NO：1中氨基酸位置160的位置处的谷氨酸(E)；

zz)在对应于SEQ ID NO：1中氨基酸位置161的位置处的缬氨酸(V)；

rrrrr)a)至qqqqq)的任何组合。

33.根据权利要求29所述的分离的多肽，其选自SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402、430、431、432和433。

34.根据权利要求29所述的分离的多肽，其中所述多肽能够识别和裂解大范围核酸酶识别位点，所述大范围核酸酶识别位点选自SEQ IDNO：2、SEQ ID NO：85、SEQ ID NO：269、SEQ ID NO：281、SEQ IDNO：331、SEQ ID NO：358、SEQ ID NO：390、SEQ ID NO：423或SEQID NO：424。

35.根据权利要求29所述的分离的多肽，其中所述多肽在与缺乏所述氨基酸修饰的对照大范围核酸酶进行比较时具有提高的大范围核酸酶活性。

36.根据权利要求29所述的分离的多肽，其中所述对照大范围核酸酶选自SEQ ID NO：1、SEQ ID NO：86、SEQ ID NO：250、SEQ ID NO：270、SEQ ID NO：271、SEQ ID NO：282、SEQ ID NO：283、SEQ IDNO：329、SEQ ID NO：356、SEQ ID NO：389、SEQ ID NO：429或SEQID NO：435。

37.根据权利要求29所述的分离的多肽，其中所述提高的大范围核酸酶活性的证据是：

d)(a)、(b)和(c)的任何组合。

38.一种组合物，其包含权利要求29所述的至少一种或多种多肽。

39.一种制备大范围核酸酶的方法，所述大范围核酸酶在一定温度范围内具有提高的活性，所述方法包括：

b)选择来自步骤a)的所述大范围核酸酶变体，并且筛选能够在16℃至37℃之间且包括16℃和37℃的温度范围内裂解DNA目标序列的所述大范围核酸酶变体。

40.根据权利要求39所述的方法，其中所述温度范围包括：

a)16℃；

b)18℃；

c)20℃；

d)24℃；

e)28℃；

f)30℃；

g)37℃；或

h)a)、b)、c)、d)、e)、f)、h)、g)和g)的任何组合。

42.根据权利要求41所述的方法，其中所述提高的大范围核酸酶活性的证据是：

d)(a)、(b)和(c)的任何组合。

43.根据权利要求1所述的分离的或重组的多核苷酸，其中所述大范围核酸酶多肽包含接头多肽，其中所述接头多肽包括：

a)SEQ ID NO：420；

b)SEQ ID NO：421；

c)SEQ ID NO：422；或

44.一种组合物，其包含权利要求1所述的至少一种或多种多核苷酸。

46.根据权利要求45所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：1具有至少80％的序列同一性的大范围核酸酶多肽。

47.根据权利要求45所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图5A-5C中所示氨基酸修饰中的任何一个。

48.根据权利要求45所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37和38。

50.根据权利要求49所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：86具有至少80％的序列同一性的大范围核酸酶多肽。

51.根据权利要求49所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图9A-9D中所示氨基酸修饰中的任何一个。

52.根据权利要求49所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252和253。

54.根据权利要求53所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：272、273、274和275。

55.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：282的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：282的位置选自位置12、16、22、31、50、56、59、62、81、98、103、105、116、118、121、153、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、182、183、184、185、186、187、188、189、190、191、192、258、281、308、312、316、319、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ ID NO：281的大范围核酸酶目标位点。

56.根据权利要求55所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：282具有至少80％的序列同一性的大范围核酸酶多肽。

57.根据权利要求55所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图10A-10C中所示氨基酸修饰中的任何一个。

58.根据权利要求55所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：284、285、286、287、288、289、290、291、292、293、294、295、296、297和298。

60.根据权利要求59所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：329具有至少80％的序列同一性的大范围核酸酶多肽。

61.根据权利要求59所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图11中所示氨基酸修饰中的任何一个。

62.根据权利要求59所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：330、331、332、333、334、335、336、337、338、339、340和341。

64.根据权利要求63所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：356具有至少80％的序列同一性的大范围核酸酶多肽。

65.根据权利要求63所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图12中所示氨基酸修饰中的任何一个。

66.根据权利要求63所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：357、358、359、360、361、362、363、364、365、366、367、368、369、370和371。

67.一种编码大范围核酸酶多肽的分离的或重组的多核苷酸，所述多肽包含在对应于SEQ ID NO：389的位置的氨基酸位置处具有至少一个氨基酸修饰的氨基酸序列，所述SEQ ID NO：389的位置选自位置12、50、56、124、129、131、153、211、237、311、316、和位置318、以及它们的组合，并且其中所述多肽能够识别和裂解包含SEQ IDNO：388的大范围核酸酶目标位点。

68.根据权利要求67所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码与SEQ ID NO：389具有至少80％的序列同一性的大范围核酸酶多肽。

69.根据权利要求67所述的分离的或重组的多核苷酸，其中所述至少一个氨基酸修饰包括在图13中所示氨基酸修饰中的任何一个。

70.根据权利要求67所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：390、391、392、393、394、395、396、397、398、399、400、401、402和403。

72.一种酵母、植物、植物细胞、外植体或种子，其包含通过权利要求36-42所述的方法创建的大范围核酸酶。

a)使至少一种在其基因组中包含大范围核酸酶识别位点的植物或酵母细胞与大范围核酸酶多肽变体接触，所述大范围核酸酶多肽变体选自SEQ ID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402和403，其中所述大范围核酸酶变体能够在所述识别位点诱导双链断裂；以及

(i)大范围核酸酶多肽变体，所述大范围核酸酶多肽变体选自SEQID NO：14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、251、252、253、272、273、274、275、272、273、274、275、284、285、286、287、288、289、290、291、292、293、294、295、296、297、298、330、331、332、333、334、335、336、337、338、339、340、341、357、358、359、360、361、362、363、364、365、366、367、368、369、370、371、390、391、392、393、394、395、396、397、398、399、400、401、402和403，

(ii)包含目的多核苷酸的DNA片段；

b)选择至少一种植物或酵母细胞，所述植物或酵母细胞包含在所述识别位点整合的目的多核苷酸盒。

76.根据权利要求75所述的分离的或重组的多核苷酸，其中所述核苷酸序列编码大范围核酸酶多肽，所述大范围核酸酶多肽选自SEQ IDNO：430、431和432。

77.一种编码SEQ ID NO：436的大范围核酸酶多肽的分离的或重组的多核苷酸，其中所述多肽能够识别和裂解包含SEQ ID NO：424的大范围核酸酶目标位点。