用于基因打靶和性状堆叠的工程化转基因整合平台(ETIP)
对相关申请的交叉引用
本申请要求2012年9月7日提交的美国临时专利申请No.61/697,882的优先权。
发明领域
本公开文本涉及植物中的植物精确转化、基因打靶、靶向基因组整合和蛋白质表达的领域。在一个优选实施方案中,本公开文本描述了一种能在植物基因组中随机地或在靶定位置处插入的工程化转基因整合平台(ETIP)。
发明背景
为了应对食品生产日益增长的全球需求的挑战,提高农业生产力(例如提高的产量或工程化害虫抗性)的典型办法依赖于突变育种或通过转化将新基因引入作物物种的基因组。这些方法内在地是非特异性的且相对低效。例如,常规植物转化方法投递外源DNA,它在随机位置处整合入基因组。如此,为了鉴定及分离具有期望属性的转基因植物系,有必要为每种构建物生成数以百计的独特随机整合事件,并随后筛选期望个体。结果,常规植物性状工程是一项费力、费时、且不可预测的任务。而且,这些整合的随机性质使得难以预测是否由于非故意的基因组破坏而发生多效效应。
当前转化方法的随机性质要求生成数以百计的事件来鉴定及选择转基因事件候选(转化和事件筛选相对于自功能基因组研究鉴定的基因候选是限速的)。另外,根据基因组内整合的位置,基因表达盒可以因基因组位置效应而以不同水平表达。这种基因组位置效应使得比较使用常规转化方法经随机插入进入基因组的不同调节元件和转基因设计的影响高度可变。结果,具有工程化基因或性状的植物系的生成、分离及表征成为极其费力且费钱的方法,且成功概率低。
精确基因修饰克服了植物系统中的常规实践的后勤挑战,而且成为基础植物研究人员和农业生物工艺学家的一项长期目标。然而,除水稻中经正-负药物选择的“基因打靶”或使用工程化前限制性位点外,所有植物物种(模型和作物二者)中的靶向基因组修饰直到最近仍然证明是难以捉摸的。Terada et al.(2002)Nat Biotechnol 20(10):1030;Teradaet al.(2007)Plant Physiol 144(2):846;D'Halluin et al.(2008)PlantBiotechnology J.6(1):93。
最近,用于靶向切割基因组DNA的方法和组合物已有描述。此类靶向切割事件可用于例如诱导细胞DNA序列的靶向诱变或靶向删除,或推动预定染色体基因座处的靶向重组。参见例如美国专利公开文本2003/0232410,2005/0208489,2005/0026157,2005/0064474和2006/0188987,和国际公开文本WO2007/014275。
美国专利公开文本No.2008/0182332公开了非规范锌指核酸酶(ZFN)用于靶向修饰植物基因组的用途。美国专利申请No.12/284,888描述了ZFN介导的、进入植物EPSPS基因座的靶向整合。然而,找到用于鉴定、选择及快速推进稳定地、靶向地进入植物基因组内精确位置的整合的组合物和方法的需要仍然存在。
发明概述
本公开文本的一个实施方案涉及一种用于生成转基因植物细胞的方法。在又一个实施方案中,提供了一种植物细胞,其具有包含可靶定核酸分子的基因组DNA。又一些实施方案包括可靶定核酸分子,其包含:至少一个位点特异性核酸酶识别位点;第一标志物基因的第一片段;和,第二标志物基因的第二片段。在另一个实施方案中,用供体核酸分子和位点特异性核酸酶核酸分子转化植物细胞。在一个后续实施方案中,在至少一个位点特异性核酸酶识别位点内切割植物细胞的基因组DNA。一个另外的实施方案包括将供体核酸分子整合入可靶定核酸分子(其中可靶定核酸分子内的整合包含至少一种功能性标志物基因)以生成转基因植物细胞,该转基因植物细胞包含可靶定核酸分子和整合的、包含至少一种功能性标志物基因的供体核酸分子。
在还有另一个实施方案中,本公开文本涉及选自下组的油菜(Brassica napus)染色体靶位点:SEQ ID NO:431核苷酸1-579至SEQ ID NO:432核苷酸166-732,SEQ ID NO:433核苷酸1-550至SEQ ID NO:434核苷酸190-653,SEQ ID NO:435核苷酸1-298至SEQ ID NO:436核苷酸51-644,SEQ ID NO:437核苷酸1-536至SEQ ID NO:438核苷酸146-545,SEQ IDNO:439核苷酸1-431至SEQ ID NO:440核苷酸167-685,SEQ ID NO:441核苷酸1-599至SEQID NO:442核苷酸116-521,SEQ ID NO:443核苷酸1-298至SEQ ID NO:444核苷酸193-775,和SEQ ID NO:445核苷酸1-651至SEQ ID NO:446核苷酸120-578。
在一个后续实施方案中,本公开文本涉及一种用于生成转基因植物细胞的方法。又一些实施方案包括可靶定核酸分子,其包含:至少一个位点特异性核酸酶识别位点;第一标志物基因的第一片段;和,第二非编码多核苷酸序列的第二片段。在另一个实施方案中,用供体核酸分子和位点特异性核酸酶核酸分子转化植物细胞。在一个后续实施方案中,在至少一个位点特异性核酸酶识别位点内切割植物细胞的基因组DNA。一个另外的实施方案包括将供体核酸分子整合入可靶定核酸分子(其中可靶定核酸分子内的整合包含至少一种功能性标志物基因)以生成转基因植物细胞,该转基因植物细胞包含可靶定核酸分子和整合的、包含至少一种功能性标志物基因的供体核酸分子。
根据下述数个实施方案的详细描述,上述和其它特征会变得更加明显,这参照附图进行。
附图简述
图1A-1E:显示FAD2基因序列的序列比对,这是使用生成的。
图2:显示FAD2基因序列的系统发生树,这是使用JalviewTMv2.3基于邻居连接距离生成的。
图3A-3M’:显示FAD3基因序列的序列比对,这是使用生成的。
图4:显示FAD3基因序列的系统发生树,这是使用JalviewTMv2.3基于邻居连接距离生成的。标记的序列对应下述各项:FAD3A’/A”贯穿本申请描述为FAD3A’;单元型2贯穿本申请描述为FAD3C’;单元型1贯穿本申请描述为FAD3C”;和,单元型3贯穿本申请描述为FAD3A”。
图5:显示pDAB104010的质粒图并呈现一种代表性锌指核酸酶(ZFN)表达盒。这种构建物的布局对其它ZFN表达盒是相似的,其中锌指域(24828和24829)与下文描述的备选锌指域交换。
图6:是一幅例示性多线图,显示每10,000个序列读出中在靶ZFN位点处具有删除的序列读出的数目。图上的X轴表示删除的碱基的数目,Y轴表示序列读出的数目,而Z轴表示颜色编码的样品身份,如图右边描述的。显示的具体例子是含有3个靶ZFN位点(A、B和C)的FAD2基因家族基因座1的,评估四个基因家族成员和两个对照转染(作为对照样品A和B)。从顶部到底部(图例顶部的A-对照_FADA’至图例底部的C_样品_FAD2C)列出的线在图上从距标记的X轴最近的(A_对照_FADA’)到距标记的X轴最远的(C_样品_FAD2C)显示。
图7:(A)该图展示来自靶向FAD2基因家族基因座4的ZFN的数据。该基因座含有两个ZFN位点和两个必需的对照转染。图7:(B)ZFN靶位点周围的具体序列背景(SEQ ID NO:471-480),鉴定含有C、T和G的三核苷酸重复的FAD2A和C,导致经由FAD2A和C基因座测序观察到的单碱基删除增多。
图8:显示pDAS000130的质粒图。
图9:显示pDAS000271的质粒图。
图10:显示pDAS000272的质粒图。
图11:显示pDAS000273的质粒图。
图12:显示pDAS000274的质粒图。
图13:显示pDAS000275的质粒图。
图14:显示pDAS000031的质粒图。
图15:显示pDAS000036的质粒图。
图16:显示pDAS000037的质粒图。
图17:图示一种ETIP和有效载荷核酸构造,以及植物细胞基因组中ETIP位点处的靶定有效载荷的产物。
图18:图示原生质体细胞的转化,接着是使用3'和5'端二者处的截短型可评分和可选择标志物的重建,宿主系中ETIP处的靶定有效载荷DNA的FACS选择。
图19A-B:图示ETIP芸苔事件的同源性定向修复,其源自锌指核酸酶(pDAS000074或pDAS000075)对基因组基因座的双链DNA切割及后续的Ds-red供体(pDAS000068、pDAS000070、或pDAS000072)进入芸苔染色体ETIP基因座的整合。供体整合入基因组基因座产生完全功能性、高表达Ds-red转基因。
图20:显示芸苔原生质体的FACS分选和用pDAS000031(‘pDAS31’)转染的芸苔原生质体的计算转染效率。另外,提供未转化芸苔原生质体的FACS分选结果作为阴性对照。
图21:显示芸苔原生质体的FACS分选和用pDAS000064/pDAS000074(顶部图)和pDAS000064/pDAS000075(底部图)转染的芸苔ETIP原生质体事件的计算转染效率。
图22:显示芸苔原生质体的FACS分选和用pDAS000068/pDAS000074(顶部图)和pDAS000068/pDAS000075(底部图)转化的芸苔ETIP原生质体事件的计算转染效率。
图23:显示芸苔原生质体的FACS分选和用pDAS000070/pDAS000074(顶部图)和pDAS000070/pDAS000075(底部图)转化的芸苔ETIP原生质体事件的计算转染效率。
图24:显示芸苔原生质体的FACS分选和用pDAS000072/pDAS000074(顶部图)和pDAS000072/pDAS000075(底部图)转化的芸苔ETIP原生质体事件的计算转染效率。
图25:显示pDAS000074的质粒图。
图26:显示pDAS000075的质粒图。
图27:显示pDAS000064的质粒图。
图28:显示pDAS000068的质粒图。
图29:显示pDAS000070的质粒图。
图30:显示pDAS000072的质粒图。
图31:是一幅示意图,显示用于转基因拷贝数评估测定法的转基因靶引物和探针的结合位点。
图32:显示一份Sequencher文件,显示FAD2A ZFN DNA识别域(bc12075_Fad2a-r272a2和bc12075_Fad2a-278a2),和ZFN特异性引物(FAD2A.UnE.F1和FAD2A.UnE.R1)和内源引物(FAD2A/2C.RB.UnE.F1和FAD2A/2C.RB.UnE.R1)的结合位点。
图33:显示一幅示意图,显示FAD2A处经完美HDR的转基因整合的检测中使用的内源和转基因靶引物的结合位点。
图34:是一幅示意图,显示完美编辑的FAD2A基因座中会存在Kpn1限制性内切核酸位点的地方,及FAD2a 5’、hph和FAD2A 3’Southern探针结合的地方。
图35:显示来自拷贝数评估qPCR的代表性数据输出。左手柱代表自具有单一随机转基因插入物的已知T0转基因植物获得的数据,并用作校准样品,所有其它样品针对它“标准化”。右手柱是具有5处转基因整合的已知T0转基因植物。两种植物的插入物拷贝数是使用Southern分析测定的。其余柱提供推定转基因植物的拷贝数估值。各柱从左到右标记为:1拷贝对照,310420,311819,311821,311822,311823,311824,311827,312524,312525,312526,312527,312529,312530,312532,313810,313811,313905,313941,313942,313944,和5拷贝对照。各柱可用于确定每种转基因植物的评估拷贝数。在使用软件评估拷贝数时,野生型植物、非转化对照植物、和仅质粒对照不产生拷贝数,因为它们不拥有hph和HMG I/Y靶二者的Cq。
图36:显示pDAB105855的质粒图,其在T-DNA边界之间含有靶DNA序列,包含:RB7MAR序列/eZFN4结合位点v1,OsUbi3启动子/Phi YFP/ZmPer5 3’UTR v2/eZFN1结合位点/ELP1 HR2 v2,ZmUbi1启动子v8/Cry34Ab1 v2/StPinII 3’UTR v2,TaPer启动子v3/Cry35Ab1 v5/StPinII 3’UTR v2,SCBVv2/AAD-1v3/ZmLip 3’UTR v1。
图37:显示pDAB105941的质粒图,其包含在具有内含子1(ZmUbi1启动子v2)和ZmPer5 3’UTR v2的玉蜀黍遍在蛋白1启动子的表达下的ZFN1编码序列。
图38:显示pDAB112366的质粒图,其含有稻遍在蛋白3(OsUbi3)启动子的无启动子内含子(rubi3内含子),接着是除草剂耐性基因(草胺膦乙酰基转移酶(PAT);和ZmLip 3’UTR。
图39:提供使用在基因组内整合的ETIP位点进行包含基因表达盒的供体多核苷酸的打靶的示意图。如示意图中显示的,若在ETIP基因座内发生整合,则供体能够表达转基因。供体的随机整合不导致转基因表达,因为那里通常没有能驱动表达的启动子元件。
发明详述
本文中描述了用于生成工程化转基因整合平台(ETIP)的方法和组合物,该ETIP包含稳定整合入植物细胞的基因组并充当供体核酸分子转化和整合的宿主种质的可靶定核酸分子。本公开文本涉及植物中的植物精确转化、基因打靶、靶向基因组整合和蛋白质表达的领域。在一个优选实施方案中,可以在植物基因组中随机地或在靶定位置处插入ETIP,从而推动快速选择和检测靶定(3'和5'端二者)在ETIP基因组位置处的一种或多种目的基因(GOI)。在一些实施方案中,可以在ETIP内引入特定双链断裂。在其它实施方案中,描述了一种方法,其用于使用流式细胞术和FACS选择及富集靶定的、分离的细胞或原生质体,接着再生可繁殖植物。
特定方法包括生成在植物及其后代中具有稳定的、可遗传的遗传修饰的转基因植物细胞,以及转基因植物的组合物。在某些实施方案中,描述了用于精确植物转化系统的ETIP,其中包含整合核酸的ETIP稳定整合入宿主种质。其它实施方案涉及用于生成转基因植物细胞的方法,使得植物细胞基因组DNA包括至少一种稳定整合的功能性标志物基因。在一些实施方案中,该方法包括使用可靶定核酸分子,其含有一种或多种靶向位点特异性核酸酶识别位点、第一标志物基因的第一片段、和第二标志物基因的第二片段。在另一个实施方案中,供体核酸分子包含目的核苷酸序列和目的核酸序列侧翼的两种核酸序列。在另一个实施方案中,目的核酸序列侧翼的两种核酸序列为第一和第二同源臂核酸序列。在其它实施方案中,使用供体核酸分子转化植物细胞。同源臂核酸序列可以与可靶定核酸分子序列或ETIP的区域同源,而且可以与可靶定核酸分子的第一和第二标志物基因的第一和第二片段同源。
还描述了转基因植物的组合物和用于生成转基因植物的方法,其中供体核酸分子表达稳定整合入植物细胞中ETIP或可靶定核酸分子的外源核酸序列的一种或多种产物(例如蛋白质或RNA分子)。在一些实施方案中,ETIP或可靶定核酸分子使用锌指核酸酶结合位点或位点特异性核酸酶,包括表达锌指核酸酶活性的蛋白。在备选实施方案中,位点特异性核酸酶由其它另外的靶向技术构成,诸如大范围核酸酶、TAL、RNA指导的CRISPR-Cas9、或亮氨酸拉链。在特定实施方案中,ETIP为推动转基因植物开发过程的早期开发阶段的基因候选和植物表达载体设计测试的可靶定核酸分子。在一些实施方案中,转基因植物细胞包括整合核酸分子,其多核苷酸序列具有一种或多种靶向位点特异性核酸酶识别位点和第一和第二标志物基因的第一和第二片段。理解的是,标志物基因片段可以不编码功能性标志物基因表达产物。而且,作为一个实施方案,标志物基因可包含内含子核酸序列。在其它实施方案中,标志物基因可包含同源臂核酸序列。
在一些实施方案中,供体核酸分子的一个或两个或更多个区域与植物基因组DNA缺乏序列同源性(外源的)。在另外的实施方案中,供体核酸分子可包含同源臂核酸序列。供体核酸分子的同源臂核酸序列可整合入可靶定核酸分子的位点特异性核酸酶限制性位点侧翼的区域。在某些实施方案中,同源臂序列可以长50bp至3kb。
在特定实施方案中,供体核酸分子可包含能够靶向ETIP可靶定核酸分子并在5'和3'端处选择精确靶向事件的外源核酸序列。外源核酸序列的产物可包括例如一种或多种基因或cDNA分子,或任何类型的编码或非编码核苷酸序列,以及一种或多种调节基因元件(例如启动子)。供体核酸分子的设计能够在供体DNA选定整合入ETIP之后切除编码和非编码DNA,包括但不限于可选择标志物。
在特定实施方案中,ETIP可靶定核酸分子可包含第一标志物基因的第一片段和第二标志物基因的第二片段,而且供体核酸分子包含对应的第一标志物基因的第二片段和第二标志物基因的第一片段。第一标志物基因的第一片段可位于可靶定核酸分子的5'端,而第二标志物基因的第二片段位于可靶定核酸分子的3'端,使得包含第一标志物基因第二片段和第二标志物基因第一片段的供体核酸分子稳定整合入植物细胞基因组生成功能性第一标志物基因和第二标志物基因。在一些实施方案中,这些标志物基因可用于选择ETIP的稳定整合。在一些实施方案中,合适的标志物基因可包括PMI、Xyl(A)、YFP、DSR、GFP、GUS、NPTII、AAD-1、AAD-12、DGT-28、AHAS、PAT、DSM-2、HYG、BAR、和荧光蛋白。在其它实施方案中,标志物基因为视觉可筛选标志物基因,其存在可通过对细胞监测颜色变化来测定。在其它实施方案中,标志物基因为可选择标志物基因(例如编码除草剂或抗生素抗性基因),其存在使用降低细胞生长的除草剂或抗生素来选择。在又一些实施方案中,标志物基因为正可选择标志物基因。
可以将还描述为报告基因的各种可选择标志物引入选定的表达载体以容许鉴定及选择经过转化的植物(“转化体”)。有多种方法可用于确认经过转化的植物中可选择标志物的表达,包括例如DNA测序和PCR(聚合酶链式反应)、Southern印迹、RNA印迹、用于检测自载体表达的蛋白质(例如介导草胺膦抗性的沉淀的蛋白质)的免疫学方法、或其它蛋白质的视觉观察,诸如编码β-葡糖醛酸糖苷酶(GUS)、萤光素酶、绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、DsRed、β-半乳糖苷酶、氯霉素乙酰基转移酶(CAT)、碱性磷酸酶、等等的报告基因(参见Sambrook,et al.,Molecular Cloning:A Laboratory Manual,Third Edition,ColdSpring Harbor Press,N.Y.,2001)。
利用可选择标志物基因来选择经过转化的细胞或组织。可选择标志物基因包括编码抗生素抗性的基因,诸如那些编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的,以及赋予针对除草剂化合物的抗性的基因。除草剂抗性基因一般编码对除草剂不敏感的经过修饰的靶蛋白或在除草剂能起作用之前降解或解毒植物中的除草剂的酶。例如,已经通过使用编码突变型靶酶,5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)的基因获得了针对草甘膦的抗性。EPSPS的基因和突变体是公知的,而且下文有进一步描述。已经通过使用编码解毒相应除草剂的pat或DSM-2、腈水解酶、aad-1、或aad-12基因的细菌基因获得了针对草铵膦、溴苯腈、和2,4-二氯苯氧基乙酸(2,4-D)的抗性。
在一个实施方案中,除草剂能抑制生长点或分生组织,包括咪唑啉酮或磺酰脲,而且针对这些除草剂的乙酰羟酸合酶(AHAS)和乙酰乳酸合酶(ALS)的抗性/耐性基因是公知的。草甘膦抗性基因包括突变型5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)和dgt-28基因(经引入重组核酸和/或天然EPSPS基因的各种形式的体内诱变),分别为aroA基因和草甘膦乙酰基转移酶(GAT)基因)。其它膦酰基化合物的抗性基因包括来自链霉菌属(Streptomyces)物种的bar基因,包括吸水链霉菌(Streptomyces hygroscopicus)和绿色产色链霉菌(Streptomyces viridichromogenes),和吡啶氧基或苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)。赋予针对环己烷二酮和/或芳基氧苯氧基丙酸(包括氟吡甲禾灵(Haloxyfop)、禾草灵(Diclofop)、精口恶唑禾草灵(Fenoxyprop)、精吡氟禾草灵(Fluazifop)、喹禾灵(Quizalofop))的抗性的例示性基因包括乙酰辅酶A羧化酶(ACC酶)的基因--Acc1-S1、Acc1-S2和Acc1-S3。在一个实施方案中,除草剂能抑制光合作用,包括三嗪(psbA和1s+基因)或苄腈(腈水解酶基因)。
在一个实施方案中,可选择标志物基因包括但不限于编码下述各项的基因:新霉素磷酸转移酶II;氨腈水合酶;天冬氨酸激酶;二氢吡啶二羧酸合酶;色氨酸脱羧酶;二氢吡啶二羧酸合酶和脱敏型天冬氨酸激酶;bar基因;色氨酸脱羧酶;新霉素磷酸转移酶(NEO);潮霉素磷酸转移酶(HPT或HYG);二氢叶酸还原酶(DHFR);草胺膦乙酰基转移酶;2,2-二氯丙酸脱卤素酶;乙酰羟酸合酶;5-烯醇丙酮-莽草酸-磷酸合酶(aroA);卤代芳基腈水解酶;乙酰辅酶A羧化酶;二氢蝶酸合酶(sul I);和32kD光系统II多肽(psbA)。
一个实施方案还包括编码针对下述各项的抗性的基因:氯霉素;甲氨蝶呤;潮霉素;大观霉素;溴苯腈;草甘膦;和草胺膦。
上文可选择标志物基因列表并非意图限制。本发明涵盖任何报告或可选择标志物基因。
在一个实施方案中,ETIP可靶定多核苷酸分子整合入基因组基因座。在一个例子中,可选择FAD2、FAD3、和IPK1基因组基因座作为ETIP整合和后续供体多核苷酸供体分子整合的靶。破坏FAD2和FAD3内源基因已经显示出对植物细胞的农艺或质量特性没有不利影响。因而,在破坏FAD2和FAD3位点后没有观察到与植物或植物产品性能(芸苔、大豆、玉米、等)有关的农艺或质量惩罚,而且与特定油质量特征有关的性状的集束加速渐渗和新种质开发。在特定实施方案中,可将供体核苷酸序列分子连接至调节元件,诸如启动子、内含子、5’UTR或3’UTR。
供体核酸分子整合入ETIP可通过位点特异性核酸酶的靶向双链切割来推动。位点特异性核酸酶可定位于ETIP可靶定核酸分子内。而且,位点特异性核酸酶可定位于包含工程化着陆垫(ELP)的ETIP可靶定核酸分子内,参见美国专利No.20110191899。而且,位点特异性核酸酶可定位于选定ETIP内的ELP内或附近。经由使用设计成结合选定ETIP内的工程化序列的融合蛋白可将切割靶向ETIP,该融合蛋白包含DNA结合域,诸如大范围核酸酶DNA结合域、RNA指导的CRISPR-Cas9 DNA结合域、亮氨酸拉链DNA结合域、TALDNA结合域、锌指蛋白(ZFP)、锌指核酸酶、或上述的嵌合组合。此类切割刺激有效载荷或供体核酸外源多核苷酸序列在ETIP中的切割位点处或附近整合。使用所公开的方法的供体核酸分子整合能经由同源性依赖性和同源性不依赖性机制二者来进行,经由筛选新的可选择和或可评分标志物(它们在靶向事件中在ETIP的3'和5'区二者处是功能性的)来实现靶向事件的选择。本公开文本演示新颖工程化锌指结合位点和ZFN在ETIP处实现选定双链断裂的用途。
在备选实施方案中,新颖工程化DNA结合域(例如ZFP、大范围核酸酶、亮氨酸拉链、TAL、RNA指导的CRISPR-Cas9)结合ETIP中的一个或多个靶位点,该靶位点在天然植物细胞基因组内不存在。DNA结合域可包括例如任何包含识别螺旋的工程化锌指DNA结合域,诸如美国申请No.12/931,096中描述的那些。在一些实施方案中,本文中描述的任何DNA结合域可进一步包含功能域,例如切割域或切割半域。在其它实施方案中,切割半域可来自IIS型限制性内切核酸酶,诸如Fokl或Stsl。切割域的又一些实施方案可包括归巢内切核酸酶,诸如例如具有经过修饰的DNA结合域的归巢内切核酸酶。
本公开文本的实施方案包括锌指DNA结合蛋白的用途。锌指DNA结合蛋白,“ZFP”(或结合域)为以序列特异性方式经由一个或多个锌指(即结合域内其结构经由锌离子的配位得到稳定化的氨基酸序列区域)结合DNA的蛋白,或较大蛋白内的域。术语锌指DNA结合蛋白常常缩写为锌指蛋白或ZFP。可以“工程化”锌指结合域以结合预定核苷酸序列。用于工程化锌指蛋白的方法的非限制性例子为设计及选择。设计的锌指蛋白为自然界中不存在的蛋白,其设计/组成主要源自理性标准。设计的理性标准包括应用用于加工已有ZFP设计和结合数据的数据库存储信息中的信息的计算机化算法和取代规则。参见例如美国专利6,140,081;6,453,242;6,534,261;和6,785,613;还可参见WO 98153058;WO 98153059;WO98153060;WO 021016536和WO 031016496;和美国专利6,746,838;6,866,997;和7,030,215。
在本公开文本的特定实施方案中,可采用锌指核酸酶(ZFN)。ZFN可以是能依照本公开文本投递至植物细胞的任何锌指核酸酶。例如,ZFN可包括包含切割域(或切割半域)和锌指结合域的融合蛋白、编码这些蛋白的多核苷酸及多肽和多肽编码多核苷酸的组合。锌指结合域可包含一个或多个锌指(例如2、3、4、5、6、7、8、9或更多个锌指),而且可以工程化成结合任何目的区域。如此,通过鉴定想要切割或重组的目的靶区域在处,可以依照本文中公开的方法构建一种或多种融合蛋白,其包含切割域(或切割半域)和工程化成识别所述目的区域中的靶序列的锌指域。细胞中存在一种或多种此类融合蛋白会导致融合蛋白结合它或它们的结合位点并在所述目的区域内或附近切割。此外,如果此类细胞中还存在与目的区域同源的外源多核苷酸,那么在双链断裂核苷酸序列和外源多核苷酸之间以高比率发生同源重组。为了本公开文本的目的,“同源重组”指例如细胞中经同源性定向修复机制的双链断裂修复期间发生的此类交换的专门形式。这种过程要求核苷酸序列同源性,使用“供体”分子作为“靶”分子(即经历双链断裂的分子)修复的模板,而且各式各样地称作“非交叉基因转换”或“短束基因转换”,因为它引起遗传信息自供体转移至靶。不希望受任何特定理论束缚,此类转移可涉及断裂的靶和供体之间形成的异源双链体DNA的错配校正,和/或“合成依赖性链退火”,其中使用供体来再合成会变成靶一部分的遗传信息,和/或相关过程。此类专门同源重组常常导致靶分子的序列改变,使得供体多核苷酸的部分或整个序列并入靶多核苷酸。
在本公开文本的方法中,本文中描述的一种或多种靶向位点特异性核酸酶在靶序列(例如细胞染色质)中在预定位点处创建双链断裂,而且可以将与断裂区域中的核苷酸序列具有同源性的“供体”多核苷酸引入细胞。双链断裂的存在已经显示出推动供体序列整合。供体序列可以物理整合,或者,供体多核苷酸作为模板用于经同源重组修复断裂,导致供体中的整个或部分核苷酸序列引入细胞染色质。如此,细胞染色质中的第一序列可以改变,而且,在某些实施方案中,可以转变成供体多核苷酸中存在的序列。如此,术语“替换”的使用可理解为表示一种核苷酸序列用另一种核苷酸序列替换,(即信息意义上的序列替换),而且并非必然要求一种多核苷酸用另一种多核苷酸物理或化学替换。
在一些实施方案中,位点特异性整合可通过利用能够识别及结合特定核苷酸序列(例如宿主生物体的基因组中的)的因子来实现。例如,许多蛋白包含能够以位点特异性方式识别及结合DNA的多肽域。受DNA结合多肽识别的DNA序列可称作“靶”序列。能够以位点特异性方式识别及结合DNA的多肽域一般正确折叠且独立发挥以位点特异性方式结合DNA的功能,甚至在不同于最初分离该域的蛋白的多肽中表达时。类似地,DNA结合多肽识别及结合的靶序列一般能够受此类多肽识别及结合,甚至在存在于较大DNA结构(例如染色体)中时,特别是在靶序列所处位点为已知是可溶性细胞蛋白可及的位点(例如基因)时。
虽然自自然界中存在的蛋白鉴定的DNA结合多肽通常结合离散核苷酸序列或基序(例如共有识别序列),但是本领域存在且知道用于修饰许多此类DNA结合多肽以识别不同核苷酸序列或基序的方法。DNA结合多肽包括例如且不限于:锌指DNA结合域;亮氨酸拉链;UPA DNA结合域;GAL4;TAL;LexA;RNA指导的CRISPR-Cas9;Tet阻抑物;LacR;和类固醇激素受体。
在一些例子中,DNA结合多肽为锌指。各个锌指基序可设计成靶向及特异性结合较大范围的DNA位点任一。规范Cys2His2(以及非规范Cys3His)锌指多肽通过将α-螺旋插入靶DNA双螺旋的大沟来结合DNA。锌指对DNA的识别是模块化的;每个指主要接触靶中的三个连续碱基对,而且多肽中的少数关键残基介导识别。通过在靶向内切核酸酶中包括多个锌指DNA结合域,靶向内切核酸酶的DNA结合特异性可得到进一步提高(而且因此由此赋予的任何基因调节效果的特异性也可得到提高)。参见例如Urnov et al.(2005)Nature435:646-51。如此,可工程化改造及利用一种或多种锌指DNA结合多肽,使得导入宿主细胞的靶向内切核酸酶与宿主细胞基因组内独特的DNA序列相互作用。
优选地,锌指蛋白是非天然存在的,因为它工程化改造成结合选定的靶位点。参见例如Beerli et al.(2002)Nature Biotechnol.20:135-141;Pabo et al.(2001)Ann.Rev.Biochem.70:313-340;Isalan et al.(2001)Nature Biotechnol.19:656-660;Segal et al.(2001)Curr.Opin.Biotechnol.12:632-637;Choo et al.(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利No.6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;和美国专利公开文本No.2005/0064474;2007/0218528;2005/0267061。
与天然存在锌指蛋白相比,工程化锌指结合域可具有新颖的结合特异性。工程化改造方法包括但不限于理性设计和各种类型的选择。理性设计包括例如使用包含三联体(或四联体)核苷酸序列和各种锌指氨基酸序列的数据库,其中每种三联体或四联体核苷酸序列与结合特定三联体或四联体序列的锌指的一种或多种氨基酸序列相关。参见例如共同拥有的美国专利6,453,242和6,534,261。
例示性选择方法(包括噬菌体展示和双杂交系统)披露于美国专利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及WO98/37186;WO 98/53057;WO 00/27878;WO 01/88197和GB 2,338,237。另外,锌指结合域的结合特异性的增强记载于例如共同拥有的WO 02/077227。
另外,如这些和其它参考文献中公开的,可使用任何合适的接头序列将锌指域和/或多指锌指蛋白连接到一起,包括例如长5个或更多个氨基酸的接头。长6个或更多个氨基酸的例示性接头序列还可参见美国专利No.6,479,626;6,903,185;和7,153,949。本文中描述的蛋白可包括蛋白的各个锌指之间的合适接头的任何组合。
靶位点的选择;ZFP及用于设计和构建融合蛋白(及其编码多核苷酸)的方法是本领域技术人员已知的且详细记载于美国专利No.6,140,0815;789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496。
另外,如这些和其它参考文献中公开的,可使用任何合适的接头序列将锌指域和/或多指锌指蛋白连接到一起,包括例如长5个或更多个氨基酸的接头。长6个或更多个氨基酸的例示性接头序列还可参见美国专利No.6,479,626;6,903,185;和7,153,949。本文中描述的蛋白可包括蛋白的各个锌指之间的合适接头的任何组合。
在一些例子中,DNA结合多肽为来自GAL4的DNA结合域。GAL4是酿酒酵母(Saccharomyces cerevisiae)中的一种模块化反式激活物,但是它也在许多其它生物体中作为反式激活物运转。参见例如Sadowski et al.(1988)Nature 335:563-4。在这种调节系统中,酿酒酵母中编码半乳糖代谢途径的酶的基因的表达受到可用碳源的严格调节。Johnston(1987)Microbiol.Rev.51:458-76。这些代谢酶的转录控制通过正调节蛋白GAL4和GAL4特异性结合的一种17bp对称DNA序列(UAS)之间的相互作用来介导。
天然GAL4由881个氨基酸残基组成,分子量99kDa。GAL4包含功能自主域,它们的组合活性构成GAL4的体内活性。Ma and Ptashne(1987)Cell 48:847-53;Brent and Ptashne(1985)Cell 43(3Pt 2):729-36。GAL4的N端65个氨基酸构成GAL4 DNA结合域。Keegan etal.(1986)Science 231:699-704;Johnston(1987)Nature 328:353-5。序列特异性结合要求存在二价阳离子,通过DNA结合域中存在的6个Cys残基来配位。经与DNA螺旋的大沟的直接接触,含有配位阳离子的域识别并与17bp UAS每一端的保守CCG三联体相互作用。Marmorstein et al.(1992)Nature 356:408-14。蛋白的DNA结合功能使C端转录激活域靠近启动子,使得激活域能引导转录。
可在某些实施方案中利用的另外的DNA结合多肽包括例如且不限于来自AVRBS3可诱导基因的结合序列;来自AVRBS3可诱导基因的共有结合序列或自其工程化改造的合成结合序列(例如UPA DNA结合域);TAL;LexA(参见例如Brent&Ptashne(1985),见上文);LacR(参见例如Labow et al.(1990)Mol.Cell.Biol.10:3343-56;Baim et al.(1991)Proc.Natl.Acad.Sci.USA 88(12):5072-6);类固醇激素受体(Ellliston et al.(1990)J.Biol.Chem.265:11517-121);Tet阻抑物(美国专利6,271,341)和在四环素(Tc)存在下结合但在缺失下不结合tet操纵基因序列的突变型Tet阻抑物;NF-κB的DNA结合域;和Wang etal.(1994)Proc.Natl.Acad.Sci.USA 91(17):8180-4中记载的、利用GAL4、激素受体、和VP16的融合物的调节系统的成分。
在某些实施方案中,本文中描述的方法和组合物中使用的一种或多种核酸酶的DNA结合域包含天然存在或工程化(非天然存在)TAL效应器DNA结合域。参见例如美国专利公开文本No.20110301073。已知黄单胞菌(Xanthomonas)属的植物致病性细菌在重要作物植物中引起许多疾病。黄单胞菌的致病性依赖于保守III型分泌(T3S)系统,它将超过25种不同效应器蛋白注射入植物细胞。在这些注射的蛋白中有转录激活物样(TAL)效应器,它们模拟植物转录激活物且操作植物转录物组(参见Kay et al(2007)Science 318:648-651)。这些蛋白含有DNA结合域和转录激活域。表征最好的TAL效应器之一是来自野油菜黄单胞菌辣椒斑点病致病变种(Xanthomonas campestgris pv.Vesicatoria的AvrBs3(参见Bonaset al(1989)Mol Gen Genet 218:127-136和WO2010079430)。TAL效应器含有串联重复的集中域,每个重复含有大约34个氨基酸,它们对于这些蛋白的DNA结合特异性是关键的。另外,它们含有核定位序列和酸性转录激活域(综述参见Schornack S,et al(2006)J PlantPhysiol 163(3):256-272)。另外,在植物致病性细菌青枯雷尔氏菌(Ralstoniasolanacearum)中,已经发现了两种称作brg11和hpx17的基因,它们与青枯雷尔氏菌生物变种1株GMI1000和生物变种4株RS1000中的黄单胞菌AvrBs3家族同源(参见Heuer et al(2007)Appl and Envir Micro 73(13):4379-4384)。这些基因在核苷酸序列方面彼此98.9%相同,但是因hpx17的重复域中1,575bp的删除而不同。然而,这两种基因产物与黄单胞菌的AvrBs3家族蛋白具有少于40%的序列同一性。参见例如美国专利No.8,420,782和8,440,431和美国专利公开文本No.20110301073。
在其它实施方案中,核酸酶包含CRISPR/Cas系统。编码该系统RNA成分的CRISPR(聚簇规则间隔短回文重复)基因座和编码蛋白的cas(CRISPR相关的)基因座(Jansen etal.,2002.Mol.Microbiol.43:1565-1575;Makarova et al.,2002.Nucleic AcidsRes.30:482-496;Makarova et al.,2006.Biol.Direct 1:7;Haft et al.,2005.PLoSComput.Biol.1:e60)拼凑CRISPR/Cas核酸酶系统的基因序列。微生物宿主中的CRISPR基因座含有CRISPR相关(Cas)基因以及能够进行CRISPR介导的核酸切割的特异性编程的非编码RNA元件的组合。
II型CRISPR是表征最好的系统之一,而且以四个连续步骤进行靶向DNA双链断裂。第一,自CRISPR基因座转录两种非编码RNA,pre-crRNA阵列和tracrRNA。第二,tracrRNA杂交至pre-crRNA的重复区并介导pre-crRNA变成含有各个间隔物序列的成熟crRNA的加工。第三,成熟crRNA:tracrRNA复合物经crRNA上的间隔物和靶DNA上挨着原间隔物(protospacer)邻近基序(PAM,靶识别的另一项要求)的原间隔物之间的Wastson-Crick碱基配对将Cas9引导至靶DNA。最后,Cas9介导靶DNA的切割,在原间隔物内创建双链断裂。CRISPR/Cas系统的活性由三个步骤构成:(i)外来DNA序列插入CRISPR阵列以防止将来的攻击,该过程称作‘改编’(adaptation),(ii)表达相关蛋白,以及表达和加工阵列,接着是(iii)RNA介导的对外来核酸的干扰。如此,在细菌细胞中,数种所谓的‘Cas’蛋白牵涉CRISPR/Cas系统的天然功能且在诸如插入外来DNA等功能中发挥作用。
在某些实施方案中,Cas蛋白可以是天然存在Cas蛋白的“功能性衍生物”。天然序列多肽的“功能性衍生物”指具有与天然序列多肽共同的定性生物学特性的化合物。“功能性衍生物”包括但不限于天然序列的片段和天然序列多肽及其片段的衍生物,前提是它们具有与相应天然序列多肽共同的生物学活性。本文中涵盖的生物学活性指功能性衍生物将DNA底物水解成片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变体、共价修饰二者及其融合。Cas多肽或其片段的合适衍生物包括但不限于Cas蛋白或其片段的突变体、融合物、共价修饰。Cas蛋白(包括Cas蛋白或其片段)以及Cas蛋白或其片段的衍生物可得自细胞或化学合成或通过这两种规程的组合来获得。该细胞可以是天然生成Cas蛋白的细胞,或天然生成Cas蛋白且经遗传工程改造成以更高表达水平生成内源Cas蛋白或自外源引入的核酸(该核酸编码与内源Cas相同或不同的Cas)生成Cas蛋白的细胞。在一些情况中,该细胞并非天然生成Cas蛋白且经遗传工程改造成生成Cas蛋白。
在生成至少两处双链断裂的一个特定实施方案中,修复双链断裂可包含除去双链断裂之间的物质并连接核苷酸序列的末端,从而切除双链断裂之间的序列。在多个实施方案中,切除的序列可以但不限于包含编码编码表达高、更高、很高、或最高的蛋白的整个或部分核苷酸序列的序列。在又一些实施方案中,切除的序列可以但不限于包含实现表达高、更高、很高、或最高的蛋白的表达的调节序列。在此类实施方案中,表达高、更高、很高、或最高的蛋白的表达相对于切割之前的表达水平降低。
在生成至少两处双链断裂的备选实施方案中,修复双链断裂可包含除去双链断裂之间的物质,用供体序列替换它,从而用供体序列替代双链断裂之间的序列。在其它实施方案中,除去的序列可以但不限于包含编码编码表达高、更高、很高、或最高的蛋白的整个或部分核苷酸序列的序列。在又一些实施方案中,除去的序列可以但不限于包含实现表达高、更高、很高、或最高的蛋白的表达的调节序列。在此类实施方案中,表达高、更高、很高、或最高的蛋白的表达相对于切割之前的表达水平降低。
在生成一处双链断裂的实施方案中,修复双链断裂可包含进入或穿过双链断裂插入供体序列。在某些实施方案中,供体序列可插入表达高、更高、很高、或最高的蛋白的编码序列。在多个实施方案中,插入此类序列可破坏表达高、更高、很高、或最高的蛋白的编码序列的转录,作为非限制性例子,这经由符合读码框的终止密码子的存在来实现。在又一些实施方案中,供体可以但不限于破坏实现表达高、更高、很高、或最高的蛋白的表达的调节序列的功能。在多个实施方案中,表达高、更高、很高、或最高的蛋白的表达相对于切割之前的表达水平降低。
在还有其它实施方案中,供体序列可编码目的蛋白。在又一些实施方案中,供体序列中存在的调节序列和/或供体序列所插入的序列中存在的调节序列可控制、调节、或可操作连接自供体序列表达目的蛋白。在另外的实施方案中,可以与供体序列分开或一起给细胞提供编码目的蛋白的核酸序列。在一些实施方案中,供体序列可以与编码目的蛋白的序列包含在同一核酸分子内。
在其它实施方案中,编码表达高、更高、很高、或最高的蛋白的核苷酸序列编码表达高、更高、很高、或最高的蛋白的核苷酸序列可以位于基因组、质粒、粘粒、人工染色体、附加体、或细胞中的其它核苷酸结构,作为非限制性例子。
在一个方面,本文中描述了用于在使用至少一种核酸酶体内切割供体后整合入选定内源基因座的双链供体多核苷酸。供体核苷酸包括要整合入内源基因座的外源序列(转基因)且含有至少一个核酸酶靶位点。供体核苷酸可包括转基因序列侧翼的同源性区域(例如同源臂)。供体序列中存在的染色体同源性可以在核酸酶结合位点中。在使用核酸酶切割供体的某些实施方案中,该核酸酶与用于切割染色体的核酸酶不同,而且有可能染色体和供体序列之间没有同源性。在其它实施方案中,供体分子经同源性依赖性机制(例如NHEJ)整合入内源基因座。在其它实施方案中,双链供体包含长至少1kb的转基因和转基因3’和/或5’的核酸酶靶位点供体内切割。供体分子可以是例如质粒。在某些实施方案中,供体在核酸酶介导的内源基因座切割后整合。在任何核酸酶介导的供体分子整合中,一种或多种用于切割供体的核酸酶可以与一种或多种用于切割内源基因座的核酸酶相同。或者,一种或多种用于切割供体的核酸酶可以与一种或多种用于切割内源基因座的核酸酶不同。
在一些实施方案中,供体包含在质粒上。供体可以在核酸酶介导的切割后整合,其中供体在质粒中侧翼为至少两个核酸酶切割位点。在某些实施方案中,供体质粒中核酸酶切割位点的序列与含有要靶定的ETIP的染色体基因座中的核酸酶切割位点的序列相同。在其它实施方案中,含有供体的质粒上供体侧翼的核酸酶切割位点与染色体的ETIP中的切割位点不相同。在另外的实施方案中,含有供体的质粒中供体侧翼的核酸酶切割位点可以不相同,而且还可以与染色体中的核酸酶切割位点不同。在又一些实施方案中,供体可以包含在质粒上,侧翼为至少两个核酸酶切割位点,而且可以整合入染色体的ETIP中通过两种核酸酶的作用创建的删除。在此类实施方案中,质粒上供体侧翼的核酸酶切割位点和染色体中的ETIP的核酸酶切割位点可以相同或可以不同。在其它实施方案中,供体为只含有单一核酸酶切割位点的质粒,而且染色体中的ETIP的核酸酶切割位点可以相同或可以不同。
供体分子的目的序列可包含一种或多种编码功能性多肽的序列(例如cDNA),有或无启动子。在某些实施方案中,核酸序列包含编码下述各项的序列:抗体、抗原、酶、生长因子、受体(细胞表面或核)、激素、淋巴因子、细胞因子、报告物、任何上述的功能性片段和上述的组合。在功能性多肽编码序列无启动子的实施方案中,那么整合序列的表达通过由内源启动子或目的区域中的其它控制元件驱动的转录来确保。在其它实施方案中,可以以这种方式将串联盒整合入选定位点,该盒的第一成分包含上文所述无启动子序列,接着是转录终止序列,和编码自主表达盒的第二序列。可以在供体分子中在同源臂之间包括另外的序列(编码或非编码序列)。在另外的实施方案中,供体核酸包含编码功能性RNA(例如miRNA或shRNA)的序列。
所公开的用于靶向切割的方法和组合物可用于诱导基因组序列中的突变。靶向切割还可用于创建基因敲除或基因敲低(例如功能基因组学或靶验证)及用于推动将序列靶向插入基因组(即序列敲入)。插入可以依靠经由作为非限制性例子的同源重组的染色体序列替换或通过靶向整合,其中在预定靶位点处插入新序列(即目的区域中不存在的序列)。在某些例子中,此类新序列可以侧翼为与染色体中的目的区域同源的序列。相同的方法还可用于用突变型序列替换野生型序列或将一种等位基因转变成不同的等位基因。
所公开的用于目的蛋白靶向重组生成的方法可用于用不相同的序列替换任何基因组序列。例如,可以将突变型基因组序列用其野生型对应物替换,由此提供用于治疗植物疾病的方法;提供针对植物病原体的抗性;提高作物产量,等。以类似的方式,可以使用本文中公开的靶向重组方法将基因的一种等位基因用不同的等位基因替换。
在许多这些情况中,目的区域包含突变,而且供体多核苷酸包含相应的野生型序列。类似地,可以将野生型基因组序列用突变型序列替换,如果想要这样的话。例如,癌基因的过表达可以通过突变该基因或通过用支持更低、非病理性水平的表达的序列替换其控制序列来逆转。事实上,以任何方式依赖于特定基因组序列的任何病理可以使用本文中公开的方法和组合物来纠正或减轻。
靶向切割、插入、切除、和/或重组还可用于改变非编码序列(例如调节序列,诸如启动子、增强子、起始子(initiator)、终止子、剪接位点)以改变基因产物的表达水平。此类方法可用于例如治疗目的、功能基因组学和/或靶验证研究。
染色质结构的靶向修饰可用于推动融合蛋白对细胞染色质的结合。在另外的实施方案中,可使用锌指结合域和重组酶(或其功能性片段)之间的一种或多种融合物,补充或代替本文中公开的锌指-切割域融合物,以推动靶向重组。参见例如共同拥有的美国专利No.6,534,261和Akopian et al.(2003)Proc.Natl.Acad.Sci.USA 100:8688-8691。在另外的实施方案中,所公开的方法和组合物用于提供ZFP结合域与其活性要求二聚化(同二聚化或异二聚化的转录激活或阻抑域的融合物。在这些情况中,融合多肽包含锌指结合域和功能域单体(例如来自二聚转录激活或阻抑域的单体)。两个此类融合多肽结合正确定位的靶位点容许二聚化,从而重建功能性转录激活或阻抑域。
而且,如上文公开的,本文所列方法和组合物可用于将外源序列靶向整合入细胞基因组中的目的区域,例如其中切割增强经同源性依赖性机制的插入,例如插入包含外源序列以及一种或多种与预定基因组序列(即靶位点)相同、或同源但不相同的序列的供体序列。
供体序列可以在外源序列侧翼的区域中含有足够同源性以支持对基因组序列中双链断裂的同源性定向修复(HDR),由此在基因组靶位点处插入外源序列。因此,供体核酸可以是足以支持通过同源性依赖性修复机制(例如同源重组)整合外源序列的任何尺寸。不希望受任何特定理论束缚,认为外源序列侧翼的同源性区域给断裂的染色体末端提供模板来再合成双链断裂位点处的遗传信息。在某些实施方案中,外源序列侧翼存在两种相同序列或两种同源但不相同序列(或各一种)。外源序列(或外源核酸或外源多核苷酸)含有在目的区域中并非天然存在的核苷酸序列。
理解的是,携带可诱导启动子控制下的ZFN基因以及它的相应识别序列的构建物可稳定整合入拟南芥(Arabidopsis),而且显示出诱导靶向突变,其源自识别位点处的非同源末端连接。例如,在国际专利公开文本No.WO/2008/021207中记载了一种经ZFN介导的同源重组精确插入转基因的方法。相反,在ZFN蛋白质能在靶生物体外表达和纯化,然后投递入靶植物细胞的情况中,可以经非同源末端连接(NHEJ)诱导外科手术般特定突变/基因敲除。如此,本公开文本能生成非转基因遗传修饰植物,会回避对转基因作物的限制,而且靶向基因编辑的方法可能会不要求转基因办法。
靶向基因添加通常通过转染可选择标志物基因(侧翼为实质量的与靶基因座同源的DNA)来实施。在靶基因座处找到自发双链断裂(DSB),很可能来自停转(stalled)DNA修复叉。虽然通过同源性定向修复(HDR)的无误修复通常以姐妹染色体为模板,但是HDR能改为使用同源供体DNA来治愈断裂。当在供体质粒中的两个同源性区域之间插入另外的DNA序列时,细胞DNA修复机制不知情地将这种遗传信息拷贝入染色体。由于这种基于同源性的打靶依赖于捕捉供体同源性区域内非常罕见的DSB,需要与靶基因座的广泛同源性来获得有用频率的靶向整合。
在备选实施方案中,可以经NHEJ给缺乏有效的基于同源性的DNA修复的细胞类型提供类似的基因添加能力。此类办法可能证明对优先使用NHEJ DNA修复途径的初级(primary)、非分裂细胞中的基因添加特别有用。经NHEJ的基因添加对于未测序基因组也会是有用的,因为供体构建没有要求费力的初步克隆和测序的基因组序列。理解的是,可以在NHEJ介导的DSB修复位点处捕捉非特定DNA。在一个特定实施方案中,通过ZFN切割创建的单链悬垂中存在的信息可用于实施使用NHEJ DNA修复机制的靶向DNA整合。
在其它实施方案中,可以通过有效的经NHEJ的和经同源性定向修复的基于同源性的DNA修复二者来提供基因添加能力。在一个此类实施方案中,供体序列的一端经NHEJ在染色体靶内整合,而供体序列的另一端经同源性定向修复在染色体靶内整合。
某些实施方案包括用于生成稳定整合入植物细胞中的ETIP、表达外源核酸序列的一种或多种产物(即蛋白质或RNA分子)的供体或有效载荷DNA的方法(图17)。
本公开文本的备选实施方案包括标志物基因的整合和并入ETIP可靶定核酸分子的标志物蛋白质的后续表达。在一些实施方案中,用于选择进入ETIP基因座的靶供体DNA的方法使用细胞分选和在ETIP 5'和3'端之一或二者处并入的标志物基因的表达的选择(图18)。ETIP在FAD2、FAD3或IPK2基因座处或附近的整合或ETIP在植物基因组中的随机位置内的整合看来不削弱宿主植物再生、开花、结籽的能力,而且能够多代地实现由靶向ETIP的供体多核苷酸分子投递的后续外源核酸序列产物的选择、再生和可遗传传递。
而且,ETIP可用于减少传统事件渐渗实验中需要生成的转基因事件的数目,因为候选基因和植物表达载体设计在同一内源植物基因组位置内整合。可以跨越所有植物物种施展ETIP技术,包括作物和模型物种,包括玉米、大豆、稻、芸苔、小麦、大麦、向日葵、番茄、拟南芥、棉、马铃薯、高粱、饲料用草、芸苔属物种(包括但不限于油菜(B.napus)、芜菁(B.rapa)、甘蓝(B.oleracea)、黑芥(B.nigra)、芥菜(B.juncea)、埃塞俄比亚芥(B.carrinata))、甘蔗、甜菜、短柄草(Brachypodium)、和苜蓿。
一个特定实施方案包括使用本文所述方法生成的转基因植物或转基因植物细胞。具体而言,在一个实施方案中,转基因植物细胞包括具有含有至少一种可靶定核酸分子的核苷酸序列(它可以是基因组的)的核酸分子,其中该可靶定核酸分子包含位点特异性核酸酶识别位点和至少一种标志物基因的片段,其中该片段不编码功能性标志物基因表达产物。可靶定核酸分子的特定实施方案可包括第一标志物基因的第一片段和第二标志物基因的第二片段。可靶定核酸分子的其它实施方案可包括一种或多种基因表达盒。在又一些实施方案中,第一和第二片段可以在位点特异性核酸酶识别位点的侧翼。
在一些实施方案中,供体核苷酸序列可以与调节元件可操作连接,诸如启动子、5’UTR、3’UTR、内含子、或MAR。在其它实施方案中,核苷酸序列可包含两种标志物基因的片段。
ETIP系统代表一种平台技术,其能够快速选择供体序列进入植物基因组的靶向整合。在某些实施方案中,ETIP技术可用于植物细胞培养物,以及藻类、苔藓、真菌系统、和哺乳动物细胞培养物,诸如NK-1、CHO、等。ETIP系统构成不同作物物种中的精确植物转化系统开发的基础,从而能够实现贯穿性状开发方法的高通量基因和构建物测试。
据此通过提述收录本文中引用的所有参考文献(包括出版物、专利、和专利申请)到它们与本公开文本的明确详情没有不一致的程度,而且收录到与就像通过提述个别且具体指出收录每一篇参考文献及在本文中完整列出相同的程度。提供本文中讨论的参考文献仅仅是因为它们的公开早于本申请的提交日。本文中无一处解释为承认发明人没有权利凭借发明在先而早于此类公开。
实施例
提供下面的实施例来例示某些特定特征和/或方面。这些实施例不应解释为将公开限制于所描述的特定特征或方面。
实施例1:自细菌人工染色体文库鉴定旁系同源FAD2和FAD3靶序列
BAC构建
细菌人工染色体(BAC)文库购自供应商(Amplicon Express,Pullman,WA)。BAC文库由110,592个BAC克隆组成,其含有自油菜变种DH10275分离的高分子量基因组DNA(gDNA)片段。用BamHI或HindIII限制酶消化gDNA。将分离的约135Kbp的gDNA片段连接入pCC1BAC载体(Epicentre,Madison,WI),并转化入大肠杆菌菌株DH10B(Invitrogen)。BAC文库由用两种不同限制酶构建的偶数个BAC克隆构成。因此,HindIII构建的BAC文库由144块384孔板组成。同样地,BamHI构建的BAC文库由144块384孔板组成。分离了总共110,592个BAC克隆,并排列入288块384孔板。288块384孔板中的每一个都由供应商以单一DNA提取提供,用于基于PCR的快速筛选。产生的BAC文库覆盖大约15Gbp gDNA,相当于油菜变种DH10275基因组的12倍基因组覆盖(如Johnston et al.(2005)Annals of Botany 95:229-235中所述,油菜基因组估值为约1.132Gbp)。
自BAC文库分离的FAD2编码序列的序列分析
用构建的BAC文库分离FAD2基因编码序列。进行测序实验以鉴定来自油菜变种DH10275的四种FAD2基因旁系同源物的具体基因序列。
FAD2基因序列最初是在模型物种拟南芥内鉴定的。基因序列在Genbank中列为基因座标签:At3g12120。先前描述了模型植物物种拟南芥和二倍体芜菁(四倍体油菜的祖先之一)之间的比较基因组关系(Schranz et al.(2006)Trends in Plant Science 11(11):535-542)。具体关于FAD2基因,比较分析预测在二倍体芸苔基因组内可存在基因的3-4个拷贝。另外的遗传作图研究由Scheffler et al.(1997)Theoretical and Applied Genetics94:583-591完成。这些遗传作图研究的结果显示在油菜中存在FAD2基因的4个拷贝。
自油菜变种DH12075构建的BAC文库的测序分析导致了四种BAC序列的分离(SEQID NO:1,SEQ ID NO:2,SEQ ID NO:3,和SEQ ID NO:4),由此确定了FAD2A(SEQ ID NO:5),FAD2-1(SEQ ID NO:6),FAD2-2(SEQ ID NO:7),和FAD2-3(SEQ ID NO:8)基因的编码序列。鉴定FAD2A,FAD2-1,FAD2-2,和FAD2-3基因序列并进行遗传作图。使用序列比对程序和利用同一性百分比的邻居连接树进行四种FAD2基因的序列分析。经由来自Vector NTI Advance11.0计算机程序(Life Technologies,Carlsbad,CA)的程序进行序列比对,并显示于图1中。使用改良的Clustal W算法来生成蛋白质或核酸序列的多重序列比对以进行相似性比较和注解。用Jalview软件产生邻居连接树,并显示于图2。(Waterhouse et al.(2009)Bioinformatics 25(9):1189-1191)。如图2中所示,分离的序列的分析指示FAD2A和FAD2-3序列共享高水平的序列相似性,同样地,FAD2-1和FAD2-2共享高水平的序列相似性。四种序列可分类为两个进化枝,其中FAD2A和FAD2-3构成第一进化枝,而FAD2-1和FAD2-2构成第二进化枝。
接着,用自油菜新分离的FAD2序列对自芜菁基因组BAC文库和甘蓝鸟枪基因组序列读出分离的基因组文库进行BLAST。芜菁和甘蓝二者均为双二倍体物种油菜(AC基因组,n=19)的二倍体祖先。油菜衍生自芜菁(A亚基因组,n=10)和甘蓝(C亚基因组,n=9)之间的最近杂交事件。使用BLASTn分析将二倍体祖先序列与自油菜分离的四种不同FAD2编码序列进行比较。此序列分析自芜菁和甘蓝鉴定出与新发现的油菜FAD2序列共享最高序列相似性的具体的带注释的基因序列。表1列出了新鉴定的FAD2编码序列和相应的祖先参照序列登录号和来源生物体。
表1:来自油菜和相应祖先生物体的FAD2序列及相关的FAD序列登录号。
FAD2基因以每个亚基因组每个基因两个拷贝存在于油菜基因组中。每种基因的一个拷贝位于A亚基因组上,同样地,每种基因的一个拷贝位于C亚基因组上。描述了新的命名规则以指示每种基因位于哪个亚基因组上。自油菜BAC基因组DNA文库分离的四种不同FAD2编码序列和祖先序列数据之间的高水平序列相似性提示FAD2-3是来自C亚基因组的FAD2序列的副本,并且可重新标记为FAD2C;FAD2-1是来自A亚基因组的FAD2序列的副本,并且可因此标记为FAD2A’;最后,FAD2-2是自C亚基因组的FAD2序列复制的第二拷贝,并且可标记为FAD2C’。
自BAC文库分离的FAD3编码序列的序列分析
用构建的BAC文库分离FAD3基因编码序列。进行测序实验以鉴定来自油菜变种DH10275的五种FAD3基因旁系同源物的具体基因序列。
FAD3基因序列最初是在模型物种拟南芥内鉴定的。基因序列在Genbank中列为基因座标签:At2g29980。先前描述了模型植物物种拟南芥和二倍体芜菁(四倍体油菜的祖先之一)之间的比较基因组关系(Schranz et al.(2006)Trends in Plant Science 11(11):535-542)。具体关于FAD基因,比较分析预测在二倍体芸苔基因组内可存在基因的3-4个拷贝。另外的遗传作图研究由Scheffler et al.(1997)Theoretical and Applied Genetics94:583-591完成。这些遗传作图研究的结果显示在油菜中存在FAD3基因的6个拷贝。
聚焦于来自油菜的FAD3基因的先前的测序努力已对A和C基因组二者的特定拷贝进行了鉴定和遗传学作图(Hu et al.(2006)Theoretical and Applied Genetics 113(3):497-507)。Andrew Sharpe(Agriculture and Agrifood Canada,107Science Place,Saskatoon,Saskatchewan)先前已从植物系DH12075构建来自种子特异性cDNA文库的EST序列集合并测序。作为来自加倍单倍体芸苔植物DH12075的EST的集合,全长基因序列未获得,此外,序列质量的指标和正确识别核苷酸的置信度也未获得。因此,不同FAD基因序列读出之间的序列变异不可明确地归于FAD3基因家族的各种旁系同源物的不同基因拷贝,基因组序列也未获得。然而,当用EST以及Hu et al.(2006)中记载的两种FAD3A和FAD3C全长基因序列实施组合序列分析时,鉴定出与二者基因均匹配的EST连同另外的3种单元型。结果,鉴定了FAD3的总共6种独特单元型。在汇编了各种FAD3单元型的所有可获取数据之后,鉴定出外显子1中的高水平外显子序列趋异性。外显子1中的FAD3序列趋异性被鉴定为可利用来设计基因/等位基因特异性PCR引物的机会。另外,鉴定出在单元型之间最低程度区分(例如,外显子5,6,7和8有1-3bp在FAD3A和FAD3C之间有变化)或者没有序列变异(例如,外显子2和3)的外显子。
自油菜变种DH12075构建的BAC文库的测序分析导致了六种BAC序列的分离(SEQID NO:9,SEQ ID NO:10,SEQ ID NO:11,SEQ ID NO:12,SEQ ID NO:13,和SEQ ID NO:14),由此确定了FAD3A(SEQ ID NO:15),FAD3A’(SEQ ID NO:16),FAD3A”(SEQ ID NO:17),FAD3C(SEQ ID NO:18),FAD3C”(SEQ ID NO:19),和FAD3C’(SEQ ID NO:20)基因的编码序列。鉴定了FAD3A,FAD3A’,FAD3A”,FAD3C,FAD3C”,和FAD3C’基因序列并进行遗传作图。
使用序列比对程序和利用同一性百分比的邻居连接树进行六种FAD3基因的序列分析。经由来自Vector NTI Advance 11.0计算机程序(Life Technologies,Carlsbad,CA)的程序进行序列比对,并显示于图3中。使用改良的Clustal W算法来生成蛋白质或核酸序列的多重序列比对以进行相似性比较和注解。用Jalview软件产生邻居连接树,并显示于图4。(Waterhouse et al.(2009)Bioinformatics 25(9):1189-1191)。用鉴定为包含FAD3基因的毗连群作为针对拟南芥基因数据库的BLASTn查询。经由与拟南芥FAD3基因(Genbank登录号:At2g29980)比较,鉴定出6个毗连群中每一个含有FAD3基因的区域。然后将FAD3毗连群定向,使得所有FAD3基因都处于5’至3’取向。修剪FAD3毗连群,在可能的情况下包含多至2个上游(5’)和1个下游(3’)拟南芥基因。一旦取向,自每个毗连群提取FAD3基因的完整编码区,并用于生成邻居连接树以展示不同FAD3基因家族成员之间的关系。将6个FAD3家族成员排列成3对FAD3基因(图4)。
基于PCR的筛选
设计一组PCR引物来筛选前述BAC文库。将引物设计为或者是通用引物(它们会扩增基因家族的所有成员)或者是基因特异性引物(它们用于靶定等位基因扩增)。将PCR引物设计成长20bp(+/-1bp)并包含50%(+/-8%)的G/C含量。表2和表3列出了设计和合成的引物。合并BAC文库的克隆,并经聚合酶链式反应(PCR)进行筛选。
表2:用于FAD3序列之PCR扩增的引物序列。
引物名称 |
SEQ ID NO |
序列 |
D_uni_F3_F1 |
SEQ ID NO:21 |
GAATAAGCCATCGGACACAC |
D_spec_F3_F2 |
SEQ ID NO:22 |
ATGCGAACGGAGACGAAAGG |
D_spec_F3_F3 |
SEQ ID NO:23 |
TGTTAACGGAGATTCCGGTG |
D_spec_F3_F4 |
SEQ ID NO:24 |
GTAGCAATGTGAACGGAGAT |
D_uni_F3_R1 |
SEQ ID NO:25 |
CAGTGTATCTGAGCATCCG |
D_spec_F3_R2 |
SEQ ID NO:26 |
GTGGCCGAGTACGAAGATAG |
D_spec_F3_R3 |
SEQ ID NO:27 |
CAGTAGAGTGGCCAGAGGA |
表3:为BAC文库筛选、FAD2基因鉴定设计的PCR引物序列。
引物名称 |
SEQ ID NO |
序列 |
D_UnivF2_F1 |
SEQ ID NO:28 |
ATGGGTGCAGGTGGAAGAATG |
D_UnivF2_F2 |
SEQ ID NO:29 |
AGCGTCTCCAGATATACATC |
D_UnivF2_R1 |
SEQ ID NO:30 |
ATGTATATCTGGAGACGCTC |
D_UnivF2_R2 |
SEQ ID NO:31 |
TAGATACACTCCTTCGCCTC |
D_SpecificF2_F3 |
SEQ ID NO:32 |
TCTTTCTCCTACCTCATCTG |
D_SpecificF2_R3 |
SEQ ID NO:33 |
TTCGTAGCTTCCATCGCGTG |
D_UnivF2_F4 |
SEQ ID NO:34 |
GACGCCACCATTCCAACAC |
D_UnivF2_R4 |
SEQ ID NO:35 |
ACTTGCCGTACCACTTGATG |
用两套不同条件进行聚合酶链式反应(PCR)。第一系列PCR反应包含:1X PCR缓冲液(包含dNTP);1.5 mM MgCl2;200μM 0.25 UDNA聚合酶(Bioline,London,UK);250nM每种引物;和,约5-10ng模板DNA。第二系列PCR反应是为了扩增基因组DNA而开发的,而且包含:5-10ng基因组DNA,1X PCR缓冲液,2mM dNTP,0.4μM正向和反向引物,和0.25UDNA聚合酶(Bioline,London,UK)。合并扩增体系成终体积13μL,并使用MJ热循环仪(BioRad,Hercules,CA)或ABI 9700基因扩增 (LifeTechnologies,Carlsbad,CA)进行扩增。使用基于Bryan等(Scottish Crops ResearchInstitute annual report:2001-2002)描述的筛选系统的4维筛选办法以及上述PCR条件对特定平板进行基于PCR的筛选。在对合并的BAC文库进行基于PCR的筛选后,使用直接Sanger测序方法对扩增的PCR产物进行测序。依照v3.1方案(AppliedBiosystems),用乙醇、乙酸钠和EDTA纯化扩增产物,并在自动化毛细管电泳平台上实施电泳。
在基于PCR的筛选和构象Sanger测序后,鉴定出包含各种不同FAD2和FAD3基因家族成员的平板集合。鉴定出总共四种独特的FAD2和FAD3旁系同源基因序列(表4和表5)。对每种FAD2和FAD3旁系同源基因序列各自挑选总共两块平板进行平板筛选以鉴定平板内包含FAD2和FAD3基因的具体孔和克隆(表4和表5)。对二者的平板鉴定具体的孔,并针对每个FAD2和FAD3基因家族成员选择克隆个体。
表4:用详述的PCR引物组合提供阳性反应的BAC克隆平板的鉴定,连同进一步用于平板内克隆鉴定的两块平板的识别号。
表5:用详述的PCR引物组合提供阳性反应的BAC克隆平板的鉴定,连同进一步用于平板内克隆鉴定的两块平板的识别号。
对于每个鉴定的FAD基因家族成员,经由测序进一步分析单个BAC克隆。依照制造商的说明书使用Large Construct(Qiagen,Valencia,CA)分离BAC克隆的DNA并准备好用于测序。依照制造商的说明书使用GS-FLXTitanium(Roche,Indianapolis,IN)制备提取的BAC DNA用于测序。使用物理区分的GS-FLX TI Pico-titer实施测序反应,成对合并BAC以提供最佳数据输出。成对组合BAC,其中FAD2基因与FAD3基因配对。通过Newbler(454 Life Sciences,Branford,CT)汇编所有生成的序列数据。使用Sequencher(GeneCodes,Ann Arbor,MI)手工评估汇编的毗连群中相应FAD基因的存在。
在鉴定并充分表征所有四种FAD2和六种FAD3基因的全基因组序列后,
设计锌指核酸酶以结合每个特定基因家族成员的序列。
实施例2:对FAD2基因特异性的锌指结合域的设计
如前所述设计针对编码FAD2基因基因座的各种功能性序列的DNA序列的锌指蛋白。参见例如Urnov et al.(2005)Nature 435:646-651。例示性靶序列和识别螺旋显示于表6和表7(识别螺旋区设计)和表8和表9(靶位点)。在表8和表9中,靶位点中与ZFP识别螺旋接触的核苷酸以大写字母指示;非接触核苷酸以小写字母指示。设计锌指核酸酶(ZFN)靶位点以结合FAD2A的5个靶位点和FAD3的7个靶位点。将FAD2和FAD3锌指设计掺入编码如下蛋白质的锌指表达载体,该蛋白质具有至少一个具有CCHC结构的指。参见美国专利公开文本No.2008/0182332。特别是,每种蛋白质中的最后一个指具有CCHC主链,用于识别螺旋。将非规范锌指编码序列与IIS型限制酶FokI的核酸酶域(Wah et al.(1998)Proc.Natl.Acad.Sci.USA 95:10564-10569的序列的第384-579位氨基酸)经四个氨基酸的ZC接头和自玉蜀黍衍生的不透明-2核定位信号融合以形成FAD2A锌指核酸酶(ZFN)。融合蛋白的表达由相对强的组成型启动子驱动,诸如自木薯叶脉花叶病毒(CsVMV)启动子衍生且侧翼为根癌农杆菌(Agrobacterium tumefaciens)ORF23 3’非翻译区(AtuORF23 3’UTRv1)的启动子。将来自明脉扁刺蛾(Thosea asigna virus)(β四体)病毒的自水解2A编码核苷酸序列(Szymczak et al.,2004)加到克隆入构建物的两个锌指核酸酶融合蛋白之间。下文记载了例示性的载体。
使用先前显示鉴定活性核酸酶的基于芽殖酵母的系统验证最佳锌指的切割活性。参见例如美国专利公开文本No.20090111119;Doyon et al.(2008)Nat Biotechnol.26:702-708;Geurts et al.(2009)Science 325:433。为各种功能域选择锌指供体内使用。在设计、生成和测试结合推定FAD基因组多核苷酸靶位点的众多ZFN中,一些ZFN鉴定为具有高水平的体内活性并选定用于进一步的实验。这些ZFN表征为能有效结合和切割植物中独特的FAD2基因组多核苷酸靶位点。
表6:FAD3锌指设计
表7:FAD2锌指设计
表8:FAD3锌指的靶位点
ZFP |
靶位点(5’至3’) |
SEQ ID NO: |
27961 |
cgCCGGAGAAAGAGAGAGAGctttgagg |
SEQ ID NO:36 |
27962 |
tgGTTGTCGCTATGGACcagcgtagcaa |
SEQ ID NO:37 |
27969 |
tcTCCGTTcGCATTGcTACGCTggtcca |
SEQ ID NO:38 |
27970 |
gaAAGGTTtGATCCGAGCGCAcaaccac |
SEQ ID NO:39 |
27973 |
tcTCCGTTcGCATTGcTACGCTggtcca |
SEQ ID NO:40 |
27974 |
tcGGAGATATAAGGGCGGCCattcctaa |
SEQ ID NO:41 |
27987 |
taGCCCAGAACAGGGTTccttgggcggc |
SEQ ID NO:42 |
27988 |
ctTCGTACTCGGCCACGactggtaattt |
SEQ ID NO:43 |
27989 |
ttGAAGTTGCAaTAAGCTttctctcgct |
SEQ ID NO:44 |
27990 |
acTTGCTGGTCGATCATGTTggccactc |
SEQ ID NO:45 |
27991 |
aaGTAGTTGAAGTTGCAataagctttct |
SEQ ID NO:46 |
27992 |
tgGTCGATCATGTTGGCcactcttgttt |
SEQ ID NO:47 |
28004 |
aaCGAGAATGAAGGAATGAAgaatatga |
SEQ ID NO:48 |
28005 |
atACCATGGTTGGTAAGtcatttatttt |
SEQ ID NO:49 |
28021 |
ccAACGAGgAATGATAGAtaaacaagag |
SEQ ID NO:50 |
28022 |
caGTCACAGTTcTAAAAGtctatggtgt |
SEQ ID NO:51 |
28023 |
tgTGACTGGACcAACGAGgaatgataga |
SEQ ID NO:52 |
28024 |
tcTAAAAGTCTATGGTGttccttacatt |
SEQ ID NO:53 |
28025 |
cgCCGGAGAAAGAGAGAGCTttgaggga |
SEQ ID NO:54 |
28026 |
tgGTTGTCGCTATGGACcagcgtagcaa |
SEQ ID NO:55 |
28035 |
ctTAAACGGTGGTTgTGCGCTcggatca |
SEQ ID NO:56 |
28036 |
tcGGAGATATAAGGGCTGCGattcctaa |
SEQ ID NO:57 |
28039 |
tcTCCGATctTAAACGGTGGTTgtgcgc |
SEQ ID NO:58 |
28040 |
atAAGGGCTGCGATTCCtaagcattgtt |
SEQ ID NO:59 |
28051 |
agATGGCCCAGAAAAGGgttccttgggc |
SEQ ID NO:60 |
28052 |
cgTACTCGGCCACGactggtaatttaat |
SEQ ID NO:61 |
28053 |
ttGAAGTTGCAaTAAGCTttctctcgct |
SEQ ID NO:62 |
28054 |
acTTGCTGGTCGATCGTGTTggccactc |
SEQ ID NO:63 |
28055 |
aaGTAGTTGAAGTTGCAataagctttct |
SEQ ID NO:64 |
28056 |
tgGTCGATCGTGTTGGCcactcttgttt |
SEQ ID NO:65 |
表9:FAD2锌指的靶位点
实施例3:FAD2基因的锌指核酸酶切割的评估
构建物装配
使用本领域普遍知道的技能和技术设计和完成如实施例2中所述使用酵母测定法鉴定的含有例示性锌指核酸酶之ZFN表达构建物的质粒载体。将每一种锌指编码序列融合至编码不透明-2核定位信号的序列(Maddaloni et al.(1989)Nuc.Acids Res.17(18):7532),其位于锌指核酸酶的上游。
接着,将不透明-2核定位信号::锌指核酸酶融合序列与互补的不透明-2核定位信号::锌指核酸酶融合序列配对。因此,每个构建物由单个可读框组成,该可读框由通过来自明脉扁刺蛾(β四体)病毒的2A序列(Mattion et al.(1996)J.Virol.70:8124-8127)隔开的两个不透明-2核定位信号::锌指核酸酶融合序列构成。融合蛋白的表达由相对强的组成型启动子驱动,诸如自木薯叶脉花叶病毒(CsVMV)启动子衍生且侧翼为根癌农杆菌ORF233’非翻译区(AtuORF233’UTR)的启动子。
使用IN-FUSIONTMAdvantage Technology(Clontech,Mountain View,CA)装配载体。限制性内切核酸获自New England BioLabs(NEB;Ipswich,MA),且将T4DNA连接酶(Invitrogen)用于DNA连接。使用质粒试剂盒(Macherey-Nagel Inc.,Bethlehem,PA)或Plasmid Midi试剂盒(Qiagen)依照供应商的说明书实施质粒制备。在琼脂糖Tris-乙酸盐凝胶电泳后使用QIAquick凝胶提取试剂盒TM(Qiagen)分离DNA片段。最初通过限制性消化微量制备的DNA来筛选所有装配质粒的菌落。由商品化测序供应商(Eurofins MWG Operon,Huntsville,AL)对选定克隆的质粒DNA进行测序。使用SEQUENCHERTM软件(Gene Codes Corp.,Ann Arbor,MI)汇编和分析序列数据。在递送至油菜原生质体之前,使用Pure Yield Plasmid Maxiprep(Promega Corporation,Madison,WI)或Plasmid Maxi(Qiagen,Valencia,CA)依照供应商的说明书从大肠杆菌培养物制备质粒DNA。
经限制酶消化和DNA测序确认了产生的11个质粒构建物:pDAB104008(含ZFN24845和ZFN24844构建物),pDAB104009(含ZFN24820和ZFN24821构建物),pDAB104010(含ZFN24828和ZFN24829构建物)(图5),pDAB104003(含ZFN24810和ZFN24811构建物),pDAB104011(含ZFN24832和ZFN24833构建物),pDAB104002(含ZFN24794和ZFN24795构建物),pDAB104006(含ZFN24796和ZFN24797构建物),pDAB104004(含ZFN24814和ZFN24815构建物),pDAB104001(含ZFN24800和ZFN24801构建物),pDAB104005(含ZFN24818和ZFN24819构建物),和pDAB104007(含ZFN24836和ZFN24837构建物)。表10列出了不同构建物和每种ZFN设计切割及结合的具体FAD序列。
经限制酶消化和DNA测序确认了产生的质粒构建物:pDAB107824(ZFN 28025-2A-28026),pDAB107815(ZFN 27961-2A-27962),pDAB107816(ZFN 27969-2A-27970),pDAB107817(ZFN 27973-2A-27974),pDAB107825(ZFN 28035-2A-28036),pDAB107826(ZFN28039-2A-28040),pDAB107818(ZFN 27987-2A-27988),pDAB107827(ZFN 28051-2A-28052),pDAB107821(ZFN 28004-2A-28005),pDAB107819(ZFN 27989-2A-27990),pDAB107828(ZFN 28053-2A-28054),pDAB107829(ZFN 28055-2A-28056),pDAB107820(ZFN27991-2A-27992),pDAB107822(ZFN 28021-2A-28022)和pDAB107823(ZFN 28023-2A-28024)。
表10:列出锌指蛋白结合基序和相应的构建物编号。每种锌指设计为结合并切割表中所述FAD2A。
用于转染的DNA的制备
通过沉淀并在100%(v/v)乙醇中清洗来对上述载体的质粒DNA灭菌,并在层流净化罩中干燥。将DNA团粒以终浓度0.7μg/μl悬浮于30μL无菌双蒸水中以供如下所述转染入原生质体细胞。进行质粒DNA的制备以产生用于瞬时转染的超螺旋质粒DNA和用于稳定转染的线性化质粒DNA。对于原生质体细胞的瞬时转染,无需对转化质粒添加载体DNA(例如鱼精DNA)。对于瞬时研究,每次转化使用约30μg质粒DNA每106个原生质体。
转染
如Spangenberg et al.(1986)Plant Physiology 66:1-8中所述完成油菜变种DH10275的转染,培养基配方记载于Spangenberg G.and Protrykus I.(1995)Polyethylene Glycol-Mediated Direct Gene Transfer in Tobacco Protoplasts.In:Gene Transfer to Plants.(Protrykus I.and Spangenberg G.Eds.)Springer-Verlag,Berlin。在70%乙醇中对油菜种子进行表面灭菌。将种子浸入12mL 70%乙醇溶液中并通过将混合物温和摇动10分钟来混合。通过倒出溶液去除70%乙醇溶液,并用由1%w/v次氯酸钙和0.1%v/v Tween-20组成的种子灭菌溶液替换。将种子浸入种子灭菌溶液中并通过温和摇动混合物25分钟来混合。倒出种子灭菌溶液并将经过灭菌的种子在50mL无菌水中漂洗3次。最后,将种子转移至已放置于陪替培养皿中的无菌80mm Whatman(Fisher-Scientific,St.Louis,MO),并将种子用无菌水轻微饱和。用(Fisher-Scientific,St.Louis,MO)密封陪替培养皿,并将平板于25℃在完全黑暗的情况下温育1-2天。在观察到种子的幼苗出现迹象后,将幼苗转移至含固化GEM培养基的陪替培养皿以鼓励进一步的种子萌发。将幼苗在GEM培养基上于25℃温育4-5天。
将一定体积的液体PS培养基(约10mL)倒入无菌陪替培养皿中。使用无菌镊子和刮刀,将处于4叶生长和发育期的4-5日龄幼苗的气生部分取下并丢弃。确定长度20-40mm的下胚轴区段以生成最高总数的小、富含胞质的原生质体。无菌切下下胚轴区段并转移至液体PS培养基。将切下的下胚轴区段聚集在一起并横切成5-10mm区段。接着,将下胚轴区段转移至新鲜的PS培养基中并在室温温育1小时。将质壁分离的下胚轴转移至含酶溶液的陪替培养皿中。小心地将所有下胚轴区段浸入溶液中。用密封陪替培养皿并于20-22℃温和摇动过夜温育16-18小时。
从下胚轴区段释放原生质体细胞。将过夜的下胚轴消化物温和摇动以将原生质体释放入酶溶液中。轻微倾斜陪替培养皿以帮助转移由酶溶液和植物碎片组成的消化悬浮液。使用10mL移液管将消化悬浮液转移至经过灭菌的原生质体过滤(100微米网孔的滤器)单元以进一步将原生质体与植物碎片分开。温和轻敲过滤单元以释放筛网中残留的过量液体。将约8-9mL原生质体悬浮液温和混合并分入14mL无菌塑料圆底离心管中。每份悬浮液用1.5mLW5溶液覆盖。以一定角度将W5溶液小心地分发于原生质体悬浮液上并以最小程度的摇动逐滴分发。添加W5溶液至原生质体悬浮液导致生成富含原生质体的界面。使用移液管收集此界面。接着,将收集的原生质体转移入一个新的14mL离心管中并温和混合。使用血球计测定所获取原生质体的产量以确定每毫升的原生质体数目。重复该方法,其中消化叶组织以生成叶肉原生质体。
接着,添加W5溶液至体积10mL,并以70g使原生质体形成团粒,之后去除W5溶液。通过温和摇动重悬浮残余的原生质体悬浮液。将含原生质体悬浮液的每个管装满5mL W5溶液并室温温育1-4小时。以70g使原生质体悬浮液形成团粒,并去除所有W5溶液。接着,将300μL转化缓冲液加到每份含有分离的原生质体的成团粒原生质体悬浮液中。在每个管中,向原生质体悬浮液中加入10μg质粒DNA。质粒DNA由上述锌指核酸酶构建物(例如pDAB104010)组成。接着,将300μL预温热的PEG 4000溶液加入原生质体悬浮液中并轻敲管。在无任何摇动的情况下使原生质体悬浮液和转化混合物在室温温育15分钟。以序贯小样1mL,1mL,1mL,2mL,2mL,和3mL在每个管中添加另外的10mL W5溶液,在每次添加W5溶液之间温和颠倒管。通过在离心机中以70g旋转使原生质体形成团粒。去除所有W5溶液,留下纯的原生质体悬浮液。
接着,加0.5mL K3培养基至成团粒原生质体细胞并重悬浮细胞。将重悬浮的原生质体细胞放置于陪替培养皿中央,以1:1浓度5mL K3和0.6mL Sea PlaqueTM琼脂糖(Cambrex,East Rutherford,NJ)。将陪替培养皿以单一的温和漩涡运动摇动并室温温育20-30分钟。用密封陪替培养皿并将原生质体在完全黑暗的情况下培养24小时。在黑暗中温育后,将陪替培养皿在弱光(5μMol m-2s-1的Osram L36 W/21 Lumilux白色管)下培养6天。在培养步骤后,用无菌刮刀将含原生质体的琼脂糖分成四个象限。将分开的四个象限放入含20mL A培养基的250mL塑料培养器皿中并在旋转摇床上以80rpm和1.25cm摆度于24℃持续弱光中温育14天,然后分析以测定每种锌指核酸酶构建物的活性水平。
自芸苔原生质体分离基因组DNA
将经转染的原生质体放置于各个1.5或2.0mL微量离心管中。使细胞于管基部在缓冲溶液中形成团粒。如下进行DNA提取,即将细胞速冻于液氮中,接着在Labconco Freezone(Labconco,Kansas City,MO)中于-40℃和约133x 10-3mBar压力将细胞冷冻干燥约48小时。使用(QIAGEN,Carlsbad,CA)植物试剂盒对冻干的细胞进行DNA提取,除了不需要组织破坏且将原生质体细胞直接加到裂解缓冲液中之外,均依照制造商的说明书进行。
在芸苔原生质体中对FAD2A和FAD3ZFN测试基因组DNA序列切割
将针对FAD2A和FAD3基因基因座的ZFN靶位点的设计聚簇,以便多对ZFN设计成与靶位点重叠。ZFN靶位点的聚簇使得PCR引物能设计成会在100bp窗口内扩增来自所有FAD2A和FAD3基因家族成员的周围基因组序列以封装所有重叠ZFN靶位点。如此,可利用Illumina短读出序列技术评估已转染原生质体的靶ZFN位点的完整性。另外,所设计的PCR引物需要包括会将序列读出归于FAD2A和FAD3家族的特定基因成员的特定核苷酸碱基。因此,会要求所有PCR引物结合离开任何ZFN靶切割位点5-10个核苷酸,因为已知非同源末端连接(NHEJ)活性引起小的删除,它能去除引发位点、抑制扩增并因此使NHEJ活性的评估失真。
将引物设计为结合FAD2A和FAD3基因家族的所有ZFN靶基因座(表11),并且凭经验经由PCR扩增产物的基于Sanger的测序测试引物对所有基因家族成员的扩增。在若干情况中,未能开发出会区分所有基因家族成员的引物(表12和表13),然而,在所有情况中,能区分FAD2A和FAD3的靶基因序列。在PCR引物设计后,将定制DNA条形码序列掺入PCR引物中,用于区分不同ZFN靶基因座并鉴定转染和ZFN的特定序列读出(表11,12和13)。
表11:为FAD2和FAD3ZFN活性评估设计的引物序列。引物包括定制条形码,连同Illumina文库构建(用于边合成边测序分析)必需的Illumina衔接子序列。购置的引物是所出现的全部三列的总和。
表12:设计的PCR引物对FAD2基因家族的扩增成效。“X”指示基因拷贝检测特异性,灰色阴影和“+”指示在待检测特定基因座处,通过两种引物设计的序列读出不能区分,而“N/A”指示不能自那些特定基因拷贝扩增基因座。
表13:设计的PCR引物对FAD3基因家族的扩增成效。“X”指示基因拷贝检测特异性,灰色阴影和“+”指示在待检测特定基因座处,通过两种引物设计的序列读出不能区分,而“N/A”指示不能自那些特定基因拷贝扩增基因座。
在用ZFN转染的芸苔原生质体的DNA提取后,实施靶ZFN基因座的PCR扩增以生成正确格式的必需的基因座特异性DNA分子用于基于Illumina的边合成边测序技术。将每项测定法优化成以25ng起始DNA(油菜基因组的约12,500个细胞当量)运作。实施多重反应,每份样品提供以适当水平评估NHEJ效率和特异性所需要的覆盖,约16个PCR反应相当于200,000个拷贝的取自原生质体个体的油菜基因组。为要以同一测试法测试的所有样品制备PCR扩增主混合物,并且使用定量PCR方法测定一式三份实施的一项反应,用于确定靶组织上实施的最佳循环数,以保证PCR扩增没有变成受试剂限制且仍然在指数扩增期。使用MX3000P(Stratagene,LaJolla,CA)以96孔形式实施实验,包含必需的阴性对照反应。根据自定量PCR平台收集的输出,对循环至循环间荧光的相对增加作图,并测定每项测试法的如下循环数,其会递送足够扩增,同时不容许反应变成受试剂限制,这试图减少过量循环及扩增共同转录物或分子。将未用过的主混合物保持在冰上直至定量PCR分析结束且循环数得到确定,然后等分入期望数目的反应管中(每项ZFN测定法约16管)并实施PCR反应。扩增后,将单个ZFN基因座的样品合并在一起,并使用MinElute PCR纯化(Qiagen)依照制造商的说明书清洁每个ZFN的200μL合并产物。为了使样品能使用Illumina短读出技术进行测序,需要通过扩增将另外的配对末端引物附着于产生的片段上。这是通过使用引物进行PCR扩增完成的,所述引物会与第一轮扩增加入的序列部分互补,但是还包含必需的配对末端序列。再次使用样品通过先前所述定量PCR循环分析确定要实施的最佳PCR循环数,它会加入配对末端序列而不过度扩增模板共同的片段。PCR扩增后,用MinElute(Qiagen)依照制造商的说明书清洁生成的产物,并在2.5%琼脂糖凝胶上进行解析。对用Safe(Life Technologies,Carlsbad,CA)显现为正确大小的条带的DNA片段进行凝胶抽提以去除任何残留的PCR生成的引物二聚体或其它假片段,用MinElute凝胶提取(Qiagen)依照制造商的说明书从凝胶条提取DNA。完成凝胶抽提后,用AMPure(Beckman-Coulter,Brea,CA)以1:1.7的DNA/珠比实施另外的DNA清洁。然后以1/40,000和1/80,000稀释,并且以一式三份实施的反应,使用基于定量PCR的文库定量试剂盒评估DNA的浓度,用于Illumina测序(KAPA)。基于定量PCR结果,将DNA稀释成2nM的标准浓度,并且组合所有文库供DNA测序。用cBot cluster generation(Illumina,SanDiego,CA)制备供测序用的样品,并在Illumina上以100bp配对末端测序读出依照制造商的说明书进行测序。
用于检测靶锌指位点处的非同源末端连接的数据分析方法
在完成测序反应及利用关于碱基识别的Illumina生物信息渠道实施的初级数据识别后,实施完整分析以鉴定每一种情况中靶ZFN位点处删除的碱基。设计定制PERL正本以在计算上依照输入序列列表自DNA序列提取和分选条形码。要被接受,条形码必须以大于30的Phred得分匹配参照序列,以减少错误认定的序列读出。将序列读出归入已使用的不同条形码组后,使质量过滤器穿过所有的序列。质量过滤器是第二个定制开发PERL正本。若识别为“N”的碱基不超过三个,或者若中值Phred得分小于20,或者若有3个连续碱基具有小于20的Phred得分,或者若序列读出长度短于40bp,则排除该序列读出。在配对序列读出二者均可获得的情况下,利用(SoftGenetics,State College,PA)程序包合并剩余的序列。然后用第三个定制PERL正本将剩余的合并序列读出简化成一个独特序列读出集合,在剩余序列标识符的末端上记录已鉴定的冗余序列数目的计数。然后用软件将独特序列读出与FAD2和FAD3参照序列比对,产生带缺口的FASTA比对文件。
使用带缺口的FASTA文件,使用第四个定制PERL正本实施缺口碱基位置编号向输入参照的转换。这使得能够在汇编的数据中鉴定出区分不同基因家族成员的碱基(不同基因家族成员之间的部分同源或旁系同源序列变异)。一旦实施了碱基编号的转换,就有可能为每一个独特序列读出生成单元型报告并将读出归于特定基因家族成员。一旦将读出按照基因分组,就围绕ZFN靶位点鉴定和评估10bp窗口。记录每个基因具有删除的序列数目连同缺失碱基的数目。
然后就每10,000个序列读出中在靶ZFN位点处删除1-10个碱基的序列的数目而言,将数据图示为多线图(图6)。对所有ZFN转染连同对照转染实施此分析。在若干情况中,天然DNA序列中的重复导致靶ZFN位点中的测序错误增多,这样的错误通常可被视为所有样品(用ZFN或对照转染二者)中报告的单碱基删除的普遍性的增加(图7)。
从这些结果看出,在基因座E处鉴定出FAD2靶位点处的最高水平ZFN活性,如通过更大NHEJ活性确定的。鉴于其显著的基因组DNA切割活性和最小的脱靶活性的特征,选择在质粒pDAB104010上编码的ZFN(即ZFN24828和24829)用于工程化转基因整合平台(ETIP)的植物打靶。
实施例4:用于工程化转基因整合平台(ETIP)芸苔植物系的DNA构建物
使用本领域技术人员普遍知道的方法和技术构建下述质粒载体构建物。此段所述的具体试剂和技术的应用是本领域技术人员易于知道的,并且可以用其它试剂和技术容易地替换以实现构建质粒载体构建物的期望目的。限制性内切核酸酶获自New EnglandBioLabs(NEB;Ipswich,MA)。用T4 DNA连接酶(Invitrogen,Carlsbad,CA)完成连接。使用LR酶混合物(Invitrogen)实施Gateway反应以将一种进入载体组装成单一目的载体。使用IN-FUSIONTMAdvantage Technology(Clontech,MountainView,CA)实施IN-FUSIONTM反应以将一种进入载体组装成单一目的载体。使用质粒试剂盒(Macherey-Nagel Inc.,Bethlehem,PA)或Plasmid Midi(Qiagen)依照供应商的说明书实施质粒制备。在琼脂糖Tris-乙酸盐凝胶电泳后使用QIAquick凝胶提取试剂盒TM(Qiagen)分离DNA片段。最初通过限制性消化微量制备的DNA来筛选所有装配质粒的菌落。由商品化测序供应商(Eurofins MWG Operon,Huntsville,AL)对选定克隆的质粒DNA进行测序。使用SEQUENCHERTM软件(Gene CodesCorp.,Ann Arbor,MI)汇编和分析序列数据。
用于在芸苔的FAD2A基因座中精确整合ETIP的直接递送载体
使用标准克隆方法构建含ETIP的载体pDAS000130(图8,如SEQ ID NO:141的T链插入物),用于特异性整合入油菜的FAD2A基因。此构建物设计成用锌指核酸酶构建物pDAB1004010递送入芸苔原生质体。锌指核酸酶构建物会切割FAD2A基因座,然后pDAS000130构建物会经由同源性定向修复机制整合在芸苔基因组内,并且可通过去除同源性侧翼区加以改良用于NHEJ介导的整合。ETIP由通过另外的ZFN识别序列分隔开的四个表达盒(两个不完全的)和含另外的ZFN识别序列的工程化着陆垫(ELP)组成。另外的ZFN识别序列是独特的,并且设计成作为靶,用于在ETIP和ELP转基因插入内引入多核苷酸序列。类似地,可利用ZFN识别序列切除多核苷酸序列。第一个基因表达盒是不完全的dsRED表达盒,并且包含来自拟南芥聚遍在蛋白10(AtUbi启动子)基因的启动子、5'非翻译区和内含子(Callis et al.(1990)J.Biol.Chem.265:12486-12493),接着是为了在双子叶植物中表达经过密码子优化的来自珊瑚礁珊瑚(Discosoma sp.)(Clontech,Mountain View,CA)的dsRed基因的210bp(dsRED(双子叶优化)外显子1),接着是来自拟南芥硫还原酶样基因的内含子(来自At硫还原酶的内含子1;登录号:NC_00374)及包含玉蜀黍胎萌-1(Viviparous-1,Vp1)基因转录终止子和多腺苷酸化位点的3'非翻译区(Zmlip终止子;Paek et al.(1998)Molecules and Cells 8(3):336-342)。第二个表达盒包含包括来自花椰菜花叶病毒的5’UTR的19S启动子(CaMV 19S;Cook and Penon(1990)Plant Molecular Biology 14(3):391-405),接着为了在双子叶植物中表达经过密码子优化的来自大肠杆菌的hph基因(hph(HygR);Kaster et al.(1983)Nucleic Acids Research 11(19):6895-6911)及包含根癌农杆菌pTi15955可读框1转录终止子和多腺苷酸化位点的3’UTR(At-ORF1终止子;Barkeret al.(1983)Plant Molecular Biology 2(6):335-50)。第三个表达盒是不完全的PAT表达盒,并且包含来自拟南芥4-香豆酰-CoA合酶的第一个内含子(内含子#24-香豆酰-CoA合酶v;登录号:At3g21320/NC003074),接着是自绿色产色链霉菌(Streptomycesviridochromogenes)分离,编码赋予针对包括膦丝菌素(phosphinothricin)、草铵膦(glufosinate)、和双丙氨磷(bialaphos)在内的谷氨酰胺合成酶抑制剂的抗性的蛋白质的膦丝菌素乙酰基转移酶基因的合成、植物优化形式的最后256bp(PAT(v6)3’末端;Wohlleben et al.(1988)Gene 70(1):25-37)。此表达盒以包含根癌农杆菌pTi15955可读框23转录终止子和多腺苷酸化位点的3’UTR(AtuORF23终止子;Barker et al.(1983)PlantMolecular Biology 2(6):335-50)终止。第四个表达盒是ipt基因盒,并且包含来自拟南芥DNA结合蛋白MYB32基因(U26933)的启动子和5’UTR的588bp截短形式(AtMYB32(T)启动子;Li et al.(1999)Plant Physiology 121:313),接着是来自根癌农杆菌的异戊基转移酶(ipt)基因和包含来自花椰菜花叶病毒的转录终止子和多腺苷酸化位点的35s终止子(CaMV35S终止子;Chenault et al.(1993)Plant Physiology 101(4):1395-1396)。为了递送至FAD2A,ETIP序列的每一端侧翼为1kb FAD2A基因组序列,其来自通过将pDAB104010中编码的ZFN递送至油菜FAD2A基因而诱导的双链断裂的位置任一侧。
由商品化基因合成供应商(GeneArt,Life Technologies)合成ETIP序列。使用Qiagen DNeasy Plant mini(Qiagen,Hilden)依照制造商的说明书从纯化自油菜DH12075叶组织的基因组DNA扩增FAD2A基因组序列的1kb区段。使用T4连接酶(NEB,Ipswich,MA)将1kb FAD2A序列连接入ETIP载体。首先通过限制性消化微量制备的DNA筛选所有装配质粒的菌落。限制性内切核酸酶获自New England BioLabs(NEB,Ipswich,MA)和Promega(Promega Corporation,WI)。使用QIAprep Spin Miniprep(Qiagen)或Pure Yield Plasmid Maxiprep(Promega Corporation,WI)依照供应商的说明书实施质粒制备。使用ABI Sanger Sequencing and Big Dye Terminator v3.1循环测序(Applied Biosystems,Life Technologies)对选定克隆的质粒DNA进行测序。使用SEQUENCHERTM软件(Gene Codes Corp.,Ann Arbor,MI)汇编和分析序列数据。
用于在芸苔FAD3基因座中精确整合ETIP的直接递送载体
使用标准克隆方法构建含ETIP的载体pDAS000271(图9,如SEQ ID NO:142的T链插入物)、pDAS000272(图10,如SEQ ID NO:143的T链插入物)、pDAS000273(图11,如SEQ IDNO:144的T链插入物)、pDAS000274(图12,如SEQ ID NO:145的T链插入物)、和pDAS000275(图13,如SEQ ID NO:146的T链插入物),其用于特异性整合入油菜的FAD3A或FAD3C基因基因座。此构建物设计成用锌指核酸酶构建物pDAB107828或pDAB107829递送入芸苔原生质体。特定锌指核酸酶构建物会切割FAD3A基因座,然后pDAS000273或pDAS000275构建物会经由同源性定向修复机制整合入芸苔基因组内。同样地,特定锌指核酸酶构建物会切割FAD3C基因座,然后pDAS000271、pDAS000272或pDAS000274构建物会经由同源性定向修复机制整合入芸苔基因组内。ETIP由通过另外的ZFN识别序列分隔开的四个表达盒(两个不完全的)和含另外的ZFN识别序列的工程化着陆垫(ELP)组成。另外的ZFN识别序列是独特的,并且设计成作为靶,用于在ETIP和ELP转基因插入内引入多核苷酸序列。类似地,可利用ZFN识别序列切除多核苷酸序列。第一个基因表达盒是不完全的dsRED表达盒,并且包含来自拟南芥聚遍在蛋白10(AtUbi启动子)基因的启动子、5'非翻译区和内含子(Callis et al.(1990)J.Biol.Chem.265:12486-12493),接着是为了在双子叶植物中表达经过密码子优化的来自珊瑚礁珊瑚(Clontech,Mountain View,CA)的dsRed基因的210bp(dsRED(双子叶优化)外显子1),接着是来自拟南芥硫还原酶样基因的内含子(来自At硫还原酶的内含子1;登录号:NC_00374)及包含玉蜀黍胎萌-1(Vp1)基因转录终止子和多腺苷酸化位点的3'非翻译区(Zmlip终止子;Paek et al.(1998)Molecules and Cells 8(3):336-342)。第二个表达盒包含包括来自花椰菜花叶病毒的5’UTR的19S启动子(CaMV 19S;Cook and Penon(1990)Plant Molecular Biology 14(3):391-405),接着是为了在双子叶植物中表达经过密码子优化的来自大肠杆菌的hph基因(hph(HygR);Kaster et al.(1983)Nucleic AcidsResearch 11(19):6895-6911)及包含根癌农杆菌pTi15955可读框1转录终止子和多腺苷酸化位点的3’UTR(At-ORF1终止子;Barker et al.(1983)Plant Molecular Biology 2(6):335-50)。第三个表达盒是不完全的PAT表达盒,并且包含来自拟南芥4-香豆酰-CoA合酶的第一个内含子(内含子#24-香豆酰-CoA合酶v;登录号:At3g21320/NC003074),接着是自绿色产色链霉菌分离,编码赋予针对包括膦丝菌素、草铵膦、和双丙氨磷在内的谷氨酰胺合成酶抑制剂的抗性的蛋白质的膦丝菌素乙酰基转移酶基因的合成、植物优化形式的最后256bp(PAT(v6)3’端;Wohlleben et al.(1988)Gene 70(1):25-37)。此表达盒以包含根癌农杆菌pTi15955可读框23转录终止子和多腺苷酸化位点的3’UTR(AtuORF23终止子;Barkeret al.(1983)Plant Molecular Biology 2(6):335-50)终止。第四个表达盒是ipt基因盒,并且包含来自拟南芥DNA结合蛋白MYB32基因(U26933)的启动子和5’UTR的588bp截短形式(AtMYB32(T)启动子;Li et al.(1999)Plant Physiology 121:313),接着是来自根癌农杆菌的异戊基转移酶(ipt)基因和包含来自花椰菜花叶病毒的转录终止子和多腺苷酸化位点的35s终止子(CaMV 35S终止子;Chenault et al.(1993)Plant Physiology 101(4):1395-1396)。为了递送至FAD3A或FAD3C,ETIP序列的每一端侧翼为1kb FAD3A或FAD3C基因组序列,其来自油菜FAD3A或FAD3C基因中通过递送编码的ZFN而诱导的双链断裂的位置的任一侧。
由商品化基因合成供应商(GeneArt,Life Technologies)合成ETIP序列。使用Qiagen DNeasy Plant mini(Qiagen,Hilden)依照制造商的说明书从纯化自油菜DH12075叶组织的基因组DNA扩增FAD3A和FAD3C基因组序列的1kb区段。使用T4连接酶(NEB,Ipswich,MA)将1kb FAD3A或FAD3C序列连接入ETIP载体。首先通过限制性消化微量制备的DNA筛选所有装配质粒的菌落。限制性内切核酸酶获自New England BioLabs(NEB,Ipswich,MA)和Promega(Promega Corporation,WI)。使用QIAprep Spin Miniprep(Qiagen)或Pure Yield Plasmid Maxiprep(Promega Corporation,WI)依照供应商的说明书进行质粒制备。使用ABI Sanger Sequencing and Big DyeTerminator v3.1循环测序(Applied Biosystems,Life Technologies)对选定克隆的质粒DNA进行测序。使用SEQUENCHERTM软件(Gene Codes Corp.,Ann Arbor,MI)汇编和分析序列数据。
对照载体
使用对照载体开发基于荧光激活细胞分选(FACS)的细胞分选方法。使用标准克隆方法构建对照载体,即由两个基因表达盒组成的pDAS000031(图14:如SEQ ID NO:147的T链插入物)。第一个基因表达盒包含花椰菜花叶病毒19s启动子(CaMV 19S启动子;Shillitoet al.(1985)Bio/Technology 3:1099-1103)::潮霉素抗性基因(hph(HygR);美国专利No.4,727,028)::和根癌农杆菌可读框1 3’非翻译区(AtORF1终止子;Huang et al.(1990)J.Bacteriol.172:1814-1822)。第二个基因表达盒包含拟南芥遍在蛋白10启动子(AtUbi10启动子;Callis et al.(1990)J.Biol.Chem.265:12486-12493)::dsRED(dsRED(D);美国专利No.6,852,849)和来自拟南芥的内含子(内含子#1;GenBank:AB025639.1)::根癌农杆菌可读框233’非翻译区(AtORF23终止子;美国专利No.5,428,147),作为反式取向(例如头对头取向)的框内融合。使用IN-FUSIONTMAdvantage Technology(Clontech,Mountain View,CA)装配质粒载体。
用于ETIP在芸苔中随机整合的二元载体的构建
为了ETIP T链序列在油菜基因组内的随机整合,构建了两种二元载体。使用标准克隆方法构建含ETIP的载体pDAS000036(图15,如SEQ ID NO:148的T链插入物)和pDAS000037(图16,如SEQ ID NO:149的T链插入物)。ETIP载体由通过ZFN识别序列分隔开的四个表达盒(两个不完全的表达盒)和含另外的ZFN识别序列的工程化着陆垫(ELP)组成。第一个基因表达盒是不完全的dsRED表达盒,并且包含来自拟南芥聚遍在蛋白10(AtUbi 10启动子)基因的启动子、5'非翻译区和内含子(Norris et al.(1993)Plant MolecularBiology 21(5):895-906),接着是为了在双子叶植物中表达经过密码子优化的来自珊瑚礁珊瑚(Clontech,Mountain View,CA)的dsRed基因的210bp,接着是来自拟南芥硫还原酶样基因的内含子(登录号:NC_00374)及包含玉蜀黍胎萌-1(Vp1)基因转录终止子和多腺苷酸化位点的3’非翻译区(UTR)(ZmLip终止子;Paek et al.(1998)Molecules and Cells 8(3):336-342)。第二个表达盒包含包括来自花椰菜花叶病毒的5’UTR的19S启动子(CsVMV19启动子;Cook and Penon(1990)Plant Molecular Biology 14(3):391-405),接着是为了在双子叶植物中表达经过密码子优化的来自大肠杆菌的hph基因(hph(D);Kaster etal.(1983)Nucleic Acids Research 11(19):6895-6911)及包含根癌农杆菌pTi15955可读框1(ORF1)转录终止子和多腺苷酸化位点的3’UTR(AtORF1终止子;Barker et al.(1983)Plant Molecular Biology 2(6):335-50)。第三个表达盒是不完全的PAT表达盒,并且包含来自拟南芥4-香豆酰-CoA合酶的第一个内含子(登录号:At3g21320(NC003074)),接着是自绿色产色链霉菌分离,编码赋予针对包括膦丝菌素、草铵膦、和双丙氨磷在内的谷氨酰胺合成酶抑制剂的抗性的蛋白质的膦丝菌素乙酰基转移酶(PAT)基因的合成、植物优化形式的最后256bp(PATv6(外显子2);Wohlleben et al.(1988)Gene 70(1):25-37)。此表达盒以包含根癌农杆菌pTi15955可读框23(ORF23)转录终止子和多腺苷酸化位点的3’UTR(AtORF23终止子;Barker et al.(1983)Plant Molecular Biology 2(6):335-50)终止。第四个表达盒是ipt基因盒,并且包含来自拟南芥DNA结合蛋白MYB32基因(U26933)的启动子和5’UTR的588bp截短形式(AtMYB32(T)启动子;Li et al.(1999)Plant Physiology 121:313),接着是来自根癌农杆菌的异戊基转移酶(ipt)基因和包含来自花椰菜花叶病毒的转录终止子和多腺苷酸化位点的35s终止子(CaMV 35S终止子;Chenault et al.(1993)PlantPhysiology 101(4):1395-1396)。
由商品化基因合成供应商(GeneArt,Life Technologies)合成具有Multi-Gateway位点的表达盒和ELP。使用BP clonase II酶混合物TM(Invitrogen,LifeTechnologies)和pDONR221载体套组TM(Invitrogen,Life Technologies)构建每种表达盒和ELP的进入克隆。然后将进入克隆用于使用LR Clonase II Plus酶混合物TM(Invitrogen,Life Technologies)与Gateway使能性二元载体一起进行的Multi-Gateway反应中。首先通过限制性消化微量制备的DNA筛选所有装配质粒的菌落。限制性内切核酸酶获自NewEngland BioLabs(NEB,Ipswich,MA)和Promega(Promega Corporation,WI)。使用QIAprepSpin Miniprep试剂盒TM(Qiagen,Hilden)或Pure Yield Plasmid Maxiprep SystemTM(Promega Corporation,WI)依照供应商的说明书实施质粒制备。使用ABI SangerSequencing and Big Dye Terminator v3.1循环测序方案TM(Applied Biosystems,LifeTechnologies)对选定克隆的质粒DNA进行测序。使用SEQUENCHERTM软件(Gene CodesCorporation,Ann Arbor,MI)汇编和分析序列数据。
实施例5:ETIP芸苔植物系的生成
油菜的转化
ETIP构建物(pDAS000036,pDAS000037),DS-Red对照构建物(pDAS000031),和FAD2A,FAD3A和FAD3C位点特异性构建物(pDAS000130,和pDAS000271-pDAS000275)以及伴随的锌指核酸酶(pDAB104010,pDAB10728,和pDAB10729)记载于实施例4中。将二元载体转化入根癌农杆菌菌株GV3101:PM90。使用实施例3中所述转化方案加以一些修改完成油菜原生质体细胞的转化。
对方案的修改包括用海藻酸钠代替Sea PlaqueTM琼脂糖。以包含5:1质粒DNA摩尔比的DNA浓度完成锌指核酸酶构建物和ETIP构建物二者共递送入油菜原生质体细胞的转染实验。以30μg质粒DNA的浓度转化其它ETIP和对照质粒构建物。因此,pDAS000130由浓度27.8μg质粒DNA组成,而pDAB104010由浓度2.2μg质粒DNA组成。以30μg质粒DNA的浓度转化其它ETIP和对照质粒构建物。
另外的对方案的修改包括在含1.5mg/mL潮霉素的培养基中从经过转化的原生质体细胞繁殖完整植物。完整植物的繁殖要求每两周更换A培养基,并且监测原生质体衍生集落的生长。在原生质体衍生集落生长到大约2-3mm直径后,将集落转移入含固化MS形态培养基的12孔板(Fisher Scientific,St.Louis,MO)的各个孔中。将平板于24℃在连续弱光下温育1-2周,直至愈伤组织增殖到直径8-10mm的大小。在原生质体细胞达到直径1-2cm之后,将原生质体细胞转移入含MS形态培养基的各个250mL培养器皿中。将器皿于24℃在16小时光照(20μMol m-2s-1Osram L36 W/21 Lumilux白色管)和8小时黑暗的条件下温育。在1-2周内,可见多个嫩芽。在嫩芽达到3-4cm长后,将它们转移入含MS培养基的250mL培养器皿中。将250mL培养器皿于24℃在16小时光照(20μMol m-2s-1Osram L36 W/21 Lumilux白色管)和8小时黑暗的条件下温育。将嫩芽保持在培养器皿中,直至它们发育成小植株,此时将它们转移至温室,生长至成熟。
实施例6:含T-DNA的ETIP在芸苔中的整合的分子确认
ETIP在芸苔中的随机整合的分子确认
使用DNeasy 96 Plant DNA提取试剂盒TM或DNeasy Plant Mini试剂盒TM(Qiagen)从所有推定转基因植物的叶组织提取基因组DNA。使用下述引物通过PCR分析来自每株植物的基因组DNA:设计为从pTiC58扩增virC以测试根癌农杆菌的存留的引物,pTiC58正向(SEQID NO:150,CGAGAACTTGGCAATTCC)和pTiC58反向(SEQ ID NO:151,TGGCGATTCTGAGATTCC);设计为扩增来自油菜的肌动蛋白以检查基因组DNA的质量的引物,肌动蛋白正向(SEQ IDNO:152,GACTCATCGTACTCTCCCTTCG)和肌动蛋白反向(SEQ ID NO:153,GACTCATCGTACTCTCCCTTCG)。设计引物来扩增由ETIP编码的hph基因;HPH正向(SEQ ID NO:154,TGTTGGTGGAAGAGGATACG)和HPH反向(SEQ ID NO:155,ATCAGCAGCAGCGATAGC)。将自virC引物没有得到产物但用针对肌动蛋白和hph的引物从其中扩增出正确大小的产物的植物归类为转基因的。
完成第二步筛选,其中用设计成在T-DNA区以外扩增二元载体的五套引物通过PCR分析来自每株转基因植物的gDNA[(1F,SEQ ID NO:156,ATGTCCACTGGGTTCGTGCC;1R,SEQ IDNO:157,GAAGGGAACTTATCCGGTCC)(2F,SEQ ID NO:158,TGCGCTGCCATTCTCCAAAT;2R,SE IDNO:159,ACCGAGCTCGAATTCAATTC)(3F,SEQ ID NO:160,CCTGCATTCGGTTAAACACC;3R,SEQ IDNO:161,CCATCTGGCTTCTGCCTTGC)(4F,SEQ ID NO:162,ATTCCGATCCCCAGGGCAGT;4R,SEQ IDNO:163,GCCAACGTTGCAGCCTTGCT)(5F,SEQ ID NO:164,GCCCTGGGATGTTGTTAAGT;5R,SEQ IDNO:165,GTAACTTAGGACTTGTGCGA)]。认为用引物组3和4从中扩增出正确和预期大小的PCR产物的植物具有主链整合。
使用经过修改的CTAB方法(Maguire et al.(1994)Plant Molecular BiologyReporter 12(2):106-109)从20g叶组织纯化来自没有主链整合的植物的DNA。用数种限制酶消化分离的gDNA,并将10μg gDNA在琼脂糖凝胶上通过电泳分开,并使用标准Southern印迹方案转移至膜。使用DIG Easy Hyb SystemTM(Roche,South San Francisco,CA)依照制造商的说明书探查膜。用以下引物从ETIP构建物扩增针对ELP每一种表达盒和针对内源对照基因肌动蛋白的探针:(IPT-F,SEQ ID NO:166,TCTCTACCTTGATGATCGG;IPT-R,SEQ ID NO:167,AACATCTGCTTAACTCTGGC;dsRED-F,SEQ ID NO:168,ATGGCTTCATCTGAGAACG;dsRED-R,SEQ ID NO:169,TTCCGTATTGGAATTGAGG;PAT-F,SEQ ID NO:170,TTGCTTAAGTCTATGGAGGCG;PAT-R,SEQ ID NO:171,TGGGTAACTGGCCTAACTGG;ELP-F,SEQ ID NO:172,ATGATATGTAGACATAGTGGG;ELP-R,SEQ ID NO:173,AGGGTGTAAGGTACTAGCC;Hph-F,SEQ IDNO:174,TGTTGGTGGAAGAGGATACG;Hph-R,SEQ ID NO:175,ATCAGCAGCAGCGATAGC;肌动蛋白-F,SEQ ID NO:176,GTGGAGAAGAACTACGAGCTACCC;肌动蛋白-R,SEQ ID NO:177,GACTCATCGTACTCTCCCTTCG)。
从所有只含单一拷贝ETIP的植物扩增ETIP序列并测序。使用ABI3730xITM(AppliedBiosystems,Life Teachnologies)通过PCR产物的直接测序分析每种T-DNA插入物的序列。使用Phusion Hot Start II聚合酶TM(Finnzymes,Thermo Fisher Scientific)从基因组DNA扩增T-DNA插入物。用多对引物完成T-DNA的扩增反应以扩增长度约2Kbp的重叠序列。用多种引物对每种PCR产物测序以保证完全覆盖。在对PCR反应测序前用虾碱性磷酸酶和外切核酸酶I(Applied Biosystems,Life Technologies)处理PCR反应以灭活过量引物。如下鉴定每种单拷贝ETIP系的T-DNA插入物侧翼的序列,即用8种限制性内切核酸酶消化纯化的基因组DNA并随后连接对由限制性内切核酸酶创建的悬垂部分特异性的双链衔接子。在此连接步骤后,用针对ETIP的3’或5’端的生物素化引物和针对每种衔接子的引物实施PCR。在Ampure Solid Phase Reversible Immobilization(SPRI)珠TM(Agencourt BioscienceCorporation,Beckman Coulter Company)上捕捉和清洁PCR产物。实施嵌套PCR,并使用ABISanger Sequencing and Big Dye Terminator v3.1循环TM测序方案(AppliedBiosystems,Life Technologies)对所有产物测序。使用SEQUENCHERTM软件(Gene CodesCorp.,Ann Arbor,MI)汇编和分析序列数据。
Southern印迹分析
在Southern探查前选择特定限制酶消化gDNA样品。如下分析推定转基因植物,即用EcoRI和SwaI消化基因组DNA。接着,用包含PATv6、IPT或ELP基因元件的多核苷酸片段探查经过消化的gDNA和未切割的gDNA样品,因为这些多核苷酸探针片段能区分EcoRI消化产物及SwaI消化产物中的多种插入物。然后用全部6种探针进一步分析已鉴定的单拷贝转基因植物系以鉴定插入载体的所有必要元件的存在。
因而,对用ETIP-pDAS000036转化的67例独立事件采样,并测试转基因(hph)的存在和载体主链的存在。在67株测试的植物中,发现47株具有整合在基因组内的转基因。在47株转基因植物中,发现17株植物包含载体主链(表14)。对剩余的30株不包含载体主链重要部分(Ori或SpecR缺失)的植物进行采样用于Southern分析。一般说来,首先用IPT探针筛选植物,然后用包含dsRED、PAT、ELP和hph基因元件的探针进一步测试鉴定为推定单拷贝系的植物系以确认完整盒的存在。
同样地,对用ETIP-pDAS000037转化且在土壤中存活的52例独立事件进行采样,并测试转基因(hph)的存在和载体主链的存在。在52株测试植物中,发现48株具有整合在基因组内的转基因。从48株转基因植物中,也发现23株植物包含载体主链,还有3株植物未测试(表14)。对剩余的22株不包含载体主链重要部分(Ori或SpecR缺失)的植物进行采样用于Southern分析。首先用IPT探针筛选这些转基因植物,并用dsRED、PAT、ELP、hph和肌动蛋白探针进一步测试鉴定为推定单拷贝系的植物系以确认结果。一旦获得5个独立单拷贝系的鉴定,就终止对剩余植物的Southern分析。总计,11个ETIP-pDAS000037系进行了Southern分析。
表14:+/-转基因和+/-载体主链PCR结果的汇总
用pDAS000036和pDAS000037转化的ETIP转基因芸苔的结果
经pDAS000036和pDAS000037转化产生的转基因油菜事件导致生成单拷贝、全长T链插入。对于每一株植物完全表征3-4例事件,并推定定位到油菜基因组内的特定染色体。尽管在T链整合期间发生了一些单碱基对重排,选定事件包含能驱动转基因强劲表达的全长表达盒。将选定T0事件培养至T1发育阶段。使用上述PCR测定法重筛选T1以测定整合T链的接合性。将筛选事件归类为纯合子的,半合子的,或无效的。
从所有只含单拷贝整合ETIP序列的转基因事件扩增ETIP序列并测序。通过PCR产物的直接测序分析每种T-DNA插入物的序列。使用Phusion Hot Start II聚合酶TM(Finnzymes,Thermo Fisher Scientific)从基因组DNA扩增T-DNA插入物。接着,用多对引物扩增T-DNA以扩增长度约2Kb的重叠序列。用多种引物对每种PCR产物测序以保证完全覆盖。在对PCR反应测序前用虾碱性磷酸酶和外切核酸酶I(Applied Biosystems,LifeTechnologies)处理PCR反应以灭活过量引物。
如下鉴定每个单拷贝ETIP系的T-DNA插入物侧翼的序列,即用8种限制性内切核酸酶消化纯化的基因组DNA,随后连接对由限制性内切核酸酶创建的悬垂部分特异性的双链衔接子。在此步骤后,用针对ETIP的3’或5’端的生物素化引物和针对每种衔接子的引物实施PCR反应。在Ampure Solid Phase Reversible ImmobilizationTM(SPRI)珠(AgencourtBioscience Corporation,Beckman Coulter Company)上捕捉和清洁PCR产物。实施嵌套PCR并使用ABI Sanger Sequencing and Big Dye Terminator v3.1循环测序方案(Applied Biosystems,Life Technologies)对所有产物测序。使用SEQUENCHERTM软件(GeneCodes Corp.,Ann Arbor,MI)汇编和分析序列数据。鉴定和选择8个ETIP系用于侧翼序列分析(表15)。左和右侧翼序列(也称作边界或连接序列)提供为SEQ ID NO:431–SEQ ID NO:446,划下划线的序列指示质粒载体,未划下划线的序列指示基因组侧翼序列。
表15:侧翼序列研究中使用的单拷贝事件的详情
pDAS000036事件详情:em02-5788-1-1左边界侧翼(SEQ ID NO:431)
TCGAGATTGTGCTGAAGTAAACCATTTTACTTCAAATCTATTTTTAACTATTTACTTTTATTAAGGAGAGAAACTTTGCTGATTAATTCAAATTAGTGATCATTAAGATTCCAAAGATTCCGATTTAGAAAAGTCAAAGATTCAAAGAACAAGTCTAGGTCCTCATGGCTCATGTTGCATCCGATTCACCATCCACTCATCTTTCATATCTTCCTCCACTGTCTCTCTAGAAACAACTCATTTAATTTAGAAAACTCCTTTTTCAATTTAGAAATATTAAAGTTTATCACAATGTATCAATTAAATATTATCCGATGACTCATTCATAGTCAGGACCTTGCTGTCTGTGTCGTCCGTAATTATTATTTCAATACAAAACAAATATATGTTCACTCAGAAAATTACGGCGCAATCATCTAATTTTGTGGACCAAAATAAATAGCGTAGCTTCGAGATTTCAAAGTTGTGTTCAAATTTAATTTTGATTTCCGTTCCTCGTATACTCTTTTATGTATAGAAAATAATAATATCCACTACTAGTAGTTGATAACTACATTACATATATTAAAATTATGATGTCACATTGCGGACGTTTTTAATGTACTGAA TTAACGCCGAATTGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTAGCTTGA GCTTGGATC
em02-5788-1-1右边界侧翼(SEQ ID NO:432)
CATAACCACCATCTCAAACAATAGAACTTCCTAAGTGAAGCAATGACTTCAAATCTACTTGAAGGCATG GAGTATAAGCCATGTTCCTTTCAGAGGGGACTGTACTTCTGTAGATTACTTTCCCTCATTAACCAGATCTGGCCGGC CTACCCAGCTTTCTTGTACACATAGCGACCGAGCTCGAGCCGAAGTTCGGTCGCTGTTTCACTGTTTGGGAAAGCATCAGTAACGCAGAAGACATAATTAAAAATTAATTATATATGGTAGTTTTTCTAGATTCTCCACTATACCTCATTGTGATTGAAAAACAACTATATATATATATATATATGTATTTAAAATTAAGAAATCATTAAATCGTACCATAATGCAGAAAACTTTATAAGTTCCTATTCTTTTGTCAAGATGAGTAGATGACACATCATGTACCACATAACATAACCATAATGGTGCGATACCATACCAAAACTTAATTTAGAAACTAATTAAAATTTTGGTAGTTTAAGATTCCTCCTAATGGTTGTCAAAAAAAAAAAAAGATTCCTCCTAATACATGGTAGAATATATTTTTGAGTTAAAATGAAAGTAAAATCTTCAAATTAGTCATAAGGAAATTCTAAAAAACATCGACTTTCTTTATAAAGATCCCATTGTAATTTTAGATGATTAATTTTATCCCAATCCAATTAAGAATTGTACACATCGGCCTCTATATATATCAAACACCTAAAA
pDAS000036事件详情:ad58-5784-2-1左边界侧翼(SEQ ID NO:433)
CGATTTGCAGCTATAATCAATCACACCTTATCGTTCTTTCAAAGAAAAATCGAAAGTTGTAAACTTTATCAGCCTGTGTAGTGATTATTTCAATTTGATAAAGAAAAAAAAAGGCTTAGCTTTATTTGGTTTTTTGTTACAATCTTGATTAATTTTAGATTAGCACTCTGATTCTAGCGGAACATGAGAGTGGTTCCATCAAACCTCAGACAGTGAGCACAGTGGTTGCAGCAAACCATTTGGGTGAGAGCTCTTCAGTTTCTTTGCTATTAGCTGGTTCTGGCTCTTCTCTTCAAGAAGCTGCTTCTCAAGCTGCCTCTTGTCATCCTTCTGTTTCCGAGGTAACTAACTACATTCTTCATTTGTCCTTTTTTCTTGTGGGTCTTAAATGTTYGTGCTTTTCTTTATAGGTACTTGTTGCTGATTCAGATAGATTTGAGTACCCTTTAGCTGAACCTTGGGCTAAACTGGTTGACTTTGTTCGCCAACAAAGAGATTACTCTCACATCCTTGCCTTCCTCTAGCTCATTTGGCAAGAACATACTTCCTCTAGACAACTTAATAACACATTGCGGACGTTTTTAATGTACTGAATTAACGCCGAATTG AATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTC
ad58-5784-2-1右边界侧翼(SEQ ID NO:434)
CCTGTCATAACCACCATCTCAAACAATAGAACTTCCTAAGTGAAGCAATGACTTCAAATCTACTTGAAG GCATGGAGTATAAGCCATGTTCCTTTCAGAGGGGACTGTACTTCTGTAGATTACTTTCCCTCATTAACCAGATCTGG CCGGCCTACCCAGCTTTCTTGTACAAAGTGGTGATAAACTATCGCCGGCCTACCTCGCGTTGCTGCTCTTTTAGATGTCTCTCCTGTTACTGATGTTGTCAAAATCTTAGGATCCAATGAGTTTATCAGGTATACTTCTATCATGTATTGCTTGAGATTTTGGAGTGTTAGTAAAGATTTCAATAAAAGAATTTTTTCAAACAAAATTTTGGGGGCTTGAAGCTAATGTTTGGAAATATGTAACGGAGTTTAAATCTTTTGGCAGGCCTATATATGCGGGAAACGCCTTGTGTAGAGTTCGCTATACTGGTGCTGGTCCTTGTGTGTTGACTATTAGAACTACATCTTTTCCTGTTACCCCAATAACTGAGTCAAAGAAAGCTACTATCTCTCAGATTGATCTCTCGAAATTCAAAGAAGGTTTGTTTAGTATTATTCTCTTGTGCATAGCCTTTTTGCTTTTTTTTTTTTTATAAAAAAAGTTGAGTATGCTTATTGCCCATTGCA
pDAS000036事件详情:ad58-5898-10-1左边界侧翼(SEQ ID NO:435)
TAATTTCATTTTCGTCATTTTGGTAAAGTAACAAAAGACAGAATATTGGTTAGTCGTGTTGGTTAGGAATAAAATAAAGAACGTGGACATCGTGGAATAAAAATATTCAGACAAGGAAACTAACAATAAAACAGTAATGAACATGGTTCTGAATCTCATCTTTGTGTATCTCCAATGGAATCCACCGCCACGAATCAGACTCCTTCTCCAAGCTCCACCGTCGACGATGACAATGGCGACGGTGTCTATACCGACGAATTTACCAAACTACCCCCGGACCCGGGGATCCTCTAGAGTCAA CAAATTGACGCTTAGACAACTTAATAACACATTGCGGACGTTTTTAATGTACTGAATTAACGCCGAATTGAATTCGA GCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTAGCTTGAGCTTGGATCAGATTGTC
ad58-5898-10-1右边界侧翼(SEQ ID NO:436)
CGGCCTACCCAGCTTTCTTGTACAAAGTGGTGATAAACTATCAGTGTTTGATTAAAGATAAAATTTGATTTTTCATTACATAATAATCCATTAATTTTCACGCACGTGGAACCCATTTGGTGTACTTCCACGTCCTCTAAGAGAGCACTGACCCACTCATCAAAAAGATACATCTTTATAAGCCCCTTCATCGTCACACAGACACACACTTCCCTCTCAATTATTCCATATTCTCCTAATTTCTAATTGTTACACCTCAACACATTAGATTCGTACCAAACAAAAACGATTAGCTCCCAAGCCTAAGCTTTTATTTCCTTATAATTTTTCTTGGGTTTCTCTCTATAAAGAATGCAAATGACTGAGAGAGGCCGAGCCATGTGGCACACGTCCCTAGCCTCGGCATTCCGCACAGCTCTAGCTTGCACAATCGTTGGTGCGGCTACGCTCTACGGACCCGAGTGGATCCTCCGTTTTGTGGCATTCCCGGCGTTTTCTTACGTCACGGTCATTCTCATCATTACGGACGCCACGCTAGGCGACACACTACGTGGCTGCTGGCTAGCCCTTTACGCCACATGTCAGAGCGTTGCACCGGCTATCATTACACTAAGGCTTATAGGACCAGCTCGGCTCACGGCCGG
pDAS000037事件详情:lf31-6139-2-3左边界侧翼(SEQ ID NO:437)
TTCTTTCCATCAGTTCTTCGGCACCTTCCTGGCTCTGCGTCTATCTTTCTTTCCATCCCGGCCCATCTCGTACACATTCCACCCAACTACACAAACACGTTATAGTCTTTTACATTATGACCAAATCAACCCTAAAGATACAGCCTTTATAAAAAATATAGGGGTCAAAGCAAAGAAGAGAAAGTTTGCTTACAGTGTGGAGAAAAGAAGTTGGAAGATGAGGAGTAAGAAGAAGAAGAGAAGAGAAAGGGTCTTCTGATGAGGAATAGGAGATAAGGTGGAACTGGAATGTTTGCCGCTAAATACTTGAAGACAAGAGCTTGATTTTCAAGCTCTTCCCATTGTGACTCAGTGAAAGGGATCCTAGTCGTCATGAAGAGATAGAGAAAATTGATGATGAAGGAGGTCTGATGAAGAGAAGAGAGAGAGAGAGATATTACACAAAGAGGGTTGTATTGCAAAATTGAAAGTGTAGAGAGAGTAGTAGGTAAGTTTTTATTAATAATGTTGTTCACACCTGCAGTCTGCAGAATATTGTGGTGTGAACAAATTGACGCTTAGACAACTTAATAACACATTGCGGACGTTTTTAATGTACTGAATTAACG CCGAATTGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTA
lf31-6139-2-3右边界侧翼(SEQ ID NO:438)
TTCAATCTACTTGAAGGCATGGAGTATAAGCCATGTTCCTTTCAGAGGGGACTGTACTTCTGTAGATTACTTTCCCT CATTAACCAGATCTGGCCGGCCTACCCAGCTTTCTTGTACAAAGTGGTGATAAACTATCAGTGTTTGAACATATATATACGCATAATATTCTCAGAACCCGACCCATTGGTTGACTCGGATCAAGATCGACCCGATCCGACCCGGTTAAAAGCACGTCGTCTCCTTTGGTTCGCCCCTTATATTCGACGAGTGAGTTCGATTGGATCGCTGTTTGTCATTTCTCACTACCTTAAGAAAAAAAAAAAGGTGCGTCTCTCTCTCACCTTTACCGCTCACTTACCTCTCAGATCTGACATCGATTTTCCAAATCTTC:TCCAGGTACTCTCTCTCCTGGCCGTTGACGGTCCCGTCCCGGCCGTGGATCTGATTTCGCCGCGATCTGAGGTCAAGCATGGCGGCAGCTAACGCCCCCATCACGATGAAGGAGGTCCTAACGGTGAGTCCCGCCTCCATTTTTAGTAACATA
pDAS000037事件详情:bm56-6315-1-1左边界侧翼(SEQ ID NO:439)
TACATCGCGATTCATCCTGGTTTGATTAGAATGACGAGGAAGTTGTCATATTCCCAAACAGGAAAATTGGGATCGCCTTATTTGAAAGTGGGATAACTTCTTCATCTTAATTCTTATGAGAATTATTCCACTTCCTGGTGATTCTCCACTACTTTTTGTATATAAATACAGCTTCTTACATCGCGATTCATCCTGATTTGATTAGAATGACGAGAAAGTTGTCATATTCCCAAACAGGAAAACTGGGATCACCTGATTTGAAAGTGGGATAACTTCTTCATCCTAATTCTTATGAGATTTATTCCACTTCCTGGTGATTCTCCACTTCTTTATGTATCCAAATACATCTTCTTACATCGCGATTCATCCTGGTTTGATTAGAATGACGAGGAAGTTGTCATATTCCCAAACATGAAAACTGGGAAAGTGGGATTGACGCTTAGACAACTTAATA ACACATTGCGGACGTTTTTAATGTACTGAATTAACGCCGAATTGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAG TCGACCTGCAGGCATGCAAGCTTAGCTTGAGCTTGGAT
bm56-6315-1-1右边界侧翼(SEQ ID NO:440)
CCACCATCTCAAACAATAGAACTTCCTAAGTGAAGCAATGACTTCAAATCTACTTGAAGGCATGGAGTA TAAGCCATGTTCCTTTCAGAGGGGACTGTACTTCTGTAGATTACTTTCCCTCATTAACCAGATCTGGCCGGCCTACC CAGCTTTCTTGTACAAAGTGACGATAAACTATCAGTCTTTCAAAGCGCATCTATGGCTAGTCATCACGGTTTTTAACTGTTTTACGAAGTCGCGGAGAGGCTCGTCTTCTCCCTAGGATAAACTGCAGAGGTCGACATCGGAGGTTTCTCGATCTATGAACATAGAGTACTGTTTGAGAAACTCCGAGGCGAGTTGGCGGAAACTCCCTATAGAGTTTTTCTTTAGACAAGAGAACCACTCAAGCGCTGCTTCGCGGAGGTTCTCGACGAAGAGGCGGCATTCGCCGGCATCTCTTTCTCTATCTTTAAACTTGGCTCTTCCCATCGCGATCTGGAAAGCCTGCAAGTGTGCCTTAGGATCGGTTGTACCATCGTAAGGAGCCACTTTGACTTTATCAGGATCCGAAACCGTAGTTTCGGTGATGCGGGTGGTGAAGGGCGTTTTTCGAGACTCCTCGAGGAGTAGGGTGATATCGAGTGCAGTACTAGTAGCGTGATGATTTGGGATTTCACCGCTCTAACCTCCGCAGCCGTTTTCA
pDAS000037事件详情:ad58-6372-1-1左边界侧翼(SEQ ID NO:441)
TTTTACAGTGTTAGAAGAAGTGGATGAAGCTGAAATTGAATTTTCAAACTCGTTCAGCTTGACTAGAGGTGGGAGAGAGTCAAAGCCTCCCATCAAGTACCAAAACATGGAATAGAAGACAGTCCGAGGGAGAGGAAACCGTGGCCGACGAGGCCGTGGCTCCTATCATTAACTAGTGTCTTTCTTACTATTAATGGTTTATTAAGTCTCAGCCTTTGTTGTTTCATTGGTTTGAGATTCACTCATACATGAAACTTGTTTCATTCCAGCTTTTCCAAACTATAAGAATATTTCCAATCTTATCTTGTAATAGTTTAAGTTTTAAATTGAAAGCCCTTAGTTCAAAAAACAAAAAAAAAAAATTAGCCCTTGAATTTATATATAATCACGACGGCCATATTTGGCAGCTACACTGATATGTTTTCAATTGGCTGACAGGCCTTGAGCAGGGTTTGCTGGGTATATTGGTAGGAAGATGTGTTGCGAGGTTGAAGCCTCATTTAGGCAATATAAACATGATCATTAGCGTTATGTCATTAGTTATACTTATACGTAGACTAAGTAACCCACTAAAGGTTGCTGATTCCTTTTGTATCGACTAACACATT GCGGACGTTTTTAATGTACTGAATTAACGCCGAATTGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCT GCAGGCATGCAAGCTTAGCTTGAGCTTGGATCAGATTGTCGTTTCCCGC
ad58-6372-1-1右边界侧翼(SEQ ID NO:442)
CATGTTCCTTTCAGAGGGGACTGTACTTCTGTAGATTACTTTCCCTCATTAACCAGATCTGGCCGGCCT ACCCAGCTTTCTTGTACAAAGTGGTGATAAACTATCAGTGTTTGACTGAATTTTAATTTCTAATTTTTGTAAAAAATTTGTATAACCTCAAATTATTAAAAGGCGGATTTTATTAGAATTATAACTAAATTATCTATAACTCCAAAATTTTGACAATCAATCATGTCTATATCTTTATTTTTTTGCTAAATTATCATGTCTATATCTTTTCTTTCTTCCAAACTTACTTGAGACTAAAAGTCTTTATAAATTTTGATAGGAGTTCCACACACAAACAAAAACAAAACAAATATTTTTCATCAAGGGATACTTATTTAACATCACGGATTCACAGTTTATTAACAAAAATCCAAACAAAGACTGAAAGACAGAAGATTCAATCTAACAATAGTCGGCAAACACCAGTGATTAACTAACGAAATAAATTAACAAGTGGTCAGATCTTCGGGAAA
pDAS000037事件详情:ad58-6620-4-1左边界侧翼(SEQ ID NO:443)
TAATTTCATTTTCGTCATTTTGGTAAAGTAACAAAAGACAGAATATTGGTTAGTCGTGTTGGTTAGGAATAAAATAAAGAACGTGGACATCGTGGAATAAAAATATTCAGACAAGGAAACTAACAATAAAACAGTAATGAACATGGTTCTGAATCTCATCTTTGTGTATCTCCAATGGAATCCACCGCCACGAATCAGACTCCTTCTCCAAGCTCCACCGTCGACGATGACAATGGCGACGGTGTCTATACCGACGAATTTACCAAACTACCCCCGGACCCGGGGATCCTCTAGAGTCAA CAAATTGACGCTTAGACAACTTAATAACACATTGCGGACGTTTTTAATGTACTGAATTAACGCCGAATTGAATTCGA GCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCAAGCTTAGCTTGAGCTTGGATCAGATTGTC
ad58-6620-4-1右边界侧翼(SEQ ID NO:444)
CATAACCACCATCTCAAACAATAGAACTTCCTAAGTGAAGCAATGACTTCAAATCTACTTGAAGGCATG GAGTATAAGCCATGTTCCTTTCAGAGGGGACTGTACTTCTGTAGATTACTTTCCCTCATTAACCAGATCTGGCCGGC CTACCCAGCTTTCTTGTACAAAGTGGTGATAAACTATCAGTGTTTGAAATAATCGGATATTTAATTTTCTTAGACAGTTCATTAGTAGTTGATCTTAAACATTCACGTTTTATTTTCTTTTCTTTTCGAATGCTAGACTCTAGTTTGGTACCCATAGGATTCGAGTTACATGAAGCTATTGACACTGGGAGTGCTTCAAGATCTGTAAGAGGCAAAGATTCACAAACAGAACGTGATTTCTTGGATAGTGATGTGGAGATTGTGATAAGAACCAGCATGAGTATTACTTTTACTGCCCCTGCTGTGGTGAAGACATCACCAAAACAGTCAAGCTCGTGAAGAAATCAGATATTCAACCCGCAAAAAAATCTGACAATGCAAATAAACCTATTGACACTAAGAATGGTTCAAGATCCGAAGACAAGAAGACAAAAAATTTGTCCTGGCTCCCTGCTTATCTCCAGAAGCTGTTTCTTTCTGTTTATGGCCACATCAAAGACAAAGGTACCCTTTCTTTTGGTGCCTTTGGTGTGGACAGGTGTGATTGACTTTGGTTTCTTGGCAGATTCAGGCAAGATAGAGGTTGATTCAAAGTCAACTAACAATGATCTTGGTACCAATAGTGAGGA
pDAS000037事件详情:ad58-6620-17-1左边界侧翼(SEQ ID NO:445)
CCGCCTTGAACAACCGCTCCGCCGTTGCTCAGTACATTATCGAGGTTACCAAAAAGTTCAATCCTTTATGCTTGTTTTGGCGTGTGATTCGTTACGAATGAGTAAAATTGATTTGGTTTTTTTCTTTGAACAGCATGGTGGAGATGTGAATGCGACGGATCATACGGGGCAGACTGCGTTGCATTGGAGTGCGGTTCGTGGTGCGGTGCAAGTTGCGGAGCTTTTGCTTCAAGAGGGTGCAAGGGTTGATGCTACGGATATGTATGGATATCAGGTTCTAACCACTTCCTCTTTCTTTGTGGAGATTGTCTTTTTGTTTCAATGCTAGTCAACTTCTTTCTTTCTTTCACAAAACTAAGTAGTATTGCTTGTTTTGTTGTCGTTGCATTTTTTCTTATGGCTGTGTTCTGAGGTTCATGTAGGTATATAAGCACTTCGTACTTTGCCACTTGTTTCATTTAGGCAACATTGTGCACATATCTAAGTAGTTGGTCTTTGTAAAATTAGTTTGTTTGTCTTCAAAGTATATTGAGCAGTTTCATGACTCATTATTCAAAGGTTTGTCTAAATTAGAGAGAACTTTCATTTTGCCTGGATTTAATCAGCATTTAGAATGTTTATAGCGATATCATTTTTAGTTGAAAAAATCTCAACAAATTGACGCTTAGACAACTTAATAACACAT TGCGGACGTTTTTAATGTACTGAATTAACGCCGAATTGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACC TGCAGGCATGCAAGCTTAGCTTGAGCTTGGATCAGATTGTCGTTTC
ad58-6620-17-1右边界侧翼(SEQ ID NO:446)
GTATAAGCCATGTTCCTTTCAGAGGGGACTGTACTTCTGTAGATTACTTTCCCTCATTAACCAGATCTG GCCGGCCTACCCAGCTTTCTTGTACAAAGTGGTGATAAACTATCAGTGTTAGATCCCCGACCGACCGCCCATCCTGGACGGCCTCGTGCATGCTGATGTTGTCAAAATCTTAGGATCCAATGAGTTTATCAGGTATACTTCTATCATGTATTGCTTGAGATTTTGGAGTGTTAGTAAAGATTTCAATAAAAGAATTTTTTCAAACAAAATTTTGGGGGCTTGAAGCTAATGTTTGGAAATATGTAACGGAGTTTAAATCTTTTGGCAGGCCTATATATGCGGGAAACGCCTTGTGTAGAGTTCGCTATACTGGTGCTGGTCCTTGTGTGTTGACTATTAGAACTACATCTTTTCCTGTTACCCCAATAACTGAGTCAAAGAAAGCTACTATCTCTCAGATTGATCTCTCGAAATTCAAAGAAGGTTTGTTTAGTATTATTCTCTTGTGCATAGCCTTTTTGSTTTTTTTTTTTTTATAAAAAAAGTTGAGTATGCTTATTGCCCATTGC
ETIP作图
对于包含单拷贝ETIP插入的每个转基因事件,手工装配后取侧翼序列并用作局部BLAST分析的查询。此过程鉴定出总共8株具有单拷贝整合的植物(表16和表17)。从NCBIGSS数据库下载来自甘蓝的595,478个基因组衍生鸟枪序列的集合,并格式化为核苷酸BLAST数据库。然后将侧翼ETIP序列与数据库进行BLASTn比较,并且手工检查所有匹配。然后从甘蓝数据库取对于侧翼ETIP序列最显著的序列匹配,并针对在线芜菁基因组序列(http://brassicadb.org/brad/blastPage.php)进行比对,其中也找回了基因组中具有最显著序列匹配的位置。在只有5’或3’侧翼序列提供与甘蓝基因组序列的显著匹配的情况中,假定未比对或未匹配序列或者鉴定来自数据库的丢失序列或者具有在ETIP整合期间生成的显著基因组重排。对于8株单拷贝ETIP植物中的每一个,对于根据分析生成显著BLASTn匹配的样品,然后在SequencherTMv5.0软件(Gene Codes Corp.,Ann Arbor,MI)中手工比对侧翼ETIP序列,最显著的甘蓝GSS匹配序列连同来自芜菁基因组的最显著匹配序列。然后比较3种序列,将来自二倍体芸苔物种任一、与侧翼ETIP相比最相似的序列指定为ETIP位于的基因组。对于大多数样品而言,两种二倍体芸苔基因组序列之间确实存在显著的变异,而且油菜衍生侧翼ETIP序列显示与二倍体序列之一或另一主要相关。然而,也有这样的情况,其中二倍体之间的序列变异不够,而且连锁群指派可以是有可能的但亚基因组指派是不可能的。然后从芜菁基因组序列的位置预测特定基因组位置。在ETIP鉴定为整合入甘蓝C基因组的情况中,用Parkin et al.(2005)Genetics 171:765-781中描述的二倍体芸苔基因组之间的比较同线性来推测进入油菜C亚基因组的基因组位置。另外,将已鉴定的序列与拟南芥基因组编码序列(TAIR 9 CDS,自http://arabidopsis.org/index.jsp下载)进行BLASTn比较,并鉴定遭到破坏的任何基因序列的身份,以及依照Schranz et al.(2006,11)Trend inPlant Science 11:535-542中描述的拟南芥芸苔同线性确认基因组位置。
表16:这些上述序列的BLAST搜索和位置预测(油菜基因组中的预测位置)。
表17:来自两种构建物pDAS000036和37的含单拷贝ETIP的植物的描述,针对甘蓝基因组序列数据库的BLASTn结果,通过拟南芥基因比较鉴定的基因序列的潜在破坏和预测的基因组位置。
经先前所述方法使用纯合子事件生成原生质体。随后用设计成靶向掺入ETIP序列内的锌指结合位点的锌指核酸酶和与ETIP的特定区域共享同源性的供体质粒共转化原生质体。锌指核酸酶切割ETIP基因座,而供体质粒经同源性定向修复整合在油菜细胞的基因组内。作为供体质粒整合的结果,部分DS-red转基因修复成全长DS-red转基因。通过FACS方法使用现今完全可操作的DS-red转基因的表达分选原生质体细胞。使用实施例7中所述FACS方法分选推定转基因植物,并将分离的原生质体再生成成熟植物。使用分子确认方法确认ETIP靶向植物内供体质粒的整合。照此,ETIP基因座充当供体多核苷酸序列的基因靶向整合的位点特异性基因座。
基因组靶向位置提供不改变植物正常表型的基因组位置。当ETIP事件与对照植物比较时,转基因靶定在ETIP内的产生事件呈现出没有农艺学上有意义的非预定差异。另外,整合在ETIP基因座内的转基因的蛋白质表达水平强劲表达,而且在多个基因组位置间是一致且稳定的。已公开的基因组序列SEQ ID NO:431至SEQ ID NO:446提供芸苔基因组内可靶定用于整合包含转基因的基因表达盒的基因组位置。
用ZFN介导的DS-RED同源重组靶向ETIP系
获得含来自pDAS000036的T链插入物的芸苔系,并经分子表征确认包含全长、单拷贝T链。此芸苔事件标注为pDAS000036–88,并经由先前描述的方法用于生成原生质体。分离原生质体,并随后用设计成靶向掺入ETIP序列内的锌指结合位点的锌指核酸酶pDAS000074(图25)或pDAS000075(图26)和与ETIP的特定区域共享同源性的供体质粒pDAS000064,pDAS000068,pDAS000070,或pDAS000072(分别见图27,图28,图29,和图30)一起共转化约50,000个芸苔原生质体细胞。图19和图20图解说明经锌指核酸酶介导的同源重组导致Ds-red转基因位点特异性整合的同源性定向修复。锌指核酸酶设计成在限定的锌指结合序列处切割ETIP基因座,由此在基因组内产生双链断裂。接着,供体质粒经同源性定向修复整合在油菜原生质体细胞的基因组内。供体质粒的内含子-1和内含子-2区与ETIP基因座的相应内含子-1和内含子-2区共享同源性。作为供体质粒整合的结果,部分DS-red转基因修复成全长、高表达DS-red转基因。用上述FACS方法使用完全可操作的DS-red转基因的表达分选原生质体细胞。照此,ETIP基因座充当供体多核苷酸序列的靶向整合的位点特异性基因座。最后,可分选分离的原生质体并再生成成熟植物。可使用分子确认方法确认ETIP靶定植物内供体质粒的整合。
将供体质粒DNA和ZFN质粒DNA以各种浓度混合并用于转染含有事件pDAS000036–88的芸苔原生质体细胞,使用先前描述的FACS转染分选转基因原生质体细胞。表18描述了各项转染实验和用于转染包含事件pDAS000036–88的芸苔原生质体的DNA浓度。经先前描述的方法分离和制备ZFN和供体质粒DNA用于转染。
表18:用于ETIP靶向实验的供体质粒和锌指核酸酶构建物。以供体对锌指核酸酶的指示比例使用DNA浓度,每次转染总浓度30微克质粒DNA。
转染实验完成后,将原生质体在室温温育48小时,并用上述FACS方案进行分选。独立分选每一项实验,并经表达DS-red转基因的各个事件的鉴定确认锌指介导的转基因渐渗。图21-24显示FACS分选的结果。根据图表中所示结果,产生了包含完整的完全整合的DS-red转基因的多个事件。这些多个Ds-Red事件是锌指核酸酶介导的供体DNA构建物在ETIP基因组基因座内整合的结果。此位点特异性整合造成了高表达的、完整拷贝的Ds-Red转基因。Ds-Red转基因表达的频率范围为约0.03-0.07%的总的芸苔原生质体细胞(约50,000)。然而,锌指核酸酶介导的供体DNA构建物整合在ETIP基因组基因座内的转染效率的频率则高得多,范围为约0.07-0.64%。
图21显示共转化供体质粒和ZFN质粒的转染的结果。顶部图,其中以26μg对4μg的质粒DNA比共转化供体pDAS000064和锌指核酸酶pDAS000074,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.03%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转化只有约10-30%的这些芸苔原生质体细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.22-0.07%。类似地,底部图,其中以26μg对4μg的质粒DNA比共转化供体pDAS000064和锌指核酸酶pDAS000075,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.03%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转染只有约10-30%的这些细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.26-0.08%。锌指介导的同源性定向修复的结果显著高于阴性对照实验,其中约50,000个原生质体中只有一个鉴定为具有红色荧光,由此导致0.00%的重组频率,如图20中所示。
图22显示共转化供体质粒和ZFN质粒的转染的结果。顶部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000068和锌指核酸酶pDAS000074,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.03%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转化只有约10-30%的这些芸苔原生质体细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.22-0.07%。类似地,底部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000068和锌指核酸酶pDAS000075,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.04%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转染只有约10-30%的这些细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.38-0.12%。锌指介导的同源性定向修复的结果显著高于阴性对照实验,其中约50,000个原生质体中只有一个鉴定为具有红色荧光,由此导致0.00%的重组频率,如图20中所示。
图23显示共转化供体质粒和ZFN质粒的转染的结果。顶部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000070和锌指核酸酶pDAS000074,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.07%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转化只有约10-30%的这些芸苔原生质体细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.64-0.21%。类似地,底部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000070和锌指核酸酶pDAS000075,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.04%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转染只有约10-30%的这些细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.34-0.11%。锌指介导的同源性定向修复的结果显著高于阴性对照实验,其中约50,000个原生质体中只有一个鉴定为具有红色荧光,由此导致0.00%的重组频率,如图20中所示。
图24显示共转化供体质粒和ZFN质粒的转染的结果。顶部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000072和锌指核酸酶pDAS000074,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.07%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转化只有约10-30%的这些芸苔原生质体细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.62-0.20%。类似地,底部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000072和锌指核酸酶pDAS000075,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.05%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转染只有约10-30%的这些细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.44-0.14%。锌指介导的同源性定向修复的结果显著高于阴性对照实验,其中约50,000个原生质体中只有一个鉴定为具有红色荧光,由此导致0.00%的重组频率,如图20中所示。
转移选定的外植体,并在含膦丝菌素的再生培养基上培养。培养期后,将存活的外植体转移至伸长培养基和根诱导培养基进行培养和植物发育。将由已发育的根和芽结构组成的完整植物转移至土壤中,并在温室中进一步繁殖。组织培养过程利用如上文先前所述培养基和培养条件。从组织培养过程产生的植物的结果显示于下文表19中。
表19:组织培养过程的结果。
芸苔中ETIP的FAD2A整合的分子确认
使用DNeasy Plant Mini试剂盒TM(Qiagen)依照制造商的说明书从所有推定转基因植物的叶组织提取基因组DNA,不同的是在80μl AE缓冲液中对组织进行洗提。将30mg来自再生植物的年轻叶组织在液氮中速冻,之后研磨成粉。
使用三次独立的测定法实施FAD2A基因座的分子表征。使用下述对照设计和优化测定法;包含单一随机整合转基因的已表征转基因事件,具有5个随机整合转基因的已表征转基因事件,野生型芸苔栽培品种DH12075植物和非模板对照反应。一起考虑来自三项下述分子分析的结果以提供关于ETIP经HDR在FAD2A处整合的证据。
通过实时聚合酶链式反应鉴定转基因整合
使用对hph(也称作hpt)靶基因(SEQ ID NO:447,hpt F791,5'CTTACATGCTTAGGATCGGACTTG 3';SEQ ID NO:448,hpt R909,5'AGTTCCAGCACCAGATCTAACG3';SEQ ID NO:449,hpt Taqman 872,5'CCCTGAGCCCAAGCAGCATCATCG 3'FAM)(图31)和编码高迁移率组蛋白质I/Y(HMG I/Y)的参照基因(SEQ ID NO:450,F,5'CGGAGAGGGCGTGGAAGG3';SEQ ID NO:451,R,5'TTCGATTTGCTACAGCGTCAAC 3';SEQ ID NO:452,探针,5'AGGCACCATCGCAGGCTTCGCT 3'HEX)特异性的引物分析每株植物的四份复制品。使用以下条件扩增反应:95℃ 10分钟,接着是40个循环的95℃ 30秒,60℃ 1分钟,在每次退火步骤结束时捕捉扩增数据。使用ΔCq方法计算拷贝数,其中ΔCq=Cq(靶基因)–Cq(参照基因)。Livak,K.J.and T.D.Schmittgen,Analysis of relative gene expression data usingreal-time quantitative PCR and the 2(-Delta Delta C(T))Method.Methods,2001.25(4):p.402-8。认为具有hph和HMG I/Y扩增且拷贝数为0.5或更多的植物是转基因的,而拷贝数≥0.5且≤1.2的植物评分为推定单拷贝。用FastStart Universal Probe Master(ROX)(Roche,Basel,Switzerland)在BioRad CFX96 TouchTM实时PCR检测系统上实施扩增。
遭到破坏的FAD2A ZFN位点的检测
在遭到破坏的基因座测试中对每株植物分析内源靶扩增的存在和缺失,这是显性测定法。该测定法是Green I qPCR测定法并且是单路的,但是在同一PCR板上同时运行每一项反应,靶向内源基因座(FAD2A/2C.RB.UnE.F1,SEQ ID NO:453,5’CTTCCACTCCTTCCTCCTCGT*C 3’和FAD2A/2C.RB.UnE.R1,SEQ ID NO:454,5’GCGTCCCAAAGGGTTGTTGA*G 3’)和ZFN基因座(ZFN pDAB104010在此结合并切割基因组的基因座)(FAD2A.UnE.F1,SEQ ID NO:455,5’TCTCTACTGGGCCTGCCAGGG*C 3’和FAD2A.UnE.R1,SEQ ID NO:456,5’CCCCGAGACGTTGAAGGCTAAGTACAA*A 3’)(图32)。使用以下条件扩增两对引物:98℃30秒,接着是35个循环(98℃10秒,65℃20秒,72℃90秒),然后接着是95℃10秒,然后进行50℃至95℃的解链分析,每0.05秒升高0.5℃,并且在每次升高时一个平板读数。反应条件列于表20中。
表20:用于PCR扩增的单一反应试剂成分和条件。
反应成分 |
体积(μl) |
10mM dNTP |
0.40 |
5X Phusion HF缓冲液 |
4.00 |
Phusion Hot Start II高保真DNA聚合酶(2U/μl)(Thermo Scientific) |
0.25 |
正向引物10μM |
0.40 |
反向引物10μM |
0.40 |
1:10000稀释的SYBR Green I染料(Invitrogen) |
1.00 |
分子生物学级别的H2O |
11.55 |
基因组DNA模板(约20ng/μl) |
2.00 |
总体积 |
20.00 |
具有内源靶扩增但没有ZFN靶扩增的植物评分为对于遭到破坏的基因座测试呈阳性,而且认为具有遭到破坏的ZFN基因座。当FAD2A基因座处的两个等位基因上的ZFN结合位点均遭到破坏时,此测定法认为是阳性的。
经同源性定向修复在FAD2A处的转基因整合的PCR检测
使用终点用PCR引物分析每一个推定植物转化体,所述引物设计成扩增转基因靶hph(hph_ExoDigPC_F1,SEQ ID NO:457,5’TTGCGCTGACGGATTCTACAAGGA 3’和hph_ExoDigPC_R1,SEQ ID NO:458,5’TCCATCAGTCCAAACAGCAGCAGA 3’),FAD2A内源基因座(FAD2A.Out.F1,SEQ ID NO:459,5’CATAGCAGTCTCACGTCCTGGT*C 3’和FAD2A.Out.Rvs3,SEQID NO:460,5’GGAAGCTAAGCCATTACACTGTTCA*G 3’),跨越经HDR插入FAD2A基因座的任何转基因的5’端,位于进入FAD2A基因座的转基因上游的区域(FAD2A.Out.F1,SEQ ID NO:461,5’CATAGCAGTCTCACGTCCTGGT*C 3’和QA520,SEQ ID NO:462,5’CCTGATCCGTTGACCTGCAG 3’)和跨越经HDR插入FAD2A基因座的任何转基因的3’端,位于进入FAD2A基因座的转基因下游的区域(QA558,SEQ ID NO:463,5’GTGTGAGGTGGCTAGGCATC 3’和FAD2A.Out.Rvs3,SEQ IDNO:464,5’GGAAGCTAAGCCATTACACTGTTCA*G 3’)(图33)。使用以下条件扩增所有引物对,98℃ 30秒,接着是35个循环(98℃ 10秒,65℃ 20秒,72℃ 90秒)。反应试剂条件如表21中所述。
表21:用于PCR扩增的单一反应试剂成分和浓度。
反应成分 |
体积(μl) |
5x Phusion HF缓冲液 |
6.00 |
10mM dNTP |
0.60 |
正向引物10μM |
0.60 |
反向引物10μM |
0.60 |
Phusion Hot Start II高保真DNA聚合酶(2U/μl)(Thermo Scientific) |
0.25 |
分子生物学级别的H2O |
19.95 |
基因组DNA模板(约20ng/μl) |
2.00 |
总体积 |
30.0 |
5’转基因-基因组侧翼靶的扩增和/或3’转基因-基因组侧翼靶的扩增指示推定插入事件。必须注意,由于pDAS000130盒中大约1,000bp FAD2A同源臂(包含与ZFN切割位点上游和下游紧接的FAD2A区域具有100%序列同一性的多核苷酸序列),PCR反应易出现假阳性PCR产物扩增,这是由于脱靶ETIP整合事件的扩增造成的PCR嵌合现象。hph靶的扩增确认转基因整合已发生。FAD2A靶的扩增提示FAD2A基因座是完整的或只包含部分插入。由于ETIP的大小(ETIP盒11,462bp或在包括FAD2A同源臂和ETIP盒的情况中13,472bp),预期当完整ETIP整合入FAD2A基因座时,FAD2A引物不会扩增产物。
FAD2A编辑的Southern检测
对于具有5’基因组-转基因侧翼靶产物扩增和/或3’转基因-基因组侧翼靶扩增的植物,或没有ZFN基因座靶扩增的植物,或二者的植物进行Southern分析以检测FAD2A基因座处的转基因整合。使用改良的CTAB方法(Maguire,T.L.,G.G.Collins,and M.Sedgley,Amodified CTAB DNA extraction procedure for plants belonging to the familyproteaceae.Plant Molecular Biology Reporter,1994.12(2):p.106-109)从5g叶组织纯化基因组DNA。接着,用Kpn1-HF(New England BioLabs)消化12μg基因组DNA,并通过在0.8%琼脂糖凝胶上电泳将消化片段分开,之后使用标准Southern印迹方案转移至膜。使用针对FAD2A 5’靶区(F,SEQ ID NO:465,5'AGAGAGGAGACAGAGAGAGAGT 3'和R,SEQ ID NO:466,5'AGACAGCATCAAGATTTCACACA 3'),FAD2A 3’靶区(F,SEQ ID NO:467,5'CAACGGCGAGCGTAATCTTAG 3'和R,SEQ ID NO:468,5'GTTCCCTGGAATTGCTGATAGG 3')和hph(F,SEQ ID NO:469,5'TGTTGGTGGAAGAGGATACG 3'和R,SEQ ID NO:470,5'ATCAGCAGCAGCGATAGC 3')的引物产生探针,用以使用DIG Easy Hyb(Roche,South San Francisco,CA)依照制造商的说明书检测FAD2A基因座内ETIP的存在(图34)。对于FAD2A 5’区在42℃实施杂交,对于FAD2A 3’区在45℃实施杂交,对于检测hph在42℃实施杂交。
以特定次序探查膜结合基因组DNA;首先探查FAD2A 5’序列,然后探查FAD2A 3’序列,最后探查hph序列(图34)。对此的合理情况如下。第一种探针(FAD2A 5’)是诊断性探针,若ETIP经完美HDR整合入FAD2A,则在膜上会可见5,321bp片段。产生的条带大小易于在电泳期间辨别,并会位于接近DIG标记的Roche DNA分子量标志物(Roche,Indianapolis,IN)中的5,148bp片段。膜的第二种探针是FAD2A 3’探针,而且经过编辑的植物会具有22,433bp片段,而未经编辑的植物会具有16,468bp片段。用FAD2A 3’探针鉴定的同一22,433bp片段也应受到hph探针结合和鉴定。在凝胶上难以区分这些片段,因为它们极其大,而且可能难以确定在DIG标记的Roche DNA分子量标志物中最大的21,226bp片段之上或之下出现的片段之间的任何差异。照此,这些探针提供了可加强鉴定ETIP经同源性定向修复(HDR)整合入FAD2A的证据,这通过使用FAD2A 5’探针显现5kb片段来进行。限制酶KpnI是适于在此测定法中使用的唯一限制性内切核酸酶,因为KpnI位点出现在ETIP盒中的单一位点,并且存在于FAD2A ZFN基因座的两个位点中(as KpnI sites occurred in a singlelocus of the cut the ETIP cassette in a single locus,and was present in twosites of the FAD2A ZFN locus)。一个位点位于FAD2A同源臂的上游,而第二个位点位于下游。另外,KpnI不是甲基化敏感的,并且可作为具有提高的保真性的重组酶获得(NewEngland Biolabs)。
分子和Southern分析的结果
在转染、培养和选择后,将转基因植物转移至土壤。自此过程,139株植物存活,并进行组织采样用于gDNA提取和分析。对全部139株植物分析拷贝数估算。在这些139株植物中,56株是ETIP阳性的,而且56株阳性植物中11株具有推定单拷贝整合(图35)(表22)。在56株ETIP整合阳性的植物中,FAD2A 5’-基因组-转基因侧翼序列的扩增出现于7株植物中。FAD2A 3’-转基因-基因组侧翼序列的扩增不出现于ETIP整合阳性的56株植物中的任一个。此外,在转基因整合阳性的56株植物中,11株植物对遭到破坏的基因座qPCR测试是阳性的。将对于FAD2A 5’基因组-转基因侧翼序列的扩增阳性和/或对于遭到破坏的基因座qPCR测试阳性的14株植物进行Southern分析,使用上述3种探针。当使用FAD2A 5’探针,FAD2A 3’和hph探针探查时,在进行Southern分析的14株植物中,所有植物均显示FAD2A基因座内的部分整合,但这些植物无一显示FAD2A基因座处经HDR的完整全长ETIP整合的证据。没有条带看起来是i)比野生型更大和ii)与用FAD2A 3’探针探查时对那些样品观察到的条带相同(表22)。
表22:来自ETIP整合分析的结果的概述。
在土壤中存活的植物的数目 |
139 |
采样的植物的数目 |
139 |
完成qPCR拷贝数分析的植物的数目 |
139 |
ETIP整合阳性的植物的数目 |
56 |
包含推定单拷贝插入物的植物的数目 |
11 |
ETIP/FAD2输入-输出5'反应的数目 |
7(来自56株) |
ETIP/FAD2输入-输出3'反应的数目 |
0(来自56株) |
遭到破坏的qPCR测试的基因座的数目 |
9(来自56株) |
ETIP中靶(Southern) |
0(来自14株) |
用pDAS000130和pDAB104010转化的ETIP转基因芸苔的结果
经pDAS000130和pDAB104010转化产生的转基因油菜事件导致来自pDAS000130的ETIP多核苷酸序列的单拷贝全长T链插入FAD2A基因座内的整合。完全表征3-4例事件,并确认包含整合的ETIP。使用输入-输出PCR扩增方法完成确认,并经Southern印迹进一步验证。将选定T0事件培养至T1发育阶段。重筛选T1植物以测定整合T链的接合性。将筛选事件归类为纯合子的,半合子的,或无效的。
经先前所述方法使用纯合子事件生成原生质体。随后用设计成靶向掺入ETIP序列内的锌指结合位点的锌指核酸酶和与ETIP的特定区域共享同源性的供体质粒共转化原生质体,其中供体经HDR机制整合在ETIP内。同样地,随后用设计成靶向掺入ETIP序列内的锌指结合位点的锌指核酸酶和与ETIP的特定区域不共享同源性的供体质粒共转化原生质体,其中供体经非同源末端连接机制整合在ETIP内。锌指核酸酶切割ETIP基因座,而供体质粒经同源性定向修复或非同源末端连接整合在油菜细胞的基因组内。作为供体质粒整合的结果,部分DS-red转基因修复成全长DS-red转基因。通过FACS方法使用现今完全可操作的DS-red转基因的表达分选原生质体细胞。使用实施例7中所述FACS方法分选推定转基因植物,并将分离的原生质体再生成成熟植物。使用分子确认方法确认ETIP靶向植物内供体质粒的整合。照此,ETIP基因座充当供体多核苷酸序列的基因靶向整合的位点特异性基因座。
用锌指核酸酶和pDAS000271-pDAS000275ETIP构建物转化的ETIP转基因芸苔的结果
经ETIP和锌指核酸酶构建物转化产生的转基因油菜事件导致来自pDAS000273或pDAS000275的ETIP多核苷酸序列的单拷贝全长T链插入FAD3A基因座内,来自pDAS000271、pDAS000272或pDAS000274的ETIP多核苷酸序列的单拷贝全长T链插入FAD3C基因座的整合。完全表征3-4例事件,并确认包含整合的ETIP。使用输入-输出PCR扩增方法完成确认,并经Southern印迹进一步验证。将选定T0事件培养至T1发育阶段。重筛选T1植物以测定整合T链的接合性。将筛选事件归类为纯合子的,半合子的,或无效的。
经先前所述方法使用纯合子事件生成原生质体。随后用设计成靶向掺入ETIP序列内的锌指结合位点的锌指核酸酶和与ETIP的特定区域共享同源性的供体质粒共转化原生质体。锌指核酸酶切割ETIP基因座,而供体质粒经同源性定向修复整合在油菜细胞的基因组内。作为供体质粒整合的结果,部分DS-red转基因修复成全长DS-red转基因。通过FACS方法使用现今完全可操作的DS-red转基因的表达分选原生质体细胞。使用实施例7中所述FACS方法分选推定转基因植物,并将分离的原生质体再生成成熟植物。使用分子确认方法确认ETIP靶向植物内供体质粒的整合。照此,ETIP基因座充当供体多核苷酸序列的基因靶向整合的位点特异性基因座。
实施例7:基于FACS的原生质体细胞分选
使用BD Biosciences Influx-Cell分选仪TM(San Jose,CA)经FACS介导的细胞分选来分选用DS-Red对照构建物pDAS000031转染的油菜原生质体。如实施例3所述分离并转染原生质体细胞。在用pDAS000031转染细胞后,使用FACS分选仪用表23中所述条件分选细胞。
表23:用于分选用pDAS000031转染的原生质体细胞的条件。
分选和分离表达DS-red转基因的原生质体。使用分选仪对FACS分离的原生质体计数。在FACS分离后的第一天将约1x105至1.8x105个细胞放入24孔微量滴定板的一个孔中。将细胞转移至珠培养达5-20天。测试相似的条件,其中在FACS分离后的第二天将约1x104个细胞放置于2或4孔微量滴定板的一个孔中。测试的各种条件造成细胞以总分离原生质体细胞的95-98%的存活率回收。将FACS分选的原生质体细胞转移至珠培养达3-20天。将FACS分选的原生质体细胞在含1.5mg/mL潮霉素的培养基上使用上述方案再生成植物。经分子确认方案确认推定转基因植物包含来自pDAS000031的完整T链插入物。
用ZFN介导的DS-RED同源重组靶向ETIP系
获得含来自pDAS000036的T链插入物的芸苔系,并经分子表征确认包含全长、单拷贝T链。此芸苔事件标注为pDAS000036–88,并经由先前描述的方法用于生成原生质体。分离原生质体,并随后用设计成靶向掺入ETIP序列内的锌指结合位点的锌指核酸酶pDAS000074(图25)或pDAS000075(图26)和与ETIP的特定区域共享同源性的供体质粒pDAS000064,pDAS000068,pDAS000070,或pDAS000072(分别见图27,图28,图29,和图30)一起共转化约50,000个芸苔原生质体细胞。图19和图20图解说明经锌指核酸酶介导的同源重组导致Ds-red转基因位点特异性整合的同源性定向修复。锌指核酸酶设计成在限定的锌指结合序列处切割ETIP基因座,由此在基因组内产生双链断裂。接着,供体质粒经同源性定向修复整合在油菜原生质体细胞的基因组内。供体质粒的内含子-1和内含子-2区与ETIP基因座的相应内含子-1和内含子-2区共享同源性。作为供体质粒整合的结果,部分DS-red转基因修复成全长、高表达DS-red转基因。用上述FACS方法使用完全可操作的DS-red转基因的表达分选原生质体细胞。照此,ETIP基因座充当供体多核苷酸序列的靶向整合的位点特异性基因座。最后,可分选分离的原生质体并再生成成熟植物。可使用分子确认方法确认ETIP靶定植物内供体质粒的整合。
将供体质粒DNA和ZFN质粒DNA以各种浓度混合并用于转染含有事件pDAS000036–88的芸苔原生质体细胞,使用先前描述的FACS转染分选转基因原生质体细胞。表24描述了各项转染实验和用于转染包含事件pDAS000036–88的芸苔原生质体的DNA浓度。经先前描述的方法分离和制备ZFN和供体质粒DNA用于转染。
表24:用于ETIP靶向实验的供体质粒和锌指核酸酶构建物。以供体对锌指核酸酶的指示比例使用DNA浓度,每次转染总浓度30微克质粒DNA。
转染实验完成后,将原生质体在室温温育48小时,并用上述FACS方案进行分选。独立分选每一项实验,并经表达DS-red转基因的各个事件的鉴定确认锌指介导的转基因渐渗。图21-24显示FACS分选的结果。根据图表中所示结果,产生了包含完整的完全整合的DS-red转基因的多个事件。这些多个Ds-Red事件是锌指核酸酶介导的供体DNA构建物在ETIP基因组基因座内整合的结果。此位点特异性整合造成了高表达的、完整拷贝的Ds-Red转基因。Ds-Red转基因表达的频率范围为约0.03-0.07%的总的芸苔原生质体细胞(约50,000个)。然而,锌指核酸酶介导的供体DNA构建物整合在ETIP基因组基因座内的转染效率的频率则高得多,范围为约0.07-0.64%。
图21显示共转化供体质粒和ZFN质粒的转染的结果。顶部图,其中以26μg对4μg的质粒DNA比共转化供体pDAS000064和锌指核酸酶pDAS000074,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.03%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转化只有约10-30%的这些芸苔原生质体细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.22-0.07%。类似地,底部图,其中以26μg对4μg的质粒DNA比共转化供体pDAS000064和锌指核酸酶pDAS000075,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.03%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转染只有约10-30%的这些细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.26-0.08%。锌指介导的同源性定向修复的结果显著高于阴性对照实验,其中约50,000个原生质体中只有一个鉴定为具有红色荧光,由此导致0.00%的重组频率,如图20中所示。
图22显示共转化供体质粒和ZFN质粒的转染的结果。顶部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000068和锌指核酸酶pDAS000074,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.03%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转化只有约10-30%的这些芸苔原生质体细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.22-0.07%。类似地,底部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000068和锌指核酸酶pDAS000075,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.04%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转染只有约10-30%的这些细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.38-0.12%。锌指介导的同源性定向修复的结果显著高于阴性对照实验,其中约50,000个原生质体中只有一个鉴定为具有红色荧光,由此导致0.00%的重组频率,如图20中所示。
图23显示共转化供体质粒和ZFN质粒的转染的结果。顶部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000070和锌指核酸酶pDAS000074,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.07%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转化只有约10-30%的这些芸苔原生质体细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.64-0.21%。类似地,底部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000070和锌指核酸酶pDAS000075,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.04%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转染只有约10-30%的这些细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.34-0.11%。锌指介导的同源性定向修复的结果显著高于阴性对照实验,其中约50,000个原生质体中只有一个鉴定为具有红色荧光,由此导致0.00%的重组频率,如图20中所示。
图24显示共转化供体质粒和ZFN质粒的转染的结果。顶部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000072和锌指核酸酶pDAS000074,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.07%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转化只有约10-30%的这些芸苔原生质体细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.62-0.20%。类似地,底部图,其中以28μg对2μg的质粒DNA比共转化供体pDAS000072和锌指核酸酶pDAS000075,导致供体DNA构建物以约50,000个芸苔原生质体细胞中约0.05%的重组频率经锌指核酸酶介导整合在ETIP基因组基因座内。实际上,重组频率要高得多。在转染实验期间提供的约50,000个芸苔原生质体细胞中,实际上转染只有约10-30%的这些细胞。照此,锌指核酸酶介导供体DNA构建物整合在ETIP基因组基因座内的实际转染效率的范围为约0.44-0.14%。锌指介导的同源性定向修复的结果显著高于阴性对照实验,其中约50,000个原生质体中只有一个鉴定为具有红色荧光,由此导致0.00%的重组频率,如图20中所示。
FACS分选方法直接可应用于筛选任何发荧光转基因序列,并用于分离在基因组基因座内ETIP区中的特定位点内经同源性介导的修复被发荧光转基因靶定的一部分油菜原生质体细胞。
实施例8:另外的ETIP设计
植物转化载体的构建
通过标准分子克隆方法构建(INVITROGEN)进入和目的载体,并用于产生最终的表达载体。进入载体(pDAB105852)包含RB7MAR序列(Hall et al.,1991)和eZFN4结合位点v1(美国专利公开文本No.20110191899)。另一进入载体(pDAB105853)包含表达盒,该表达盒包含稻遍在蛋白3(OsUbi3)启动子(Sivamani,E.and Qu,R.(2006)PlantMolecular Biology 60:225-239),黄色荧光蛋白(Phi YFP)标志物基因编码区(Shagin,D.A.(2004)Mol Biol Evol.21:841-50)(Evrogen,Moscow Russia)(其含有ST-LS1(Vancanneyt,G.(1990)Mol Gen Genet.220:245-50)内含子,接着是包含来自玉蜀黍过氧化物酶5基因的3’非翻译区(UTR)的片段(ZmPer5 3’UTR v2;美国专利No.6,699,984)),eZFN1结合位点,和工程化着陆垫(ELP1 HR2 v2)(美国专利公开文本No.20110191899)。别的进入载体(pDAB105850)包含在带内含子1的一拷贝玉蜀黍遍在蛋白1启动子(ZmUbi1启动子v8)(Christensen,A.H.and Quail,P.H.(1996)Transgenic Research 5:213-218;Christensen,A.H.(1992)Plant Molecular Biology 18:675-689)表达控制下的Cry34Ab1蛋白编码区(美国专利No.8,273,535),和包含来自马铃薯的StPinII 3’UTR的片段(An,G.(1989)Plant Cell.1:115-22)。另一种进入载体(pDAB105851)包含小麦过氧化物酶(TaPer)启动子(Hertig,C.(1991)Plant Mol Biol.16:171-4)和Cry35Ab1(美国专利公开文本No.20110191899)蛋白编码区,接着是包含来自马铃薯的StPinII 3’UTR的片段。
通过使用标准克隆方法和采用典型目的二元载体(pDAB109805)和如上所述的进入载体进行的重组反应,构建用于农杆菌介导的玉蜀黍胚胎转化的转化/表达载体。二元目的载体pDAB109805包含在甘蔗杆状病毒(SCBV)启动子表达控制下的除草剂耐性基因(芳基氧链烷酸双加氧酶(AAD-1);美国专利No.7,838,733);本质上如美国专利No.6,093,569中所述。使用包含来自玉蜀黍脂肪酶基因的3’UTR(ZmLip 3’UTR,美国专利No.7,179,902)的片段终止AAD-1 mRNA的转录。AAD-1的表达赋予针对除草化合物诸如氟吡甲禾灵和喹禾灵的耐性。使用重组反应使进入载体pDAB105852,pDAB105853,pDAB105850,和pDAB105851与目的载体pDAB109805重组以获得用作靶载体的表达载体pDAB105855(图36)。ETIP质粒pDAB105855包含靶DNA序列,其在T-DNA边界之间包含:RB7MAR序列/eZFN4结合位点v1,OsUbi3启动子/Phi YFP/ZmPer5 3’UTR v2/eZFN1结合位点/ELP1HR2 v2,ZmUbi1启动子v8/Cry34Ab1 v2/StPinII 3’UTR v2,TaPer启动子v3/Cry35Ab1 v5/StPinII 3’UTR v2,SCBV v2/AAD-1 v3/ZmLip 3’UTR v1。pDAB105855质粒是ETIP质粒,并用于整合在玉蜀黍基因组内。
锌指核酸酶(ZFN1)载体(pDAB105941;图37)包含在带内含子1的玉蜀黍遍在蛋白1启动子(ZmUbi1启动子v2)和ZmPer5 3’UTR v2表达控制下的ZFN1编码序列。供体载体(pDAB112366;图38)包含稻遍在蛋白3(OsUbi3)启动子的无启动子的内含子(rubi3内含子),接着是除草剂耐性基因(膦丝菌素乙酰基转移酶(PAT);Wehrmann et al.(1996)Nature Biotechnology 14:1274-1278),和ZmLip 3’UTR。这种没有活性启动子的供体构造不产生用于除草剂选择的PAT基因的信息。供体载体中的ZmLip 3’UTR后面是eZFN4和eZFN8结合位点,和ELP1 HR2 v2,如美国专利公开文本No.20110191899中所述的。供体(pDAB112366)中的5’rubi3内含子和3’ELP1 HR2 v2序列用于与靶(pDAB105855)的5’和3’同源性,用于基因打靶,用供体的PAT序列精确替换靶中的Phi YFP序列,产生由稻遍在蛋白3(OsUbi3)启动子驱动的功能性PAT,造成对基因打靶的阳性选择。
构建阳性PAT对照载体(pDAB112364),并用于随后的实验,其包含驱动除草剂耐性基因(膦丝菌素乙酰基转移酶(PAT))的稻遍在蛋白3(OsUbi3)启动子,接着是ZmLip 3’UTR。
根癌农杆菌的转化
将二元表达载体转化入根癌农杆菌菌株DAt13192三元体(国际专利公开文本No.WO 2012016222)。分离细菌菌落,然后分离二元质粒DNA并经限制酶消化确认。
农杆菌介导的转化
使用农杆菌介导的转化将上述转基因稳定整合入植物基因组并由此产生生成AAD-1的转基因玉蜀黍细胞,组织,和植物。采用超二元或二元转化载体的玉蜀黍转化方法是本领域已知的,例如描述于国际PCT公开文本No.WO2010/120452。经过转化的组织通过它们在含氟吡甲禾灵或双丙氨磷的培养基上生长的能力进行选择。
农杆菌培养开始
在根癌农杆菌宿主菌株DAt13192(WO 2012/016222A2)中提供了计划载体的甘油储液。将来自甘油储液的农杆菌培养物划线到含适当抗生素的AB基本培养基上并在20℃于黑暗中温育3天。然后将培养物划线到含抗生素的YEP培养基平板上并在20℃于黑暗中温育1天。
在实验那天,以对实验中的构建物数目恰当的体积制备接种培养基和乙酰丁香酮(Frame et al.(2011)Methods in Molecular Biology 710:327-341)的混合物,并吸量入无菌、一次性250mL烧瓶中。接种培养基含:2.2gm/L MS盐;1X ISU改良MS维生素(Frame etal.,ibid.);68.4gm/L蔗糖;36gm/L葡萄糖;115mg/L L-脯氨酸;和100mg/L肌肉-肌醇;pH5.4。将来自100%二甲亚砜中的1M储液的乙酰丁香酮加入含接种培养基的烧瓶中至终浓度200μM。
对于每种构建物,将来自YEP平板的满满的1或2个接种环的农杆菌在无菌、一次性50mL离心管中悬浮于15mL接种培养基/乙酰丁香酮混合物中,并在分光光度计中测量溶液于550nm的光密度(OD550)。然后使用另外的接种培养基/乙酰丁香酮混合物将悬浮液稀释至0.3-0.4的OD550。然后将农杆菌悬浮液管水平放置于设置为约75rpm的平台摇床上,室温振荡1-4小时,之后使用。
穗绝育和胚胎分离
于温室中产生来自玉蜀黍栽培品种B104的穗,并在授粉后10-12天收获。将收获的穗脱壳,并通过浸入商品化漂白剂的20%溶液(UltraGermicidal Bleach,6.15%次氯酸钠;加两滴TWEEN 20)中20分钟进行表面灭菌,接着在层流净化罩内用无菌去离子水漂洗3次。从每个穗无菌切下不成熟的合子胚(1.8-2.2mm长),并分配入一个或多个含2.0mL农杆菌悬浮液的微量离心管中,其中已加入2μL 10%BREAK-S233表面活性剂(Evonik Industries;Essen,Germany)。
农杆菌共培养
分离后,将胚胎在摇动平台上放5分钟。然后将管的内容物倒到共培养培养基平板上,其包含4.33gm/L MS盐;1X ISU改良MS维生素;30gm/L蔗糖;700mg/L L-脯氨酸;3.3mg/LDicamba于KOH中(3,6-二氯-邻-茴香酸或3,6-二氯-2-甲氧基苯甲酸);100mg/L肌肉肌醇;100mg/L酪蛋白酶水解物;15mg/L AgNO3;200μM乙酰丁香酮于DMSO中;和3gm/L琼脂(SIGMA-ALDRICH,植物细胞培养测试),pH 5.8。用无菌一次性转移吸量管去除液体农杆菌悬浮液,并将含胚胎的共培养平板放置于层流净化罩后部30分钟,盖微开,此后在显微镜的帮助下使用无菌镊子使胚胎的方向为盾片朝上。将平板放回层流净化罩后部再15分钟,盖微开。然后盖上平板,用3MTMMicroporeTM医用胶带密封,并放置于温箱内于25℃以大约60μEm-2sec-1光强度进行连续光照。
愈伤组织选择和转基因事件的再生
共培养期后,将胚胎转移至休息培养基,它包含4.33gm/L MS盐;1X ISU改良MS维生素;30gm/L蔗糖;700mg/L L-脯氨酸;3.3mg/L Dicamba于KOH中;100mg/L肌肉肌醇;100mg/L酪蛋白酶水解物;15mg/L AgNO3;0.5gm/L MES(2-(N-吗啉基)乙磺酸单水合物(PhytoTechnologies Labr.;Lenexa,KS);250mg/L头孢噻肟;和7.0gm/L琼脂;pH 5.8。将不超过36个胚胎转移至每块板中。将平板用MicroporeTM胶带包裹,并在27℃以大约50μmol m-2s-1光强度连续光照温育7-10天。然后将愈合胚胎(<18个/板)转移至选择培养基I,它由休息培养基(上文)构成,但只含6.5gm/L琼脂,并且视情况而定含100nM R-氟吡甲禾灵酸(0.0362mg/L;用于选择包含AAD-1基因的转化体)或5.0mg/L双丙氨磷(用于选择包含PAT基因的转化体)。双丙氨磷作为提供。将平板用MicroporeTM胶带包裹,并在27℃以约50μEm-2sec-1光强度持续光照7天。然后将愈合胚胎(<12个/板)转移至选择培养基II,它由休息培养基(上文)构成,但只含6.5gm/L琼脂,并且视情况而定含50nM R-氟吡甲禾灵酸(0.0181mg/L)或5.0mg/L双丙氨磷。包裹平板,并在27℃以大约50μEm-2sec-1光强度持续光照温育14天。
在此阶段将抗性愈伤组织(<9个/平板)转移至预再生培养基。预再生培养基含4.33gm/L MS盐;1X ISU改良MS维生素;45gm/L蔗糖;350mg/L L-脯氨酸;100mg/L肌肉肌醇;50mg/L酪蛋白酶水解物;1.0mg/L AgNO3;0.5gm/L MES;0.5mg/L萘乙酸于NaOH中;2.5mg/L脱落酸于乙醇中;1mg/L 6-苄氨基嘌呤;250mg/L头孢噻肟;5.5gm/L琼脂;及视情况而定50nM R-氟吡甲禾灵酸或3.0mg/L双丙氨磷;pH 5.8。包裹平板,并在27℃以大约50μEm-2sec-1光强度持续光照温育7天。然后将再生中的愈伤组织(<6个/平板)转移至PhytatraysTM(sigma-aldrich)中的再生培养基,并在28℃每天16小时光照/8小时黑暗下以大约150μmolm-2s-1光强度温育14天或直至幼苗发育。再生培养基含4.33gm/L MS盐;1X ISU改良MS维生素;60gm/L蔗糖;0.50gm/L MES;125mg/L头孢噻肟;5.5gm/L琼脂;和视情况而定50nM R-氟吡甲禾灵酸或3.0mg/L双丙氨磷;pH 5.8。然后分离具有初生根的小幼苗,并转移至无选择的伸长培养基(即无R-氟吡甲禾灵酸或双丙氨磷的再生培养基)供进一步生长。将约6cm或更高的生根小植株移植入土壤中,并转移至生长室使其受冷而变得耐寒(harden off)。
在温室内转移和建立T0植物供测定和种子生成
将通过其在视情况而定含氟吡甲禾灵或双丙氨磷的培养基上生长的能力而选择的经过转化的植物组织从PhytatraysTM移植至装满生长培养基(ProMix BX;Premier TechHorticulture)的小罐(T.O.Plastics,3.5”SVD),用humidome(Arco Plastics Ltd.)覆盖,然后在生长室(28℃白天/24℃晚上,16小时光周期,50-70%RH,200μEm-2sec-1光强度)中使其受冷而变得耐寒。当植物达到V3-V4期时,将它们移植入Sunshine Custom Blend 160土壤混合物中,并在温室中培养至开花(曝光类型:光合或同化;高光限制:1200PAR;16小时日长;27℃白天/24℃夜晚)。使用设计成检测转基因相对拷贝数的引物通过定量实时PCR测定法对推定转基因小植株分析转基因拷贝数,并将选择用于提升的单拷贝事件移植入5加仑罐中。定期观察以追踪任何异常表型。
在温室中生成T1S1半合子的不成熟的胚胎用于粒子轰击
将对于靶序列是转基因的T0植物自花授粉以获得T1种子。种植T1种子,并使用qPCR方法对植物分析靶转基因的接合性。将对于靶转基因是纯合的植物进一步提升供花粉生成。使用来自纯合靶植物的花粉回交B104玉米植物以获得T1S1半合子的不成熟的胚胎。将不成熟的胚胎用于用供体和ZFN1DNA进行的粒子轰击,测试基因打靶。
经微粒轰击靶向玉米不成熟胚胎
在微粒轰击前3天,从经过表面灭菌的穗分离1.5-2.2mm胚胎,并(盾片朝上)放置于N6基础培养基和维生素(Phytotechnology Laboratories,Shawnee Mission,KS)上,含2.0mg/L 2,4-D,2.8g/L脯氨酸,30g/L蔗糖,100mg/L酪蛋白酶水解物,100mg/L肌肉肌醇和4.25mg/L硝酸银,用2.5g/L Gelzan(Phytotechnology Laboratories,Shawnee Mission,KS)固化。在微粒轰击前4小时,将约35-40个胚胎(盾片朝上)放置于含相同培养基并添加36.4g/L山梨醇和36.4g/L甘露醇的100x 15mm陪替培养皿的中央。
如下制备用于DNA沉淀的微粒金(0.6微米,BioRad,Hercules,CA),即称出15mg放入无菌、硅化1.7mL微量离心管(Sigma-Aldrich,St.Louis,MO,T3406)内,并缓慢加入500μL冰冷的100%乙醇。在FS-14超声波水浴(Fisher Scientific,Nazareth,PA)中超声处理15秒后,允许金在室温沉降30分钟,之后使用MiniSpin(Eppendorf,Hauppauge,NY)以3,000rpm离心60秒。去除上清液后,加入1mL冰冷的无菌水,用吸量器上下混合,并容许沉降3-5分钟,之后以3,000离心60秒。再一次重复清洗步骤,之后将金悬浮于500μL冰冷的无菌水中。然后将经过清洗的金等分入分开的1.7mL无菌、硅化微量离心管(50μL每管),通过在管之间上下吸量小心地保持金混合良好。然后将经过清洗的金(约1.5mg每50μL)贮存于-20℃待用。
对于DNA沉淀,对于每10份待轰击的靶而言,融化一个在50μL水中含约1.5mg金的管,并在超声波水浴中超声处理15秒,然后放置于冰上。将质粒DNA(0.6μg ZFN+4.4μg供体)预混合于0.6mL微量离心管(FisherScientific,Nazareth,PA)中,并加入金悬浮液,温和上下吸取数次使混合彻底。加入50微升(50μL)冰冷的2.5M氯化钙,并通过上下吸量数次温和混合。然后加入20微升(20μL)冷的0.1M亚精胺,并通过上下吸量数次温和混合。然后盖上管,并放置于Vortex Genie 2(Scientific Instruments Inc.,Bohemia,NY)上混合(设置在‘shake 2’档)10分钟,之后将混合物沉降3-5分钟。以5,000rpm离心15秒后,小心去除上清液并加入250μL冰冷的100%乙醇,盖上管并用手剧烈混合使团粒离位。再次以5,000rpm离心15秒后,加入120μL冰冷的100%乙醇,盖上管并用手剧烈混合使团粒离位。
对于微粒轰击,将经过灭菌的宏载体(BioRad,Hercules,CA)安装入不锈钢架(BioRad,Hercules,CA)并高压灭菌。将10微升(10μL)金/DNA悬浮液均匀涂布在宏载体的中央,保证上下吸量以便混合良好,然后放置于一片无菌125mm Whatman#4滤纸(GEHealthcare,Buckinghamshire,UK)上,在140x 25mm玻璃陪替培养皿中的8筛网Drierite(W.A Hammond Drierite Co.,Xenia,OH)的床上。让金/DNA完全干燥约10分钟。通过在异丙醇中浸泡几分钟将防爆片(650psi,BioRad,Hercules,CA)灭菌,然后装入微粒轰击装置(PDS-1000,BioRad,Hercules,CA)的抵盖中。将经过高压灭菌的停止屏(BioRad,Hercules,CA)和已加载的宏载体放入发射装备中,拧上盖子并滑入轰击室,正好在喷嘴下。将包含盖上的屏的叶靶的陪替培养皿打开盖子,并放置于轰击室中喷嘴下6cm处。拔出真空(-0.9巴)并使装置开火。
次日(轰击后16-20小时),将经过轰击的胚胎(盾片向上)转移至N6基础培养基和维生素(Phytotechnology Laboratories,Shawnee Mission,KS)上,含2.0mg/L 2,4-D,2.8g/L脯氨酸,30g/L蔗糖,100mg/L酪蛋白酶水解物,100mg/L肌肉肌醇。
使用阳性PAT载体(pDAB112364)为粒子轰击进行PAT优化
使用PAT对照载体(pDAB112364)为经过粒子轰击的玉米胚胎标准化组织培养条件。对于潜在的背景选择,在有或无ZFN1载体(pDAB105941)的情况下测试供体载体(pDAB112366)。如下文表25中所示,使用PAT对照载体(pDAB112364)获得9%的转化频率。此数据显示稻遍在蛋白3(OsUbi3)启动子驱动PAT基因强劲表达,从而获得对于使用玉米B104不成熟胚胎的粒子轰击的植物转化的选择。使用供体载体(pDAB112366)在有或无ZFN1载体(pDAB105941)的情况下对于不成熟的经过轰击的胚胎而言在PAT选择培养基上获得很小数目(1-2个)的植物。这些结果确认了包含无上游启动子之rubi3内含子的供体载体(pDAB112366)不提供针对PAT基因的转化选择。
表25:显示玉米基因组内ETIP构建物的转化频率。
构建物 |
经过转化的胚胎的数目 |
得到确认的事件 |
转化频率 |
pDAB105941/112366 |
480 |
2 |
0.42 |
pDAB112364 |
720 |
63 |
9 |
pDAB112366(供体) |
720 |
1 |
0.14 |
使用供体和ZFN1粒子轰击对于pDAB105855是转基因的不成熟胚胎进行基因打靶
处理对于靶pDAB105855是半合子的不成熟玉米胚胎,供使用ZFN1和供体DNA预混和物(pDAB105941/112366)进行的粒子轰击,以便获得基因打靶,这使用阳性PAT选择进行。表17显示靶事件和用于每例事件的胚胎的数目。表26中还显示对于每例靶事件而言在PAT选择培养基上成功再生的植物的数目。总计,从覆盖所有事件的经过处理的13,563个不成熟胚胎再生出68株植物。在PAT选择培养基上获得小数目的植物证明了大多数非靶向随机PAT供体插入得到消除。
表26:显示靶事件和用于每例事件的胚胎的数目。
靶事件编号 |
经过处理的样品 |
再生的事件 |
105855[4]-001 |
150 |
0 |
105855[4]-002 |
2089 |
5 |
105855[4]-009 |
720 |
1 |
105855[4]-011 |
1918 |
11 |
105855[4]-012 |
1350 |
26 |
105855[4]-017 |
1929 |
4 |
105855[4]-025 |
1155 |
11 |
105855[4]-026 |
1103 |
6 |
105855[4]-027 |
1654 |
2 |
105855[4]-028 |
1495 |
2 |
靶事件编号 |
经过处理的样品 |
再生的事件 |
总计 |
13563 |
68 |
ETIP基因打靶的PCR分析
所述qPCR检测在PAT选择培养基上再生的总共68株植物中的67株植物内的YFP和PAT编码序列。结果总结于表27中。如表27指示的,使用qPCR测定法发现50株植物是PAT阳性的,而24株植物对于YFP编码序列是阴性的。数据提示在PAT选择上获得的17株植物是野生种(escape)且ZFN1表达破坏了至少24株植物中靶基因座中的YFP。
表27:67株植物中YFP和PAT编码序列的qPCR分析和检测。
进行分析的事件 |
PAT阳性 |
YFP阴性 |
67 |
50 |
24 |
对24例YFP阴性事件实施进一步的诊断性输入/输出PCR以测量基因打靶。5’输入/输出PCR利用与OsUbi3启动子退火的靶DNA特异性5’寡聚物和与PAT编码序列退火的供体DNA特异性3’寡聚物来获得1838bp的预期PCR产物。预期PCR产物会支持位于靶基因座5’的精确基因打靶。PCR结果确认了预期1838bp产物在21例事件中得到扩增。
实施相似的3’输入/输出PCR。该方法利用与PAT编码序列退火的供体DNA特异性5’寡聚物和与ZmUbi1启动子序列退火的供体DNA特异性3’寡聚物来获得2184bp的预期PCR产物。预期PCR产物会支持位于靶基因座3’的精确基因打靶。PCR结果确认了2184bp的预期扩增子在16例事件中得到扩增。
关于靶基因座的5’和3’二者的输入/输出PCR总结于表28中。数据揭示15例事件产生了预期PCR产物,指示全部PAT阳性再生植物中约30%的基因打靶频率。
表28:获得的事件的分子确认分析。
基因打靶的Southern印迹分析
使用Southern印迹分析对靶事件的表征揭示了事件#12中靶转基因的截短。总计对12例事件分析了Southern印迹。数据确认了在5株植物(3株事件#12和2株其它事件)中鉴定出预期条带样式。这些结果指示,已整合在基因组内的ETIP构建物随后可用供体序列再靶定,而且ETIP可充当打靶平台。图39提供了使用整合在基因组内的ETIP位点靶向包含基因表达盒的供体多核苷酸的示意图。如图中所示,若整合发生在ETIP基因座内,则供体能表达转基因。供体多核苷酸的随机整合不造成转基因表达,因为当供体多核苷酸随机整合在基因组内时没有能驱动表达的启动子元件。供体在ETIP位点内的打靶产生功能性标志物基因,它能进行检测或选择。
虽然本文中描述了某些例示性实施方案,但是本领域普通技术人员会认识和领会,可以对例示性实施方案进行许多添加、删除、和修饰而不偏离所附权利要求的范围。另外,来自一个实施方案的特征可以与另一个实施方案的特征组合。