发明说明
本发明解决的问题在于提供一种基于锌指蛋白插入载体的随机锌指蛋白库的构建方法,通过构建将具有简并性的随机锌指蛋白表达序列插入到表达载体中进行转化,得到了高容量的随机锌指蛋白库,为锌指蛋白的筛选奠定了基础。
本发明通过以下技术方案来实现:
一种锌指蛋白插入载体,包括启动子和抗生素筛选基因,在启动子的下游含有Gal11p基因序列,在Gal11p基因序列的下游含有锌指蛋白序列插入位点。
所述的启动子为Lac-UV5启动子;所述的锌指蛋白序列插入位点的核苷酸序列如SEQ.ID.NO.3所示。
所述的锌指蛋白插入载体为pBD-P-Gal11p-ZFR,通过酶切位点将lac-UV5启动子克隆到载体pBD,然后将Gal11p基因序列克隆到lac-UV5启动子的下游,再将锌指蛋白序列的插入位点ZFR克隆到Gal11p基因序列的下游。
所示的Lac-UV5启动子的核苷酸序列如SEQ.ID.NO.1所示;Gal11p基因序列的核苷酸序列如SEQ.ID.NO.2所示;锌指蛋白序列插入位点的核苷酸序列如SEQ.ID.NO.3所示。
一种随机锌指蛋白序列,其核苷酸序列如SEQ.ID.NO.4所示。
一种随机锌指蛋白表达载体,是将具有粘性末端的如SEQ.ID.NO.4所示的随机锌指蛋白序列插入到pBD-P-Gal11p-ZFR载体的锌指蛋白序列的插入位点ZFR中;
所述的pBD-P-Gal11p-ZFR载体,是通过酶切位点将Lac-UV5启动子克隆入载体pBD,然后将Gal11p基因序列克隆到Lac-UV5启动子的下游,再将锌指蛋白序列的插入位点ZFR克隆到Gal11p基因序列的下游而构成。
一种随机锌指蛋白库的构建方法,包括以下步骤:
1)分别克隆Lac-UV5启动子元件、Gal11p基因序列和SEQ.ID.NO.3所示的锌指蛋白序列的插入位点ZFR,然后按照Lac-UV5-gal11p-ZFR的顺序将3个序列克隆到pBD载体中,构建pBD-P-Gal11p-ZFR载体;
2)根据锌指蛋白的-1,1,2,3,5,6位点设计随机引物,通过重叠PCR获得如SEQ.ID.NO.4所示的随机锌指蛋白序列;
3)将SEQ.ID.NO.4所示的随机锌指蛋白序列酶切后插入到pBD-P-Gal11p-ZFR载体的锌指蛋白序列的插入位点ZFR中,得到pBD-P-Gal11p-ZFS表达载体;
4)以E.coli DH5a为宿主菌,将pBD-P-Gal11p-ZFS表达载体转化宿主菌,收集经过氯霉素抗性筛选后的所有单克隆,提取质粒,将得到的所有质粒混匀,得到随机锌指蛋白库。
所述的粘性末端的酶切是对随机锌指蛋白序列用pfu DNA polymerase内切活性进行酶切。
所述的随机锌指蛋白序列通过BbsI酶切位点插入到pBD-P-Gal11p-ZFR载体中。
所述的pBD-P-Gal11p-ZFS表达载体的转染是采用电转化的方法。电转化条件,电穿孔仪参数:电压1800V,持续时间5ms;电击杯规格:Gap(mm)2.0,Minimum Volume 40μl,Maximum Volume 400μl。
与现有技术相比,本发明具有以下有益的技术效果:
目前锌指蛋白库的构建方法报道比较少,最常用的锌指蛋白库是向Joung Lab购买单指锌指库,然后通过重叠PCR的方法构建所需要的锌指库。然而单指锌指库有74个,每个库单独售价为65$,购买所有单指锌指库需要4440$(http://www.addgene.org/zfc/browse/)。由需要从国外递送质粒,程序很繁琐。
本发明基于锌指蛋白结构特点设计兼并引物,通过重叠PCR的方法构建随机锌指库,其具有以下优点:
1)构建方法简单,使用分子生物学常规方法就可完成,基本所有分子生物学实验室都具备这一条件。只需要PCR仪和电穿孔仪两种仪器,通过PCR、酶切、连接、电转化和质粒提取即可完成。
2)成本低,本方法的主要费用是:兼并引物合成、限制内切酶Bbs I、电击杯、dTTP和一些实验室常用试剂和器材费用。
3)周期短,锌指蛋白插入pBD-P-Gal11p-ZFR载体构建,只需在骨架载体中插入3个DNA片段即可完成,大概需要两周时间。随机锌指库构建只需在pBD-P-Gal11p-ZFR载体插入随机锌指蛋白序列,再电转化宿主菌,提取质粒即可完成,不超过3天即可完成。
4)库容量大,此随机锌指蛋白库包含了所有识别9bp核苷酸序列可能的锌指蛋白,大约包含1.41×1022种不同的锌指蛋白。
具体实施方式
本发明提供一种随机锌指蛋白库的构建方法,包括锌指蛋白表达插入载pBD-P-Gal11p-ZFR的构建、随机锌指蛋白序列的构建以及随机锌指蛋白表达载体pBD-P-Gal11p-ZFS,在将其转化并表达后获得高容量的随机锌指蛋白库。下面结合具体的实施方式对本发明进行详细的说明,所述只是对本发明的解释而不是限定。
首先提供以下培养液/载体的来源或制备:
pBD载体、pTRG-gal11P载体、pBD-LGF2载体购于TaKaRa公司。大肠杆菌DH5α购于天根公司。
SOB培养基改良型配方(1L体系):胰化蛋白胨20g;酵母提取物5g;NaCl 0.5g;KCl 10ml(250uM)。
SOC培养基改良型配方(1L体系):胰化蛋白胨20g;酵母提取物5g;NaCl 0.5g;KCl 10ml(250uM));葡萄糖1.8ml(20%)。
氯霉素(34mg/ml)配制:0.34g溶于10ml乙醇中。
IPTG(100mg/ml)配制:1.2g溶于50ml ddH2O中,0.22um滤膜过滤。
1、随机锌指插入载体pBD-P-Gal11P-ZFR的构建
1.1pBD-P载体的构建
设计引物Plac-F、Plac-R从pBD载体上克隆lac-UV5启动子:
Plac-F:gcttatcatc gataagctaa ttctcactca tta;
Plac-R:gttagcggcc gctttgaaga cctcatacgc tgtttcctgt;
其中,划线部分为酶切位点;
Lac-uv5启动子的扩增体系:pBD载体1ul;引物Plac-F 2ul;Plac-R 2ul;pfuDNA polymerase 1ul;pfu DNA polymerase buffer 5ul;dNTP 1ul;ddH2O 29ul.
Lac-uv5启动子的扩增条件:95℃3min;95℃30s,58℃45s,72℃45s,30cycle;72℃10min。
然后分别用Cla I和Not I双酶切pBD载体(切除pBD载体上的λCI ORF)及PCR扩增的Lac-UV5启动子,回收酶切片段后,T4DNA连接酶4℃过夜连接;将连接产物转化DH5α,涂菌液于含氯霉素抗性(34ug/ml)的LB固体培养基上37℃倒置培养。挑取单克隆,菌落PCR鉴定并测序,鉴定正确后得到pBD-P载体。pBD-P载体的酶切鉴定结果如图1所示,其中M为marker(100bp,250bp,500bp,750bp,1000bp,2000bp,3000bp,5000bp);泳道4为pBD载体,泳道1、2和3为pBD载体单酶切(插入Lac-UV5启动子的pBD-P载体中含有Bbs I酶切位点,而骨架载体pBD不含有Bbs I酶切位点),片段大小为2511bp。lac-uv5启动子的核苷酸序列如SEQ.ID.NO.1所示。
1.2 pBD-P-Gal11p载体的构建
设计引入酶切位点的引物Gal11-F、Gal11-R,以PTRG-Gal11p为模板扩增Gal11P片段:
Gal11-F:gccgaagaca ttatgcctca acagcagcaa;
Gal11-R:gacgcggccg ccaaagcttg gatttttctc a;
其中,划线部分为酶切位点;
Gal11p的扩增体系:pTRG载体1ul;引物Gal11-F 2ul;Ga111-R2ul;Pfu DNApolymerase 1ul;Pfu DNA polymerase buffer 5ul;dNTP 1ul;ddH2O 29ul。
Gal11p的扩增条件:95℃3min;95℃30s,58℃45s,72℃45s,35cycle;72℃10min。
然后分别用Bbs I和Not I双酶切pBD-P和扩增的Gal11p片段,回收酶切片段后DNA连接酶4℃过夜连接;将连接产物转化DH5α,涂菌液于含氯霉素抗性(34ug/ml)的固体培养基上37℃倒置培养。挑取单克隆,菌落PCR并测序鉴定,鉴定正确后得到pBD-P-Gal11P载体。pBD-P-Gal11p载体的PCR鉴定结果如图2所示,其中M为marker(100、200、300、400、500、600),泳道1,2,3,4,5,7为构建正确的克隆,其PCR鉴定条带大小为296bp。Ga111p的核苷酸序列如SEQ.ID.NO.2所示。
1.3pBD-P-Gal11P-ZFR载体的构建
设计引入酶切位点的引物ZFR1、ZFR2,通过重叠PCR方法得到锌指蛋白插入序列ZFR:
ZFR1:cgatgcggcc gctgactaca aagattctag acccggggag gtcttctaag tgataa;
ZFR2:gcatggatcc ttactactgt gcatgtcttc ttacttatca cttagaagac ctcc;
其中,划线部分为两端重叠引物搭桥序列。
重叠PCR所合成的锌指蛋白插入序列ZFR如下(即SEQ.ID.NO.3所示):
CGATTGACTACAAAGATTCTAGACCCGGGGAGGTCTT CTAAGTGATAAGTAAGAAGACATGCACAGTAGTAAATGC
其中,划虚线部分为酶切位点Not I和BamH I,划实线部分都为酶切位点Bbs I。Bbs I限制性内切酶的识别位点和切割位点不相同,通过合理设计可以在酶切后去除Bbs I酶切位点,以消除酶切位点DNA序列的影响。
ZFR的扩增体系:ZFR1 2ul;ZFR2 2ul;pfu DNA polymerase 1ul;pfuDNA polymerase buffer 5ul;dNTP 2ul;ddH2Oul37ul。
ZFR的扩增条件:94℃3min;94℃30s,58℃30s,72℃45s,25cycle;72℃10min。
然后分别用Not I和BamH I双酶切pBD-P-Gal11P和扩增的ZFR片段,回收酶切片段后DNA连接酶4℃过夜连接;将连接产物转化DH5α,涂菌液于含氯霉素抗性(34ug/ml)的固体培养基上37℃倒置培养。挑取单克隆,菌落PCR并测序鉴定,鉴定正确后得到pBD-P-Gal11P-ZFR载体。
pBD-P-Gal11P-ZFR载体的菌落PCR鉴定结果如图3所示,其中M为Trans2k DNA marker(从上而下大小为2000,1000,750,500,250,100bp)4,6,7,为阳性克隆,1,2,3,5阴性克隆。根据设计引物目的片段大小为753bp。
1.4所构建的pBD-P-Gal11P-ZFR载体的质粒图谱如图4所示,其中,插入的3个元件的排列顺序为Lac-UV5-Gal11p-ZFR;
Lac-UV5是一种中等强度的启动子,其负责Gal11p和锌指序列转录和翻译。
Gal11p可以与Gal4两者相互作用,能够调控启动子转录与否,已被广泛应用于蛋白质与蛋白质或做研究中,如细菌双杂交系统和酵母双杂交系统。这样使得所构建的载体、锌指蛋白库能够用双杂交系统进行筛选。
ZFR为锌指蛋白序列插入位点,包含两个Bbs I酶切位点,酶切后能产生于锌指蛋白序列配对的粘性末端,并且能去除载体中含有的Bbs I酶切位点,以消除酶切位点对锌指蛋白序列影响。
2、随机锌指蛋白序列的构建
C2H2锌指结构域于1983年在非洲爪蟾卵母细胞的转录因子TFIIIA中被发现,是迄今在真核生物基因组中分布最广的一类蛋白。这种锌指蛋白由大约30个氨基酸残基组成ββα的结构,每个锌指结合3个连续的核苷酸序列。其结构比较固定并且亲和力强,所以非常适合设计人工DNA结合蛋白。本发明设计三指随机锌指蛋白库,其识别9bp核苷酸序列。
锌指蛋白具有保守的序列,其结合核酸的位点为其-1,1,2,3,5,6位点,即这六个位点为可变氨基酸。根据上述锌指蛋白序列结构特点和密码子兼并性,设计引物,通过重叠PCR方法获得随机锌指蛋白序列(构建流程如图5所示)。
针对识别9bp核苷酸的所有序列的随机锌指蛋白序列,所设计的随机引物为:
ZFF11:gagcgcccct tccagtgtcg catttgcatg cggaactttt cgvnsvnmvn vnwcttvnwvnmcataccc gtactcatac;
ZFF12:cgcatacaga tccgacactg aaacggtttt tcaccggtat gagtacgggt atg;
ZFF21:gtgtcggatc tgtatgcgaa atttctccvn kvnmvnsvnm ttgvnwvnkc atctacgtacgcacacc;
ZFF22:tcggcattgg aatggcttct cgccggtgtg cgtacgtaga tg
ZFF31:gccattccaa tgccgaatat gcatgcgcaa cttcagt
ZFF32:ccctcaggtg ggtttttagg tgknbmnbca gsnbmnbknb mnbactgaag tgcgcatg;
ZFA1:ggggagcgcc ccttccagtg tcgc;
ZFA2:gtgcagagga tcccctcagg tgggttttta ggtg;
其中,N代表A、T、C、G;V代表G、A、C;S代表G、C;M代表A、C;W代表A、T;K代表G、T;
随机锌指蛋白序列的扩增程序为:
ZFF11与ZFF12的扩增ZFF1,扩增体系(50ul)为:ZFF11 1ul(50uM);ZFF121ul(50uM);pfu DNA polymerase 1ul;pfu DNA polymerase buffer 5ul;dNTP 1ul;ddH2O 41ul;
ZFF21与ZFF22的扩增ZFF2,扩增体系(50ul)为:ZFF211ul(50uM);ZFF221ul(50uM);Pfu DNA polymerase 1ul;pfu DNA polymerase buffer 5ul;dNTP 1ul;ddH2O 41ul;
ZFF31与ZFF32的扩增ZFF3,扩增体系(50ul)为:ZFF31 1ul(50uM);
ZFF321ul(50uM);pfu DNA polymerase 1ul;pfu DNA polymerase buffer 5ul;dNTP 1ul;ddH2O 41ul;
扩增条件为:94℃3min;94℃30s,50℃30s,72℃30s,6cycle;94℃30s,56℃30s,72℃30s,25cycle;72℃10min。
上述扩增完成后分别回收扩增得到的ZFF1,ZFF2,ZFF3片段,其序列如下:
ZFF-1:gagcgcccct tccagtgtcg catttgcatg cggaactttt cgvnsvnmvn mvnwcttvnwvnmcataccc gtactcatac cggtgaaaaa ccgtttcagt gtcggatctg tatgcg
ZFF-2:gtgtcggatc tgtatgcgaa atttctccvn kvnmvnsvnm ttgvnwvnkc atctacgtacgcacaccggc gagaagccat tccaatgccg a
ZFF-3:gccattccaa tgccgaatat gcatgcgcaa cttcagtvnk vnmvnkvnsc tgvnkvnmcacctaaaaacc cacctgaggg
划线部分为三段锌指蛋白序列重叠部分,通过重叠PCR即可实现这三段序列的随机组合。然后以下程序搭桥扩增:
ZFF1+ZFF2扩增体系扩增ZFF12:ZFF1 1.5ul;ZFF2 1.5ul;pfu DNApolymerase 1ul;pfuDNA polymerase buffer 2ul;dNTP 1ul;ddH2O 13ul。
ZFF2+ZFF3搭桥扩增体系扩增ZFF23:ZFF2 1.5ul;ZFF3 1.5ul;pfuDNA polymerase 1ul;pfu DNA polymerase buffer 2ul;dNTP 1ul;ddH2O13ul
扩增条件为:94℃3min;94℃30s,58℃30s,72℃30s,15cycle;72℃10min。
扩增完成后分别回收扩增得到的ZFF12与ZFF23片段,然后进行以下搭桥扩增:
扩增体系:ZFF12 3ul;ZFF23 3ul;Pfu DNA polymerase 1ul;Pfu DNApolymerase buffer 5ul;dNTP 1ul;ddH2O 37ul;
扩增条件:94℃3min;94℃30s,57℃30s,72℃30s,15cycle;72℃10min。
上述扩增完成后回收扩增得到的ZFF123片段,其扩增结果的电泳检测结果如图6所示,其中,M为50bpmarker,1为ZFF123扩增片段大小为283bp。
以ZFF123片段为模板,利用磷酸化引物(磷酸化为提高后续连接效率)ZFA1、ZFA2扩增ZFF123A,其扩增体系为:
ZFF1233ul;ZFA1primer 1ul(50uM);ZFA2primer 1ul(50uM);pfuDNA polymerase 1ul;pfu DNA polymerase buffer 5ul;dNTP 1ul;ddH2O 38ul;
扩增条件为:94℃3min;94℃30s,58℃45s,72℃45s,35cycle;72℃10min。最终扩增得到的ZFF123A片段如图6所示,其中M为50bp marker,1为F123扩增片段,其大小为286bp。
回收扩增得到的ZFF 123A片段,其序列如SEQ.ID.NO.4所示。
再通过pfu DNApolymerase的3′-5′外切酶活性,以得到带有粘性末端的锌指蛋白序列ZFS。其粘性末端如下:
GGGG----ZFS----
----ZFS----CGTG
其酶切体系:ZFF12 310ul;dTTP 3ul;pfu DNA polymerase 1ul;pfu DNApolymerase Buffer 3ul;ddH2O 13ul;酶切条件:72℃15min。从而得到具有粘性末端的锌指蛋白序列ZFS。
3、表达载体pBD-P-Gal11p-ZFS的构建及随机锌指蛋白库的建立
将pBD-P-Gal11p-ZFR载体用BbsI酶切(37℃酶切6h)后,回收酶切片段后DNA。将酶切回收的具有粘性末端的锌指蛋白序列ZFS与其连接,T4连接酶4℃过夜连接;得到随机锌指表达载体pBD-P-Gal11p-ZFS;
随机锌指表达载体pBD-P-Gal11p-ZFS的质粒图谱如图7所示,其中插入的ZFS位于锌指蛋白插入位点ZFR的两个BbsI酶切位点之间。将锌指表达载体pBD-P-Gal11p-ZFS转入BL21菌株诱导蛋白的表达,37℃培养菌体浓度至0.6左右,加入50uM IPTG 27℃诱导12h,收集1ml菌体(12000rpm 1min),PBS洗剂菌体两次,加入30ul裂解液[Popculture reagent(Novagen,cat.no.71092)按照10∶1加入4units/ml的溶菌酶]冰上裂解30min,加入上样buffer[100Mm TrisHCL(ph=6.8);4%(m/v)SDS;2%(v/v)溴酚蓝;20%甘油;2%β巯基乙醇]95℃水浴10min,10%聚丙烯酰胺凝胶电泳显示ZFS能正常表达如图8所示,其中M为Blue Plus II Protein Marker(从上而下大100kDa,62kDa,40kDa,30kDa,24kDa,14kDa),1,2为对空菌株,3,4,5,6为样品,1,3,5为诱导样品菌株,2,4,6为未诱导样品菌株。Lac-UV5启动下目的片段的大小为20kDa左右,图8中红色箭头所示为目的片段。
电转化细胞的制备:接1%的新鲜E.coli DH5a菌种于SOB液体培养液,37℃培养8~10h至OD为0.8~1.0之间,接1ml菌液于100ml灭菌SOC培养液中于25℃~37℃培养,尝试最佳的培养温度,待OD为0.6时,收集100ml菌体,4℃,3000g离心5min。去上清,10%甘油洗菌体,4℃,5000g离心5min,重复两次。用400ul10%甘油悬浮菌体,以上步骤都在冰上操作。
电转化随机锌指表达载体pBD-P-Gal11p-ZFS:
将pBD-P-Gal11p-ZFS加入制备的感受态中,轻轻混匀,均在冰中操作。电击1800V,5ms。电击后冰上放置6min,然后加入800uL SOC液体培养基,37℃,120rpm培养1h,均匀涂布于含氯霉素(34mg/ul)平板,共电转化20管,每一管电转化菌体涂布于两个150mm培养皿中。37℃倒置培养,最终得到30皿转化菌体。
收集培养皿的所有单克隆,提取质粒,采用omega公司中提质粒试剂盒,具体步骤参照说明书。将所得的所有质粒混匀,最终得到随机锌指蛋白库。所得到的随机锌指蛋白库是包含随机三联体锌指蛋白序列锌指表达载体质粒混合物。
随机锌指蛋白库其锌指蛋白序列如下:
ggggagcgcc ccttccagtg tcgcatttgc atgcggaact tttcgvnsvn mvnmvnwctt
vnwvnmcata cccgtactca taccggtgaa aaaccgtttc agtgtcggat ctgtatgcga
aatttctccv nkvnmvnsvn mttgvnwvnk catctacgta cgcacaccgg cgagaagcca
ttccaatgcc gaatatgcat gcgcaacttc agtvnkvnmv nkvnsctgvn kvnmcaccta
aaaacccacc tgaggggatc ctctgcac
其中,N代表A、T、C、G;V代表G、A、C;S代表G、C;M代表A、C;
W代表A、T;K代表G、T;
由于锌指蛋白具有保守的序列,其结合核酸的位点为其-1,1,2,3,5,6位点,但这些位点氨基酸通常不含有芳香氨基酸。通过设计随机引物,采用重叠PCR的方法获得三段锌指蛋白在其-1,1,2,3,5,6位点包含了15或16种氨基酸(除去Phe、Tyr、Trp和Cys四种氨基酸),包含了单个锌指蛋白所有可能的蛋白序列。再通过重叠PCR实现了三段锌指蛋白序列的随机组合,即完成三联体锌指蛋白序列库,再通过PCR扩大,酶切、连接、电转化和提取质粒即完成随机三联体锌指蛋白库。随机三联体锌指蛋白库指的是最终提取的质粒混合物,随机三联体锌指蛋白库的库容量大于1.48×1021(1518)。