一种改进的PB转座子系统及其用途
技术领域
本发明涉及一种改进的PB转座子系统及其用途。
背景技术
外源基因在宿主细胞内的表达形式可分为瞬时表达与稳定表达,其中稳定表达是指:(1)外源基因转染真核细胞并整合入基因组后的表达。重组基因的稳定表达水平一般要比短暂表达低1~2个数量级。(2)宿主细胞虽经过多次传代或条件变化,但表达水平仍然保持稳定。
鉴于稳定表达能随着细胞分裂维持外源基因长时间持续表达,在离体细胞修饰(ex vivo),如转基因嵌合抗原受体T细胞(Chimeric Antigen ReceptorT-CellImmunotherapy,CAR-T)治疗研究中具有重要意义。CAR-T细胞能特异识别并高效杀伤表达特定细胞表面抗原的肿瘤细胞,已取得显著的临床疗效。如针对CD19的CAR-T能高效杀伤表达CD19表面抗原的B细胞淋巴瘤,对晚期难治性B细胞淋巴瘤患者,有效缓解率达到90%(Maude SL,Frey N,Shaw PA,Aplenc R,Barrett DM,Bunin NJ,Chew A,Gonzalez VE,ZhengZ,Lacey SF,Mahnke YD,Melenhorst JJ,Rheingold SR,Shen A,Teachey DT,LevineBL,June CH,Porter DL,Grupp SA.,Chimeric antigen receptor T cells forsustained remissions in leukemia,N Engl J Med.2014;371(16):1507-17)。
为实现外源基因在宿主细胞内的稳定表达,常用的载体系统包括:1.逆转录病毒系统:能有效感染宿主细胞,并介导外源基因表达框的基因组高效整合,但其装载容量有限,且重组病毒颗粒制备工艺复杂。2.真核表达质粒系统:制备工艺相对简单,但其通过随机DNA重组的方式插入宿主基因组,整合效率极低。3.转座子系统:采用质粒系统,制备工艺相对简单,通过转座酶将外源基因整合入基因组,整合效率相对较低。
最早应用的哺乳动物转座子系统是源于鱼类的“睡美人”转座子(SleepingBeauty),但是“睡美人”转座子存在过量抑制效应和携带片段偏小(5kb左右)等缺陷,使其在转基因应用上受到限制。来源于鳞翅目昆虫的piggyBac(PB)转座子是目前哺乳动物中活性最高的转座子。其宿主范围极其广泛,从单细胞生物到哺乳动物都能够发挥作用;能够携带较大的外源DNA片段,当转座片段在14kb以内时,转座效率不会显著下降。PB转座子主要采取“cut-paste”机制发生转座,在转座片段被切除后不会在原位点留下印迹(footprint),基因组可以实现切除后精确修复,在可逆转基因的应用中具有重要作用。此外,PB转座酶可塑性高,通过与其它功能蛋白融合或改变转座酶的功能区域,不仅能够改变转座酶的活性和作用方式,也可以提高外源基因转座的靶向性。近年来,通过密码子优化、特定位点氨基酸定点突变、相应核定位标签的引入等,使PB在哺乳动物细胞内的整合效率进一步提高,使得该系统在基因组研究、基因治疗、细胞治疗、干细胞诱导和诱导后分化等领域获得了广泛的应用。
传统的PB转座子系统采用供体质粒(在外源基因表达框两端含有可以为PB整合酶识别的末端重复序列)和转座酶辅助质粒(提供PB转座酶)构成的二元转座系统。在该二元转座系统中,为实现外源基因表达框的有效整合,必须满足两个质粒被转染到同一细胞内,这在转染过程中只有一部分细胞能够实现(其它细胞要么一个质粒也没成功转染,要么只转染了其中一个质粒,都不能实现有效整合),一定程度上降低了整合效率。同时,由于PB转座子系统采用完全可逆的“cut-paste”形式发生,只要整合酶维持表达,其仍具有将已整合入基因组的外源基因表达框重新剪切掉的可能,导致基因组不稳定,且实际上降低了整合效率。为提高PB转座子系统的整合效率,一种策略是将供体质粒与转座酶辅助质粒纳入同一质粒,同时设置转座酶的自我失活(Self-inactivating)机制,保证在外源基因实现整合后,转座酶的表达能被及时关闭。例如,使PB表达框与外源基因表达框同向放置,并共用同一个PolyA加尾信号序列,一旦外源基因表达框被从质粒上切除并整合到基因组,PB表达框将缺损PolyA加尾信号序列,导致转录的mRNA不稳定而被快速降解,PB的表达被关闭(Chakraborty S,Ji H,Chen J,Gersbach CA,Leong KW,Vector modifications toeliminate transposase expression following piggyBac-mediated transgenesis,SciRep.2014;4:7403)。
PB转座子系统的另一个缺陷在于:其野生型的5’和3’反向末端重复序列(Inverted Terminal Repeats,ITR)的长度都在700bp以上,总长度约1.5kb。这些序列是外源基因通过转座整合到基因组中所必需的。然而一旦转座完成,这1.5kb的序列将不会再发挥功能,并且由于其本身就有启动子和增强子活性,还可能潜在地增加细胞转化的风险。此外较长的ITR序列还增加了转染时载量的负担,影响了转染效率。而缩短ITR长度会导致转座效率的显著下降(Zhuang L,Wei H,Lu C,Zhong B.,The relationship betweeninternal domain sequences of piggyBac and its transposition efficiency in BmNcells and Bombyx mori.,Acta Biochim Biophys Sin(Shanghai)2010;42:426–431;LiX,Harrell RA,Handler AM,Beam T,Hennessy K,Fraser Jr.MJ.,piggyBac internalsequences are necessary for efficient transformation of target genomes,InsectMol Biol 2005;14:17–30.)。
Solodushko等人报道了一种最小化的PB转座系统末端重复序列(minTR),去除了野生型ITR的大部分序列,其中5’minTR长35bp,3’minTR长63bp,长度大大小于野生型5’和3’ITR,但仅有minTR自身的存在无法完成转座过程。全长ITR的序列,即使是在转座体系以外的载体中存在,也仍然是转座发生所必需的元件(Solodushko V,Bitko V,Fouty B,Minimal piggyBac vectors for chromatin integration,Gene Ther.2014Jan;21(1):1-9)。这种最小化的PB转座系统末端重复序列虽然能够显著减少ITR序列整合到靶细胞基因组中的长度、从而减少靶细胞转化的风险,但由于全长ITR序列仍然需要在整个体系中的某个地方存在且需要通过诸如病毒或电转等方法被一起导入细胞,因此需要被转入细胞的核酸负载仍然较大,转染效率也仍然会受到影响。
我们在前期提供了一种高效安全的转座子整合系统,该系统采用了一元转座系统,一个载体中包含了外源基因与PB转座酶基因,并且两者的方向相反,共用一个双向的polyA序列(CN105154473A)。在该系统中仅使用了最小化的5’和3’末端重复序列,而没有包含5’和3’ITR的全长序列,但PB转座系统仍能够正常有效地工作。该转座系统较传统的二元PB转座系统而言转座效率明显更高,但对于CAR-T细胞的制备而言,其转座效率仍然有待进一步提高。
发明内容
本发明第一方面提供一种核酸构建体,其含有依次连接的控制PiggyBac转座酶表达的启动子、PiggyBac转座酶编码序列、PiggyBac转座子5’末端重复序列、任选的polyA加尾信号序列1、多克隆插入位点、polyA加尾信号序列2和PiggyBac转座子3’末端重复序列。
在一个或多个实施方案中,所述PiggyBac转座子5’末端重复序列为截短的PiggyBac转座子5’末端重复序列。
在一个或多个实施方案中,所述PiggyBac转座子3’末端重复序列为截短的PiggyBac转座子3’末端重复序列。
在一个或多个实施方案中,所述核酸构建体不含有所述polyA加尾信号序列1。
在一个或多个实施方案中,所述核酸构建体中除所述5’末端重复序列和3’末端重复序列所含的TTAA序列以外的其它TTAA序列被删除。
在一个或多个实施方案中,所述控制PiggyBac转座酶表达的启动子选自CMV启动子、SV40启动子、PGK启动子和鸡β-actin启动子,优选为CMV启动子,更优选地,所述启动子的序列如SEQ ID NO:1所示。
在一个或多个实施方案中,所述PiggyBac转座酶编码序列含核定位信号,所述核定位信号选自c-myc核定位信号和SV40核定位信号;优选地,所述PiggyBac转座酶编码序列如SEQ ID NO:2所示;优选地,所述核定位信号位于所述PiggyBac转座酶编码序列的N端。
在一个或多个实施方案中,所述PiggyBac转座子5’末端重复序列如SEQ ID NO:3所示。
在一个或多个实施方案中,所述polyA加尾信号序列1如SEQ ID NO:4所述。
在一个或多个实施方案中,所述多克隆插入位点如SEQ ID NO:5所示。
在一个或多个实施方案中,所述polyA加尾信号序列2为SV40 polyA加尾信号序列;优选地,所述polyA加尾信号序列2如SEQ ID NO:6所示。
在一个或多个实施方案中,所述PiggyBac转座子3’末端重复序列如SEQ ID NO:7所示。
在一个或多个实施方案中,所述核酸构建体选自:
(a)含有依次连接的SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、任选的SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6和SEQ ID NO:7的核酸构建体;
(b)在(a)所示的核酸构建体的基础上删除了除SEQ ID NO:3和SEQ ID NO:7所含TTAA以外的其它TTAA的核酸构建体。
在一个或多个实施方案中,所述核酸构建体的多克隆位点可操作地插入了一个或多个相同或不同的表达框,或所述多克隆位点被替换为一个或多个相同或不同的表达框。
本发明第二方面提供一种重组载体,所述重组载体含有本文任一实施方案所述的核酸构建体。
在一个或多个实施方案中,所述核酸构建体的多克隆位点可操作地插入了一个或多个相同或不同的外源基因以及任选的控制所述外源基因表达的启动子,或者所述多克隆位点被替换为一个或多个相同或不同的外源基因编码序列以及任选的控制外源基因表达的启动子。
在一个或多个实施方案中,所述重组载体为重组克隆载体、重组真核表达质粒或者重组病毒载体。
在一个或多个实施方案中,所述重组克隆载体为本文任一实施方案所述的核酸构建体与pUC18、pUC19、pMD18-T、pMD19-T、pGM-T载体、pUC57、pMAX或pDC315系列载体经重组得到的重组载体;
在一个或多个实施方案中,所述重组表达载体为本文任一实施方案所述的核酸构建体与pCDNA3系列载体、pCDNA4系列载体、pCDNA5系列载体、pCDNA6系列载体、pRL系列载体、pUC57载体、pMAX载体或pDC315系列载体经重组得到的重组表达载体;
在一个或多个实施方案中,所述重组病毒载体为重组腺病毒载体、重组腺相关病毒载体、重组逆转录病毒载体、重组单纯疱疹病毒载体或重组痘苗病毒载体。
本发明第三方面提供含有本文任一实施方案所述的核酸构建体或重组载体的重组细胞。
在一个或多个实施方案中,所述重组宿主细胞为重组哺乳动物细胞,例如重组原代培养T细胞、Jurkat细胞、K562细胞、胚胎干细胞、肿瘤细胞、HEK293细胞或CHO细胞。
本发明第四方面提供一种制备基因组整合有外源基因表达框的细胞的方法,所述方法包括将本文任一实施方案所述的重组载体转染到感兴趣的细胞中,以及培养转染的细胞的步骤;优选地,培养所述细胞至三代以上。
本发明第五方面提供采用本文所述方法获得的其基因组中整合有外源基因表达框的细胞。
本发明第六方面提供本文任一实施方案所述的核酸构建体和重组载体的用途,选自:
(1)在制备将外源基因表达框整合到宿主细胞基因组的药物或者试剂中的用途;
(2)在作为将外源基因表达框整合到宿主细胞基因组的工具中的用途;
(3)在制备基因组研究、基因治疗、细胞治疗或者干细胞诱导和诱导后分化的药物或制剂中的用途;
(4)在作为基因组研究、基因治疗、细胞治疗或者干细胞诱导和诱导后分化的工具的用途。
本发明第七方面提供本文任一实施方案中的所述核酸构建体、所述重组载体和所述细胞中的一种或多种在制备治疗癌症的药物中的用途。
本发明第八方面提供一种癌症的治疗方法,其包括以下步骤:向患有癌症的个体施用含有本文任一实施方案中的所述核酸构建体、所述重组载体和所述细胞中的一种或多种的药物。
在一个或多个实施方案中,,所述癌症为CD19、CD20、CEA、GD2、GPC3、FR、PSMA、gp100、CA9、CD171/L1-CAM、IL-13Rα2、MART-1、ERBB2、NY-ESO-1、MAGE家族蛋白、BAGE家族蛋白、GAGE家族蛋白、AFP、MUC1、CD22、CD23、CD30、CD33、CD44v7/8、CD70、VEGFR1、VEGFR2、IL-11Rα、EGP-2、EGP-40、FBP、GD3、PSCA、FSA、PSA、TAG-72、h5T4、胎儿型乙酰胆碱受体、LeY、EpCAM、MSLN、IGFR1、EGFR、EGFRvIII、ERBB3、ERBB4、CA125、CA15-3、CA19-9、CA72-4、CA242、CA50、CYFRA21-1、SCC、AFU、EBV-VCA、TSGF、SF、POA、β2-MG和PROGRP中的一种或多种高表达的癌症;优选地,为CD19、MSLN、MUC1、EGFR、EGFRvIII和GPC3中的一种或多种高表达的癌症。
在一个或多个实施方案中,所述癌症选自急性B淋巴细胞白血病、慢性B淋巴细胞白血病、套细胞淋巴瘤、非霍奇金淋巴瘤、多发性骨髓瘤肺癌、肝癌、淋巴瘤、结肠癌、大肠癌、乳腺癌、卵巢癌、宫颈癌、胃癌、胆管癌、胆囊癌、食管癌、肾癌、神经胶质瘤、黑色素瘤、骨肉瘤、胰腺癌和前列腺癌中的一种或多种。
本发明的有益效果在于,本发明提供的一种与现有的PB转座子载体系统相比转座整合效率更高的转座子整合系统,其能够更进一步地显著提高外源基因整合到目的细胞(如免疫效应细胞)中的比例,同时还提高了外源基因在目的细胞中的表达强度,为细胞治疗提供了一种新的基于非病毒载体的工具和手段。
附图说明
图1:pNBC载体的载体结构示意图。
图2:pNBC(-)载体的载体结构示意图。
图3:pNBC-AD载体的载体结构示意图。
图4:pNBC-D3载体的载体结构示意图。
图5:pNBC-D5载体的载体结构示意图。
图6:pNB338CFL-EGFP(-)的载体结构示意图。
图7A:pNB338C-EGFP的整合效率。
图7B:pNB338C-EGFP(-)的整合效率。
图7C:pNB338C-EGFP-AD的整合效率。
图7D:pNB338B-EGFP的整合效率。
图7E:pNB338B-EGFP-D3的整合效率。
图7F:pNB338B-EGFP-D5的整合效率。
图7G:pNB338CFL-EGFP(-)的整合效率。
图7H:在转染后的第13天、3次传代后用流式细胞仪检测的EGFP阳性细胞的比例变化。
图8:不同个体来源的PBMC转染含PD-1单链抗体编码序列的载体后PD-1抗体表达量的检测结果。
图9:不同个体来源的PBMC转染含CD19CAR编码序列后的CD19CAR整合效率的检测结果。
具体实施方式
应理解,在本发明范围中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成优选的技术方案。
下面对本发明涉及的部分术语进行解释。
本发明中,术语“单链抗体”(scFv)是指由抗体轻链可变区(VL区)氨基酸序列和重链可变区(VH区)氨基酸序列经铰链连接而成,具有结合抗原能力的抗体片段。在某些实施方案中,感兴趣单链抗体(scFv)来自感兴趣的抗体。感兴趣的抗体可以是人抗体,包括人鼠嵌合抗体和人源化抗体。抗体可以是分泌型或膜锚定型。
术语“表达框”是指表达一个基因所需的完整元件,包括启动子、基因编码序列、PolyA加尾信号序列。
术语“核酸构建体”在本文中定义为单链或双链核酸分子,优选指人工构建的核酸分子。可选地,所述核酸构建体还包含有可操作地连接的1个或多个调控序列,所述调控序列在其相容条件下能指导编码序列在合适的宿主细胞中进行表达。表达应理解为包括蛋白或多肽生产中所涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
术语“可操作地插入/连接”在文中定义为这样一种构象,其中调控序列位于相对DNA序列的编码序列的适当位置,以使调控序列指导蛋白或多肽的表达。在本发明的核酸构建体中,例如,外源基因启动子与外源基因编码序列通过DNA重组技术被置于所述多克隆位点。所述“可操作地连接”可以通过DNA重组的手段实现,具体地,所述核酸构建体为重组核酸构建体。
术语“编码序列”在本文中定义为核酸序列中直接确定其蛋白产物的氨基酸序列的部分。编码序列的边界通常是由紧邻mRNA 5’端开放读码框上游的核糖体结合位点(对于原核细胞)和紧邻mRNA 3’端开放读码框下游的转录终止序列确定。编码序列可以包括但不限于DNA、cDNA和重组核酸序列。
本文中,术语“调控序列”定义为包括表达感兴趣的多肽所必需或有利的所有组分。每个调控序列对于编码蛋白或多肽的核酸序列可以是天然含有的或外来的。这些调控序列包括但不限于前导序列、多聚腺苷酸化序列、前肽序列、启动子、信号序列和转录终止子。最低限度,调控序列要包括启动子以及转录和翻译的终止信号。为了导入特定的限制位点以便将调控序列与编码蛋白或多肽的核酸序列的编码区进行连接,可以提供带接头的调控序列。
调控序列可以是合适的启动子序列,即可被表达核酸序列的宿主细胞识别的核酸序列。启动子序列含有介导蛋白或多肽表达的转录调控序列。启动子可以是在所选宿主细胞中有转录活性的任何核酸序列,包括突变的、截短的和杂合的启动子,可以得自编码与宿主细胞同源或异源的胞外或胞内蛋白或多肽的基因。用于本发明的启动子包括但不限于本领域常规用于在T细胞中表达外源基因的各类启动子序列。进一步的,适用于本发明的启动子包括但不限于EF1α启动子、PGK启动子、β-actin启动子、CMV启动子、EEF2启动子、CAG启动子、U6启动子和SV40启动子等;优选的启动子为EF1α启动子、CMV启动子和β-actin启动子。可根据不同的编码序列、不同的宿主细胞选用不同的启动子,这为本领域所熟知。
调控序列还可以是合适的转录终止序列,即能被宿主细胞识别从而终止转录的一段序列。终止序列可操作连接在编码蛋白或多肽的核酸序列的3’末端。在所选宿主细胞中可发挥功能的任何终止子都可以用于本发明。
调控序列还可以是合适的前导序列,即对宿主细胞的翻译十分重要的mRNA非翻译区。前导序列可操作连接于编码多肽的核酸序列的5’末端。在所选宿主细胞中可发挥功能的任何前导序列均可用于本发明。
调控序列还可以是信号肽编码区,该区编码一段连在蛋白或多肽氨基端的氨基酸序列,能引导编码多肽进入细胞分泌途径。核酸序列编码区的5’端可能天然含有翻译读框一致地与分泌多肽的编码区片段自然连接的信号肽编码区。或者,编码区的5’端可含有对编码序列是外来的信号肽编码区。当编码序列在正常情况下不含有信号肽编码区时,可能需要添加外来信号肽编码区。或者,可以用外来的信号肽编码区简单地替换天然的信号肽编码区以增强多肽分泌。但是,任何能引导表达后的多肽进入所用宿主细胞的分泌途径的信号肽编码区都可以用于本发明。
调控序列还可以是肽原编码区,该区编码位于多肽氨基末端的一段氨基酸序列。所得多肽被称为酶原或多肽原。多肽原通常没有活性,可以通过催化或自我催化而从多肽原切割肽原而转化为成熟的活性多肽。
在多肽的氨基末端即有信号肽又有肽原区时,肽原区紧邻多肽的氨基末端,而信号肽区则紧邻肽原区的氨基末端。
添加能根据宿主细胞的生长情况来调节多肽表达的调控序列可能也是需要的。调控系统的例子是那些能对化学或物理刺激物(包括在有调控化合物的情况下)作出反应,从而开放或关闭基因表达的系统。调控序列的其他例子是那些能使基因扩增的调控序列。在这些例子中,应将编码蛋白或多肽的核酸序列与调控序列可操作地连接在一起。
本文中,术语“高表达”是指基因,如肿瘤相关抗原基因的表达水平明显高于正常组织中相应的基因的表达水平。
本文中,术语“个体”、“对象”和“患者”具有相同的含义,指动物,尤其是哺乳动物,更优选指人。
本发明的核酸构建体可含有依次连接的控制PiggyBac转座酶表达的启动子、PiggyBac转座酶编码序列、PiggyBac转座子5’末端重复序列、任选的polyA加尾信号序列1、多克隆插入位点、polyA加尾信号序列2和PiggyBac转座子3’末端重复序列。
PiggyBac转座酶表达的启动子包括本领域周知的各种适用于PiggyBac转座酶表达的启动子,包括但不限于EF1α启动子、PGK启动子、β-actin启动子、CMV启动子、EEF2启动子、CAG启动子、U6启动子和SV40启动子。在某些实施方案中,本发明使用CMV启动子。进一步地,示例性的CMV启动子的序列可如SEQ ID NO:1所示。
本文中,PiggyBac转座酶为是本领域周知的PiggyBac转座酶,包括其本领域周知的具有所需转座酶功能的各种突变体。通常,在本发明的核酸构建体中,在PiggyBac转座酶表达的启动子和PiggyBac转座酶编码序列之间还可含有核定位信号(NLS)的编码序列。核定位信号通常为一短的氨基酸序列,它能与入核载体相互作用,使蛋白能被运进细胞核。核定位信号通常由4-8个氨基酸组成,含有Pro、Lys和Arg。本领域周知的核定位信号可用于本发明。示例性的核定位信号包括但不限于c-myc核定位信号和SV40核定位信号。PiggyBac转座酶的编码序列可操作性地与一个或多个拷贝的核定位信号序列的编码序列连接。示例性的含有核定位信号编码序列的PiggyBac转座酶的编码序列可如SEQ ID NO:2所示。
本发明的核酸构建体中还含有PiggyBac转座子的3’和5’末端重复序列。可使用全长的3’和5’末端重复序列。示例性的全长的5’和3’末端重复序列可如SEQ ID NO:10和11所示。本文优选使用本领域周知的截短的、具有功能的3’和5’末端重复序列。示例性的截短的5’和3’末端重复序列可分别如本申请SEQ ID NO:3和7所示;或者,也可使用本领域已披露的其它已知的截短的5’和3’末端重复序列。例如,可使用CN105154473A(本文将其全部内容以引用的方式纳入本文)所披露的截短的5’和3’末端重复序列(该申请的SEQ ID NO:1和4)。
本领域周知的polyA加尾信号序列均可用于本发明,包括但不限于SV40polyA加尾信号序列以及本领域周知的各种截短形式的polyA加尾信号。示例性的polyA加尾信号序列可如SEQ ID NO:4和6所述。本发明的核酸构建体中可含有两条polyA加尾信号,如本文所述,分别称为polyA加尾信号1和polyA加尾信号2,这两条polyA加尾信号可相同或不同。在优选的实施方案中,本发明的核酸构建体中仅含有polyA加尾信号2。
本发明的核酸构建体中还含有多克隆插入位点,用于在此处插入感兴趣的表达框,或用感兴趣的表达框替换该多克隆插入位点。
在本发明的优选实施方案中,本发明的核酸构建体含有依次连接的CMV启动子序列(SEQ ID NO:1)、含c-myc核定位信号的PiggyBac转座酶编码序列(SEQ ID NO:2)、PiggyBac转座子5’末端重复序列(SEQ ID NO:3)、polyA加尾信号序列1(SEQ ID NO:4)、多克隆插入位点(SEQ ID NO:5)、polyA加尾信号序列2(SEQ ID NO:6)和PiggyBac转座子3’末端重复序列(SEQ ID NO:7)。在某些实施方案中,本发明的核酸构建体含有依次连接的CMV启动子序列(SEQ ID NO:1)、含c-myc核定位信号的PiggyBac转座酶编码序列(SEQ ID NO:2)、PiggyBac转座子5’末端重复序列(SEQ ID NO:3)、多克隆插入位点(SEQ ID NO:5)、polyA加尾信号序列2(SEQ ID NO:6)和PiggyBac转座子3’末端重复序列(SEQ ID NO:7)。
在某些优选的实施方案中,本发明各实施方案所述的核酸构建体中,除5’和3’末端重复序列内所含的TTAA外的其它所有TTAA均被删除。因此,在某些优选的实施方案中,本发明的核酸构建体含有依次连接的CMV启动子序列(SEQ ID NO:1)、含c-myc核定位信号的PiggyBac转座酶编码序列(SEQ ID NO:2)、PiggyBac转座子5’末端重复序列(SEQ ID NO:3)、多克隆插入位点(SEQ ID NO:5)、polyA加尾信号序列2(SEQ ID NO:6)和PiggyBac转座子3’末端重复序列(SEQ ID NO:7),且除5’和3’末端重复序列内所含的TTAA外的其它所有TTAA均被删除。
在某些实施方案中,本发明的核酸构建体中,在多克隆插入位点处插入了一个或多个相同或不同的感兴趣基因的表达框,或者该多克隆插入位点被一个或多个相同或不同的感兴趣基因的表达框替换。通常,表达框的数量可根据需要设定,例如1个、2个、3个或更多个。感兴趣基因通常表达感兴趣的多肽,如活性蛋白,包括抗体,如scFv。示例性的感兴趣的多肽包括但不限于:各种报告子,如荧光素报告蛋白(例如绿色荧光蛋白、红色荧光蛋白和黄色荧光蛋白等)、荧光素酶(例如萤火虫荧光素酶和海肾荧光素酶等);具有感兴趣的生物学功能的功能蛋白,如TP53、GM-CSF、OCT4、SOX2、Nanog、KLF4和c-Myc等;抗体,如scFv,或其功能性片段,如抗PD1抗体或其scFv;各种类型的嵌合抗原受体(CAR),如针对CD19或PD1的CAR等。可插入多克隆插入位点或替换该多克隆插入位点的序列还包括RNAi基因。
在某些实施方案中,本发明的核酸构建体为重组载体。重组载体可以是重组克隆载体、重组真核表达质粒或者重组病毒载体。重组克隆载体的骨架载体可来自pUC18、pUC19、pMD18-T、pMD19-T、pGM-T载体、pUC57、pMAX或pDC315系列载体。重组表达载体的骨架载体可来自pCDNA3系列载体、pCDNA4系列载体、pCDNA5系列载体、pCDNA6系列载体、pRL系列载体、pUC57载体、pMAX载体或pDC315系列载体。重组病毒载体的骨架载体可来自重组腺病毒载体、重组腺相关病毒载体、重组逆转录病毒载体、重组单纯疱疹病毒载体或重组痘苗病毒载体。
可采用本领域周知的方法构建本发明的重组载体。例如,可根据所使用的骨架载体所含的酶切位点,在本发明的核酸构建体的两端分别加入合适的酶切位点,然后装入该骨架载体中。
本发明的核酸构建体和重组载体可用作将外源基因表达框整合到宿主细胞基因组的工具,或者可用作基因组研究、基因治疗、细胞治疗或者干细胞诱导和诱导后分化的工具。在某些实施方案中,本发明的核酸构建体和重组载体还可用于制备将外源基因表达框整合到宿主细胞基因组的药物或者试剂,或用于制备基因组研究、基因治疗、细胞治疗或者干细胞诱导和诱导后分化的药物或制剂。
因此,在某些实施方案中,本发明还提供一种重组细胞,所述重组细胞含有或转入了本发明任一实施方案所述的核酸构建体或重组载体。合适的重组细胞可以是任何感兴趣的细胞,包括但不限于哺乳动物细胞,例如原代培养T细胞、Jurkat细胞、K562细胞、胚胎干细胞、肿瘤细胞、HEK293细胞或CHO细胞等。在某些实施方案中,所述重组细胞的基因组中整合有感兴趣的表达框,该表达框经由本发明的核酸构建体或重组载体整合到该重组细胞的基因组中。
因此,本发明和包括制备基因组整合有外源基因表达框的细胞的方法以及由此获得的重组细胞。本发明的方法包括将含有感兴趣表达框的本发明所述的重组载体转染到感兴趣的细胞中,并培养转染的细胞。通常,培养转染的细胞至三代以上,可获得表达框已稳定整合到基因组中的细胞。细胞转染及培养的方法为本领域常规方法,可根据不同细胞种类选择合适的转染及培养方法。
在某些实施方案中,当本发明的载体中含有治疗性蛋白的表达框时,该载体或含有该载体的细胞,或经由该载体而在基因组中整合了该表达框的细胞可用于医药用途,例如用于治疗该治疗性蛋白能治疗的疾病,或用于制备治疗该治疗性蛋白能治疗的疾病用的药物或制剂。合适的治疗性蛋白为本领域所周知,包括各种具有治疗功能的抗体(包括单链抗体)、嵌合抗原受体和细胞因子等。在某些实施方案中,适用于本发明的治疗性蛋白可以是本领域周知的可用于治疗高表达CD19、CD20、CEA、GD2、GPC3、FR、PSMA、gp100、CA9、CD171/L1-CAM、IL-13Rα2、MART-1、ERBB2、NY-ESO-1、MAGE家族蛋白、BAGE家族蛋白、GAGE家族蛋白、AFP、MUC1、CD22、CD23、CD30、CD33、CD44v7/8、CD70、VEGFR1、VEGFR2、IL-11Rα、EGP-2、EGP-40、FBP、GD3、PSCA、FSA、PSA、TAG-72、h5T4、胎儿型乙酰胆碱受体、LeY、EpCAM、MSLN、IGFR1、EGFR、EGFRvIII、ERBB3、ERBB4、CA125、CA15-3、CA19-9、CA72-4、CA242、CA50、CYFRA21-1、SCC、AFU、EBV-VCA、TSGF、SF、POA、β2-MG和PROGRP中的一种或多种的癌症的治疗性蛋白;优选地,治疗性蛋白是可用于治疗CD19、MSLN、MUC1、EGFR、EGFRvIII和GPC3中的一种或多种高表达的癌症的治疗性蛋白。更进一步地,适用于本发明的治疗性蛋白可以是本领域周知的可用于治疗急性B淋巴细胞白血病、慢性B淋巴细胞白血病、套细胞淋巴瘤、非霍奇金淋巴瘤、多发性骨髓瘤肺癌、肝癌、淋巴瘤、结肠癌、大肠癌、乳腺癌、卵巢癌、宫颈癌、胃癌、胆管癌、胆囊癌、食管癌、肾癌、神经胶质瘤、黑色素瘤、骨肉瘤、胰腺癌和前列腺癌中的一种或多种的治疗性蛋白。
因此,本发明也包括本发明所述的各种核酸构建体、重组载体和细胞中的一种或多种在制备治疗癌症药物中的应用,以及使用本发明所述的各种核酸构建体、重组载体和细胞中的一种或多种或其药物组合物治疗个体的癌症的方法。优选地,所述核酸构建体、重组载体和细胞含有治疗性蛋白的表达框;更优选地,所述治疗性蛋白特异性结合或靶向前文所述的在癌症中高表达的蛋白(所述结合或靶向将使得高表达所述蛋白的癌细胞的生长、转移被抑制,或使得该表达所述蛋白的癌细胞被杀死)中的一种或多种。优选地,癌症可以是前文所述的高表达一种或多种所述蛋白的癌症,或者可选自急性B淋巴细胞白血病、慢性B淋巴细胞白血病、套细胞淋巴瘤、非霍奇金淋巴瘤、多发性骨髓瘤肺癌、肝癌、淋巴瘤、结肠癌、大肠癌、乳腺癌、卵巢癌、宫颈癌、胃癌、胆管癌、胆囊癌、食管癌、肾癌、神经胶质瘤、黑色素瘤、骨肉瘤、胰腺癌和前列腺癌中的一种或多种。
可采用本领域周知的各种给药方式给药,包括但不限于局部给药等;具体的给药方式可根据不同药物类型和疾病种类加以确定。给药的剂量可根据患者的年龄、性别、疾病的严重程度、所使用的药剂等由本领域技术人员加以确定。
药物组合物中可含有治疗有效量的本文所述的核酸构建体、载体和/或细胞。所述治疗有效量为能有效治疗或缓解疾病的一种或多种症状的量,可由本领域技术人员采用常规的方法加以确定。药物组合物中还可含有合适的药学上可接受的载体或赋形剂。例如,对于含有细胞的药物组合物,可含有合适的适于保持细胞活性并与动物体相容的载体或赋形剂。
下面将结合实施例对本发明的实施方案进行详细描述。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1载体的构建
pNBC载体的构建
委托上海杰瑞生物科技有限公司合成依次连接的CMV启动子序列(SEQ ID NO:1)、含c-myc核定位信号的PiggyBac转座酶编码序列(SEQ ID NO:2)、PiggyBac转座子5’末端重复序列(SEQ ID NO:3)、synthetic polyA加尾信号序列(SEQ ID NO:4)、多克隆插入位点(SEQ ID NO:5)、SV40 polyA加尾信号序列(SEQ ID NO:6)和PiggyBac转座子3’末端重复序列(SEQ ID NO:7),并在两端分别加入PacI与AscI酶切位点,装入pUC57(购自上海杰瑞生物),所得载体命名为pNBC载体,载体结构见图1。
pNBC(-)载体的构建
构建方法同pNBC,区别在于不包含synthetic polyA加尾信号序列(SEQ ID NO:4),片段装入pUC57(购自上海杰瑞生物),命名为pNBC(-)载体,载体结构见图2。
pNBC-AD载体的构建
前半部分构建方法同pNBC(-),区别在于获得pNBC(-)后,将pNBC(-)中5’末端重复序列和3’末端重复序列以外的“TTAA”删除,包括SV40 poly A加尾序列中2处,复制起始点与CMV启动子之间3处,复制起始点与卡那霉素抗性基因之间1处。
委托上海杰瑞生物科技有限公司合成bGH poly(A)加尾信号序列(SEQ ID NO:8)替换SV40 poly A加尾信号序列;命名pNBC-i(-)。
合成引物(杰瑞):
Nde I-CMV:TTGGCATATGATACACTTGATGTACTG(SEQ ID NO:15)
Xho I-CMV:GCCTCTCGAGGACATTGATTATTGAC(SEQ ID NO:16)
Xho I-ori:TGTCCTCGAGAGGCCTCACGTGACATGT(SEQ ID NO:17)
Inter-R:ATGACCAAAATCCCCGTGAGTTTTCGTTCC(SEQ ID NO:18)
Inter-F:AACGAAAACTCACGGGGATTTTGGTCATGC(SEQ ID NO:19)
Nco I-KanR:GTGACCCATGGCGATGCCT(SEQ ID NO:20)
以pNBC(-)为模板,分别以引物Nde I-CMV/Xho I-CMV、Xho I-ori/Inter-R和Inter-F/Nco I-KanR进行PCR扩增,按照
HS DNA polymerase试剂盒说明操作,分别扩增得264bp、742bp和274bp片段,分别电泳回收片段后1:1:1混匀作为模板,以引物Nde I-CMV/Nco I-KanR进行合拉PCR扩增,获得1238bp片段双链DNA,此片段经Nde I+NcoI(NEB)双酶切后回收;
质粒pNBC-i(-)经ASC I+Nde I双酶切,分别回收2568bp片段和1860bp片段;1860bp片段再用Nco I酶切,回收623bp片段;将2568bp片段、623bp片段和上述酶切后的1238bp片段进行三片段连接(solution I)获得的删除多余TTAA序列的载体,命名为pNBC-AD,载体结构见图3。
pNBC-D3载体的构建
构建方法同pNBC(-),区别在于PiggyBac转座子5’末端重复序列(SEQ ID NO:3)也替换为3’末端重复序列(SEQ ID NO:7),片段装入pUC57(购自上海杰瑞生物),命名为pNBC-D3载体,载体结构见图4。
pNBC-D5载体的构建
构建方法同pNBC(-),区别在于PiggyBac转座子3’末端重复序列(SEQ ID NO:7)也替换为5’末端重复序列(SEQ ID NO:3),片段装入pUC57(购自上海杰瑞生物),命名为pNBC-D5载体,载体结构见图5。
实施例2:含外源基因表达框的载体的构建
1、含EGFP表达框的pNBC载体的构建
(1)委托上海杰瑞生物科技有限公司合成DTS EF1α启动子的序列(序列如SEQ IDNO:8所示),并在两端分别加入Xba I与EcoR I酶切位点,装入实施例1制备的各载体,分别获得pNB338C、pNB338C(-)、pNB338C-AD、pNB338C-D3和pNB338C-D5。
(2)委托上海杰瑞生物科技有限公司合成EGFP的编码序列(SEQ ID NO:9),并在两端分别加入EcoR I与Sal I酶切位点,装入(1)中获得的各载体,获得相应的载体,分别命名为pNB338C-EGFP、pNB338C-EGFP(-)、pNB338C-EGFP-AD、pNB338C-EGFP-D3和pNB338C-EGFP-D5。
2、pNB338B-EGFP载体的构建
基于CN105154473A公开的pNB328-EGFP载体,将pNB328-EGFP中的EF1a启动子序列替换成本发明的序列为SEQ ID NO:8的DTS EF1a启动子,即获得pNB338B-EGFP载体。
3、pNB338CFL-EGFP(-)载体的构建
委托上海杰瑞生物科技有限公司合成PB转座子全长的5’ITR的序列(SEQ ID NO:10)和全长的3’ITR的序列(SEQ ID NO:11),分别替换载体pNB338C-EGFP(-)的5’ITR和3’ITR,获得全长ITR的含EGFP表达框的PB载体pNB338CFL-EGFP(-)。载体结构见图6。
4、含PD-1单链抗体编码序列的pNBC载体的构建
方法与含EGFP表达框载体的构建方法相同,将pNB338C-EGFP、pNB338C-EGFP(-)、pNB338C-EGFP-AD、pNB338C-EGFP-D3和pNB338C-EGFP-D5中EGFP的编码序列替换成PD-1单链抗体的编码序列(序列如SEQ ID NO:12所示),分别获得pNB338C-PD1scFv、pNB338C-PD1scFv(-)、pNB338C-PD1scFv-AD、pNB338C-PD1scFv-D3和pNB338C-PD1scFv-D5。
5、pNB338B-PD1scFv载体的构建
基于CN105154473A公开的pNB328-EGFP载体,将pNB328-EGFP中的EF1a启动子序列替换成本发明的序列为SEQ ID NO:8的DTS EF1a启动子,将其中的EGFP编码序列替换成序列为SEQ ID NO:12的PD-1单链抗体编码序列,即获得pNB338B-PD1scFv载体。
6、含CD19CAR编码序列的pNBC载体的构建
与上述含EGFP表达框的载体的构建方法相同,将pNB338B-EGFP、pNB338C-EGFP(-)和pNB338C-EGFP-AD中EGFP的编码序列替换成CD19CAR编码序列(序列如SEQ ID NO:21所示),分别获得pNB338B-CD19CAR、pNB338C-CD19CAR(-)、pNB338C-CD19CAR-AD。
实施例3:含EGFP表达框载体在CHO细胞中整合效率的检测
准备2×106个代谢旺盛的CHO细胞,通过Lonza-Nucleofector 2b仪器,分别将质量均为6μg的pNB338B-EGFP、pNB338C-EGFP、pNB338C-EGFP(-)、pNB338C-EGFP-AD、pNB338C-EGFP-D3、pNB338C-EGFP-D5及pNB338CFL-EGFP(-)转染到细胞核中(NucleofectorTM 2b程序H-014),置37℃、5%CO2孵箱培养。待细胞长满后,按1:5的比例传代培养。在转染后的第13天、3次传代后用流式细胞仪检测EGFP阳性细胞的比例变化,未转染质粒的CHO细胞作为流式细胞检测的对照。
按1:5的比例稀释传代,非整合的质粒随着细胞的分裂,质粒很快丢失。3代以后,绿色荧光阳性的细胞可以认为绿色荧光表达框已经稳定整合。通过流式检测绿色荧光阳性细胞比例,可确定整合的效率。
结果如图7所示,图7A-7C分别显示pNB338C-EGFP、pNB338C-EGFP(-)、pNB338C-EGFP-AD的整合效率分别为49.8%、59.64%和54.43%(图7A-7C),均高于pNB338B-EGFP的32.15%(图7D)。而当两端的ITR均为3’末端重复序列时,整合效率有大约35%(图7E)。当两端的ITR均为5’末端重复序列时则基本观察不到整合现象(图7F),与流式检测的对照结果基本一致。当两端ITR为全长序列时,整合效率有54.11%(图7G),与最小的ITR整合效率没有显著差别。图7A-7G的定量柱状图结果如图7H所示。pNB338C-EGFP(-)与pNB338C-EGFP-AD的整合效率相对最高;pNB338CFL-EGFP(-)的整合效率与pNB338C-EGFP(-)和pNB338C-EGFP-AD的整合效率基本相当。
pNB338C-EGFP(-)、pNB338C-EGFP-AD在整合效率上大体相当,但pNB338C-EGFP-AD的荧光强度整体上比pNB338C-EGFP(-)的荧光强度更强,表明在整合到细胞基因组后,pNB338C-EGFP-AD的表达强度明显高于pNB338C-EGFP(-)。
实施例4:不同个体来源的PBMC转染含PD-1单链抗体编码序列的pNBC载体后PD-1抗体表达量的检测
将实施例2构建得到的含PD-1单链抗体编码序列的pNB338C-PD1scFv、pNB338C-PD1scFv(-)、pNB338C-PD1scFv-AD、pNB338C-PD1scFv-D3、pNB338C-PD1scFv-D5和pNB338B-PD1scFv通过Lonza2b-Nucleofector仪器电转来源于5名供体受试者(5名供体受试者均为健康成年人)的PBMC(NucleofectorTM 2b程序U-014),电转获得的活化T细胞按2×106细胞数目收集细胞并按2×106细胞/孔,铺在加有3ml AIM-V培液的6孔板中,置于37℃,5%CO2培养箱培养,并于培养24h后收集细胞上清,-20℃保存备用。
用ELISA方法检测PD-1scFv的表达水平。使用纯化的人源的PD-1抗原重组蛋白包被酶标板,用带HRP标记的鼠抗人IgG4mAb作为二抗,以纯化的PD-1单链抗体作为标准品制作标准曲线。纯化的人源PD-1抗原按以下方法制备得到:合成序列为SEQ ID NO:13所示的在5’端包含轻链信号肽编码序列的人源PD-1抗原编码序列,在5’端与3’端分别连接EcoRI与XbaI的酶切位点接头后,连接到pCDNA3.4载体上,构建得到过表达人源PD-1抗原的表达载体。根据ExpiCHOTM表达系统(购自Thermo Fisher公司,货号:A29133)说明书,使用ExpiCHOTM表达系统对上述融合蛋白进行过表达后,使用GE Healthcare的MabSelect亲和层析树脂按说明书操作步骤对表达产物进行纯化,获得人源PD-1抗原蛋白。纯化的PD-1单链抗体的制备方法与上述类似,将SEQ ID NO:13替换为序列为SEQ ID NO:14所示的在5’端包含轻链信号肽编码序列的PD-1scFv编码序列,其他同人源PD-1抗原的纯化步骤。待测样品50倍稀释后定量检测电转了pNB338C-PD1scFv、pNB338C-PD1scFv(-)、pNB338C-PD1scFv-AD、pNB338C-PD1scFv-D3、pNB338C-PD1scFv-D5和pNB338B-PD1scFv的来源于五名患者T细胞的PD-1单链抗体的表达量。
结果如图8所示,电转了pNB338C-PD1scFv(-)和pNB338C-PD1scFv-AD载体的5名供体受试者的原代T细胞中PD-1单链抗体表达量的中位数值分别为96.06ng/mL和97.66ng/mL,高于电转了pNB338B-PD1scFv载体的五名患者原代T细胞PD-1抗体表达量的中位数值77.94ng/mL。电转了pNB338C-PD1scFv载体的5名供体受试者的原代细胞的PD-1抗体表达量的中位数值为81.45ng/mL,略高于pNB338B-PD1scFv载体。电转了pNB338C-PD1scFv-D3载体的5名供体受试者的原代细胞的PD-1抗体表达量的中位数值为38.50ng/mL,与pNB338C-PD1scFv(-)载体的PD-1抗体表达量中位数值相比明显更低。而电转了pNB338C-PD1scFv-D5的细胞几乎没有检测到PD-1单链抗体表达量的表达。
实施例5:不同个体来源的PBMC转染含CD19CAR编码序列的pNBC载体CD19CAR-T细胞比例检测
(1)包板:6孔板中加入1ml PBS溶液,加入CD19抗原(Acro,货号:CD9-H5259)和抗CD28抗体(Merck Millipore,货号:CBL517),终浓度各5μg/ml,4℃,包板过夜。
(2)从3名供体受试者(3名供体受试者均为健康成年人)的血液中分离PBMC,15ml离心管中加入5ml含2%FBS AIM-Ⅴ培养基,将细胞转移到离心管中,1200rpm,离心5min;弃去上清,转移到加入3ml含2%FBS AIM-Ⅴ培养基的六孔板中,培养20-30min。
(3)将细胞收集到15ml离心管中,1200rpm,离心5min,弃去上清,5ml0.9%生理盐水重悬计数;将细胞加入到1.5ml离心管,每管2×106个细胞,2000rpm,离心4min;弃去上清。
(4)取Lonza电转试剂盒配置电转液,每份电转液100μl(18μl NucleofectorTMSupplement+82μl NucleofectorTM Solution),分别加入质粒pNB338B-CD19CAR、pNB338C-CD19CAR(-)和pNB338C-CD19CAR-AD各6μg,用电转液重悬细胞,U-014程序进行电转。电转后的细胞加入12孔板,每孔1ml AIM-Ⅴ(含2%的FBS)培养基,培养箱中放置4-6小时。
(5)弃去包被孔板中的包被液,将电转后放置4-6小时的T细胞转入包被的6孔板;每孔补充含2%FBS AIM-Ⅴ培养基至3ml,加入IL-2(500IU/ml),轻轻混匀,记为第0天。
(6)37℃,5%CO2细胞培养箱中放置5天;第5天将细胞转出包被的孔板,继续培养;根据显微镜下观察细胞密度,每1-2天进行传代培养,培养使用添加了IL-2(50IU/ml)的含2%FBS AIM-Ⅴ培养基,继续培养扩增。
在第13天取CAR-T细胞,流式检测其阳性率。
(1)在流式管中加入1×106个细胞;加入1ml PBS磷酸盐缓冲液进行洗涤,400g离心5min,弃去上清;加入100μl PBS磷酸盐缓冲液进行重悬;
(2)加入2μl生物素化人CD19,Fc标签,伯胺标记的(Acro,CD-H8259)流式抗体,混匀,2-8℃冰箱放置,避光孵育30min;设置一组空白对照,不加试剂;
(3)加入1ml PBS磷酸盐缓冲液,400g离心5min,弃去上清,再次加入1ml PBS磷酸盐缓冲液,400g离心5min,弃去上清;
(4)加入100μl PBS磷酸盐缓冲液重悬细胞,加入1μl PE链霉亲和素流式抗体(BD,554061),混匀,2-8℃冰箱放置,避光孵育30min;
(5)加1ml PBS磷酸盐缓冲液,400g离心5min,弃去上清,再次加入1ml PBS磷酸盐缓冲液,400g离心5min,弃去上清;吸取400μl PBS磷酸盐缓冲液重悬细胞,用流式细胞仪进行检测。
结果如图9所示,pNB338B-CD19CAR组的CAR-T细胞阳性比例为64.21%,pNB338C-CD19CAR(-)组和pNB338C-CD19CAR-AD组的CAR T细胞阳性比例分别为73.34%和77.90%,pNB338C-CD19CAR-AD组与pNB338B-CD19CAR组之间呈显著差异(p=0.0417)。图9结果表明pNB338C-CD19CAR(-)与pNB338C-CD19CAR-AD的整合效率明显高于pNB338B-CD19CAR。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 上海细胞治疗集团有限公司
上海细胞治疗研究院
<120> 一种改进的PB转座子系统及其用途
<130> 183644
<160> 21
<170> SIPOSequenceListing 1.0
<210> 1
<211> 601
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
gacattgatt attgactagt tatagtaatc aattacgggg tcattagttc atagcccata 60
tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga 120
cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt 180
ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt 240
gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca 300
ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt 360
catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg gatagcggtt 420
tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt tgttttggca 480
ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga cgcaaatggg 540
cggtaggcgt gtacggtggg aggtctatat aagcagagct cgtttagtga accgtcagat 600
c 601
<210> 2
<211> 1815
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atgggccctg ctgccaagag ggtcaagttg gacggcagca gcctggacga cgagcacatc 60
ctgagcgccc tgctgcagag cgacgacgag ctggtgggcg aggacagcga cagcgaggtg 120
agcgaccacg tgagcgagga cgacgtgcag agcgacaccg aggaggcctt catcgacgag 180
gtgcacgagg tgcagcccac cagcagcggc agcgagatcc tggacgagca gaacgtgatc 240
gagcagcccg gcagcagcct ggccagcaac cgcatcctga ccctgcccca gcgcaccatc 300
cgcggcaaga acaagcactg ctggagcacc agcaagccca cccgccgcag ccgcgtgagc 360
gccctgaaca tcgtgcgcag ccagcgcggc cccacccgca tgtgccgcaa catctacgac 420
cccctgctgt gcttcaagct gttcttcacc gacgagatca tcagcgagat cgtgaagtgg 480
accaacgccg agatcagcct gaagcgccgc gagagcatga ccagcgccac cttccgcgac 540
accaacgagg acgagatcta cgccttcttc ggcatcctgg tgatgaccgc cgtgcgcaag 600
gacaaccaca tgagcaccga cgacctgttc gaccgcagcc tgagcatggt gtacgtgagc 660
gtgatgagcc gcgaccgctt cgacttcctg atccgctgcc tgcgcatgga cgacaagagc 720
atccgcccca ccctgcgcga gaacgacgtg ttcacccccg tgcgcaagat ctgggacctg 780
ttcatccacc agtgcatcca gaactacacc cccggcgccc acctgaccat cgacgagcag 840
ctgctgggct tccgcggccg ctgccccttc cgcgtgtaca tccccaacaa gcccagcaag 900
tacggcatca agatcctgat gatgtgcgac agcggcacca agtacatgat caacggcatg 960
ccctacctgg gccgcggcac ccagaccaac ggcgtgcccc tgggcgagta ctacgtgaag 1020
gagctgagca agcccgtgca cggcagctgc cgcaacatca cctgcgacaa ctggttcacc 1080
agcatccccc tggccaagaa cctgctgcag gagccctaca agctgaccat cgtgggcacc 1140
gtgcgcagca acaagcgcga gatccccgag gtgctgaaga acagccgcag ccgccccgtg 1200
ggcaccagca tgttctgctt cgacggcccc ctgaccctgg tgagctacaa gcccaagccc 1260
gccaagatgg tgtacctgct gagcagctgc gacgaggacg ccagcatcaa cgagagcacc 1320
ggcaagcccc agatggtgat gtactacaac cagaccaagg gcggcgtgga caccctggac 1380
cagatgtgca gcgtgatgac ctgcagccgc aagaccaacc gctggcccat ggccctgctg 1440
tacggcatga tcaacatcgc ctgcatcaac agcttcatca tctacagcca caacgtgagc 1500
agcaagggcg agaaggtgca gagccgcaag aagttcatgc gcaacctgta catgggcctg 1560
accagcagct tcatgcgcaa gcgcctggag gcccccaccc tgaagcgcta cctgcgcgac 1620
aacatcagca acatcctgcc caaggaggtg cccggcacca gcgacgacag caccgaggag 1680
cccgtgatga agaagcgcac ctactgcacc tactgcccca gcaagatccg ccgcaaggcc 1740
agcgccagct gcaagaagtg caagaaggtg atctgccgcg agcacaacat cgacatgtgc 1800
cagagctgct tctaa 1815
<210> 3
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ccctagaaag atagtctgcg taaaattgac gcatg 35
<210> 4
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
aataaaatat ctttattttc attacatctg tgtgttggtt ttttgtgtg 49
<210> 5
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tctagagtca gaattcggat ccgatatcac tagtgtcgac 40
<210> 6
<211> 214
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa aaatgcttta 60
tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc aataaacaag 120
ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg tgggaggttt 180
tttaaagcaa gtaaaacctc tacaaatgtg gtag 214
<210> 7
<211> 63
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
catgcgtcaa ttttacgcat gattatcttt aacgtacgtc acaatatgat tatctttcta 60
ggg 63
<210> 8
<211> 685
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60
agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120
tgcatctcaa ttagtcagca accaaggatc tgcgatcgct ccggtgcccg tcagtgggca 180
gagcgcacat cgcccacagt ccccgagaag ttggggggag gggtcggcaa ttgaacgggt 240
gcctagagaa ggtggcgcgg ggtaaactgg gaaagtgatg tcgtgtactg gctccgcctt 300
tttcccgagg gtgggggaga accgtatata agtgcagtag tcgccgtgaa cgttcttttt 360
cgcaacgggt ttgccgccag aacacagctg aagcttcgag gggctcgcat ctctccttca 420
cgcgcccgcc gccctacctg aggccgccat ccacgccggt tgagtcgcgt tctgccgcct 480
cccgcctgtg gtgcctcctg aactgcgtcc gccgtctagg taagtagctc aggtcgagac 540
cgggcctttg tccggcgctc ccttggagcc tacctagact cagccggctc tccacgcttt 600
gcctgaccct gcttgctcaa ctctacgtct ttgtttcgtt ttctgttctg cgccgttaca 660
gatccaagct gtgaccggcg cctac 685
<210> 9
<211> 720
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 10
<211> 311
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ccctagaaag atagtctgcg taaaattgac gcatgcattc ttgaaatatt gctctctctt 60
tctaaatagc gcgaatccgt cgctgtgcat ttaggacatc tcagtcgccg cttggagctc 120
ccgtgaggcg tgcttgtcaa tgcggtaagt gtcactgatt ttgaactata acgaccgcgt 180
gagtcaaaat gacgcatgat tatcttttac gtgactttta agatttaact catacgataa 240
ttatattgtt atttcatgtt ctacttacgt gataacttat tatatatata ttttcttgtt 300
atagatacct c 311
<210> 11
<211> 230
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ttgttacttt atagaagaaa ttttgagttt ttgttttttt ttaataaata aataaacata 60
aataaattgt ttgttgaatt tattattagt atgtaagtgt aaatataata aaacttaata 120
tctattcaaa ttaataaata aacctcgata tacagaccga taaaacacat gcgtcaattt 180
tacgcatgat tatctttaac gtacgtcaca atatgattat ctttctaggg 230
<210> 12
<211> 1488
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
atggaagccc cagctcagct tctcttcctc ctgctactct ggctcccaga taccaccgga 60
gaaattgtgt tgacacagtc tccagccacc ctgtctttgt ctccagggga aagagccacc 120
ctctcctgca gggccagcaa aggtgtcagt acatctggct atagttattt gcactggtat 180
caacagaaac ctggccaggc tcccaggctc ctcatctatc ttgcatccta cctagaatct 240
ggcgtcccag ccaggttcag tggtagtggg tctgggacag acttcactct caccatcagc 300
agcctagagc ctgaagattt tgcagtttat tactgtcagc acagcaggga ccttccgctc 360
acgttcggcg gagggaccaa agtggagatc aaaggtggag gcggttcagg cggaggtggc 420
agcggcggtg gcgggtcgca ggtgcagctg gtgcagtccg gcgtggaggt gaagaagcct 480
ggcgcctccg tcaaggtgtc ctgtaaggcc tccggctaca ccttcaccaa ctactacatg 540
tactgggtgc ggcaggcccc aggccaggga ctggagtgga tgggcggcat caacccttcc 600
aacggcggca ccaacttcaa cgagaagttc aagaaccggg tgaccctgac caccgactcc 660
tccaccacaa ccgcctacat ggaactgaag tccctgcagt tcgacgacac cgccgtgtac 720
tactgcgcca ggcgggacta ccggttcgac atgggcttcg actactgggg ccagggcacc 780
accgtgaccg tgtcctccga gtccaaatat ggtcccccat gcccaccatg cccagcacct 840
gagttcctgg ggggaccatc agtcttcctg ttccccccaa aacccaagga cactctcatg 900
atctcccgga cccctgaggt cacgtgcgtg gtggtggacg tgagccagga agaccccgag 960
gtccagttca actggtacgt ggatggcgtg gaggtgcata atgccaagac aaagccgcgg 1020
gaggagcagt tcaacagcac gtaccgtgtg gtcagcgtcc tcaccgtcct gcaccaggac 1080
tggctgaacg gcaaggagta caagtgcaag gtctccaaca aaggcctccc gtcctccatc 1140
gagaaaacca tctccaaagc caaagggcag ccccgagagc cacaggtgta caccctgccc 1200
ccatcccagg aggagatgac caagaaccag gtcagcctga cctgcctggt caaaggcttc 1260
taccccagcg acatcgccgt ggagtgggag agcaatgggc agccggagaa caactacaag 1320
accacgcctc ccgtgctgga ctccgacggc tccttcttcc tctacagcag gctaaccgtg 1380
gacaagagca ggtggcagga ggggaatgtc ttctcatgct ccgtgatgca tgaggctctg 1440
cacaaccact acacacagaa gagcctctcc ctgtctctgg gtaaatga 1488
<210> 13
<211> 924
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atggaagccc cagctcagct tctcttcctc ctgctactct ggctcccaga taccaccgga 60
cagatcccac aggcgccctg gccagtcgtc tgggcggtgc tacaactggg ctggcggcca 120
ggatggttct tagactcccc agacaggccc tggaaccccc ccaccttctc cccagccctg 180
ctcgtggtga ccgaagggga caacgccacc ttcacctgca gcttctccaa cacatcggag 240
agcttcgtgc taaactggta ccgcatgagc cccagcaacc agacggacaa gctggccgcc 300
ttccccgagg accgcagcca gcccggccag gactgccgct tccgtgtcac acaactgccc 360
aacgggcgtg acttccacat gagcgtggtc agggcccggc gcaatgacag cggcacctac 420
ctctgtgggg ccatctccct ggcccccaag gcgcagatca aagagagcct gcgggcagag 480
ctcagggtga cagagagaag ggcagaagtg cccacagccc accccagccc ctcacccagg 540
tcagccggcc agttccaaac cctggtggtt ggtgtcgtgg gcggcctgct gggcagcctg 600
gtgctgctag tctgggtcct ggccgtcatc tgctcccggg ccgcacgagg gacaatagga 660
gccaggcgca ccggccagcc cctgaaggag gacccctcag ccgtgcctgt gttctctgtg 720
gactatgggg agctggattt ccagtggcga gagaagaccc cggagccccc cgtgccctgt 780
gtccctgagc agacggagta tgccaccatt gtctttccta gcggaatggg cacctcatcc 840
cccgcccgca ggggctcagc tgacggccct cggagtgccc agccactgag gcctgaggat 900
ggacactgct cttggcccct ctga 924
<210> 14
<211> 1545
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
atggaagccc cagctcagct tctcttcctc ctgctactct ggctcccaga taccaccgga 60
gaagccccag ctcagcttct cttcctcctg ctactctggc tcccagatac caccggagaa 120
attgtgttga cacagtctcc agccaccctg tctttgtctc caggggaaag agccaccctc 180
tcctgcaggg ccagcaaagg tgtcagtaca tctggctata gttatttgca ctggtatcaa 240
cagaaacctg gccaggctcc caggctcctc atctatcttg catcctacct agaatctggc 300
gtcccagcca ggttcagtgg tagtgggtct gggacagact tcactctcac catcagcagc 360
ctagagcctg aagattttgc agtttattac tgtcagcaca gcagggacct tccgctcacg 420
ttcggcggag ggaccaaagt ggagatcaaa ggtggaggcg gttcaggcgg aggtggcagc 480
ggcggtggcg ggtcgcaggt gcagctggtg cagtccggcg tggaggtgaa gaagcctggc 540
gcctccgtca aggtgtcctg taaggcctcc ggctacacct tcaccaacta ctacatgtac 600
tgggtgcggc aggccccagg ccagggactg gagtggatgg gcggcatcaa cccttccaac 660
ggcggcacca acttcaacga gaagttcaag aaccgggtga ccctgaccac cgactcctcc 720
accacaaccg cctacatgga actgaagtcc ctgcagttcg acgacaccgc cgtgtactac 780
tgcgccaggc gggactaccg gttcgacatg ggcttcgact actggggcca gggcaccacc 840
gtgaccgtgt cctccgagtc caaatatggt cccccatgcc caccatgccc agcacctgag 900
ttcctggggg gaccatcagt cttcctgttc cccccaaaac ccaaggacac tctcatgatc 960
tcccggaccc ctgaggtcac gtgcgtggtg gtggacgtga gccaggaaga ccccgaggtc 1020
cagttcaact ggtacgtgga tggcgtggag gtgcataatg ccaagacaaa gccgcgggag 1080
gagcagttca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca ccaggactgg 1140
ctgaacggca aggagtacaa gtgcaaggtc tccaacaaag gcctcccgtc ctccatcgag 1200
aaaaccatct ccaaagccaa agggcagccc cgagagccac aggtgtacac cctgccccca 1260
tcccaggagg agatgaccaa gaaccaggtc agcctgacct gcctggtcaa aggcttctac 1320
cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa ctacaagacc 1380
acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaggct aaccgtggac 1440
aagagcaggt ggcaggaggg gaatgtcttc tcatgctccg tgatgcatga ggctctgcac 1500
aaccactaca cacagaagag cctctccctg tctctgggta aatga 1545
<210> 15
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ttggcatatg atacacttga tgtactg 27
<210> 16
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
gcctctcgag gacattgatt attgac 26
<210> 17
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tgtcctcgag aggcctcacg tgacatgt 28
<210> 18
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
atgaccaaaa tccccgtgag ttttcgttcc 30
<210> 19
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
aacgaaaact cacggggatt ttggtcatgc 30
<210> 20
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gtgacccatg gcgatgcct 19
<210> 21
<211> 1461
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
atggccttac cagtgaccgc cttgctcctg ccgctggcct tgctgctcca cgccgccagg 60
ccggacatcc agatgacaca gactacatcc tccctgtctg cctctctggg agacagagtc 120
accatcagtt gcagggcaag tcaggacatt agtaaatatt taaattggta tcagcagaaa 180
ccagatggaa ctgttaaact cctgatctac catacatcaa gattacactc aggagtccca 240
tcaaggttca gtggcagtgg gtctggaaca gattattctc tcaccattag caacctggag 300
caagaagata ttgccactta cttttgccaa cagggtaata cgcttccgta cacgttcgga 360
ggggggacta agttggaaat aacaggtgga ggcggttcag gcggaggtgg cagcggcggt 420
ggcgggtcgg aggtgaaact gcaggagtca ggacctggcc tggtggcgcc ctcacagagc 480
ctgtccgtca catgcactgt ctcaggggtc tcattacccg actatggtgt aagctggatt 540
cgccagcctc cacgaaaggg tctggagtgg ctgggagtaa tatggggtag tgaaaccaca 600
tactataatt cagctctcaa atccagactg accatcatca aggacaactc caagagccaa 660
gttttcttaa aaatgaacag tctgcaaact gatgacacag ccatttacta ctgtgccaaa 720
cattattact acggtggtag ctatgctatg gactactggg gtcaaggaac ctcagtcacc 780
gtctcctcaa ccacgacgcc agcgccgcga ccaccaacac cggcgcccac catcgcgtcg 840
cagcccctgt ccctgcgccc agaggcgtgc cggccagcgg cggggggcgc agtgcacacg 900
agggggctgg acttcgcctg tgatatctac atctgggcgc ccctggccgg gacttgtggg 960
gtccttctcc tgtcactggt tatcaccctt tactgcaaac ggggcagaaa gaagctcctg 1020
tatatattca aacaaccatt tatgagacca gtacaaacta ctcaagagga agatggctgt 1080
agctgccgat ttccagaaga agaagaagga ggatgtgaac tgagagtgaa gttcagcagg 1140
agcgcagacg cccccgcgta ccagcagggc cagaaccagc tctataacga gctcaatcta 1200
ggacgaagag aggagtacga tgttttggac aagagacgtg gccgggaccc tgagatgggg 1260
ggaaagccga gaaggaagaa ccctcaggaa ggcctgtaca atgaactgca gaaagataag 1320
atggcggagg cctacagtga gattgggatg aaaggcgagc gccggagggg caaggggcac 1380
gatggccttt accagggtct cagtacagcc accaaggaca cctacgacgc ccttcacatg 1440
caggccctgc cccctcgctg a 1461