[go: up one dir, main page]

CN110564772B - 改造宿主细胞基因组的方法及其用途 - Google Patents

改造宿主细胞基因组的方法及其用途 Download PDF

Info

Publication number
CN110564772B
CN110564772B CN201910264952.7A CN201910264952A CN110564772B CN 110564772 B CN110564772 B CN 110564772B CN 201910264952 A CN201910264952 A CN 201910264952A CN 110564772 B CN110564772 B CN 110564772B
Authority
CN
China
Prior art keywords
gene
cho
sequence
host cell
site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910264952.7A
Other languages
English (en)
Other versions
CN110564772A (zh
Inventor
高闻达
毛昌群
邵静
岳国华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Antagen Beijing Biotechnology Co ltd
Original Assignee
Antagen Beijing Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Antagen Beijing Biotechnology Co ltd filed Critical Antagen Beijing Biotechnology Co ltd
Priority to CN201910264952.7A priority Critical patent/CN110564772B/zh
Publication of CN110564772A publication Critical patent/CN110564772A/zh
Application granted granted Critical
Publication of CN110564772B publication Critical patent/CN110564772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • C12N2510/02Cells for production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Reproductive Health (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了一种在宿主细胞基因组的指定位点整合多种外源基因的方法。本发明还提供了一种改造宿主细胞基因组的方法,所述方法包括:a.在宿主细胞基因组的指定位点整合外源基因;和/或b.在宿主细胞基因组中敲除岩藻糖转移酶8基因和/或谷氨酰胺合成酶基因和/或α2,3‑唾液酸转移酶基因4和/或α2,3‑唾液酸转移酶基因6。本发明还提供了根据本发明的方法制备的宿主细胞。本发明还提供了所述宿主细胞用于生产目的蛋白的用途。本发明提供的CHO株的细胞基因组中定点整合了能够提高蛋白表达的基因,对于开发新型抗体和高端仿制抗体,有着重要的意义。

Description

改造宿主细胞基因组的方法及其用途
技术领域
本发明属于分子生物学、细胞生物学和生物工程学领域。具体而言,本发明涉及一种改造宿主细胞基因组的方法,本发明还涉及使用经该方法改造的宿主细胞,以及所述经改造的宿主细胞的用途。
背景技术
自1982年美国FDA批准Genetech的重组胰岛素上市以来,重组蛋白已经成功用于科学研究、多种疾病的诊断、治疗及预防等。目前,重组蛋白主要使用外源蛋白表达系统来进行生产和表达。用哺乳动物细胞生产重组蛋白已经成为生物技术药物的主流技术。目前已上市、正在进行临床实验及临床前研究的蛋白药物,大部分都由哺乳动物细胞进行表达,而其中,中国仓鼠卵巢(Chinese Hamster Ovary,CHO)细胞是在重组蛋白生产中最广泛使用的宿主细胞。CHO细胞具有多个品系。目前用于工业生产的CHO细胞主要系包括CHO-K1、CHO-DG44、CHO-DXB11(又称CHO-DUKX)、CHO-S及CHOZN(CHOZN ZFN-Modified CHO CellLines)等,还有在开发中的CHO-MK。
尽管CHO细胞被工业界广泛用来生产医用抗体,但是现有技术条件下的CHO细胞存在各种不足。
首先,CHO细胞的组织来源属性是成纤维细胞,与免疫系统中专业表达抗体的浆细胞,在抗体的表达能力和修饰上还有不少差距。以细胞单产的指标pg/cell/day(pcd)为例,CHO细胞株历经冗长繁复的基因扩增和筛选后,如能达到20~40pcd左右就被用于工业化生产了,而抗体的商业化大规模生产则主要通过下游的高密度细胞培养和发酵工艺的优化来实现。对比CHO细胞,浆细胞往往能轻松地达到100~200pcd的表达水平,而且对于超大分子五聚体IgM的组装和分泌,也毫无困难。对表达需要进行复杂的糖基化修饰和多条链组装的大分子,CHO细胞则显示出瓶颈,无论是在表达载体构建,还是在药物增压筛选方面,pcd在20~40之后的增加都似乎触及了天花板。
其次,野生型CHO细胞所分泌的糖蛋白(包括抗体)都带有岩藻糖(Fucose)糖基。抗体Fc部分所携带的糖链上的岩藻糖会阻碍抗体和Fc受体之间的结合。虽然当前有多种方法去除岩藻糖(Fucose)糖基,例如用化学或酶法处理、小分子类似物作抑制剂、RNA干扰、过表达β-1,4-N-acetyl-glucosaminyltransferase III(β-1,4-N-乙酰葡糖胺转移酶III)和高尔基体α-mannosidase II(α-甘露糖苷酶II)两种酶以改变岩藻糖合成路径,或者利用某些岩藻糖低表达的自然突变CHO株(例如蛋白质岩藻糖化缺陷的Lec13 CHO细胞)。但是,这些方法都很难做到完全去除抗体的岩藻糖,因而抗体药物无法达到制剂均一性方面的严格要求。通过把CHO细胞中负责岩藻糖合成的特定基因敲除,可以在基因水平确保CHO细胞表达的抗体100%完全不再带有岩藻糖。具体来说,敲除负责岩藻糖终末加成的岩藻糖转移酶8(Fucosyltransferase 8,Fut8)基因是使得抗体不再带有岩藻糖的有效途径。传统的基因敲除的方法是构建基因打靶载体,利用同源重组,以外源基因替代目的基因。但这种方法的效率很低:在小鼠的ES细胞中,同源重组的效率在百万分之一。而CHO是双倍体体细胞,其同源重组的效率比小鼠ES细胞还要低100倍。虽然一家日本实验室使用此法,耗时1年半,从约12000个CHO-DG44细胞克隆中艰辛筛选到一个Fut8-/-的CHO细胞株(Yamane-Ohnuki N,等,Biotechnol Bioeng 2004;87:614–622),但他们的方法对普通实验室不具有简易的可重复性和推广的实用性。
利用锌指核酸酶(Zinc Finger Nuclease,ZFN)、类转录激活因子效应物核酸酶(TALEN),以及原核生物后天免疫系统(簇间规则间隔短回文重复序列,ClusteredRegularly Interspaced Short Palindromic Repeats,CRISPR)进行的染色体DNA切割大大增强了人们对基因组定点部位的任意操作的能力。用ZFN将CHO细胞中的Fut8基因敲除,已见报道(Malphettes L等,Biotechnol Bioeng.2010;106:774-83)。但ZFN存在严重的脱靶效应(Wang X等,Nat Biotechnol.2015;33:175-8),很难确定ZFN还会对CHO细胞基因组中的其它功能基因有什么影响。同样,尽管用CRISPR技术可以比较高效地敲除CHO细胞中的Fut8基因(Sun T等,Engineering in Life Sciences,2015;15:660–6;Ronda C.et al.,Biotechnol.Bioeng.2014;111:1604–16),但是脱靶几率依然很高。Ronda C等人的工作表明,对于一个标准的GN19NGG靶标序列,CHO-K1的基因组中平均有6个完全相同的序列、377个有一个核苷酸误配的序列、4558个有两个核苷酸误配的序列。全基因组测序表明,用CRISPR技术定点改造基因而制成的转基因小鼠与野生型对照小鼠相比,出现1397个单核苷酸突变和117处DNA序列的插入或缺失(Schaefer,K.A.et al.Nat.Methods 2017;14,547-8)。因而,用ZFN和CRISPR方法制成的Fut8-/-CHO细胞,具有太多的遗传和表观不确定性,难以做为医用蛋白生产的稳定的通用性工业化细胞株。
与ZFN和CRISPR相比,TALEN的特异性则要高得多。这是因为,TALEN的左右两个臂膀不仅对各自在DNA正义和反义链上的结合序列有精确要求,而且它们之间必须严格间隔14~20碱基对。这大大降低了在CHO基因组中的脱靶效应。目前,用TALEN制备Fut8-/-CHO细胞株的报道仅来自于Sangamo BioSciences的Gregory Cost实验室。然而,其采用的方法是在CHO细胞的Fut8基因中插入抗体表达的组件(Cristea S等,Biotechnol Bioeng.2013;110:871-80),籍此既表达抗体基因,又敲除Fut8基因。但是,由于Fut8基因的表达和调控不能与抗体的表达相比,如此获得的Fut8-/-CHO细胞在产量上难以作为大规模生产医用蛋白的通用性工业化细胞株。
再次,CHO细胞在高密度生长的后期,营养消耗而体系中的铵离子增加,这对细胞的存活带来很大压力。谷氨酰胺合成酶(Glutamine Synthetase,GS)是一种控制氮代谢的酶。谷氨酰胺这种氨基酸,不仅被细胞用来合成蛋白质,也是用来运输氮的。铵离子对细胞有毒性,当细胞需要排除多余的铵离子的时候,就用铵离子和谷氨酸来合成谷氨酰胺。谷氨酰胺合成酶(GS)催化的就是该反应。
对于工业化生产抗体用的CHO细胞株而言,敲除其内源性的GS基因之后,细胞在谷氨酰胺缺失的培养基中无法生长。而外源质粒上带有的GS基因,不仅可以增加在谷氨酰胺缺失的培养基中筛选稳定细胞株时候的严谨性,而且更增强了将废物铵离子转化成谷氨酰胺氨基酸的反应,对大规模细胞培养非常有利。GS敲除的CHO细胞株已经通过ZFN方法得到(Fan L.et al.Biotechnol Bioeng.2012Apr;109(4):1007-15)。但这一方法的缺点亦如用ZFN敲除Fut8基因所分析的一样。
综上所述,如果能在CHO细胞中实现上述对CHO细胞的生长、蛋白(包括抗体)生产和活性有利的多基因的受控表达,CHO细胞工程株的改建和优化是可期的。CHO细胞株的工程改造(Cell Line Engineering)可以为生物学基础研究和药物开发提供不可或缺的工具。建立能同时稳定高表达若干基因产物的特殊细胞系,对于研究多亚基的膜受体功能和酶活性、信号传导、代谢途径、蛋白修饰、病毒组装等等由多个基因参与的过程,是非常重要的。而且这些基因产物往往要求按特定的比例表达。虽然CRISPR等新出现的基因编辑(Genome Editing)技术有助于快速的基因失活和替换,但要实现多基因的按比例稳定高表达,长久以来一直是业界的瓶颈,因技术难度大而进展甚微。遇到的主要技术问题是:
1)常规方法是外源基因在染色体上的随机插入。基因A高表达的细胞株,不一定高表达基因B。多转几个基因后,会造成细胞株的异质性,筛选难度大。而且由于基因沉默效应(Gene Silencing),插在不同染色体部位的基因,会按不同的速度慢慢关闭表达,更增加了细胞株的不可控性和实验的不确定性。
2)如果每个基因都用一个带有特定抗药性基因的载体,那么转3~4个基因后,会把现有的抗药性基因差不多用完。如果在此改造的CHO细胞株上,还要表达抗体基因,则又要用到至少一个抗药性基因。
综上所述,当前对能够高效全面地改造CHO细胞株的方法存在需求。
发明内容
基于现有技术的不足,本发明的目的是提供一种改造宿主细胞基因组的方法,本发明提供的方法不仅能够在宿主细胞基因组中定点整合多个外源基因使其稳定高效地共表达,而且能够有效地敲除Fut8基因和/或GS基因和/或α2,3-唾液酸转移酶基因4和/或α2,3-唾液酸转移酶基因6,从而构建能满足工业大规模抗体生产的高效的宿主细胞。本发明还提供了根据所述方法制备的宿主细胞及其用途。
一方面,本发明提供了一种在宿主细胞的指定位点整合多种外源基因的方法,所述方法为基于Cre-LoxP系统的“Toggle-In”法,包括以下步骤:
1)制备“锚定”的宿主细胞,所述“锚定”的宿主细胞包含位点特异性重组酶识别序列LoxPwt、LoxP1、PGK启动子驱动的正筛选序列;
优选地,所述正筛选序列为Puro-T2A-d1EGFP;该序列使得“锚定”的宿主细胞在荧光显微镜下呈现微弱的绿色荧光标记,且为Puromycin抗性。
优选地,所述“锚定”的宿主细胞通过打靶载体获得,所述打靶载体含有指定位点的同源左右臂、位点特异性重组酶识别序列Loxpwt、Loxp1和正负筛选序列;
更优选地,所述打靶载体依次含有GAPDH同源左臂、Zeocin-T2A-TK的正负筛选序列、Puro-T2A-d1EGFP的正筛选序列,Cre-LoxP系统中的位点特异性重组酶识别序列Loxpwt和Loxp1、GAPDH同源右臂和白喉霉素(Diphtheria toxin)A链(DTA)的负筛选序列;
2)制备含有外源基因的定点整合载体系列(pToggle),其中包括:
第一定点整合载体,其使用第一载体制备,包含第一外源基因,第一抗生素抗性基因、位点特异性重组酶识别序列LoxPwt、LoxP4和LoxP2;
第二定点整合载体,其使用第二载体制备,包含第二外源基因,第二抗生素抗性基因、位点特异性重组酶识别序列LoxPwt、LoxP1和LoxP5;
任选地,第三定点整合载体,其使用第一载体制备,包含第三外源基因,第一抗生素抗性基因、位点特异性重组酶识别序列LoxPwt、LoxP4和LoxP2;
任选地,第四定点整合载体,其使用第二载体制备,包含第四外源基因,第二抗生素抗性基因、位点特异性重组酶识别序列LoxPwt、LoxP1和LoxP5;
任选地,根据拟整合的基因制备相应的载体;
3)使用第一定点整合载体转染宿主细胞,并用第一抗生素筛选出第一抗生素抗性、第二抗生素敏感的克隆;
4)使用第二定点整合载体转染步骤3)得到的克隆,并用第二抗生素筛选出筛选出第二抗生素抗性、第一抗生素敏感的克隆;
5)任选地,使用第三定点整合载体转染步骤4)得到的克隆,并用第一抗生素筛选出第一抗生素抗性、第二抗生素敏感的克隆;
6)任选地,使用第四定点整合载体转染步骤5)得到的克隆,并用第二抗生素筛选出筛选出第二抗生素抗性、第一抗生素敏感的克隆;
7)任选地,根据拟整合的基因制备相应的载体依次整合,得到在指定位点整合多种基因的宿主细胞。
优选地,所述第一抗生素抗性基因和第二抗生素抗性基因分别选自以下的两个:
潮霉素B基因、嘌呤霉素抗性基因、遗传霉素基因、杀稻瘟菌素基因、腐草霉素基因。
优选地,所述第一抗生素抗性基因和/或第二抗生素基因还通过自动切割肽段连接示踪蛋白的基因序列;
优选地,所述示踪蛋白选自d1EGFP或DsRed-E2;
优选地,所述第一定点整合载体按排列顺序依次是:重组酶识别序列LoxPwt、不带启动子的抗性基因HygB序列(优选地,其核苷酸序列如SEQ ID NO:13所示)或HygB-T2A-DsRed-E2序列、重组酶识别序列LoxP4、人延长因子1a(EF1a)启动子(优选地,其核苷酸序列如SEQ ID NO:14所示)、第一外源基因和重组酶识别序列LoxP2;
优选地,所述第二定点整合载体按排列顺序依次是:重组酶识别序列LoxPwt、不带启动子的抗性基因Puro序列或Puro-T2A-d1EGFP序列(优选地,其核苷酸序列如SEQ ID NO:15所示)、重组酶识别序列LoxP1、人延长因子1a(EF1a)启动子、第二外源基因和重组酶识别序列LoxP5;
优选地,所述第三定点整合载体按排列顺序依次是:重组酶识别序列LoxPwt、不带启动子的抗性基因HygB序列或HygB-T2A-DsRed-E2序列、重组酶识别序列LoxP4、人延长因子1a(EF1a)启动子、第三外源基因和重组酶识别序列LoxP2;
优选地,所述第四定点整合载体按排列顺序依次是:重组酶识别序列LoxPwt、不带启动子的抗性基因Puro序列或Puro-T2A-d1EGFP序列、重组酶识别序列LoxP1、人延长因子1a(EF1a)启动子、第四外源基因和重组酶识别序列LoxP5;
优选地,所述第一抗生素抗性基因和第二抗生素抗性基因分别选自以下的两个:
潮霉素B基因、嘌呤霉素抗性基因、遗传霉素基因、杀稻瘟菌素基因、腐草霉素基因。
优选地,所述第一载体和第二载体分别选自质粒载体pBR322、pUC57、pBluescript、pCI-neo、pcDNA3.1;
在优选的实施方案中,本发明所用的第一载体和第二载体分别为pTOG3和pTOG4;
所述载体pTOG3核苷酸序列如SEQ ID NO:11所示;
所述载体pTOG4核苷酸序列如SEQ ID NO:12所示;
优选地,将两种或更多种基因的序列用自动切割肽段连接作为任选的外源基因;将另外的两种或更多种基因的序列用自动切割肽段连接作为另一任选的外源基因;
更优选地,所述自动切割肽段选自P2A、T2A或E2A;
更优选地,所述自动切割肽段为P2A,更优选地,其序列如SEQ ID NO:16所示:
SEQ ID NO:16:GSGATNFSLLKQAGDVEENPGP。
优选地,所述宿主细胞为哺乳动物宿主细胞;优选地为中国仓鼠卵巢细胞;
更优选地,所述宿主细胞选自以下的细胞株:
CHO-K1细胞株、CHO-S细胞株、DG44细胞株、CHO-DXB11细胞株、CHOZN细胞株、CHO-MK细胞株、CHL-YN细胞株。
优选地,所述指定位点为宿主细胞基因组的高表达热点区域;
优选地,所述指定位点选自以下基因的区域:
Rosa26基因、β-actin、β2-microglobulin、CDK2、Ubiquitin、DHFR和GAPDH基因;
更优选地,所述指定位点选自GAPDH基因的区域;
进一步优选地,所述指定位点为GAPDH基因在CHO-K1基因组中从3574544到3575484位的区域;优选地,所述位点区域的序列如SEQ ID NO:8所示。
另一方面,本发明提供了一种改造宿主细胞基因组的方法,所述方法包括:
a.在宿主细胞基因组的指定位点整合外源基因信号识别颗粒-9(Signalrecognition particle-9,SRP-9)、信号识别颗粒-14(Signal recognition particle-14,SRP-14)、信号识别颗粒-54(Signal recognition particle-9,SRP-54)、内质网氧化还原酶(Endoplasmic Reticulum Oxidoreductase,ERO1-L)、成纤维细胞生长因子9(fibroblast growth factor 9,FGF-9)、β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase 1,GT)和/或α2,6-唾液酸转移酶1(α2,6-sialyltransferase 1,ST1)中的一个或多个;和/或
b.在宿主细胞基因组中,使用类转录激活因子效应物核酸酶(TALEN)敲除岩藻糖转移酶8(Fucosyltransferase 8,Fut8)基因和/或谷氨酰胺合成酶(GlutamineSynthetase,GS)基因和/或α2,3-唾液酸转移酶基因4(α2,3-sialyltransferase 4,ST4)和/或α2,3-唾液酸转移酶基因6(α2,3-sialyltransferase 6,ST6);
优选地,所述宿主细胞为哺乳动物宿主细胞;更优选地为中国仓鼠卵巢(CHO)细胞;进一步优选地为CHO-K1、CHO-S、CHOZN、DG44、CHO-DXB11、CHO-MK或CHL-YN细胞株;
优选地,所述指定位点为宿主细胞基因组的高表达热点区域,更优选地,所述指定位点选自以下基因的区域:Rosa26,β-actin,β2-microglobulin,CDK2,Ubiquitin,DHFR和GAPDH等恒定型高表达热点区域。进一步优选地,所述定点为甘油醛-3-磷酸脱氢酶(glyceraldehyde-3-phosphate dehydrogenase,GAPDH)基因所在的区域。具体地是GAPDH基因在CHO-K1基因组中从3574544到3575484位的区域,在一个具体的实施方案中,所述位点序列的序列如SEQ ID NO:8所示。
优选地,在步骤a中,通过“Toggle-In”将编码外源基因的异源多核苷酸序列依次插入到宿主细胞的指定位点;更优选地,将人源整合外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54三个基因用自动切割肽段连接作为任选的外源基因,优选地如SEQID NO:17所示;将内质网氧化还原酶、成纤维细胞生长因子9用自动切割肽段连接,为任选的外源基因;将人源β1,4-半乳糖基转移酶1和/或α2,6-唾液酸转移酶1基因用自动切割肽段连接,为任选的外源基因。
优选地,在所述步骤b中,采用TALEN方法进行敲除。
优选地,敲除Fut8基因所构建的TALEN左右臂蛋白基因序列如SEQ ID NO:18和SEQID NO:19所示;所靶向的区域是CHO细胞Fut8基因的10号外显子,但也可以是任何影响其功能的外显子;
更优选地,所使用的引物如SEQ ID NO:20和SEQ ID NO:21所示。
优选地,敲除GS基因所构建的TALEN左右臂蛋白基因序列如SEQ ID NO:22和23所示。所靶向的区域是CHO细胞GS基因的7号外显子,但也可以是任何影响其功能的外显子;
更优选地,所使用的引物如SEQ ID NO:24和SEQ ID NO:25所示。
优选地,敲除ST3GAL4基因所构建的TALEN左右臂蛋白基因序列如SEQ ID NO:26和27所示;所靶向的区域是CHO细胞ST3GAL4基因的5号外显子,但也可以是任何影响其功能的外显子。
更优选地,所使用的引物如SEQ ID NO:28和SEQ ID NO:29所示。
优选地,敲除ST3GAL6基因所构建的TALEN左右臂蛋白基因序列如SEQ ID NO:30和31所示;所靶向的区域是CHO细胞ST3GAL6基因的2号外显子,但也可以是任何影响其功能的外显子;
更优选地,所使用的引物如SEQ ID NO:32和SEQ ID NO:33所示。
另一方面,本发明提供了根据本发明的方法改造的宿主细胞;
优选地,所述改造的宿主细胞携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(Endoplasmic Reticulum Oxidoreductase,ERO1-L)、成纤维细胞生长因子9(fibroblast growth factor 9,FGF-9)、β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase 1,GT)和/或α2,6-唾液酸转移酶1(α2,6-sialyltransferase 1,ST6)中的一个或多个;
优选地,所述改造的宿主细胞至少携带外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54、内质网氧化还原酶、成纤维细胞生长因子9;
优选地,所述改造的宿主细胞携带外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54、内质网氧化还原酶、成纤维细胞生长因子9、β1,4-半乳糖基转移酶1和α2,6-唾液酸转移酶1;
优选地,所述改造的宿主细胞不表达岩藻糖转移酶8基因和/或谷氨酰胺合成酶基因和/或α2,3-唾液酸转移酶4和/或α2,3-唾液酸转移酶6中的一个或多个;
优选地,所述改造的宿主细胞不表达岩藻糖转移酶8(Fucosyltransferase 8,Fut8)基因和/或谷氨酰胺合成酶(Glutamine Synthetase,GS)基因;
优选地,所述改造的宿主细胞不表达岩藻糖转移酶8基因、谷氨酰胺合成酶基因、α2,3-唾液酸转移酶4和α2,3-唾液酸转移酶6;
更优选地,本发明提供了如下所述的CHO细胞株。
CHO-E细胞株:在野生型CHO-K1基础上携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)和成纤维细胞生长因子9(FGF-9),具有更佳的蛋白翻译能力和抵御细胞凋亡的能力。
CHO-EF细胞株:敲除Fut 8基因,并且携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)和成纤维细胞生长因子9(FGF-9),具更佳的蛋白翻译能力和抵御细胞凋亡的能力,且表达的蛋白分子完全不带有岩藻糖。
CHO-EG细胞株:携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)、成纤维细胞生长因子9(FGF-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase 1,GT),具更佳的蛋白翻译能力和抵御细胞凋亡的能力,且表达的蛋白分子的糖链末端更多地带β1,4-位的半乳糖基。
CHO-EFG细胞株:敲除Fut 8基因,并且携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)、成纤维细胞生长因子9(FGF-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase 1,GT),具更佳的蛋白翻译能力和抵御细胞凋亡的能力,且表达的蛋白分子完全不带有岩藻糖,糖链末端更多地带β1,4-位的半乳糖基。
CHO-ES(3,6)细胞株:携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)、成纤维细胞生长因子9(FGF-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase 1,GT)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase 1,ST6)。该细胞株除了具有上述CHO-E细胞株的基本特性外,还能使得CHO细胞表达的蛋白分子带有α2,6-位链接的唾液酸。由于CHO细胞内源的α2,3-唾液酸转移酶(α2,3-sialyltransferase,ST3)的存在,细胞表达的蛋白分子同时带有α2,3-位和α2,6-位链接的唾液酸,更接近于人源糖基化形式。
CHO-EFS(3,6)细胞株:敲除Fut 8基因,并且携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)、成纤维细胞生长因子9(FGF-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase 1,GT)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase 1,ST6)。该细胞株除了具有上述CHO-ES(3,6)细胞株的基本特性外,还能使得CHO细胞表达的蛋白分子完全不带有岩藻糖。
CHO-EFS(3,6)GS细胞株:敲除Fut 8基因和GS基因,并且携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)、成纤维细胞生长因子9(FGF-9)、β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,GT)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase 1,ST6)。该细胞株同时表达α-2,3-唾液酸转移酶和α-2,6-唾液酸转移酶、并且岩藻糖转移酶基因8和谷氨酸酰合成酶基因双缺失的高性能CHO-K1细胞株。
CHO-ES(6)细胞株:携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)、成纤维细胞生长因子9(FGF-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase 1,GT)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase 1,ST6),并且敲除了CHO细胞内源性的α2,3-唾液酸转移酶(α2,3-sialyltransferase,ST3)。该细胞株除了具有上述CHO-E细胞株的基本特性外,还能使得CHO细胞表达的蛋白分子只带有α2,6-位链接的唾液酸,不带有α2,3-位链接的唾液酸,能更均一地表达生物活性依赖于α2,6-位唾液酸的生物大分子。
CHO-EFS(6)细胞株:敲除Fut 8基因,并且携带外源基因SRP-9、SRP-14、SRP-54、内质网氧化还原酶(ERO1-L)、成纤维细胞生长因子9(FGF-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase 1,GT)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase 1,ST6),并且敲除了CHO细胞内源性的α2,3-唾液酸转移酶(α2,3-sialyltransferase,ST3)。该细胞株除了具有上述CHO-ES(6)细胞株的基本特性外,还能使得CHO细胞表达的蛋白分子完全不带有岩藻糖。
本发明的CHO细胞株系列具有以下性质:所表达的蛋白,优选地抗体完全不带有岩藻糖;或者能表达人源的糖基化,尤其是对糖蛋白进行半乳糖苷化修饰或CHO细胞所不能的α2,6位唾液酸化修饰;尤其是敲除了CHO细胞内源的α2,3位唾液酸修饰酶,或者是上述不同基因型的不同组合对医药蛋白的理化性质带来的定向优化。
再一方面,本发明提供了所述宿主细胞用于表达目的蛋白的用途;优选地,所述目的蛋白为抗体。
与现有技术相比,本发明的细胞株具有以下优点:
1)本发明提供的CHO细胞株敲除了CHO细胞中的Fut8基因和/或GS基因和/或α2,3-唾液酸转移酶基因。Fut8基因的敲除使得CHO细胞株所表达的抗体具有更高的与FcγRIIIA受体的结合力,大大提高抗体的ADCC(antibody-dependent cell-mediatedcytotoxicity,抗体依赖的细胞介导的细胞毒性)效应和体内杀肿瘤活性。GS基因的敲除使得外源基因的表达和克隆的挑选与载体上的GS挂钩,同时也能在大规模生产时对细胞生长有利;
2)本发明提供的CHO株的细胞基因组中定点整合了能够提高抗体表达的SRP-14、SRP-54、SRP-9、ERO-L1、FGF9等基因,以及负责人源糖基化的GT和ST6基因,使得构建的CHO细胞株不仅能提高产量,而且所产生的抗体带有人类抗体的唾液酸修饰或半乳糖苷修饰。在岩藻糖缺失的基础上(Fut8敲除),引入人源唾液酸化,不仅提升ADCC活性,而且还能屏蔽分子的免疫原性、增加体内的半衰期。在岩藻糖缺失的基础上,引入人源半乳糖苷化,能同时提升ADCC和补体激活的CDC(complement dependent cytotoxicity,补体依赖的细胞毒性)功能。对于某些特殊需要的蛋白,例如活性特别依赖于带α2,6-位唾液酸的静脉丙种球蛋白(IVIG)、诱导中和抗体所必需的α2,6-位唾液酸修饰的HIV外壳Env蛋白,等等,本发明的CHO-ES(6)细胞株,可提供不带α2,3-位唾液酸而仅带α2,6-位唾液酸的蛋白表达平台,使得唾液酸修饰更偏向于对生物活性重要的方向。这些糖基合成途径改造过的CHO细胞株,尤其是在此基础上GS基因敲除的各种衍生株,对于开发新型抗体和高端仿制抗体,有着重要的意义。
附图的简要说明
以下,结合附图来详细说明本发明的实施方案,其中:
图1显示了CHO细胞打靶载体CHO GAPDH-Zeo-TK HR v1.5,其中在GAPDH同源序列的左右臂之间,包含了TK基因作为负筛选,PGK启动子-嘌呤霉素-T2A-d1EGFP表达盒作为正筛选。而且,在紧邻该表达盒的上下游,分别带有LoxPwt和LoxP1序列。
图2显示了CHO-K1细胞(ATCC,CCL-61)接受打靶载体的电转化,并经药物(嘌呤霉素)筛选以后的FACS图谱。其中,绝大多数的抗性克隆是随机插入,表达很弱的d1EGFP信号(图2左下)。而只有0.6%非常低比例的才是真正GAPDH位点定点整合的事件,表达很强的d1EGFP信号(图2右下)。
图3显示了pTOG3载体与带有LoxP序列的染色体DNA在Cre重组酶介导下发生同源重组,亦即“Toggle In”反应第一步的情况。
图4显示了pTOG4载体与带有LoxP序列的染色体DNA在Cre重组酶介导下发生同源重组,亦即“Toggle In”反应第二步的情况。
图5显示了带有DsRed-E2的pTOG3载体,转化锚定CHO细胞,并经过潮霉素筛选后的显微镜照片。普通光镜视野下的细胞克隆,与荧光显微镜视野下发出红色荧光的细胞克隆高度重合(图5A),说明此染色体基因组定点整合技术的高效率。RT-PCR显示,随机挑选的整合了SRP-14-9-54、hERO-L、hFGF9等基因的CHO-E细胞株的不同克隆均表达同等水平的上述基因,说明各个细胞克隆之间的基因同质性(isogenicity)(图5B)。
图6显示了CHO-K1细胞(ATCC,CCL-61)接受TALEN载体转化,敲除Fut8基因之后,用FITC标记的植物凝集素LCA对获得的克隆进行FACS分析的结果。野生型CHO细胞表面因带有岩藻糖而显强阳性,而Fut8-/-的克隆则都为阴性。
图7显示了对Fut8-/-的CHO细胞克隆的DNA序列分析。用PCR将TALEN针对的10号外显子区域基因组DNA扩增(715bp),限制性内切酶MscI作用后走琼脂糖电泳。与野生型等位基因酶切片段(417bp、298bp)相对比,各个Fut8-/-的CHO细胞克隆至少有一条甚至两条等位基因的MscI位点都被TALEN破坏了(图7A)。对1号克隆的两条等位基因的测序表明,TALEN均造成了两者的无义突变,蛋白产物提前终止。测序结果表明其中一条等位基因的MscI位点被TALEN破坏,与图7B结果相符。
图8显示了野生型CHO-K1和CHO-Fut8-/-细胞表达的Fc融合蛋白的糖链Mass Spec质谱分析。结果表明CHO-Fut8-/-细胞表达的产物100%不带有岩藻糖(图中实心菱形标记)。
图9显示了野生型CHO-K1和CHO-Fut8-/-细胞表达的抗体的糖链Mass Spec质谱分析。结果表明CHO-Fut8-/-细胞表达的产物100%不带有岩藻糖(图中实心菱形标记)。
图10显示了野生型CHO-K1和CHO-Fut8-/-细胞表达的hIgG1抗体对多种小鼠和人的Fc受体蛋白的ELISA结合活性。结果表明,岩藻糖缺失的hIgG1抗体对小鼠FcRγI、FcRγIIb、FcRγIII,以及人的FcRγI、FcRγIIa(H133)、FcRγIIa(R133)、FcRγIIb的结合力没有变化,而对FcRγIIIa的结合力有很大提升。
图11显示了用生物信息学方法,从UniProt蛋白序列库中鉴定出的豚鼠蛋白(H0VDZ8,定名为Guinea Pig FcRγIV,gpFcRγIV),与小鼠FcRγIV和人的FcRγIIIa在蛋白序列上的高度同源性。
图12显示了野生型(空心圆圈)和岩藻糖缺失(实心圆圈)的人hIgG1、小鼠mIgG2a抗体与hFcRγIIIa-V158、mFcRγIV和gpFcRγIV的结合力差别。结果显示,用CHO-Fut8-/-细胞表达的岩藻糖缺失的hIgG1、小鼠mIgG2a抗体对这些受体的结合力都有不同程度的提高。
图13显示了野生型和岩藻糖缺失的hIgG1对靶细胞的ADCC活性比较。此系统中,效应细胞采用的是慢病毒介导在Jurkat细胞上表达hFcRγIIIa-V158受体,激发下游萤光素酶Luciferase的受激表达。
图14显示了野生型和岩藻糖缺失的mIgG2c对靶细胞的ADCC活性比较。此系统中,效应细胞采用的是慢病毒介导在Jurkat细胞上表达mFcRγIV受体,激发下游萤光素酶Luciferase的受激表达。
图15显示了CHO细胞经TALEN敲除GS基因之后,#4号亚克隆和野生型细胞分别在完全培养基和谷氨酰胺缺失的培养基中的生长情况。GS-/-的CHO细胞只能在完全培养基中生长,而在谷氨酰胺缺失的培养基则不能生长。而GS+/+的CHO细胞则能在两者中皆能生长。
图16显示了GS-/-的CHO-K1#4号克隆株的两条染色体在GS的7号外显子区域的DNA序列。由于基因编辑的作用,两条染色体的GS等位基因都提前终止了。
图17显示了在GS-/-的CHO-K1#4号克隆株的基础上进一步用本发明中揭示的TALEN方法敲除Fut8基因后,用FITC标记的植物凝集素LCA对获得的克隆进行FACS分析的结果。其中#1,#4,#5和#7为GS-/-和Fut8-/-双敲除株。
图18显示了CHO-EF细胞被GT-P2A-ST6基因转化并经药物筛选和亚克隆后得到的CHO-EFS-6.1、CHO-EFS-6.3细胞株,经植物凝集素Sambucus Nigra Lectin(SNA)染色,证明细胞表面带有CHO-F母细胞株所不能表达的α2,6位的唾液酸;而植物凝集素MaackiaAmurensis Lectin II(MAL II)所特异识别的α2,3位的唾液酸则在三者没有差别(图18A)。表达α2,6位唾液酸的CHO-EFS-6.1细胞株,其表面半乳糖被部分遮蔽,故植物凝集素ErythrinaCristagalli lectin(ECL)对半乳糖的特异染色比之CHO-F母细胞株要低(图18B)。
图19显示了CHO-E细胞被GT-P2A-ST6基因转化并经药物筛选和亚克隆后得到的CHO-ES-#3、CHO-ES-#4、CHO-ES-#5细胞株。经植物凝集素Sambucus Nigra Lectin(SNA)染色,证明这些细胞表面带有CHO-E母细胞株所不能表达的α2,6位的唾液酸,与CHO-EFS-6.1细胞株的特征一致,只是前者带有岩藻糖(LCA染色阳性,同CHO-K1)而后者是岩藻糖缺失的(LCA染色阴性,同CHO-F)。
图20显示了在CHO-ES(3,6)细胞中用TALEN技术敲除α2,3唾液酸转移酶(ST3GAL4和ST3GAL6)之后得到的CHO-ES(6)细胞株,经由植物凝集素Sambucus Nigra Lectin(SNA)和Maackia Amurensis Lectin II(MAL II)染色后的FACS图谱。野生型CHO-E细胞仅表达α2,3位的唾液酸。CHO-ES(3,6)细胞同时表达α2,3和α2,6位的唾液酸。在此基础上敲除α2,3唾液酸转移酶的CHO-ES(6)细胞株仅表达α2,6位的唾液酸。
图21显示了野生型CHO-K1和Fut8-/-的CHO-EFS(3,6)细胞株表达的人IgG1抗体的糖链Mass Spec质谱分析。结果表明两者的糖链有很大的不同。后者不仅不带有岩藻糖,而且还带有更多的末端唾液酸。
图22显示了分别用野生型(WT)CHO-K1细胞株、岩藻糖缺失型(AF)CHO-F细胞株以及岩藻糖缺失并人源唾液酸化型(AF+S)CHO-EFS(3,6)细胞株表达的抗肿瘤靶点GPC3的hIgG1抗体对GPC3阳性的Huh7细胞的ADCC效果。岩藻糖缺失抗体的ADCC活力比野生型抗体的ADCC活力要显著提高,而在岩藻糖缺失基础上又增加唾液酸后,抗体的ADCC活力又有提升。
实施发明的最佳方式
为了更加清楚的解释本发明的目的、技术方案和优点,以下结合实施例进一步说明本发明。此处所描述的具体实施例仅用以说明和解释本发明,并不是限定本发明的应用范畴。本发明实施例中未注明具体条件的实验方法,通常按照常规条件(例如可参考《分子克隆:实验室指南》中所述的条件、或按照制造厂商所建议的条件)即可实现。除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。
本发明的详细描述如下:
如本文中所使用的,术语“宿主细胞”是指可用于导入载体的细胞,其包括但不限于,原核细胞例如大肠杆菌细胞或枯草杆菌细胞等,真菌细胞例如酵母细胞或曲霉菌细胞等,昆虫细胞例如S2果蝇细胞或SF9细胞,和动物细胞例如纤维源细胞、CHO细胞、COS细胞、NS0细胞、Hela细胞、BHK细胞、HEK293细胞、Per.C6细胞或人细胞等。
如本文中所使用的,某一细胞的“后代细胞”是指直接或间接起源于该细胞的细胞,其不仅包括该细胞通过细胞分裂或细胞繁殖而直接产生的后代细胞,而且包括由该细胞的后代细胞产生的后代细胞。例如,CHO-K1的后代细胞包括,任何直接或间接源于CHO-K1的细胞。
如本文中所使用的,术语“谷氨酰胺合成酶(GS)”是指,能够催化谷氨酸和铵合成为谷氨酰胺的酶。GS的国际系统分类编号为EC6.3.1.2。CHO细胞的基因组中,编码谷氨酰胺合成酶(GS)的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NW_003613921.1;第1430036-1435423位。
如本文中所使用的,术语“岩藻糖基转移酶8(Fut8)”亦称为α-(1,6)-岩藻糖基转移酶,其能够催化岩藻糖基以α-(1,6)的连接方式转移至蛋白的糖基化位点。FUT8的国际系统分类编号为EC2.4.1.68。CHO细胞的基因组中,编码岩藻糖基转移酶8(FUT8)的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NW_003613860.1;第570169-731500位。
如本文中所使用的,术语“α2,3-唾液酸转移酶4(ST3GAL4)”亦称为ST3β-galactosideα-2,3-sialyltransferase 4,是能够催化唾液酸糖基以α-(2,3)的连接方式转移至β-半乳糖苷的第4亚型酶。ST3GAL4的国际系统分类编号为EC2.4.99.4。CHO细胞的基因组中,编码α2,3-唾液酸转移酶4(ST3GAL4)的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NW_003613908.1;第1021239-1065065位。
如本文中所使用的,术语“α2,3-唾液酸转移酶6(ST3GAL6)”亦称为ST3β-galactosideα-2,3-sialyltransferase 6,是能够催化唾液酸糖基以α-(2,3)的连接方式转移至β-半乳糖苷的第6亚型酶。ST3GAL6的国际系统分类编号为EC2.4.99.4。CHO细胞的基因组中,编码α2,3-唾液酸转移酶6(ST3GAL6)的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NW_003614792.1;第384880-438354位。
如本文中所使用的,术语“内质网氧化还原酶”(ERO1-L)亦称为EndoplasmicReticulum Oxidoreductase,是在内质网中催化二硫键形成的氧化还原酶。ERO1-L的国际系统分类编号为EC1.8.4.2。人类基因组中,编码ERO1-L的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NC_000014.9;第52639915-52695931位。
如本文中所使用的,术语“SRP-14”亦称为信号识别颗粒分子量14kDa蛋白。它与SRP-9、SRP-54组成识别信号肽并暂时终止翻译的复合物,将分泌蛋白导入粗糙内质网内腔。人类基因组中,编码SRP-14的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NC_000015.10;第40035690-40039202位。
如本文中所使用的,术语“SRP-54”亦称为信号识别颗粒分子量54kDa蛋白。它与SRP-9、SRP-14组成识别信号肽并暂时终止翻译的复合物,将分泌蛋白导入粗糙内质网内腔。人类基因组中,编码SRP-54的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NC_000014.9;第34982898-35029567位。
如本文中所使用的,术语“SRP-9”亦称为信号识别颗粒分子量9kDa蛋白。它与SRP-14、SRP-54组成识别信号肽并暂时终止翻译的复合物,将分泌蛋白导入粗糙内质网内腔。人类基因组中,编码SRP-9的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NC_000001.11;第225777813-225790466位。
如本文中所使用的,术语“FGF9”亦称为成纤维细胞生长因子9,术语“hFGF9”亦称为人成纤维细胞生长因子9,可促进CHO细胞的生长和抗凋亡。人类基因组中,编码FGF9的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NC_0000013.11;第21671076-21704501位。
如本文中所使用的,术语“GT”亦称为β1,4-galactosyltransferase 1,参与高尔基体中蛋白糖基化过程中以β1,4位链接的半乳糖残基加成。GT的国际系统分类编号为EC2.4.1.133。人类基因组中,编码GT的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NC_000009.12;第33110641-33167358位。
如本文中所使用的,术语“ST6”亦称为α2,6-sialyltransferase 1,参与高尔基体中蛋白糖基化过程中以α2,6位链接的唾液酸残基加成。ST6的国际系统分类编号为EC2.4.99.10。人类基因组中,编码ST6的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,NCBI登录号NC_000003.12;第186930526-187078553位。
如本文中所使用的,术语“载体(vector)”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;人工染色体,例如酵母人工染色体(YAC)、细菌人工染色体(BAC)或P1来源的人工染色体(PAC);噬菌体如λ噬菌体或M13噬菌体及动物病毒等。可用作载体的动物病毒包括但不限于,逆转录酶病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒、乳头多瘤空泡病毒(如SV40)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。
如本文中所使用的,术语“稳定表达”是指,宿主细胞将整合到宿主细胞基因组中的编码外源蛋白的基因表达为外源蛋白。在稳定表达过程中,编码外源蛋白的基因被稳定插入宿主细胞的基因组(例如染色体)中,因此,宿主细胞能够长期稳定地表达外源蛋白。
如本文中所使用的,术语“基因敲除”是指,对细胞基因组中的基因进行编辑(例如,对该基因进行插入、替换、和/或删除等改造),使得该基因丧失其原有功能(例如,不能表达功能性的蛋白)。可使用各种已知的分子生物学技术(例如,使用ZFN、TALEN、CRISPR/cas9、或NgAgo的基因编辑技术)来编辑细胞基因组中的基因。基因敲除并不局限于将整个基因完整缺失或去除,而只要使基因丧失其原有功能即可。例如,可通过在基因中插入外源DNA片段,使得该基因无法表达功能性蛋白,或可通过在基因中插入或缺失一个或数个碱基,使得该基因发生移码突变,来实现对该基因的敲除。
如本文中所使用的,术语“ADCC”,亦称为抗体依赖的细胞介导的细胞毒作用(antibody-dependent cell-mediated cytotoxicity),是指具有杀伤活性的细胞(例如NK细胞、巨噬细胞和中性粒细胞),通过其表面表达的Fc受体(FcR)识别特异性结合于靶细胞(例如病毒感染的细胞和肿瘤细胞)表面抗原的抗体的Fc片段,直接杀伤靶细胞(例如病毒感染的细胞和肿瘤细胞)。
如本文中所使用的,术语“CDC”,亦称为补体依赖的细胞毒作用(complementdependent cytotoxicity),是指抗体通过激活补体系统来直接杀伤靶细胞的作用,即通过特异性抗体与细胞膜表面相应抗原结合,形成复合物而激活补体经典途径,所形成的攻膜复合物对靶细胞发挥裂解效应。
如本文所使用的,其中所述LoxP野生型和突变体的序列如下所示:
LoxPwt如SEQ ID NO:1所示ATAACTTCGTATAGCATACATTATACGAAGTTAT
LoxP 1如SEQ ID NO:2所示ATAACTTCGTATAGTATAGTATATACGAACGGTA
LoxP 2如SEQ ID NO:3所示TACCGTTCGTATAGTATAGTATATACGAAGTTAT
LoxP 3如SEQ ID NO:4所示TACCGTTCGTATA GTATAGTA ATACGAACGGTA
LoxP 4如SEQ ID NO:5所示ATAACTTCGTATAGGCTATAGTATACGAACGGTA
LoxP 5如SEQ ID NO:6所示TACCGTTCGTATAGGCTATAG TATACGAAGTTAT
LoxP 6如SEQ ID NO:7所示TACCGTTCGTATAGGCTATAGTATACGAACGGTA
GAPDH基因3574544位到3575484位的核苷酸序列如SEQ ID NO:8所示:gggtgatgctggcgccgagtatgttgtggaatctactggcgtcttcaccaccatggagaaggctggggcccacttgaagggcggggccaagagggtcatcatctccgccccttctgctgatgcccccatgtttgtgatgggtgtgaaccaagacaagtatgacaactccctcaagattgtcaggtgaggatggcagagggctgtggcaaagtgggcaagcaggggcaaggttacaggtgggcgagcctcctaacctgtctcttctcttcagcaatgcgtcctgcaccaccaactgcttagcccccctggccaaggtcatccatgacaactttggcattgtggaaggactcatggtatgtagttcatctgtttcatcctgccagcagtgggcgctgtggtgggggccctgcaagacctcactccctgcctctgtgtctttcagaccacggtccatgccatcactgccacccagaagactgtggatggcccctccgggaagctgtggcgtgatggccgtggggctgcccagaacatcatccctgcatccactggcgctgccaaggctgtgggcaaagtcatcccagagctgaacgggaagctgactggcatggccttccgtgttcctacccccaacgtgtccgttgtggatctgacatgtcgcctggagaaacctgtatgtctggggtgggctgagggttgtctctagtggtgaggttggggcttgagtagtcaccttgatttttgcccttaataggccaagtatgaggacatcaagaaggtggtgaagcaggcatctgagggcccactgaagggcatcctgggctacaccgaggaccaggttgtctcctgcgacttcaacagtgactcccactcttccacctttgatgctggggctggcattgctctcaatgacaactttgtaaagctcatttcctggtatgacaatgaatttggctacagcaacagagtggtggacctcatggcctacatggcctccaagg
正筛选序列Puromycin-T2A-d1EGFP的氨基酸序列如SEQ ID NO:9所示:
MATEYKPTVRLATRDDVPRAVRTLAAAFADYPATRHTVDPDRHIERVTELQELFLTRVGLDIGKVWVADDGAAVAVWTTPESVEAGAVFAEIGSRMAELSGSRLAAQQQMEGLLAPHRPKEPAWFLATVGVSPDHQGKGLGSAVVLPGVEAAERAGVPAFLETSAPRNLPFYERLGFTVTADVEVPEGPRTWCMTRKPGAGSEGRGSLLTCGDVEENPGPMVSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPDHMKQHDFFKSAMPEGYVQERTIFFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYIMADKQKNGIKVNFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITLGMDELYKKLSHGFPPAVAAQDDGTLPMSCAQESGMDRHPAACASARINV
所述打靶载体(GAPDH同源序列的左右臂及中间部分DNA序列,包括TK基因-SV40PolyA-PGK启动子-Puromycin-T2A-d1EGFP)的DNA序列如SEQ ID NO:10所示,其中,所述Puromycin-T2A-d1EGFP序列(SEQ ID NO:15)使用加粗下划线表示:
Figure GDA0002179117960000181
Figure GDA0002179117960000191
Figure GDA0002179117960000201
Figure GDA0002179117960000211
所述载体pTOG3核苷酸序列如SEQ ID NO:11所示,其中加黑下划线处为示踪蛋白DsRed-E2,其核苷酸序列如SEQ ID NO:36所示(未单独列出):
Figure GDA0002179117960000212
Figure GDA0002179117960000221
Figure GDA0002179117960000231
Figure GDA0002179117960000241
所述载体pTOG4核苷酸序列如SEQ ID NO:12所示,其中加黑下划线处为示踪蛋白d1EGFP,其核苷酸序列如SEQ ID NO:37所示(未单独列出):
Figure GDA0002179117960000242
Figure GDA0002179117960000251
Figure GDA0002179117960000261
不带启动子的抗性基因HygB如SEQ ID NO:13所示;
atgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatag
人延长因子1a(EF1a)启动子如SEQ ID NO:14所示;
cgtgaggctccggtgcccgtcagtgggcagagcgcacatcgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaaggtggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagggtgggggagaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacacaggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttgaattacttccacctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggagagttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctggggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctctagccatttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaagatctgcacactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgcacatgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctcaagctggccggcctgctctggtgcctggcctcgcgccgccgtgtatcgccccgccctgggcggcaaggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggccctgctgcagggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaaggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtccaggcacctcgattagttctggagcttttggagtacgtcgtctttaggttggggggaggggttttatgcgatggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttgatgtaattctccttggaatttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagtttttttcttccatttcaggtgtcgtga
人源整合外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54三个基因用自动切割肽段连接作为任选的外源基因,如SEQ ID NO:17所示:
atggtgttgttggagagcgagcagttcctgacggagctgaccagacttttccagaagtgccggacgtcgggcagcgtctatatcaccttgaagaagtatgacggtcgaaccaaacccattccaaagaaaggtactgtggagggctttgagcccgcagacaacaagtgtctgttaagagctaccgatgggaagaagaagatcagcactgtggtgagctccaaggaagtgaataagtttcagatggcttattcaaacctccttagagctaacatggatgggttgaagaagagagacaaaaagaacaaaactaagaagaccaaagcagcagcagcagcagcagcagcagcacctgccgcagcagcaacagcagcacagggcagcgagggaaggggaagcctgctcacatgcggcgacgtcgaagagaaccctggccccatgccgcagtaccagacctgggaggagttcagccgcgctgccgagaagctttacctcgctgaccctatgaaggcacgtgtggttctcaaatataggcattctgatgggaacttgtgtgttaaagtaacagatgatttagttagacagtgtcttgctctattgctcaggctgcagtgcagtggcatgatcatagctcactgcatcctcgacctcctgggctcaagcggtcctcttgcttcagcctccggagccaccaacttcagcctgctgaagcaggccggcgatgtggaggagaatcctggccccatggttctagcagaccttggaagaaaaataacatcagcattacgctcgttgagcaatgccaccattatcaatgaagaggtattgaatgctatgctaaaagaagtctgtaccgctttgttggaagcagatgttaatattaaactagtgaagcaactaagagaaaatgttaagtctgctattgatcttgaagagatggcatctggtcttaacaaaagaaaaatgattcagcatgctgtatttaaagaacttgtgaagcttgtagaccctggagttaaggcatggacacccactaaaggaaaacaaaatgtgattatgtttgttggattgcaagggagtggtaaaacaacaacatgttcaaagctagcatattattaccagaggaaaggttggaagacctgtttaatatgtgcagacacattcagagcaggggcttttgaccaactaaaacagaatgctaccaaagcaagaattccattttatggaagctatacagaaatggatcctgtcatcattgcttctgaaggagtagagaaatttaaaaatgaaaattttgaaattattattgttgatacaagtggccgccacaaacaagaagactctttgtttgaagaaatgcttcaagttgctaatgctatacaacctgataacattgtttatgtgatggatgcctccattgggcaggcttgtgaagcccaggctaaggcttttaaagataaagtagatgtagcctcagtaatagtgacaaaacttgatggccatgcaaaaggaggtggtgcactcagtgcagtcgctgccacaaaaagtccgattattttcattggtacaggggaacatatagatgactttgaacctttcaaaacacagccttttattagcaaacttcttggtatgggcgacattgaaggactgatagataaagtcaacgagttgaagttggatgacaatgaagcacttatagagaagttgaaacatggtcagtttacgttgcgagacatgtatgagcaatttcaaaatatcatgaaaatgggccccttcagtcagatcttggggatgatccctggttttgggacagattttatgagcaaaggaaatgaacaggagtcaatggcaaggctaaagaaattaatgacaataatggatagtatgaatgatcaagaactagacagtacggatggtgccaaagtttttagtaaacaaccaggaagaatccaaagagtagcaagaggatcgggtgtatcaacaagagatgttcaagaacttttgacacaatataccaagtttgcacagatggtaaaaaagatgggaggtatcaaaggacttttcaaaggtggcgacatgtctaagaatgtgagccagtcacagatggcaaaattgaaccaacaaatggccaaaatgatggatcctagggttcttcatcacatgggtggtatggcaggacttcagtcaatgatgaggcagtttcaacagggtgctgctggcaacatgaaaggcatgatgggattcaataatatgtaa
敲除Fut8基因所构建的TALEN左臂蛋白的DNA序列如SEQ ID NO:18所示:
atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacatcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa
敲除Fut8基因所构建的TALEN右臂蛋白的DNA序列如SEQ ID NO:19所示:
atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagccatgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagccatgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagccatgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatcccatgacgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa
用于扩增Fut8基因10号外显子TALEN靶向区域的PCR引物1如SEQ ID NO:20所示:
taaatctgttgattccaggttccc
用于扩增Fut8基因10号外显子TALEN靶向区域的PCR引物2如SEQ ID NO:21所示:
gtactaagaagtgtggtactgtgttg
敲除GS基因所构建的TALEN左臂蛋白的DNA序列如SEQ ID NO:22所示:
atggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagatggcccccaagaagaagagaaaggtgggcatccacagaggcgtgcccatggtggacctgagaaccctgggctacagccagcagcagcaggagaagatcaagcccaaggtgagaagcaccgtggcccagcaccacgaggccctggtgggccacggcttcacccacgcccacatcgtggccctgagccagcaccccgccgccctgggcaccgtggccgtgaagtaccaggacatgatcgccgccctgcccgaggccacccacgaggccatcgtgggcgtgggcaagcagtggagcggcgccagagccctggaggccctgctgaccgtggccggcgagctgagaggcccccccctccagctggacaccggccagctgctgaagatcgccaagagaggcggcgtgaccgccgtggaggccgtgcacgcctggagaaacgccctgaccggcgcccccctgaatttgacacccgaccaagttgtggccattgccagcaacggtggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctcccatgacggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacaacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggccattgccagcaacaacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacatcggcggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgccatcgcctctaacatcgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagccatgacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacggtggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacatcgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggccattgccagcaacaacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctcccatgacggcggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgccatcgcctctaacatcgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagcaacaacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctcccatgacggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagaccatgggctgacccccgagcaggtggtggccatcgccagcaacaacggcggcagacccgccctggagagcatcgtggcccagctgagcagacccgaccccgccctggccgccctgaccaacgaccacctggtggccctggcctgcctgggcggcagacccgccctggacgccgtgaagaagggcctgccccacgcccccgccctgatcaagagaaccaacagaagaatccccgagagaaccagccacagagtggccggcagccagctggtgaagagcgagctggaggagaagaagagcgagctgagacacaagctgaagtacgtgccccacgagtacatcgagctgatcgagatcgccagaaacagcacccaggacagaatcctggagatgaaggtgatggagttcttcatgaaggtgtacggctacagaggcaagcacctgggcggcagcagaaagcccgacggcgccatctacaccgtgggcagccccatcgactacggcgtgatcgtggacaccaaggcctacagcggcggctacaacctgcccatcggccaggccgacgagatgcagagatacgtggaggagaaccagaccagaaacaagcacatcaaccccaacgagtggtggaaggtgtaccccagcagcgtgaccgagttcaagttcctgttcgtgagcggccacttcaagggcaactacaaggcccagctgaccagactgaaccacatcaccaactgcaacggcgccgtgctgagcgtggaggagctgctgatcggcggcgagatgatcaaggccggcaccctgaccctggaggaggtgagaagaaagttcaacaacggcgagatcaacttcagaagctctagatga
敲除GS基因所构建的TALEN右臂蛋白的DNA序列如SEQ ID NO:23所示:
atggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagatggcccccaagaagaagagaaaggtgggcatccacagaggcgtgcccatggtggacctgagaaccctgggctacagccagcagcagcaggagaagatcaagcccaaggtgagaagcaccgtggcccagcaccacgaggccctggtgggccacggcttcacccacgcccacatcgtggccctgagccagcaccccgccgccctgggcaccgtggccgtgaagtaccaggacatgatcgccgccctgcccgaggccacccacgaggccatcgtgggcgtgggcaagcagtggagcggcgccagagccctggaggccctgctgaccgtggccggcgagctgagaggcccccccctccagctggacaccggccagctgctgaagatcgccaagagaggcggcgtgaccgccgtggaggccgtgcacgcctggagaaacgccctgaccggcgcccccctgaatttgacacccgaccaagttgtggccattgccagcaacggtggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacaacggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacaacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggccattgccagcaacatcggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacggtggcggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgccatcgcctctcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagcaacggtggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacatcggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacaacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggccattgccagccatgacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacggtggcggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgccatcgcctctcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagcaacatcggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacatcggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagaccatgggctgacccccgagcaggtggtggccatcgccagcaacggtggcggcagacccgccctggagagcatcgtggcccagctgagcagacccgaccccgccctggccgccctgaccaacgaccacctggtggccctggcctgcctgggcggcagacccgccctggacgccgtgaagaagggcctgccccacgcccccgccctgatcaagagaaccaacagaagaatccccgagagaaccagccacagagtggccggcagccagctggtgaagagcgagctggaggagaagaagagcgagctgagacacaagctgaagtacgtgccccacgagtacatcgagctgatcgagatcgccagaaacagcacccaggacagaatcctggagatgaaggtgatggagttcttcatgaaggtgtacggctacagaggcaagcacctgggcggcagcagaaagcccgacggcgccatctacaccgtgggcagccccatcgactacggcgtgatcgtggacaccaaggcctacagcggcggctacaacctgcccatcggccaggccgacgagatgcagagatacgtggaggagaaccagaccagaaacaagcacatcaaccccaacgagtggtggaaggtgtaccccagcagcgtgaccgagttcaagttcctgttcgtgagcggccacttcaagggcaactacaaggcccagctgaccagactgaaccacatcaccaactgcaacggcgccgtgctgagcgtggaggagctgctgatcggcggcgagatgatcaaggccggcaccctgaccctggaggaggtgagaagaaagttcaacaacggcgagatcaacttcagaagctctagatga
用于扩增GS基因7号外显子TALEN靶向区域的PCR引物1如SEQ ID NO:24所示
ttgtacccgttggagaagtgacag
用于扩增GS基因7号外显子TALEN靶向区域的PCR引物2如SEQ ID NO:25所示:
gatgaactaggaaaggctcaagatcac
敲除ST3GAL4基因所构建的TALEN左臂蛋白的DNA序列如SEQ ID NO:26所示:
atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacaacgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa
敲除ST3GAL4基因所构建的TALEN右臂蛋白的DNA序列如SEQ ID NO:27所示:
atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacatcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa
用于扩增ST3GAL4基因5号外显子TALEN靶向区域的PCR引物1如SEQ ID NO:28所示:
ctaaaggctgctcccactctac
用于扩增ST3GAL4基因5号外显子TALEN靶向区域的PCR引物2如SEQ ID NO:29所示:
caaagtggaacttgggttgagg
敲除ST3GAL6基因所构建的TALEN左臂蛋白基因序列如SEQ ID NO:30所示:
atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacggcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa
敲除ST3GAL6基因所构建的TALEN右臂蛋白基因序列如SEQ ID NO:31所示:
atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacatcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa
用于扩增ST3GAL6基因2号外显子TALEN靶向区域的PCR引物1如SEQ ID NO:32所示:
gggtgtagagatagattctcc
用于扩增ST3GAL6基因2号外显子TALEN靶向区域的PCR引物2如SEQ ID NO:33所示:
ggccagccatcactagtattc
所述hERO-L基因的DNA序列如SEQ ID NO:38所示:
atgggccgcggctggggattcttgtttggcctcctgggcgccgtgtggctgctcagctcgggccacggagaggagcagcccccggagacagcggcacagaggtgcttctgccaggttagtggttacttggatgattgtacctgtgatgttgaaaccattgatagatttaataactacaggcttttcccaagactacaaaaacttcttgaaagtgactactttaggtattacaaggtaaacctgaagaggccgtgtcctttctggaatgacatcagccagtgtggaagaagggactgtgctgtcaaaccatgtcaatctgatgaagttcctgatggaattaaatctgcgagctacaagtattctgaagaagccaataatctcattgaagaatgtgaacaagctgaacgacttggagcagtggatgaatctctgagtgaggaaacacagaaggctgttcttcagtggaccaagcatgatgattcttcagataacttctgtgaagctgatgacattcagtcccctgaagctgaatatgtagatttgcttcttaatcctgagcgctacactggttacaagggaccagatgcttggaaaatatggaatgtcatctacgaagaaaactgttttaagccacagacaattaaaagacctttaaatcctttggcttctggtcaagggacaagtgaagagaacactttttacagttggctagaaggtctctgtgtagaaaaaagagcattctacagacttatatctggcctacatgcaagcattaatgtgcatttgagtgcaagatatcttttacaagagacctggttagaaaagaaatggggacacaacattacagaatttcaacagcgatttgatggaattttgactgaaggagaaggtccaagaaggcttaagaacttgtattttctctacttaatagaactaagggctttatccaaagtgttaccattcttcgagcgcccagattttcaactctttactggaaataaaattcaggatgaggaaaacaaaatgttacttctggaaatacttcatgaaatcaagtcatttcctttgcattttgatgagaattcattttttgctggggataaaaaagaagcacacaaactaaaggaggactttcgactgcattttagaaatatttcaagaattatggattgtgttggttgttttaaatgtcgtctgtggggaaagcttcagactcagggtttgggcactgctctgaagatcttattttctgagaaattgatagcaaatatgccagaaagtggacctagttatgaattccatctaaccagacaagaaatagtatcattattcaacgcatttggaagaatttctacaagtgtgaaagaattagaaaacttcaggaacttgttacagaatattcattga
所述hFGF9基因的DNA序列如SEQ ID NO:39所示:
Atgaccagcaagctcgccgtggctctgctggctgccttcctgatcagcgccgccctctgcgagggcttaggtgaagttgggaactatttcggtgtgcaggatgcggtaccgtttgggaatgtgcccgtgttgccggtggacagcccggttttgttaagtgaccacctgggtcagtccgaagcaggggggctccccaggggacccgcagtcacggacttggatcatttaaaggggattctcaggcggaggcagctatactgcaggactggatttcacttagaaatcttccccaatggtactatccagggaaccaggaaagaccacagccgatttggcattctggaatttatcagtatagcagtgggcctggtcagcattcgaggcgtggacagtggactctacctcgggatgaatgagaagggggagctgtatggatcagaaaaactaacccaagagtgtgtattcagagaacagttcgaagaaaactggtataatacgtactcatcaaacctatataagcacgtggacactggaaggcgatactatgttgcattaaataaagatgggaccccgagagaagggactaggactaaacggcaccagaaattcacacattttttacctagaccagtggaccccgacaaagtacctgaactgtataaggatattctaagccaaagttga
所述GT-P2A-ST6基因的DNA序列如SEQ ID NO:40所示:
atgaggcttcgggagccgctcctgagcggcagcgccgcgatgccaggcgcgtccctacagcgggcctgccgcctgctcgtggccgtctgcgctctgcaccttggcgtcaccctcgtttactacctggctggccgcgacctgagccgcctgccccaactggtcggagtctccacaccgctgcagggcggctcgaacagtgccgccgccatcgggcagtcctccggggagctccggaccggaggggcccggccgccgcctcctctaggcgcctcctcccagccgcgcccgggtggcgactccagcccagtcgtggattctggccctggccccgctagcaacttgacctcggtcccagtgccccacaccaccgcactgtcgctgcccgcctgccctgaggagtccccgctgcttgtgggccccatgctgattgagtttaacatgcctgtggacctggagctcgtggcaaagcagaacccaaatgtgaagatgggcggccgctatgcccccagggactgcgtctctcctcacaaggtggccatcatcattccattccgcaaccggcaggagcacctcaagtactggctatattatttgcacccagtcctgcagcgccagcagctggactatggcatctatgttatcaaccaggcgggagacactatattcaatcgtgctaagctcctcaatgttggctttcaagaagccttgaaggactatgactacacctgctttgtgtttagtgacgtggacctcattccaatgaatgaccataatgcgtacaggtgtttttcacagccacggcacatttccgttgcaatggataagtttggattcagcctaccttatgttcagtattttggaggtgtctctgctctaagtaaacaacagtttctaaccatcaatggatttcctaataattattggggctggggaggagaagatgatgacatttttaacagattagtttttagaggcatgtctatatctcgcccaaatgctgtggtcgggaggtgtcgcatgatccgccactcaagagacaagaaaaatgaacccaatcctcagaggtttgaccgaattgcacacacaaaggagacaatgctctctgatggtttgaactcactcacctaccaggtgctggatgtacagagatacccattgtatacccaaatcacagtggacatcgggacaccgagctcgagcggcagcggagccaccaacttcagcctgctgaagcaggccggcgatgtggaggagaatcctggccccatgattcacaccaacctgaagaaaaagttcagctgctgcgtcctggtctttcttctgtttgcagtcatctgtgtgtggaaggaaaagaagaaagggagttactatgattcctttaaattgcaaaccaaggaattccaggtgttaaagagtctggggaaattggccatggggtctgattcccagtctgtatcctcaagcagcacccaggacccccacaggggccgccagaccctcggcagtctcagaggcctagccaaggccaaaccagaggcctccttccaggtgtggaacaaggacagctcttccaaaaaccttatccctaggctgcaaaagatctggaagaattacctaagcatgaacaagtacaaagtgtcctacaaggggccaggaccaggcatcaagttcagtgcagaggccctgcgctgccacctccgggaccatgtgaatgtatccatggtagaggtcacagattttcccttcaatacctctgaatgggagggttatctgcccaaggagagcattaggaccaaggctgggccttggggcaggtgtgctgttgtgtcgtcagcgggatctctgaagtcctcccaactaggcagagaaatcgatgatcatgacgcagtcctgaggtttaatggggcacccacagccaacttccaacaagatgtgggcacaaaaactaccattcgcctgatgaactctcagttggttaccacagagaagcgcttcctcaaagacagtttgtacaatgaaggaatcctaattgtatgggacccatctgtataccactcagatatcccaaagtggtaccagaatccggattataatttctttaacaactacaagacttatcgtaagctgcaccccaatcagcccttttacatcctcaagccccagatgccttgggagctatgggacattcttcaagaaatctccccagaagagattcagccaaaccccccatcctctgggatgcttggtatcatcatcatgatgacgctgtgtgaccaggtggatatttatgagttcctcccatccaagcgcaagactgacgtgtgctactactaccagaagttcttcgatagtgcctgcacgatgggtgcctaccacccgctgctctatgagaagaatttggtgaagcatctcaaccagggcacagatgaggacatctacctgcttggaaaagccacactgcctggcttccggaccattcactgctaa
实施例1:CHO细胞打靶载体的构建和锚定细胞株的建立
为了实现在CHO细胞基因组上的连续的、循环交替的、无上限的定点整合,首先需要在CHO细胞基因组中找到一个高表达的热点(Hot-Spot)。发明人经过深入研究,发现组成型高表达的管家基因GAPDH的启动子(Promoter)符合染色体结构开放、恒定高表达的要求。例如,Bahr S.等人在CHO细胞中鉴定出类似于小鼠ROSA26的位点。ROSA26是已知的小鼠基因组中结构开放、恒定高表达的位点,经常被用于植入外源基因,制备转基因小鼠。尽管CHO细胞中的也存在ROSA26基因,但其mRNA水平的转录强度,与其它数个恒定型管家基因相比,是较低的,尤其仅为GAPDH转录强度的1/300。GAPDH基因比第二位的β-actin基因要高4~5倍。所以,我们选取CHO细胞中的GAPDH基因3574544位到3575484位的核苷酸序列(SEQ IDNO:8)所示进行基因打靶。
基因打靶技术已经被广泛用于制备基因敲除(knockout)、基因敲入(knockin)小鼠,其原理是建立在染色体DNA与外源DNA的同源重组基础上的。我们在购自商业化公司的打靶载体pDNL(AddGene)上,在PacI和FseI酶切位点之间,克隆进GAPDH的左右臂。在GAPDH左右臂之间,包含了TK基因作为负筛选,PGK启动子-嘌呤霉素-T2A-d1EGFP表达盒作为正筛选。而且,在紧邻该表达盒的上下游,分别带有LoxPwt和LoxP1序列。此打靶载体被命名为CHO GAPDH-Zeo-TK HR v1.5(图1,其部分核苷酸序列如SEQ ID NO:10所示)。在这个过程中,所有的分子克隆操作都采用高保真DNA聚合酶Herculase II Fusion DNA Polymerase(Aligent公司),按Overlapping PCR方法将不同片段连接起来。所有的PCR引物都由Integrated DNA Technology(IDT)公司合成。限制性内切酶都购自New England Biolabs(NEB)。
CHO-K1细胞(ATCC,CCL-61)接受打靶载体的电转。电转仪是LifeTech公司的NeonElectroporation系统。电转条件是1620v,10ms,3次脉冲。打靶载体的DNA用量是10μg,细胞用量是2百万个。电转后,CHO细胞培养在含5%FBS的DMEM培养基中,48小时后,用药物嘌呤霉素(10μg/mL)筛选。
我们用d1EGFP作为示踪蛋白,与嘌呤霉素通过自动切割序列连接,其氨基酸序列如SEQ ID NO:9所示。所述自动切割序列选自2A肽段(参阅“基于2A肽策略构建多基因表达载体的研究进展”,China Biotechnology,2013,33:104-108)。自剪切2A肽源于口蹄疫病毒(foot-and-mouth disease viruses,FMDV)。这些2A肽段或2A类似肽段均由18~22个氨基酸组成,C末端序列高度保守:-DxExNPGP-。在核糖体翻译至此序列时,因发生“跳跃”而实现无需蛋白酶的自动断裂(剪切)。剪切发生在C末端G-P残基之间。优选地选自P2A(SEQ IDNO:16:ATNFSLLKQAGDVEENPGP)、T2A(SEQ ID NO:34:EGRGSLLTCGDVEENPGP)或E2A(SEQ IDNO:35:QCTNYALLKLAGDVESNPGP)。
EGFP在细胞内的半衰期约为24小时,荧光强度很强。d1EGFP是半衰期仅为1小时的EGFP的突变体,荧光强度大大减弱(序列购自Clontech公司)。本发明中,采用d1EGFP作为表达示踪蛋白的原理是:当打靶载体定位于GAPDH表达热点后,因转录旺盛,即便是荧光很弱的d1EGFP都能发出很强的荧光;而那些随机插入染色体其他位置的事件则给出羸弱的荧光。
将嘌呤霉素筛选出的抗性克隆用FACS检测,发现绝大多数的抗性克隆是随机插入,表达很弱的d1EGFP信号。而只有0.6%非常低比例的才是真正GAPDH位点定点整合的事件,表达很强的d1EGFP信号(图2)。发明人进而用流式细胞仪(MoFlo)将这些d1EGFP高表达的克隆富集后亚克隆。获得的一株表达很强的d1EGFP信号、形态好且生长快的CHO细胞株,作为可供进一步实现“连续、循环交替的、无上限的基因组定点整合”的锚定CHO细胞株(Anchor Cell Line)。
实施例2:“Toggle-In”载体的构建和多基因稳定共表达的方法
为解决CHO细胞株改造所面临的多基因稳定共表达的难题,发明人在前述锚定CHO细胞株的基础上,研发出一套Cre-LoxP介导的同源重组的“Toggle-In”平台系统。该系统的特征是:依次用两个载体(pTOG3和pTOG4,只用两个抗药性基因(潮霉素B和嘌呤霉素)就可以实现连续、循环交替的、无上限的基因组定点整合。而且,这些CHO细胞克隆,每个都是均质(Isogeneic)的,可以做到插入片段1:1表达。
pTOG3(其核苷酸序列如SEQ ID NO:11所示,其中携带DsRed-E2示踪蛋白,其核苷酸序列如SEQ ID NO:36)和pTOG4(其核苷酸序列如SEQ ID NO:12所示,其中携带d1EGFP示踪蛋白,其核苷酸序列如SEQ ID NO:37所示)的构建依然采用前述分子克隆操作方法,即由高保真DNA聚合酶Herculase II Fusion DNA Polymerase(Aligent公司),按OverlappingPCR方法将不同片段连接起来。所有的PCR引物都由Integrated DNA Technology(IDT)公司合成。限制性内切酶都购自New England Biolabs(NEB)。
其中,pTOG3带有潮霉素抗性基因(潮霉素B)和外源基因-1(Gene-of-Interest,GOI-1),而pTOG4则带有嘌呤霉素抗性基因(嘌呤霉素)和外源基因-2(GOI-2)。
表1列出了pTOG3和pTOG4载体所用到的LoxP野生型和突变体的序列。LoxP序列(34nt)可以分为左臂(13nt)、间隔区(8nt)和右臂(13nt)。核心的间隔区决定了LoxP序列之间的匹配,即只有相同间隔区的LoxP序列,之间才能进行同源重组(例如LoxP1和LoxP2,或LoxP4和LoxP5)。Cre重组酶可以容忍在左右臂区之一有一定程度的突变(例如LoxP1的右臂相较于LoxPwt的右臂),但不能容忍左右臂区同时出现突变(例如LoxP3或LoxP6相较于LoxPwt)。一旦如此,重组后新产生的LoxP3或LoxP6便失活了,不能进一步发生Cre介导的重组。
表1
LoxP序列 左臂 间隔区 右臂 序列号
LoxPwt ATAACTTCGTATA GCATACAT TATACGAAGTTAT SEQ ID NO:1
LoxP1 ATAACTTCGTATA G<u>T</u>ATA<u>GTA</u> TATACGAA<u>CGGTA</u> SEQ ID NO:2
LoxP2 <u>TACCG</u>TTCGTATA G<u>T</u>ATA<u>GTA</u> TATACGAAGTTAT SEQ ID NO:3
LoxP3 <u>TACCG</u>TTCGTATA G<u>T</u>ATA<u>GTA</u> TATACGAA<u>CGGTA</u> SEQ ID NO:4
LoxP4 ATAACTTCGTATA G<u>GC</u>TA<u>T</u>A<u>G</u> TATACGAA<u>CGGTA</u> SEQ ID NO:5
LoxP5 <u>TACCG</u>TTCGTATA G<u>GC</u>TA<u>T</u>A<u>G</u> TATACGAAGTTAT SEQ ID NO:6
LoxP6 <u>TACCG</u>TTCGTATA G<u>GC</u>TA<u>T</u>A<u>G</u> TATACGAA<u>CGGTA</u> SEQ ID NO:7
第一步,先在实施例1制备的锚定CHO细胞中,转化pTOG3。具体方法是:将锚定CHO细胞用含5%FBS的DMEM培养在6孔板中。当细胞密度达到80%满时,用Fugene 6试剂(Promega公司)同时转化1.0μg的带外源基因的pTOG3和20ng编码Cre蛋白的pOG231质粒(购自AddGene)。由于此一步Cre-LoxP同源重组的效率非常之高,pOG231的量不能太多否则效率反而下降,20ng的量是已滴定过的最优剂量。转化48小时后,将细胞用胰酶消化后,重新铺在两块10厘米平皿里,加800μg/mL的潮霉素B,筛选7~10天后,可见几百个克隆形成。
作为示范,发明人将DsRed-E2示踪蛋白的基因(SEQ ID NO:36),克隆到pTOG3的MluI和XhoI酶切位点之间,由pTOG3载体导入锚定CHO细胞的GAPDH的表达热点,并经过潮霉素筛选出克隆。荧光显微镜观察表明,所有药物抗性克隆均表达很高水平的红色荧光蛋白(图5A),说明此染色体基因组定点整合技术的高效率。
药物抗性试验(Drug test)的目的是筛选出真正的基因打靶事件,而非随机整合事件。在潮霉素B筛选出的克隆长至1000个细胞左右时,用2ml PBS将平皿洗三次,去除任何漂浮的细胞。然后用无菌枪头挑取形态好的克隆至48孔中,继续用含5%FBS的DMEM培养。当细胞在48孔中长至80%满时,可胰酶消化,各个克隆分别种在两组复孔中,其中一组加嘌呤霉素(10μg/mL)筛选,另一组留种。一般1~2天后即可看出细胞是否对嘌呤霉素敏感。
根据“Toggle-In”平台系统的原理,带有GOI-1的pTOG3载体与GAPDH位点上的LoxPwt:LoxPwt序列以及LoxP1:LoxP2序列之间发生同源重组,保留LoxPwt序列,并生成失活的LoxP3序列。GOI-1由此整合到染色体高表达位点,并由潮霉素筛选出带有LoxP4序列的正确克隆(图3)。而这些真正发生同源重组的正确克隆,其嘌呤霉素抗性基因是被潮霉素抗性基因置换掉的,故细胞应该显出对嘌呤霉素敏感。如果不敏感,则是随机整合事件。虽然有些双抗性的克隆也可能会表达GOI-1,但却无法进行下一步的“Toggle-In”操作。
第二步,将上述嘌呤霉素敏感的克隆用含5%FBS的DMEM培养在6孔板中。当孔内的细胞密度达到80%满时,用Fugene 6试剂同时转化1.0μg的带外源基因GOI-2的pTOG4和20ng的pOG231质粒,由嘌呤霉素筛选出带有LoxP1序列的正确克隆(图4)。在此过程中,pTOG4载体和上述新整合位点上的LoxPwt:LoxPwt序列以及LoxP4:LoxP5序列之间发生同源重组,保留LoxPwt序列,并生成失活的LoxP6序列,GOI-2由此整合到同一染色体高表达位点。上述转化48小时后,将细胞用胰酶消化后,重新铺在两块10厘米平皿里,加10μg/mL的嘌呤霉素,筛选7~10天后,可见10-20个克隆形成。因为LoxP序列的关系,此一步的重组效率要比pTOG3的要明显低很多。
药物抗性试验(Drug test):当嘌呤霉素筛选出的克隆长至1000个细胞左右时,用2ml PBS将平皿洗三次,去除任何漂浮的细胞。然后用无菌枪头挑取形态好的克隆至48孔中,继续用含5%FBS的DMEM培养。当细胞在48孔中长至80%满时,可胰酶消化,各个克隆分别种在两组复孔中,其中一组加潮霉素(800μg/mL)筛选,另一组留种。一般7天后即可看出细胞是否对潮霉素敏感。
经过这两轮的同源重组整合,染色体上又恢复到带有LoxPwt和LoxP1序列的初始状态,又可以进行下一轮的整合。每轮整合的筛选仅用潮霉素或嘌呤霉素两种抗生素交替进行。发明人用此方法,把SRP-14-9-54(核苷酸序列如SEQ ID NO:17所示)、hERO-L(核苷酸序列如SEQ ID NO:38所示)、hFGF9(核苷酸序列如SEQ ID NO:39所示)等基因,转入到CHO细胞高表达位点,形成能促进抗体配对、折叠和分泌的高表达细胞株,被命名为CHO-E,其中”E“代表Enhanced之意。RT-PCR显示各个CHO-E细胞克隆之间的基因同质性(isogenicity)(图5B)。
实施例3:用TALEN技术敲除CHO细胞中的Fut8基因
为方便快速地敲除CHO细胞中Fut8基因,发明人构建了针对CHO细胞Fut8基因第10号外显子的一对TALEN载体(编码敲除CHO细胞Fut8基因的TALEN蛋白左臂的DNA序列如SEQID NO:18所示,编码敲除CHO细胞Fut8基因的TALEN蛋白右臂的DNA序列如SEQ ID NO:19所示),分别命名为FL#2和FR#12。取这两个miniPrep制备的质粒各5μg,用电转方法导入1百万个CHO-K1细胞(ATCC,CCL-61)。电转仪是LifeTech公司的Neon Electroporation系统。电转条件是1620v,10ms,3次脉冲。电转后,CHO细胞在含5%FBS的DMEM培养基中培养8天,不加任何药物筛选。此一生长阶段是让那些Fut8基因被破坏的克隆能充分地分裂,并通过细胞膜的周转代谢,稀释掉膜上原先带有岩藻糖(Fucose)的糖蛋白,而那些新产生的跨膜糖蛋白则不带有岩藻糖了。此后,Fut8-/-的CHO细胞可用MACS磁珠负筛选。具体做法是:
于15mL离心管中,离心(1200rpm,5分钟)收集细胞。弃上清,细胞团悬浮在1mL的MACS缓冲液(PBS加5mM EDTA加1%BSA)中,用1:2500倍稀释(终浓度2μg/mL)的biotin标记的特异结合岩藻糖的植物凝集素Lens Culinaris Agglutinin(LCA)4℃染色15分钟。LCA-biotin购自美国Vector Laboratories,Inc.公司(Burlingame,CA)。细胞悬液加10mL MACS缓冲液,离心(1200rpm,5分钟)收集细胞,用1mL的MACS缓冲液重悬。加PE标记的Streptavidin(终浓度1μg/mL)4℃避光染色15分钟。Streptavidin-PE购自美国eBioscience,Inc.公司(San Diego,CA)。细胞悬液加10mL MACS缓冲液,离心(1200rpm,5分钟)收集细胞,用1mL的MACS缓冲液重悬。加anti-PE Microbeads 70μL,4℃结合15分钟。抗PE的磁珠购自Miltenyi Biotec公司(San Diego,CA)。细胞悬液加10mL MACS缓冲液,离心(1200rpm,5分钟)收集细胞,用0.5mL的MACS缓冲液重悬,加到已经用5mL MACS缓冲液淋润过,并置于磁铁上的MS分离柱上。当细胞悬液进入柱面后,加10mL MACS缓冲液洗涤柱子。用15mL离心管收集从柱上流出的液体,离心(1200rpm,5分钟)收集细胞。此部分细胞是不被LCA结合的,亦即岩藻糖缺失的。这部分的细胞约占细胞总数的1%。将细胞按一定浓度稀释种在含5%FBS DMEM培养基的10厘米培养皿中。10~14天后,用无菌枪头挑取形态好的克隆至48孔板中,继续用含5%FBS的DMEM培养。当细胞在48孔板中长至80%满时,可胰酶消化,各个克隆分别种在两组复孔中,其中一组用FACS验证其表面是否存在LCA结合位点,另一组留种。图6即显示获得的FACS图谱。
在获得了18个LCA染色阴性的克隆后,发明人继续对1号克隆进一步进行10号外显子区域基因组DNA的PCR扩增(所用引物序列SEQ ID NO:20-21所示)。基因组DNA的提取方法按Qiagen试剂盒的说明书操作。PCR片段用Qiagen公司的PCR回收试剂盒回收,并于37℃用NEB公司的MscI酶切1个小时。2%琼脂糖电泳走胶的图谱(图7A)显示:野生型细胞的715bpPCR产物被完全切成417bp和298bp两段,与MscI酶切位点在扩增片段中的位置相符。1、2、18号克隆则有一半DNA被完全切成417bp和298bp两段,另一半DNA则不被酶切。而3、4、12号克隆的PCR产物则完全不能酶切。这一结果说明:1、2、18号克隆有一条等位基因上的MscI酶切位点被TALEN失活了,而3、4、12号克隆的两条等位基因上的MscI酶切位点都被TALEN失活了。
为了更进一步确立Fut8基因不再表达功能性蛋白,发明人针对1号克隆,将其未经酶切的纯化后的PCR产物用T4 DNA Polymerase末端加磷,然后用LifeTech公司的TACloning试剂盒克隆并转化细菌。随机挑取5个单菌落,接种培养后抽取质粒测序。测序结果(图7B)表明,1号克隆的两条Fut8的外显子10的等位基因都已经失活了:其中一条是在MscI酶切位点附近,发生核苷酸缺失和插入的突变,不仅使得MscI酶切位点丧失,而且造成蛋白转译的提前终止;另外一条虽然保留了MscI酶切位点,但核苷酸插入突变也造成了蛋白转译的提前终止。这一结果与PCR片段的酶切图谱是相符的。由此,发明人建立了CHO-Fut8-/-细胞株,即CHO-F细胞株(表2)。
为了更进一步说明CHO-F细胞株确能表达100%岩藻糖缺失的抗体,在根据本发明的另一个实施方案中,发明人用Mass Spec质谱分析比较了野生型CHO-K1和CHO-F细胞表达的Fc融合蛋白(图8)或抗体(图9)的糖链。此部分工作由提供外包服务的Waters公司按糖链Mass Spec质谱分析的标准方法进行。结果表明CHO-F细胞表达的产物100%不带有岩藻糖。
实施例4:岩藻糖缺失抗体的Fc受体结合活力比较
为了更进一步说明岩藻糖缺失抗体与Fc受体的结合活性的改变,在本发明的另一个实施方案中,发明人用ELISA的方法,比较了野生型CHO-K1和CHO-F细胞表达的hIgG1抗体对多种小鼠和人的Fc受体蛋白的结合能力(图10)。ELISA操作按标准方法进行,即把各种Fc受体蛋白(美国AB Biosciences公司,Boston,MA)按2μg/mL的剂量包在ELISA板上。脱脂奶粉封闭之后,加相同剂量的野生型或岩藻糖缺失抗体1μg/mL,充分洗涤后再用HRP标记的羊抗人抗体检测。结果表明,岩藻糖缺失的hIgG1抗体对小鼠FcRγI、FcRγIIb、FcRγIII,以及人的FcRγI、FcRγIIa(H133)、FcRγIIa(R133)、FcRγIIb的结合力没有变化,而对人的FcRγIIIa的结合力有很大提升。
根据小鼠FcRγIV是人的FcRγIIIa的功能类似物的文献报道(Mechetina,L.V.etal.,Immunogenetics.2002;54:463-8),发明人希望比较两者对野生型和岩藻糖缺失的hIgG1、小鼠mIgG2a抗体的结合曲线。发明人还用生物信息学方法,从UniProt蛋白序列库中鉴定出先前未知的一个豚鼠蛋白(H0VDZ8),与小鼠FcRγIV和人的FcRγIIIa序列高度同源(图11),进而将其定名为Guinea Pig FcRγIV(gpFcRγIV)。发明人将hFcRγIIIa-V158、mFcRγIV或gpFcRγIV分别用pTOG3和“Toggle-In”方法表达在转化了Fc Receptor commonγchain的CHO-E细胞表面,然后用FACS的方法比较野生型和岩藻糖缺失的hIgG1、小鼠mIgG2a抗体与三者的结合力(图12)。结果显示,用CHO-F细胞表达的岩藻糖缺失的hIgG1、小鼠mIgG2a抗体对这些受体的结合力都有不同程度的提高(Mao,C.et al.,J.Infect.Dis.Med.,2016;1:1)。至此,发明人建立的TALEN快速敲除CHO细胞中Fut8基因的方法已经从基因和蛋白的功能水平得以验证。
需要指出的是,在用pTOG3导入hFcRγIIIa-V158、mFcRγIV或gpFcRγIV之前,发明人考虑到很多Fc受体的膜表达和活性功能都依赖一个称为Fc Receptor commonγchain的通用受体亚基(Nimmerjahn F.et al,Immunity.2005Jul;23:41-51),故将它克隆在pTOG4载体上,预先用“Toggle-In”方法表达在CHO-E细胞表面。继而在下一轮的pTOG3导入hFcRγIIIa-V158、mFcRγIV或gpFcRγIV之后,所建立的CHO细胞株都能同时表达亚基1:1比例构成的功能性的Fc受体复合物。
因为是单拷贝定点整合,不同Fc受体在不同细胞株上的表达密度是非常接近的。这为横向比较同一抗体对不同受体的结合力提供了随机整合所无法提供的优势。例如,从图12中y轴的MFI数值可知,人IgG1抗体对豚鼠gpFcRγIV受体的结合活性远高于其他两个种属的同源受体。因而人的治疗性IgG1抗体在不同种属的动物模型中,所获得的药代动力学等数据是否能作跨种属的推论,是需要谨慎考虑的。上述案例也是本发明所阐述的“Toggle-In”方法的又一个成功应用。
实施例5:岩藻糖缺失抗体的ADCC活力比较
为了在细胞功能水平进一步阐述岩藻糖缺失抗体的性质,发明人进一步比较了野生型和岩藻糖缺失的hIgG1、小鼠mIgG2c抗体的ADCC能力。传统的检测ADCC的方法是测量靶细胞的死亡(51Cr或LDH的释放),而效应细胞多采用PBMC或从中纯化的NK细胞。但不同捐献者的效应细胞往往有很多差异,且不易收集和储存。Promega公司开发出一种检测效应细胞系(Jurkat)通过转化的hFcRγIIIa(V158)受体被激活、引发荧光信号的测活方案。但是该细胞系是通过三个质粒共转化、两种抗生素药物筛选来维持功能性hFcRγIIIa表达的。传代多了之后,渐渐出现hFcRγIIIa功能性丢失的现象。在本发明中,发明人采用慢病毒介导的方法,在Jurkat系中稳定地表达hFcRγIIIa或mFcRγIV受体,使得Jurkat系长期稳定且荧光信号大大增强。
利用此系统,发明人用hFcRγIIIa-Jurkat细胞比较了野生型和岩藻糖缺失的hIgG1对靶细胞的ADCC。具体做法是:在Falcon white opaque细胞培养96孔板(Cat#353296)里,于实验开始24小时之前预先接种10000个表达靶抗原的细胞。这样的细胞可以是表达靶抗原的肿瘤细胞系,也可以是将靶抗原克隆后用pTOG3和“Toggle-In”方法在表面表达的CHO-E细胞。实验当天,在上述96孔板中,加入2×105/孔的hFcRγIIIa-Jurkat细胞,并与不同稀释度的抗靶抗原的抗体混合,总体积控制在75~90μL,在37℃孵育6小时。孵育结束后,于每孔加60μL的Bio-Glo萤光素酶底物(Promega公司,Cat#G719A),室温30分钟后上荧光读数仪读数。结果显示,用CHO-F细胞表达的岩藻糖缺失的hIgG1对靶细胞的ADCC比野生型hIgG1提高了50~100倍(图13)。按同样方法,发明人比较了野生型和岩藻糖缺失的mIgG2c对靶细胞的ADCC。所不同的是,效应细胞采用的是用慢病毒介导表达的mFcRγIV-Jurkat细胞。结果显示,岩藻糖缺失的mIgG2c对靶细胞的ADCC比野生型mIgG2c提高了50~100倍(图14)。至此,建立快速敲除CHO细胞株中Fut8基因的方法,已经在本发明的实施例中,不仅在基因和蛋白的功能水平,而且在抗体介导的细胞活性水平得以确立。运用此方法,发明人不仅在CHO-K1细胞株中敲除了Fut8基因,得到CHO-F细胞株,而且在第一部分实施例中建立的、同时表达多个基因的CHO-E细胞株中也敲除了Fut8基因,得到CHO-EF细胞株。
实施例6:GS缺失的CHO细胞克隆的筛选
如实施例3所示,CHO-K1细胞或Fut8基因缺失的CHO-F细胞,经电转导入针对GS基因的TALEN左臂(SEQ ID NO:22)和右臂(SEQ ID NO:23)载体GS-L和GS-R(各5μg)。电转仪是LifeTech公司的Neon Electroporation系统。电转条件是1620v,10ms,3次脉冲。电转后,CHO细胞按一定浓度稀释后种在含5%FBS的DMEM培养基的10厘米培养皿中培养,不加任何药物筛选,以形成单克隆。10~14天后,用无菌枪头挑取形态好的克隆至48孔板中,继续用含5%FBS的DMEM培养。当细胞在48孔板中长至80%满时,可胰酶消化,各个克隆分别种在两组复孔中,其中一组用PBS洗涤两遍后,换成用不含谷氨酰胺的HyCell培养基(GE HealthSciences,Logan,CT.Cat No.SH30934.01);另一组则在上述HyCell培养基中补充2mM的谷氨酰胺。7天以后,GS-/-的CHO细胞(clone#4)只能在含谷氨酰胺的HyCell培养基中生长,而在谷氨酰胺缺失的培养基则不能生长。而GS+/+的CHO细胞则能在两者中皆能生长(图15)。
我们用针对GS基因7号外显子的一对引物(SEQ ID NO:24和25)从clone#4基因组中扩增出被TALEN打靶的DNA区域。用分子克隆技术分别进行测序,结果表明两条等位基因都被打靶失活了(图16)。
为进一步验证GS-/-CHO-K1株能用于外源基因的筛选,我们按上述电转的方法,将用于抗体基因表达并带有GS表达盒子的pDirect载体(10μg)导入GS-/-CHO-K1细胞。电转后,细胞先用含谷氨酰胺的5%FBS-DMEM培养基培养一天,然后用PBS洗涤两次,换作不含谷氨酰胺的HyCell培养基,继续培养。8~10天后,当没有转外源GS基因的GS-/-CHO-K1细胞都死亡时,接受了外源GS基因的GS-/-CHO-K1细胞,于培养皿中出现抗性克隆。
至此,我们用功能性生长实验证明了CHO-K1细胞经TALEN处理后,#4克隆中不再带有功能性的GS基因。用同样的方法,我们也得到了Fut8基因缺失的CHO-F细胞的GS-/-克隆株(图17中的#1,#4,#5和#7)和GS-/-、GS-/-Fut8-/-的CHO-DG44细胞株。
实施例7:CHO细胞的人源糖基化改造
为使CHO细胞表达的抗体更具有类似人源抗体的糖基化(尤其是CHO细胞所不能进行的α2,6位的唾液酸化),发明人采用前述建立的岩藻糖缺失的CHO-EF细胞株为模型,进一步按实施例2中阐述的方法,转入负责特殊糖基合成的酶的基因。具体做法是:
首先,为使CHO细胞能进行原本不具有的α2,6位的唾液酸化,GT-P2A-ST6基因(SEQID NO:40)被克隆到pTOG3载体上,转化CHO-EF细胞。将CHO-EF细胞用含5%FBS的DMEM培养在6孔板中。当细胞密度达到80%满时,用Fugene 6试剂(Promega公司)同时转化1.0μg的带GT-P2A-ST6基因的pTOG3和20ng编码Cre蛋白的pOG231质粒(购自AddGene)。由于此一步Cre-LoxP同源重组的效率非常之高,pOG231的量不能太多否则效率反而下降,20ng的量是已滴定过的最优剂量。转化48小时后,将细胞用胰酶消化后,重新铺在两块10厘米平皿里,加800μg/mL的潮霉素B,筛选7~10天后,可见几百个克隆形成。10~14天后,用无菌枪头挑取形态好的克隆至48孔板中,继续用含5%FBS的DMEM培养。当细胞在48孔板中长至80%满时,可胰酶消化,各个克隆分别种在两组48孔复孔中,其中一组用嘌呤霉素(10μg/mL)做药物试验,另一组留种。那些真正发生同源重组的正确克隆,其嘌呤霉素抗性基因是被潮霉素抗性基因置换掉的,故细胞应该显出对嘌呤霉素敏感。如果不敏感,则是随机整合事件。发明人因此获得了潮霉素抗性且嘌呤霉素敏感的CHO-EFS-6.1、CHO-EFS-6.3两株克隆。然后,细胞经biotin标记的植物凝集素Sambucus Nigra Lectin(SNA)或biotin标记的植物凝集素Maackia Amurensis Lectin II(MAL II)于4℃染色15分钟(原液稀释2000倍,至终浓度2.5μg/mL)。SNA-biotin和MAL II-biotin购自美国Vector Laboratories,Inc.公司(Burlingame,CA)。细胞悬液加10mL MACS缓冲液,离心(1200rpm,5分钟)收集细胞,用1mL的MACS缓冲液重悬。加PE标记的Streptavidin(终浓度1μg/mL)4℃避光染色15分钟。Streptavidin-PE购自美国eBioscience,Inc.公司(San Diego,CA)。
图18即显示获得的FACS图谱。CHO-F母细胞株不能表达α2,6位的唾液酸,SNA染色呈阴性;但它们能表达α2,3位的唾液酸,故MAL II染色呈阳性。CHO-EFS-6.1、CHO-EFS-6.3两株克隆的SNA染色和MAL II染色皆呈阳性,说明它们在原有α2,3位唾液酸化的基础上,也能进行α2,6位唾液酸化(图18A)。图18B则显示CHO-EFS-6.1克隆与母细胞株CHO-F细胞相比,其表面植物凝集素Erythrina Cristagalli lectin(ECL)的结合位点减少了。ECL-biotin也购自美国Vector Laboratories,Inc.公司(Burlingame,CA),染色方法同上。ECL特异识别半乳糖(Galactose)。抗体糖链末端未被唾液酸封闭的半乳糖(Galactose)和高甘露糖对抗体的体内分布和动力学影响很大。没有唾液酸化的抗体会被肝脏中的Asialoglycoprotein Receptor(ASGPR)结合并从血液中清除。带有高甘露糖的抗体也会被肝脏中的甘露糖受体(Mannose Receptor,ManR)结合并迅速清除。可以预期,由CHO-EFS-6.1或CHO-EFS-6.3细胞生产的抗体,更能抵御ASGPR和ManR的清除,故体内半衰期应更长,且免疫原性应更低。发明人选取经两次亚克隆后形态最好的CHO-EFS-6.1号细胞株,命名为CHO-EFS(3,6)(表2),其中数字3和6分别表示细胞株能同时进行α2,3位和α2,6位的末端唾液酸修饰。类似地,按前述方法,pTOG3-GT-P2A-ST6转入岩藻糖保有的CHO-E细胞后建立了细胞株CHO-ES#3,#4,#5(图19),其中CHO-ES#3被命名为CHO-ES(3,6)(表2)。该细胞株的特征是:表达岩藻糖和α2,6位唾液酸(图19)。
在本发明的另一个实施方案中,为使CHO细胞能进行人类抗体的半乳糖化,促进补体激活能力,GT基因被克隆到pTOG3载体上,转化CHO-E或CHO-EF细胞。所得到的潮霉素抗性且嘌呤霉素敏感的克隆分别被命名为CHO-EG或CHO-EFG(表2)。至此,建立定向改造CHO细胞糖基化(尤其是人源α2,6位唾液酸化)的方法,已经在本发明的实施例中得以确立。
实施例8:用TALEN技术敲除CHO细胞中的ST3GAL4和ST3GAL6基因
即便是通过上述方法转入了人源α2,6位唾液酸化的酶基因,但由于CHO细胞内源性的α2,3位唾液酸转移酶(主要是ST3GAL4和ST3GAL6这两个酶)的存在,糖蛋白末端唾液酸修饰会同时呈现α2,3和α2,6位链接的唾液酸,造成产物均一性的不可控性。此外,文献报道,利用体外酶化学修饰的方法证明,α2,3位链接的唾液酸对ADCC是抑制的,而α2,6位链接的唾液酸则是一种最佳的形式,能在岩藻糖缺失的情况下更进一步提高ADCC活性(Lin CWet al.Proc Natl Acad Sci U S A.2015;112(34):10611-6)。为此,我们继续用TALEN技术对已获得的CHO-ES(3,6)和CHO-EFS(3,6)细胞株进行基因水平的改造,同时敲除其ST3GAL4和ST3GAL6酶基因。
我们构建了针对CHO细胞ST3GAL4基因第5号外显子的一对TALEN载体(SEQ ID NO:26-27显示编码TALEN蛋白的DNA序列),分别命名为S3G4-1和S3G4-2,针对其的引物为SEQID NO:28-29。我们还构建了针对CHO细胞ST3GAL6基因第2号外显子的一对TALEN载体(SEQID NO:30-31显示编码TALEN蛋白的DNA序列),分别命名为S3G6-1和S3G6-2;针对其的引物为SEQ ID NO:32-33。取这四个miniPrep制备的质粒各2μg,用电转方法导入2百万个CHO-ES(3,6)细胞或CHO-EFS(3,6)。电转仪是LifeTech公司的Neon Electroporation系统。电转条件是1620v,10ms,3次脉冲。电转后,CHO细胞在含5%FBS的DMEM培养基中培养8天,不加任何药物筛选。此一生长阶段是让那些ST3GAL4/6基因被破坏的克隆能充分地分裂,并通过细胞膜的周转代谢,稀释掉膜上原先带有α2,3位链接的唾液酸的糖蛋白或糖脂,而那些新产生的跨膜糖蛋白或糖脂则不带有α2,3位链接的唾液酸了。此后,ST3-/-的CHO细胞可用FACS方法负筛选。具体做法是:细胞经biotin标记的植物凝集素Maackia Amurensis Lectin II(MAL II)于4℃染色15分钟(原液稀释2000倍,至终浓度2.5μg/mL)。MAL II-biotin购自美国Vector Laboratories,Inc.公司(Burlingame,CA)。细胞用FACS缓冲液洗涤,离心(1200rpm,5分钟)收集细胞,加PE标记的Streptavidin(终浓度1μg/mL)4℃避光染色15分钟。Streptavidin-PE购自美国eBioscience,Inc.公司(San Diego,CA)。然后用MoFlo流式细胞仪分选MAL II阴性的细胞群(图20),并用96孔板亚克隆即得。
表2列出了本发明中涉及或新制备的CHO细胞株,及其基因型特征。其中,在CHO-K1基础上敲除Fut8基因之后的细胞株,被命名为CHO-F。敲除GS基因之后的细胞株,被命名为CHO-GS。双敲除GS和Fut8基因之后的细胞株,被命名为CHO-GSF。用Cre-LoxP方法定点转入SRP-14-9-54、hERO-L、hFGF9等基因,促进抗体高表达的细胞株,被命名为CHO-E,其中“E”代表Enhanced之意。在CHO-E和CHO-EF基础上,转入能进行人源α2,6位唾液酸化的GT和ST6基因后的细胞株,分别被命名为CHO-ES(3,6)和CHO-EFS(3,6);转入能进行半乳糖苷化的GT基因后的细胞株,分别被命名为CHO-EG和CHO-EFG。在CHO-ES(3,6)和CHO-EFS(3,6)基础上,用TALEN技术敲除CHO细胞内源α2,3位唾液酸转移酶4/6基因后的细胞株,分别被命名为CHO-ES(6)和CHO-EFS(6)。在CHO-DG44基础上敲除Fut8基因之后的细胞株,被命名为CHO-F(DG44)。敲除GS基因之后的细胞株,被命名为CHO-GS(DG44)。双敲除GS和Fut8基因之后的细胞株,被命名为CHO-GSF(DG44)。
表2
Figure GDA0002179117960000541
实施例9:CHO细胞人源糖基化改造后的效果
时至今日,在抗体制药工业界,用野生型CHO细胞生产抗体仍然是普遍现象。随着培养基的不断优化和发酵工艺的改进,所生产的抗体在量上虽已能达到下游纯化工艺的要求(2~5g/L),但也已经触及发展的瓶颈。另一方面,目前医用抗体在质上仍然具有很大的成长空间。本发明所构建的诸多基因改造的细胞株,主要侧重于后者,提出了具体的改进方案。
例如,岩藻糖缺失的CHO细胞株可以提高抗体的ADCC活力50~100倍,大大降低了体内用量、毒副作用和生产成本。但其它形式的糖基改造,及其各种组合,对抗体的质的提升,尚未有很系统的探索。文献报道的体外酶化学修饰的方法,并不具有大规模工业化的可操作性。在本实施例中,我们提供了在基因水平上进行这些严格意义的、系统性探索的方法。例如,我们在Toggle In定点整合机制的确保下制备稳定细胞株,引入人源α2,6位唾液酸修饰所必需的GT和ST6两个酶,制备了CHO-ES(3,6)和CHO-EFS(3,6)两个细胞株,以便头对头地比较在岩藻糖有无的情况下,唾液酸修饰对抗体ADCC活性的影响。图21显示了野生型CHO-K1和Fut8-/-的CHO-EFS(3,6)细胞株表达的人IgG1抗体的糖链Mass Spec质谱分析。结果表明两者的糖链有很大的不同。后者不仅不带有岩藻糖,而且还带有更多的末端唾液酸。
接着,我们分别用野生型(WT)CHO-K1细胞株、岩藻糖缺失型(AF)CHO-F细胞株以及岩藻糖缺失并人源唾液酸化型(AF+S)CHO-EFS(3,6)细胞株表达了抗肿瘤靶点GPC3的hIgG1抗体,并在体外测试了它们对GPC3阳性的Huh7细胞的ADCC效果。具体实验操作,参见实施例5中体外ADCC测定的荧光素酶法。岩藻糖缺失抗体的ADCC活力比野生型抗体的ADCC活力要显著提高,而在岩藻糖缺失基础上增加唾液酸后,抗体的ADCC活力又有提升(图22),这与文献报道的增加α2,6位唾液酸能在岩藻糖缺失基础上再进一步提升ADCC也是相符合的(LinCW et al.Proc Natl Acad Sci U S A.2015;112(34):10611-6)。以此类推,我们提供的方法,也可比较岩藻糖有无情况下,末端仅带有α2,6位唾液酸而不带α2,3位唾液酸对抗体ADCC的影响,或者末端半乳糖残基修饰对补体激活CDC活性的影响,等等。
尽管已经对本发明的具体实施方式进行了详细说明和描述,但应当认识到,本发明不受所述具体实施方式的限制。本发明所提供的方法,不仅适用于CHO-K1细胞株,也适用于CHO-DG44等其它CHO细胞株系。在不脱离本发明主旨和范围的情况下,可以对本发明做出各种改进、修饰和变化,而这些改进、修饰和变化均在本发明的范围之内。
序列表
<110> 安泰吉(北京)生物技术有限公司
<120> 改造宿主细胞基因组的方法及其用途
<130> DIC18110048
<160> 40
<170> SIPOSequenceListing 1.0
<210> 1
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ataacttcgt atagcataca ttatacgaag ttat 34
<210> 2
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ataacttcgt atagtatagt atatacgaac ggta 34
<210> 3
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
taccgttcgt atagtatagt atatacgaag ttat 34
<210> 4
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
taccgttcgt atagtatagt aatacgaacg gta 33
<210> 5
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ataacttcgt ataggctata gtatacgaac ggta 34
<210> 6
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
taccgttcgt ataggctata gtatacgaag ttat 34
<210> 7
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
taccgttcgt ataggctata gtatacgaac ggta 34
<210> 8
<211> 1001
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gggtgatgct ggcgccgagt atgttgtgga atctactggc gtcttcacca ccatggagaa 60
ggctggggcc cacttgaagg gcggggccaa gagggtcatc atctccgccc cttctgctga 120
tgcccccatg tttgtgatgg gtgtgaacca agacaagtat gacaactccc tcaagattgt 180
caggtgagga tggcagaggg ctgtggcaaa gtgggcaagc aggggcaagg ttacaggtgg 240
gcgagcctcc taacctgtct cttctcttca gcaatgcgtc ctgcaccacc aactgcttag 300
cccccctggc caaggtcatc catgacaact ttggcattgt ggaaggactc atggtatgta 360
gttcatctgt ttcatcctgc cagcagtggg cgctgtggtg ggggccctgc aagacctcac 420
tccctgcctc tgtgtctttc agaccacggt ccatgccatc actgccaccc agaagactgt 480
ggatggcccc tccgggaagc tgtggcgtga tggccgtggg gctgcccaga acatcatccc 540
tgcatccact ggcgctgcca aggctgtggg caaagtcatc ccagagctga acgggaagct 600
gactggcatg gccttccgtg ttcctacccc caacgtgtcc gttgtggatc tgacatgtcg 660
cctggagaaa cctgtatgtc tggggtgggc tgagggttgt ctctagtggt gaggttgggg 720
cttgagtagt caccttgatt tttgccctta ataggccaag tatgaggaca tcaagaaggt 780
ggtgaagcag gcatctgagg gcccactgaa gggcatcctg ggctacaccg aggaccaggt 840
tgtctcctgc gacttcaaca gtgactccca ctcttccacc tttgatgctg gggctggcat 900
tgctctcaat gacaactttg taaagctcat ttcctggtat gacaatgaat ttggctacag 960
caacagagtg gtggacctca tggcctacat ggcctccaag g 1001
<210> 9
<211> 501
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 9
Met Ala Thr Glu Tyr Lys Pro Thr Val Arg Leu Ala Thr Arg Asp Asp
1 5 10 15
Val Pro Arg Ala Val Arg Thr Leu Ala Ala Ala Phe Ala Asp Tyr Pro
20 25 30
Ala Thr Arg His Thr Val Asp Pro Asp Arg His Ile Glu Arg Val Thr
35 40 45
Glu Leu Gln Glu Leu Phe Leu Thr Arg Val Gly Leu Asp Ile Gly Lys
50 55 60
Val Trp Val Ala Asp Asp Gly Ala Ala Val Ala Val Trp Thr Thr Pro
65 70 75 80
Glu Ser Val Glu Ala Gly Ala Val Phe Ala Glu Ile Gly Ser Arg Met
85 90 95
Ala Glu Leu Ser Gly Ser Arg Leu Ala Ala Gln Gln Gln Met Glu Gly
100 105 110
Leu Leu Ala Pro His Arg Pro Lys Glu Pro Ala Trp Phe Leu Ala Thr
115 120 125
Val Gly Val Ser Pro Asp His Gln Gly Lys Gly Leu Gly Ser Ala Val
130 135 140
Val Leu Pro Gly Val Glu Ala Ala Glu Arg Ala Gly Val Pro Ala Phe
145 150 155 160
Leu Glu Thr Ser Ala Pro Arg Asn Leu Pro Phe Tyr Glu Arg Leu Gly
165 170 175
Phe Thr Val Thr Ala Asp Val Glu Val Pro Glu Gly Pro Arg Thr Trp
180 185 190
Cys Met Thr Arg Lys Pro Gly Ala Gly Ser Glu Gly Arg Gly Ser Leu
195 200 205
Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Met Val Ser Lys
210 215 220
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp
225 230 235 240
Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly
245 250 255
Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly
260 265 270
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
275 280 285
Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe
290 295 300
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe
305 310 315 320
Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
325 330 335
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
340 345 350
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser
355 360 365
His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val
370 375 380
Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala
385 390 395 400
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
405 410 415
Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro
420 425 430
Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
435 440 445
Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Lys Leu Ser His Gly
450 455 460
Phe Pro Pro Ala Val Ala Ala Gln Asp Asp Gly Thr Leu Pro Met Ser
465 470 475 480
Cys Ala Gln Glu Ser Gly Met Asp Arg His Pro Ala Ala Cys Ala Ser
485 490 495
Ala Arg Ile Asn Val
500
<210> 10
<211> 6128
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gggtgatgct ggcgccgagt atgttgtgga atctactggc gtcttcacca ccatggagaa 60
ggctggggcc cacttgaagg gcggggccaa gagggtcatc atctccgccc cttctgctga 120
tgcccccatg tttgtgatgg gtgtgaacca agacaagtat gacaactccc tcaagattgt 180
caggtgagga tggcagaggg ctgtggcaaa gtgggcaagc aggggcaagg ttacaggtgg 240
gcgagcctcc taacctgtct cttctcttca gcaatgcgtc ctgcaccacc aactgcttag 300
cccccctggc caaggtcatc catgacaact ttggcattgt ggaaggactc atggtatgta 360
gttcatctgt ttcatcctgc cagcagtggg cgctgtggtg ggggccctgc aagacctcac 420
tccctgcctc tgtgtctttc agaccacggt ccatgccatc actgccaccc agaagactgt 480
ggatggcccc tccgggaagc tgtggcgtga tggccgtggg gctgcccaga acatcatccc 540
tgcatccact ggcgctgcca aggctgtggg caaagtcatc ccagagctga acgggaagct 600
gactggcatg gccttccgtg ttcctacccc caacgtgtcc gttgtggatc tgacatgtcg 660
cctggagaaa cctgtatgtc tggggtgggc tgagggttgt ctctagtggt gaggttgggg 720
cttgagtagt caccttgatt tttgccctta ataggccaag tatgaggaca tcaagaaggt 780
ggtgaagcag gcatctgagg gcccactgaa gggcatcctg ggctacaccg aggaccaggt 840
tgtctcctgc gacttcaaca gtgactccca ctcttccacc tttgatgctg gggctggcat 900
tgctctcaat gacaactttg taaagctcat ttcctggtat gacaatgaat ttggctacag 960
caacagagtg gtggacctca tggcctacat ggcctccaag gagggaggtg ggaagttcct 1020
attccgaagt tcctattctt caaatagtat aggaacttcg ggcagcggag ccaccaactt 1080
cagcctgctg aagcaggccg gcgatgtgga ggagaatcct ggccccttgg ccaagttgac 1140
cagtgccgtt ccggtgctca ccgcgcgcga cgtcgccgga gcggtcgagt tctggaccga 1200
ccggctcggg ttctcccggg acttcgtgga ggacgacttc gccggtgtgg tccgggacga 1260
cgtgaccctg ttcatcagcg cggtccagga ccaggtggtg ccggacaaca ccctggcctg 1320
ggtgtgggtg cgcggcctgg acgagctgta cgccgagtgg tcggaggtcg tgtccacgaa 1380
cttccgggac gcctccgggc cggccttgac cgagatcggc gagcagccgt gggggcggga 1440
gttcgccctg cgcgacccgg ccggcaactg cgtgcacttc gtggccgagg agcaggacgg 1500
cagcgagggc agaggcagcc tgctgacctg cggcgacgtg gaggagaacc ccggccccat 1560
ggcttcgtac ccctgccatc aacacgcgtc tgcgttcgac caggctgcgc gttctcgcgg 1620
ccatagcaac cgacgtacgg cgttgcgccc tcgccggcag caagaagcca cggaagtccg 1680
cctggagcag aaaatgccca cgctactgcg ggtttatata gacggtcctc acgggatggg 1740
gaaaaccacc accacgcaac tgctggtggc cctgggttcg cgcgacgata tcgtctacgt 1800
acccgagccg atgacttact ggcaggtgct gggggcttcc gagacaatcg cgaacatcta 1860
caccacacaa caccgcctcg accagggtga gatatcggcc ggggacgcgg cggtggtaat 1920
gacaagcgcc cagataacaa tgggcatgcc ttatgccgtg accgacgccg ttctggctcc 1980
tcatatcggg ggggaggctg ggagttcaca tgccccgccc ccggccctca ccctcatctt 2040
cgaccgccat cccatcgccg ccctcctgtg ctacccggcc gcgcgatacc ttatgggcag 2100
catgaccccc caggccgtgc tggcgttcgt ggccctcatc ccgccgacct tgcccggcac 2160
aaacatcgtg ttgggggccc ttccggagga cagacacatc gaccgcctgg ccaaacgcca 2220
gcgccccggc gagcggcttg acctggctat gctggccgcg attcgccgcg tttacgggct 2280
gcttgccaat acggtgcggt atctgcaggg cggcgggtcg tggcgggagg attggggaca 2340
gctttcgggg acggccgtgc cgccccaggg tgccgagccc cagagcaacg cgggcccacg 2400
accccatatc ggggacacgt tatttaccct gtttcgggcc cccgagttgc tggcccccaa 2460
cggcgacctg tacaacgtgt ttgcctgggc cttggacgtc ttggccaaac gcctccgtcc 2520
catgcacgtc tttatcctgg attacgacca atcgcccgcc ggctgccggg acgccctgct 2580
gcaacttacc tccgggatgg tccagaccca cgtcaccacc cccggctcca taccgacgat 2640
ctgcgacctg gcgcgcacgt ttgcccggga gatgggggag gctaactgaa gttcctattc 2700
cgaagttcct attctctaga aagtatagga acttcatcat aatcagccat accacatttg 2760
tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa 2820
tgaatgcatt tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca 2880
atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 2940
ccaaactcat caatgtatct tatcatgtct caattgtacc gggtagggta ggcgcttttc 3000
ccaaggcagt ctggagcatg cgctttagca gccccgctgg gcacttggcg ctacacaagt 3060
ggcctctggc ctcgcacaca ttccacatcc accggtaggc gccaaccggc tccgttcttt 3120
ggtggcccct tcgcgccacc ttctactcct cccctagtca ggaagttccc ccccgccccg 3180
cagctcgcgt cgtgcaggac gtgacaaatg gaagtagcac gtctcactag tctcgtgcag 3240
atggacagca ccgctgagca atggaagcgg gtaggccttt ggggcagcgg ccaatagcag 3300
ctttgctcct tcgctttctg ggctcagagg ctgggaaggg gtgggtccgg gggcgggctc 3360
aggggcgggc tcaggggcgg ggcgggcgcc cgaaggtcct ccggaggccc ggcattctgc 3420
acgcttcaaa agcgcacgtc tgccgcgctg ttctcctctt cctcatctcc gggcctttcg 3480
accataactt cgtatagcat acattatacg aagttatgcc gccaccatgg ccaccgagta 3540
caagcccacg gtgcgcctcg ccacccgcga cgacgtcccc cgggccgtac gcaccctcgc 3600
cgccgcgttc gccgactacc ccgccacgcg ccacaccgtc gacccggacc gccacatcga 3660
gcgggtcacc gagctgcaag aactcttcct cacgcgcgtc gggctcgaca tcggcaaggt 3720
gtgggtcgcg gacgacggcg ccgcggtggc ggtctggacc acgccggaga gcgtcgaagc 3780
gggggcggtg ttcgccgaga tcggctcgcg catggccgag ttgagcggtt cccggctggc 3840
cgcgcagcaa cagatggaag gcctcctggc gccgcaccgg cccaaggagc ccgcgtggtt 3900
cctggccacc gtcggcgtct cgcccgacca ccagggcaag ggtctgggca gcgccgtcgt 3960
gctccccgga gtggaggcgg ccgagcgcgc tggggtgccc gccttcctgg agacctccgc 4020
gccccgcaac ctccccttct acgagcggct cggcttcacc gtcaccgccg acgtcgaggt 4080
gcccgaagga ccgcgcacct ggtgcatgac ccgcaagccc ggtgccggca gcgagggcag 4140
aggcagcctg ctgacctgcg gcgacgtgga ggagaacccc ggccccatgg tgagcaaggg 4200
cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg acgtaaacgg 4260
ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca agctgaccct 4320
gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct 4380
gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc acgacttctt 4440
caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca aggacgacgg 4500
caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga accgcatcga 4560
gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc tggagtacaa 4620
ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca tcaaggtgaa 4680
cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc actaccagca 4740
gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc tgagcaccca 4800
gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc tggagttcgt 4860
gaccgccgcc gggatcactc tcggcatgga cgagctgtac aagaagctca gccatggctt 4920
cccgccggcg gtggcggcgc aggatgatgg cacgctgccc atgtcttgtg cccaggagag 4980
cgggatggac cgtcaccctg cagcctgtgc ttctgctagg atcaatgtat aacttcgtat 5040
agtatagtat atacgaacgg tagcggccgc gaagcccacc ctggaccatc caccccagca 5100
aggactcgag caagagggag gccctggctg ctgagcagtc cctgtccaat aacccccaca 5160
ccgatcatct ccctcacagt ttccatccca gacccccaga ataaggaggg gcttagggag 5220
ccctactctc ttgaatacca tcaataaagt tcactgcacc catcttcctt ggcctttcaa 5280
tgtaaggttg ggggagggag gctgtgacct agcaaggttg ggaatcctct gtgtcacttt 5340
tcaaacaggg cactagccac atgccagccc aggtttcctg tcctgaacag atgaaaattc 5400
acctaaggtg tcttggtgct gggaggagtg ggggttgaca atgggaccag tagtatggtc 5460
ttagaggctt gggctggact gcatcaagtt ccagggctgt gtgtgtgtta tctgcaaaca 5520
aaggtcattt gtgtctggag gccttaggta aaattggaag gatgcccaac atagtaaaaa 5580
tgtatcagcc aggggaagtg actacactgt atctaacctg aaacagctga gctgtaagcc 5640
agcagctgtc actatgttca ggtgtggtcc gctggttctg gggtggtcac ttgtatccag 5700
tttgttagga agtgttgtca ttgcttgtta ggaagacaac acatctcagg ctgggcagtg 5760
gtagtgcgtg cctctaatgc cagcattccc agcacggaag tggcagaggc aggaggacag 5820
cctggaataa caacccaggg cagagccccc atctcggaaa agacaaaaac cagaaagtgc 5880
ttaaaacatt gacacaaagg tgctcaaata ttccttcatt gcttttagag attccactgt 5940
cagcttggca tggcctctag tgagacatcc tgacttggtc ccctgctttc caaggtcagg 6000
agaatgatag ccacagaacg ttccctcagc tgatggctgg agaaccgggg tccctgagcc 6060
cccaccctca cacccatgtg caggagggag cttcaccttt ccctccgagc agtgtctgcc 6120
ttcaggac 6128
<210> 11
<211> 6208
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct ggatccataa 60
cttcgtatag catacattat acgaagttat gccgccacca tgtggtggcg cctgtggtgg 120
ctgctgctgc tgctgctgct gctgtggccc atggtgtggg ctatgttccc cgccatgccc 180
ctgagcagcc tgttcgtgaa cggccccaga accctgtgcg gcgccgagct ggtggacgcc 240
ctgcagttcg tgtgcggcga ccggggcttc tacttcaaca agcccaccgg ctacggcagc 300
agcagccggc gggcccccca gaccggcatc gtggacgagt gctgcttcag aagctgcgac 360
ctgcggagac tggagatgta ctgcgccccc ctgaagcccg ccaagagcgc cggcagcgag 420
ggcagaggca gcctgctgac ctgcggcgac gtggaggaga accccggccc catgaaccca 480
gccatcagcg tcgctctcct gctctcagtc ttgcaggtgt cccgagggca gaaggtgacc 540
agcctgacag cctgcctggt gaaccaaaac cttcgcctgg actgccgcca tgagaataac 600
accaaggata actccatcca gcatgagttc agcctgaccc gagagaagag gaagcacgtg 660
ctctcaggca ccctcgggat acccgagcac acgtaccgct cccgcgtcac cctctccaac 720
cagccctata tcaaggtcct taccctagcc aacttcacca ccaaggatga gggcgactac 780
ttttgtgagc ttcgagtctc gggcgcgaat cccatgagct ccaataaaag tatcagtgtg 840
tatagagaca aactggtcaa gtgtggcggc ataagcctgc tggttcagaa cacatcctgg 900
atgctgctgc tgctgctttc cctctccctc ctccaagccc tggacttcat ttctctgggc 960
agccagtgca caaactacgc cctgctgaaa ctggccggag atgtggaaag caaccccgga 1020
cccaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 1080
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 1140
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 1200
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 1260
ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 1320
caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat 1380
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 1440
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 1500
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 1560
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 1620
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 1680
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 1740
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 1800
cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 1860
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 1920
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 1980
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 2040
gaatagaagc ttatcataat cagccatacc acatttgtag aggttttact tgctttaaaa 2100
aacctcccac acctccccct gaacctgaaa cataaaatga atgcaattgt tgttgttaac 2160
ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 2220
aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 2280
catgtctgat aacttcgtat aggctatagt atacgaacgg tacgtgaggc tccggtgccc 2340
gtcagtgggc agagcgcaca tcgcccacag tccccgagaa gttgggggga ggggtcggca 2400
attgaaccgg tgcctagaga aggtggcgcg gggtaaactg ggaaagtgat gtcgtgtact 2460
ggctccgcct ttttcccgag ggtgggggag aaccgtatat aagtgcagta gtcgccgtga 2520
acgttctttt tcgcaacggg tttgccgcca gaacacaggt aagtgccgtg tgtggttccc 2580
gcgggcctgg cctctttacg ggttatggcc cttgcgtgcc ttgaattact tccacctggc 2640
tgcagtacgt gattcttgat cccgagcttc gggttggaag tgggtgggag agttcgaggc 2700
cttgcgctta aggagcccct tcgcctcgtg cttgagttga ggcctggcct gggcgctggg 2760
gccgccgcgt gcgaatctgg tggcaccttc gcgcctgtct cgctgctttc gataagtctc 2820
tagccattta aaatttttga tgacctgctg cgacgctttt tttctggcaa gatagtcttg 2880
taaatgcggg ccaagatctg cacactggta tttcggtttt tggggccgcg ggcggcgacg 2940
gggcccgtgc gtcccagcgc acatgttcgg cgaggcgggg cctgcgagcg cggccaccga 3000
gaatcggacg ggggtagtct caagctggcc ggcctgctct ggtgcctggc ctcgcgccgc 3060
cgtgtatcgc cccgccctgg gcggcaaggc tggcccggtc ggcaccagtt gcgtgagcgg 3120
aaagatggcc gcttcccggc cctgctgcag ggagctcaaa atggaggacg cggcgctcgg 3180
gagagcgggc gggtgagtca cccacacaaa ggaaaagggc ctttccgtcc tcagccgtcg 3240
cttcatgtga ctccacggag taccgggcgc cgtccaggca cctcgattag ttctggagct 3300
tttggagtac gtcgtcttta ggttgggggg aggggtttta tgcgatggag tttccccaca 3360
ctgagtgggt ggagactgaa gttaggccag cttggcactt gatgtaattc tccttggaat 3420
ttgccctttt tgagtttgga tcttggttca ttctcaagcc tcagacagtg gttcaaagtt 3480
tttttcttcc atttcaggtg tcgtgaacgc gtcgccacca tgagcgatag cactgagaac 3540
gtcatcaagc ccttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 3600
ttcgagatcg agggcgaggg cgagggcaag ccctacgagg gcacccagac cgccaagctg 3660
caggtgacca agggcggccc cctgcccttc gcctgggaca tcctgtcccc ccagttccag 3720
tacggctcca aggtgtacgt gaagcacccc gccgacatcc ccgactacaa gaagctgtcc 3780
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 3840
gtgacccagg actcctccct gcaggacggc accttcatct accacgtgaa gttcatcggc 3900
gtgaacttcc cctccgacgg ccccgtaatg cagaagaaga ctctgggctg ggagccctcc 3960
accgagcgcc tgtacccccg cgacggcgtg ctgaagggcg agatccacaa ggcgctgaag 4020
ctgaagggcg gcggccacta cctggtggag ttcaagtcaa tctacatggc caagaagccc 4080
gtgaagctgc ccggctacta ctacgtggac tccaagctgg acatcacctc ccacaacgag 4140
gactacaccg tggtggagca gtacgagcgc gccgaggccc gccaccacct gttccagtag 4200
ctcgaggact gtgccttcta gttgccagcc atctgttgtt tgcccctccc ccgtgccttc 4260
cttgaccctg gaaggtgcca ctcccactgt cctttcctaa taaaatgagg aaattgcatc 4320
gcattgtctg agtaggtgtc attctattct ggggggtggg gtggggcagg acagcaaggg 4380
ggaggattgg gaagagaata gcaggcatgg cggccgctac cgttcgtata gtatagtata 4440
tacgaagtta tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 4500
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 4560
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 4620
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 4680
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 4740
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 4800
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 4860
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 4920
tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag 4980
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 5040
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 5100
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 5160
attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 5220
agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 5280
atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 5340
cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 5400
ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 5460
agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 5520
tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 5580
gctgcaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 5640
caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 5700
ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 5760
gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 5820
tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 5880
tcaacacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 5940
cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 6000
cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 6060
gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 6120
atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 6180
agcggataca tatttgaatg tatttaga 6208
<210> 12
<211> 5932
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct ggatccataa 60
cttcgtatag catacattat acgaagttat gccgccacca tggccaccga gtacaagccc 120
acggtgcgcc tcgccacccg cgacgacgtc ccccgggccg tacgcaccct cgccgccgcg 180
ttcgccgact accccgccac gcgccacacc gtcgacccgg accgccacat cgagcgggtc 240
accgagctgc aagaactctt cctcacgcgc gtcgggctcg acatcggcaa ggtgtgggtc 300
gcggacgacg gcgccgcggt ggcggtctgg accacgccgg agagcgtcga agcgggggcg 360
gtgttcgccg agatcggctc gcgcatggcc gagttgagcg gttcccggct ggccgcgcag 420
caacagatgg aaggcctcct ggcgccgcac cggcccaagg agcccgcgtg gttcctggcc 480
accgtcggcg tctcgcccga ccaccagggc aagggtctgg gcagcgccgt cgtgctcccc 540
ggagtggagg cggccgagcg cgctggggtg cccgccttcc tggagacctc cgcgccccgc 600
aacctcccct tctacgagcg gctcggcttc accgtcaccg ccgacgtcga ggtgcccgaa 660
ggaccgcgca cctggtgcat gacccgcaag cccggtgccg gcagcgaggg cagaggcagc 720
ctgctgacct gcggcgacgt ggaggagaac cccggcccca tggtgagcaa gggcgaggag 780
ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa cggccacaag 840
ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac cctgaagttc 900
atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac cctgacctac 960
ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt cttcaagtcc 1020
gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga cggcaactac 1080
aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat cgagctgaag 1140
ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta caactacaac 1200
agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt gaacttcaag 1260
atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca gcagaacacc 1320
cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac ccagtccgcc 1380
ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc 1440
gccgggatca ctctcggcat ggacgagctg tacaagaagc tcagccatgg cttcccgccg 1500
gcggtggcgg cgcaggatga tggcacgctg cccatgtctt gtgcccagga gagcgggatg 1560
gaccgtcacc ctgcagcctg tgcttctgct aggatcaatg tgtagaagct tatcataatc 1620
agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca cctccccctg 1680
aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat 1740
ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 1800
tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgata acttcgtata 1860
gtatagtata tacgaacggt acgtgaggct ccggtgcccg tcagtgggca gagcgcacat 1920
cgcccacagt ccccgagaag ttggggggag gggtcggcaa ttgaaccggt gcctagagaa 1980
ggtggcgcgg ggtaaactgg gaaagtgatg tcgtgtactg gctccgcctt tttcccgagg 2040
gtgggggaga accgtatata agtgcagtag tcgccgtgaa cgttcttttt cgcaacgggt 2100
ttgccgccag aacacaggta agtgccgtgt gtggttcccg cgggcctggc ctctttacgg 2160
gttatggccc ttgcgtgcct tgaattactt ccacctggct gcagtacgtg attcttgatc 2220
ccgagcttcg ggttggaagt gggtgggaga gttcgaggcc ttgcgcttaa ggagcccctt 2280
cgcctcgtgc ttgagttgag gcctggcctg ggcgctgggg ccgccgcgtg cgaatctggt 2340
ggcaccttcg cgcctgtctc gctgctttcg ataagtctct agccatttaa aatttttgat 2400
gacctgctgc gacgcttttt ttctggcaag atagtcttgt aaatgcgggc caagatctgc 2460
acactggtat ttcggttttt ggggccgcgg gcggcgacgg ggcccgtgcg tcccagcgca 2520
catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg gggtagtctc 2580
aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc ccgccctggg 2640
cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg cttcccggcc 2700
ctgctgcagg gagctcaaaa tggaggacgc ggcgctcggg agagcgggcg ggtgagtcac 2760
ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac tccacggagt 2820
accgggcgcc gtccaggcac ctcgattagt tctggagctt ttggagtacg tcgtctttag 2880
gttgggggga ggggttttat gcgatggagt ttccccacac tgagtgggtg gagactgaag 2940
ttaggccagc ttggcacttg atgtaattct ccttggaatt tgcccttttt gagtttggat 3000
cttggttcat tctcaagcct cagacagtgg ttcaaagttt ttttcttcca tttcaggtgt 3060
cgtgaacgcg tgccgccacc atggtgagca agggcgagga gctgttcacc ggggtggtgc 3120
ccatcctggt cgagctggac ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg 3180
gcgagggcga tgccacctac ggcaagctga ccctgaagtt catctgcacc accggcaagc 3240
tgcccgtgcc ctggcccacc ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc 3300
gctaccccga ccacatgaag cagcacgact tcttcaagtc cgccatgccc gaaggctacg 3360
tccaggagcg caccatcttc ttcaaggacg acggcaacta caagacccgc gccgaggtga 3420
agttcgaggg cgacaccctg gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg 3480
acggcaacat cctggggcac aagctggagt acaactacaa cagccacaac gtctatatca 3540
tggccgacaa gcagaagaac ggcatcaagg tgaacttcaa gatccgccac aacatcgagg 3600
acggcagcgt gcagctcgcc gaccactacc agcagaacac ccccatcggc gacggccccg 3660
tgctgctgcc cgacaaccac tacctgagca cccagtccgc cctgagcaaa gaccccaacg 3720
agaagcgcga tcacatggtc ctgctggagt tcgtgaccgc cgccgggatc actctcggca 3780
tggacgagct gtacaagaag ctcagccatg gcttcccgcc ggcggtggcg gcgcaggatg 3840
atggcacgct gcccatgtct tgtgcccagg agagcgggat ggaccgtcac cctgcagcct 3900
gtgcttctgc taggatcaat gtataactcg aggactgtgc cttctagttg ccagccatct 3960
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 4020
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 4080
ggtggggtgg ggcaggacag caagggggag gattgggaag agaatagcag gcatggcggc 4140
ctaccgttcg tataggctat agtatacgaa gttatgtgag caaaaggcca gcaaaaggcc 4200
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 4260
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 4320
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 4380
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt 4440
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 4500
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 4560
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 4620
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 4680
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 4740
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 4800
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 4860
tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc 4920
tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact 4980
tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt 5040
cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta 5100
ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta 5160
tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc 5220
gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat 5280
agtttgcgca acgttgttgc cattgctgca ggcatcgtgg tgtcacgctc gtcgtttggt 5340
atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 5400
tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca 5460
gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta 5520
agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg 5580
cgaccgagtt gctcttgccc ggcgtcaaca cgggataata ccgcgccaca tagcagaact 5640
ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg 5700
ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt 5760
actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga 5820
ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc 5880
atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta ga 5932
<210> 13
<211> 1026
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60
agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120
gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180
cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240
ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300
caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat 360
gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420
atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480
cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540
ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600
tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660
atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720
tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780
cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840
ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900
gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960
tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020
gaatag 1026
<210> 14
<211> 1184
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
cgtgaggctc cggtgcccgt cagtgggcag agcgcacatc gcccacagtc cccgagaagt 60
tggggggagg ggtcggcaat tgaaccggtg cctagagaag gtggcgcggg gtaaactggg 120
aaagtgatgt cgtgtactgg ctccgccttt ttcccgaggg tgggggagaa ccgtatataa 180
gtgcagtagt cgccgtgaac gttctttttc gcaacgggtt tgccgccaga acacaggtaa 240
gtgccgtgtg tggttcccgc gggcctggcc tctttacggg ttatggccct tgcgtgcctt 300
gaattacttc cacctggctg cagtacgtga ttcttgatcc cgagcttcgg gttggaagtg 360
ggtgggagag ttcgaggcct tgcgcttaag gagccccttc gcctcgtgct tgagttgagg 420
cctggcctgg gcgctggggc cgccgcgtgc gaatctggtg gcaccttcgc gcctgtctcg 480
ctgctttcga taagtctcta gccatttaaa atttttgatg acctgctgcg acgctttttt 540
tctggcaaga tagtcttgta aatgcgggcc aagatctgca cactggtatt tcggtttttg 600
gggccgcggg cggcgacggg gcccgtgcgt cccagcgcac atgttcggcg aggcggggcc 660
tgcgagcgcg gccaccgaga atcggacggg ggtagtctca agctggccgg cctgctctgg 720
tgcctggcct cgcgccgccg tgtatcgccc cgccctgggc ggcaaggctg gcccggtcgg 780
caccagttgc gtgagcggaa agatggccgc ttcccggccc tgctgcaggg agctcaaaat 840
ggaggacgcg gcgctcggga gagcgggcgg gtgagtcacc cacacaaagg aaaagggcct 900
ttccgtcctc agccgtcgct tcatgtgact ccacggagta ccgggcgccg tccaggcacc 960
tcgattagtt ctggagcttt tggagtacgt cgtctttagg ttggggggag gggttttatg 1020
cgatggagtt tccccacact gagtgggtgg agactgaagt taggccagct tggcacttga 1080
tgtaattctc cttggaattt gccctttttg agtttggatc ttggttcatt ctcaagcctc 1140
agacagtggt tcaaagtttt tttcttccat ttcaggtgtc gtga 1184
<210> 15
<211> 1506
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
atggccaccg agtacaagcc cacggtgcgc ctcgccaccc gcgacgacgt cccccgggcc 60
gtacgcaccc tcgccgccgc gttcgccgac taccccgcca cgcgccacac cgtcgacccg 120
gaccgccaca tcgagcgggt caccgagctg caagaactct tcctcacgcg cgtcgggctc 180
gacatcggca aggtgtgggt cgcggacgac ggcgccgcgg tggcggtctg gaccacgccg 240
gagagcgtcg aagcgggggc ggtgttcgcc gagatcggct cgcgcatggc cgagttgagc 300
ggttcccggc tggccgcgca gcaacagatg gaaggcctcc tggcgccgca ccggcccaag 360
gagcccgcgt ggttcctggc caccgtcggc gtctcgcccg accaccaggg caagggtctg 420
ggcagcgccg tcgtgctccc cggagtggag gcggccgagc gcgctggggt gcccgccttc 480
ctggagacct ccgcgccccg caacctcccc ttctacgagc ggctcggctt caccgtcacc 540
gccgacgtcg aggtgcccga aggaccgcgc acctggtgca tgacccgcaa gcccggtgcc 600
ggcagcgagg gcagaggcag cctgctgacc tgcggcgacg tggaggagaa ccccggcccc 660
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 720
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 780
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 840
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 900
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 960
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 1020
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 1080
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 1140
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 1200
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 1260
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 1320
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagaag 1380
ctcagccatg gcttcccgcc ggcggtggcg gcgcaggatg atggcacgct gcccatgtct 1440
tgtgcccagg agagcgggat ggaccgtcac cctgcagcct gtgcttctgc taggatcaat 1500
gtataa 1506
<210> 16
<211> 19
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 16
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 17
<211> 2256
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
atggtgttgt tggagagcga gcagttcctg acggagctga ccagactttt ccagaagtgc 60
cggacgtcgg gcagcgtcta tatcaccttg aagaagtatg acggtcgaac caaacccatt 120
ccaaagaaag gtactgtgga gggctttgag cccgcagaca acaagtgtct gttaagagct 180
accgatggga agaagaagat cagcactgtg gtgagctcca aggaagtgaa taagtttcag 240
atggcttatt caaacctcct tagagctaac atggatgggt tgaagaagag agacaaaaag 300
aacaaaacta agaagaccaa agcagcagca gcagcagcag cagcagcacc tgccgcagca 360
gcaacagcag cacagggcag cgagggaagg ggaagcctgc tcacatgcgg cgacgtcgaa 420
gagaaccctg gccccatgcc gcagtaccag acctgggagg agttcagccg cgctgccgag 480
aagctttacc tcgctgaccc tatgaaggca cgtgtggttc tcaaatatag gcattctgat 540
gggaacttgt gtgttaaagt aacagatgat ttagttagac agtgtcttgc tctattgctc 600
aggctgcagt gcagtggcat gatcatagct cactgcatcc tcgacctcct gggctcaagc 660
ggtcctcttg cttcagcctc cggagccacc aacttcagcc tgctgaagca ggccggcgat 720
gtggaggaga atcctggccc catggttcta gcagaccttg gaagaaaaat aacatcagca 780
ttacgctcgt tgagcaatgc caccattatc aatgaagagg tattgaatgc tatgctaaaa 840
gaagtctgta ccgctttgtt ggaagcagat gttaatatta aactagtgaa gcaactaaga 900
gaaaatgtta agtctgctat tgatcttgaa gagatggcat ctggtcttaa caaaagaaaa 960
atgattcagc atgctgtatt taaagaactt gtgaagcttg tagaccctgg agttaaggca 1020
tggacaccca ctaaaggaaa acaaaatgtg attatgtttg ttggattgca agggagtggt 1080
aaaacaacaa catgttcaaa gctagcatat tattaccaga ggaaaggttg gaagacctgt 1140
ttaatatgtg cagacacatt cagagcaggg gcttttgacc aactaaaaca gaatgctacc 1200
aaagcaagaa ttccatttta tggaagctat acagaaatgg atcctgtcat cattgcttct 1260
gaaggagtag agaaatttaa aaatgaaaat tttgaaatta ttattgttga tacaagtggc 1320
cgccacaaac aagaagactc tttgtttgaa gaaatgcttc aagttgctaa tgctatacaa 1380
cctgataaca ttgtttatgt gatggatgcc tccattgggc aggcttgtga agcccaggct 1440
aaggctttta aagataaagt agatgtagcc tcagtaatag tgacaaaact tgatggccat 1500
gcaaaaggag gtggtgcact cagtgcagtc gctgccacaa aaagtccgat tattttcatt 1560
ggtacagggg aacatataga tgactttgaa cctttcaaaa cacagccttt tattagcaaa 1620
cttcttggta tgggcgacat tgaaggactg atagataaag tcaacgagtt gaagttggat 1680
gacaatgaag cacttataga gaagttgaaa catggtcagt ttacgttgcg agacatgtat 1740
gagcaatttc aaaatatcat gaaaatgggc cccttcagtc agatcttggg gatgatccct 1800
ggttttggga cagattttat gagcaaagga aatgaacagg agtcaatggc aaggctaaag 1860
aaattaatga caataatgga tagtatgaat gatcaagaac tagacagtac ggatggtgcc 1920
aaagttttta gtaaacaacc aggaagaatc caaagagtag caagaggatc gggtgtatca 1980
acaagagatg ttcaagaact tttgacacaa tataccaagt ttgcacagat ggtaaaaaag 2040
atgggaggta tcaaaggact tttcaaaggt ggcgacatgt ctaagaatgt gagccagtca 2100
cagatggcaa aattgaacca acaaatggcc aaaatgatgg atcctagggt tcttcatcac 2160
atgggtggta tggcaggact tcagtcaatg atgaggcagt ttcaacaggg tgctgctggc 2220
aacatgaaag gcatgatggg attcaataat atgtaa 2256
<210> 18
<211> 3216
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gtagatttga gaactttggg atattcacag cagcagcagg aaaagatcaa gcccaaagtg 180
aggtcgacag tcgcgcagca tcacgaagcg ctggtgggtc atgggtttac acatgcccac 240
atcgtagcct tgtcgcagca ccctgcagcc cttggcacgg tcgccgtcaa gtaccaggac 300
atgattgcgg cgttgccgga agccacacat gaggcgatcg tcggtgtggg gaaacagtgg 360
agcggagccc gagcgcttga ggccctgttg acggtcgcgg gagagctgag agggcctccc 420
cttcagctgg acacgggcca gttgctgaag atcgcgaagc ggggaggagt cacggcggtc 480
gaggcggtgc acgcgtggcg caatgcgctc acgggagcac ccctcaacct gaccccagag 540
caggtcgtgg caattgcgag caacaacggg ggaaagcagg cactcgaaac cgtccagagg 600
ttgctgcctg tgctgtgcca agcgcacgga cttacgccag agcaggtcgt ggcaattgcg 660
agcaacatcg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 720
caagcgcacg gactaacccc agagcaggtc gtggcaattg cgagcaacat cgggggaaag 780
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cgggttgacc 840
ccagagcagg tcgtggcaat tgcgagcaac atcgggggaa agcaggcact cgaaaccgtc 900
cagaggttgc tgcctgtgct gtgccaagcg cacggcctga ccccagagca ggtcgtggca 960
attgcgagca acaacggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 1020
ctgtgccaag cgcacggact gacaccagag caggtcgtgg caattgcgag caacggaggg 1080
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacgga 1140
cttacacccg aacaagtcgt ggcaattgcg agcaacaacg ggggaaagca ggcactcgaa 1200
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gacttacgcc agagcaggtc 1260
gtggcaattg cgagcaacaa cgggggaaag caggcactcg aaaccgtcca gaggttgctg 1320
cctgtgctgt gccaagcgca cggactaacc ccagagcagg tcgtggcaat tgcgagcaac 1380
atcgggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 1440
cacgggttga ccccagagca ggtcgtggca attgcgagca acggaggggg aaagcaggca 1500
ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggcct gaccccagag 1560
caggtcgtgg caattgcgag caacatcggg ggaaagcagg cactcgaaac cgtccagagg 1620
ttgctgcctg tgctgtgcca agcgcacgga ctgacaccag agcaggtcgt ggcaattgcg 1680
agcaacatcg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 1740
caagcgcacg gcctcacccc agagcaggtc gtggcaattg cgagcaacat cgggggaaag 1800
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggacttacg 1860
ccagagcagg tcgtggcaat tgcgagcaac atcgggggaa agcaggcact cgaaaccgtc 1920
cagaggttgc tgcctgtgct gtgccaagcg cacggactaa ccccagagca ggtcgtggca 1980
attgcgagca acatcggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 2040
ctgtgccaag cgcacgggtt gaccccagag caggtcgtgg caattgcgag caacatcggg 2100
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacggc 2160
ctgaccccag agcaggtcgt ggcaattgcg agcaacatcg ggggaaagca ggcactcgaa 2220
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gactgacacc agagcaggtc 2280
gtggcaattg cgagcaacaa cgggggaaag caggcactcg aaaccgtcca gaggttgctg 2340
cctgtgctgt gccaagcgca cggactcacg cctgagcagg tagtggctat tgcatccaac 2400
atcgggggca gacccgcact ggagtcaatc gtggcccagc tttcgaggcc ggaccccgcg 2460
ctggccgcac tcactaatga tcatcttgta gcgctggcct gcctcggcgg acgacccgcc 2520
ttggatgcgg tgaagaaggg gctcccgcac gcgcctgcat tgattaagcg gaccaacaga 2580
aggattcccg agaggacatc acatcgagtg gcaggttccc aactcgtgaa gagtgaactt 2640
gaggagaaaa agtcggagct gcggcacaaa ttgaaatacg taccgcatga atacatcgaa 2700
cttatcgaaa ttgctaggaa ctcgactcaa gacagaatcc ttgagatgaa ggtaatggag 2760
ttctttatga aggtttatgg ataccgaggg aagcatctcg gtggatcacg aaaacccgac 2820
ggagcaatct atacggtggg gagcccgatt gattacggag tgatcgtcga cacgaaagcc 2880
tacagcggtg ggtacaatct tcccatcggg caggcagatg agatgcaacg ttatgtcgaa 2940
gaaaatcaga ccaggaacaa acacatcaat ccaaatgagt ggtggaaagt gtatccttca 3000
tcagtgaccg agtttaagtt tttgtttgtc tctgggcatt tcaaaggcaa ctataaggcc 3060
cagctcacac ggttgaatca cattacgaac tgcaatggtg cggttttgtc cgtagaggaa 3120
ctgctcattg gtggagaaat gatcaaagcg ggaactctga cactggaaga agtcagacgc 3180
aagtttaaca atggcgagat caatttccgc tcataa 3216
<210> 19
<211> 3216
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gtagatttga gaactttggg atattcacag cagcagcagg aaaagatcaa gcccaaagtg 180
aggtcgacag tcgcgcagca tcacgaagcg ctggtgggtc atgggtttac acatgcccac 240
atcgtagcct tgtcgcagca ccctgcagcc cttggcacgg tcgccgtcaa gtaccaggac 300
atgattgcgg cgttgccgga agccacacat gaggcgatcg tcggtgtggg gaaacagtgg 360
agcggagccc gagcgcttga ggccctgttg acggtcgcgg gagagctgag agggcctccc 420
cttcagctgg acacgggcca gttgctgaag atcgcgaagc ggggaggagt cacggcggtc 480
gaggcggtgc acgcgtggcg caatgcgctc acgggagcac ccctcaacct gaccccagag 540
caggtcgtgg caattgcgag ccatgacggg ggaaagcagg cactcgaaac cgtccagagg 600
ttgctgcctg tgctgtgcca agcgcacgga cttacgccag agcaggtcgt ggcaattgcg 660
agccatgacg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 720
caagcgcacg gactaacccc agagcaggtc gtggcaattg cgagcaacgg agggggaaag 780
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cgggttgacc 840
ccagagcagg tcgtggcaat tgcgagcaac ggagggggaa agcaggcact cgaaaccgtc 900
cagaggttgc tgcctgtgct gtgccaagcg cacggcctga ccccagagca ggtcgtggca 960
attgcgagca acggaggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 1020
ctgtgccaag cgcacggact gacaccagag caggtcgtgg caattgcgag caacatcggg 1080
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacgga 1140
cttacacccg aacaagtcgt ggcaattgcg agcaacatcg ggggaaagca ggcactcgaa 1200
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gacttacgcc agagcaggtc 1260
gtggcaattg cgagccatga cgggggaaag caggcactcg aaaccgtcca gaggttgctg 1320
cctgtgctgt gccaagcgca cggactaacc ccagagcagg tcgtggcaat tgcgagcaac 1380
atcgggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 1440
cacgggttga ccccagagca ggtcgtggca attgcgagca acatcggggg aaagcaggca 1500
ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggcct gaccccagag 1560
caggtcgtgg caattgcgag caacatcggg ggaaagcagg cactcgaaac cgtccagagg 1620
ttgctgcctg tgctgtgcca agcgcacgga ctgacaccag agcaggtcgt ggcaattgcg 1680
agcaacaacg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 1740
caagcgcacg gcctcacccc agagcaggtc gtggcaattg cgagcaacat cgggggaaag 1800
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggacttacg 1860
ccagagcagg tcgtggcaat tgcgagcaac atcgggggaa agcaggcact cgaaaccgtc 1920
cagaggttgc tgcctgtgct gtgccaagcg cacggactaa ccccagagca ggtcgtggca 1980
attgcgagca acaacggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 2040
ctgtgccaag cgcacgggtt gaccccagag caggtcgtgg caattgcgag caacaacggg 2100
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacggc 2160
ctgaccccag agcaggtcgt ggcaattgcg agcaacaacg ggggaaagca ggcactcgaa 2220
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gactgacacc agagcaggtc 2280
gtggcaattg cgagcaacgg agggggaaag caggcactcg aaaccgtcca gaggttgctg 2340
cctgtgctgt gccaagcgca cggactcacg cctgagcagg tagtggctat tgcatcccat 2400
gacgggggca gacccgcact ggagtcaatc gtggcccagc tttcgaggcc ggaccccgcg 2460
ctggccgcac tcactaatga tcatcttgta gcgctggcct gcctcggcgg acgacccgcc 2520
ttggatgcgg tgaagaaggg gctcccgcac gcgcctgcat tgattaagcg gaccaacaga 2580
aggattcccg agaggacatc acatcgagtg gcaggttccc aactcgtgaa gagtgaactt 2640
gaggagaaaa agtcggagct gcggcacaaa ttgaaatacg taccgcatga atacatcgaa 2700
cttatcgaaa ttgctaggaa ctcgactcaa gacagaatcc ttgagatgaa ggtaatggag 2760
ttctttatga aggtttatgg ataccgaggg aagcatctcg gtggatcacg aaaacccgac 2820
ggagcaatct atacggtggg gagcccgatt gattacggag tgatcgtcga cacgaaagcc 2880
tacagcggtg ggtacaatct tcccatcggg caggcagatg agatgcaacg ttatgtcgaa 2940
gaaaatcaga ccaggaacaa acacatcaat ccaaatgagt ggtggaaagt gtatccttca 3000
tcagtgaccg agtttaagtt tttgtttgtc tctgggcatt tcaaaggcaa ctataaggcc 3060
cagctcacac ggttgaatca cattacgaac tgcaatggtg cggttttgtc cgtagaggaa 3120
ctgctcattg gtggagaaat gatcaaagcg ggaactctga cactggaaga agtcagacgc 3180
aagtttaaca atggcgagat caatttccgc tcataa 3216
<210> 20
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
taaatctgtt gattccaggt tccc 24
<210> 21
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
gtactaagaa gtgtggtact gtgttg 26
<210> 22
<211> 3222
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 60
gacgacaaga tggcccccaa gaagaagaga aaggtgggca tccacagagg cgtgcccatg 120
gtggacctga gaaccctggg ctacagccag cagcagcagg agaagatcaa gcccaaggtg 180
agaagcaccg tggcccagca ccacgaggcc ctggtgggcc acggcttcac ccacgcccac 240
atcgtggccc tgagccagca ccccgccgcc ctgggcaccg tggccgtgaa gtaccaggac 300
atgatcgccg ccctgcccga ggccacccac gaggccatcg tgggcgtggg caagcagtgg 360
agcggcgcca gagccctgga ggccctgctg accgtggccg gcgagctgag aggccccccc 420
ctccagctgg acaccggcca gctgctgaag atcgccaaga gaggcggcgt gaccgccgtg 480
gaggccgtgc acgcctggag aaacgccctg accggcgccc ccctgaattt gacacccgac 540
caagttgtgg ccattgccag caacggtgga gggaaacaag cattggagac tgtccaacgg 600
ctccttcccg tgttgtgtca agcccacggt ttgacccctg cacaagtggt cgccatcgcc 660
tcccatgacg gcggtaagca ggccctggaa acagtgcaac ggttgctccc tgtcttgtgt 720
caagatcatg gactgacccc agaccaggtg gtcgcaatcg cctctaacaa cgggggaaag 780
caagccctgg aaaccgtgca aaggttgttg cccgtccttt gtcaagacca cggccttaca 840
cccgagcaag tcgtggccat tgcatcaaac atcggtggca aacaggctct tgagactgtt 900
cagagacttc tcccagttct ctgccaggca cacgggctta ctcccgatca agttgtggcc 960
attgccagca acaacggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 1020
ttgtgtcaag cccacggttt gacccctgca caagtggtcg ccatcgcctc caacatcggc 1080
ggtaagcagg ccctggaaac agtgcagcgc ctgctgcctg tgctgtgcca ggatcatgga 1140
ctgaccccag accaggttgt cgccatcgcc tctaacatcg ggggaaagca agccctggaa 1200
accgtgcaaa ggttgttgcc cgtcctttgt caagaccacg gccttacacc cgagcaagtc 1260
gtggccattg catcaaacat cggtggcaaa caggctcttg agactgttca gagacttctc 1320
ccagttctct gtcaagccca cggtttgaca cccgaccaag ttgtggccat tgccagccat 1380
gacggaggga aacaagcatt ggagactgtc caacggctcc ttcccgtgtt gtgtcaagcc 1440
cacggtttga cccctgcaca agtggtcgcc atcgcctcca acggtggcgg taagcaggcc 1500
ctggaaacag tgcaacggtt gctccctgtc ttgtgtcaag atcatggact gaccccagac 1560
caggtggtcg caatcgcctc taacatcggg ggaaagcaag ccctggaaac cgtgcaaagg 1620
ttgttgcccg tcctttgtca agaccacggc cttacacccg agcaagtcgt ggccattgca 1680
tcaaacatcg gtggcaaaca ggctcttgag actgttcaga gacttctccc agttctctgc 1740
caggcacacg ggcttactcc cgatcaagtt gtggccattg ccagcaacaa cggagggaaa 1800
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacc 1860
cctgcacaag tggtcgccat cgcctcccat gacggcggta agcaggccct ggaaacagtg 1920
cagcgcctgc tgcctgtgct gtgccaggat catggactga ccccagacca ggttgtcgcc 1980
atcgcctcta acatcggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgcccgtc 2040
ctttgtcaag accacggcct tacacccgag caagtcgtgg ccattgcatc aaacatcggt 2100
ggcaaacagg ctcttgagac tgttcagaga cttctcccag ttctctgtca agcccacggt 2160
ttgacacccg accaagttgt ggccattgcc agcaacaacg gagggaaaca agcattggag 2220
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacccc tgcacaagtg 2280
gtcgccatcg cctcccatga cggcggtaag caggccctgg aaacagtgca acggttgctc 2340
cctgtcttgt gtcaagacca tgggctgacc cccgagcagg tggtggccat cgccagcaac 2400
aacggcggca gacccgccct ggagagcatc gtggcccagc tgagcagacc cgaccccgcc 2460
ctggccgccc tgaccaacga ccacctggtg gccctggcct gcctgggcgg cagacccgcc 2520
ctggacgccg tgaagaaggg cctgccccac gcccccgccc tgatcaagag aaccaacaga 2580
agaatccccg agagaaccag ccacagagtg gccggcagcc agctggtgaa gagcgagctg 2640
gaggagaaga agagcgagct gagacacaag ctgaagtacg tgccccacga gtacatcgag 2700
ctgatcgaga tcgccagaaa cagcacccag gacagaatcc tggagatgaa ggtgatggag 2760
ttcttcatga aggtgtacgg ctacagaggc aagcacctgg gcggcagcag aaagcccgac 2820
ggcgccatct acaccgtggg cagccccatc gactacggcg tgatcgtgga caccaaggcc 2880
tacagcggcg gctacaacct gcccatcggc caggccgacg agatgcagag atacgtggag 2940
gagaaccaga ccagaaacaa gcacatcaac cccaacgagt ggtggaaggt gtaccccagc 3000
agcgtgaccg agttcaagtt cctgttcgtg agcggccact tcaagggcaa ctacaaggcc 3060
cagctgacca gactgaacca catcaccaac tgcaacggcg ccgtgctgag cgtggaggag 3120
ctgctgatcg gcggcgagat gatcaaggcc ggcaccctga ccctggagga ggtgagaaga 3180
aagttcaaca acggcgagat caacttcaga agctctagat ga 3222
<210> 23
<211> 3222
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
atggactaca aggaccacga cggcgactac aaggaccacg acatcgacta caaggacgac 60
gacgacaaga tggcccccaa gaagaagaga aaggtgggca tccacagagg cgtgcccatg 120
gtggacctga gaaccctggg ctacagccag cagcagcagg agaagatcaa gcccaaggtg 180
agaagcaccg tggcccagca ccacgaggcc ctggtgggcc acggcttcac ccacgcccac 240
atcgtggccc tgagccagca ccccgccgcc ctgggcaccg tggccgtgaa gtaccaggac 300
atgatcgccg ccctgcccga ggccacccac gaggccatcg tgggcgtggg caagcagtgg 360
agcggcgcca gagccctgga ggccctgctg accgtggccg gcgagctgag aggccccccc 420
ctccagctgg acaccggcca gctgctgaag atcgccaaga gaggcggcgt gaccgccgtg 480
gaggccgtgc acgcctggag aaacgccctg accggcgccc ccctgaattt gacacccgac 540
caagttgtgg ccattgccag caacggtgga gggaaacaag cattggagac tgtccaacgg 600
ctccttcccg tgttgtgtca agcccacggt ttgacccctg cacaagtggt cgccatcgcc 660
tccaacaacg gcggtaagca ggccctggaa acagtgcaac ggttgctccc tgtcttgtgt 720
caagatcatg gactgacccc agaccaggtg gtcgcaatcg cctctaacaa cgggggaaag 780
caagccctgg aaaccgtgca aaggttgttg cccgtccttt gtcaagacca cggccttaca 840
cccgagcaag tcgtggccat tgcatcaaac aacggtggca aacaggctct tgagactgtt 900
cagagacttc tcccagttct ctgccaggca cacgggctta ctcccgatca agttgtggcc 960
attgccagca acatcggagg gaaacaagca ttggagactg tccaacggct ccttcccgtg 1020
ttgtgtcaag cccacggttt gacccctgca caagtggtcg ccatcgcctc caacggtggc 1080
ggtaagcagg ccctggaaac agtgcagcgc ctgctgcctg tgctgtgcca ggatcatgga 1140
ctgaccccag accaggttgt cgccatcgcc tctcatgacg ggggaaagca agccctggaa 1200
accgtgcaaa ggttgttgcc cgtcctttgt caagaccacg gccttacacc cgagcaagtc 1260
gtggccattg catcaaacaa cggtggcaaa caggctcttg agactgttca gagacttctc 1320
ccagttctct gtcaagccca cggtttgaca cccgaccaag ttgtggccat tgccagcaac 1380
ggtggaggga aacaagcatt ggagactgtc caacggctcc ttcccgtgtt gtgtcaagcc 1440
cacggtttga cccctgcaca agtggtcgcc atcgcctcca acatcggcgg taagcaggcc 1500
ctggaaacag tgcaacggtt gctccctgtc ttgtgtcaag atcatggact gaccccagac 1560
caggtggtcg caatcgcctc taacaacggg ggaaagcaag ccctggaaac cgtgcaaagg 1620
ttgttgcccg tcctttgtca agaccacggc cttacacccg agcaagtcgt ggccattgca 1680
tcaaacaacg gtggcaaaca ggctcttgag actgttcaga gacttctccc agttctctgc 1740
caggcacacg ggcttactcc cgatcaagtt gtggccattg ccagccatga cggagggaaa 1800
caagcattgg agactgtcca acggctcctt cccgtgttgt gtcaagccca cggtttgacc 1860
cctgcacaag tggtcgccat cgcctccaac ggtggcggta agcaggccct ggaaacagtg 1920
cagcgcctgc tgcctgtgct gtgccaggat catggactga ccccagacca ggttgtcgcc 1980
atcgcctctc atgacggggg aaagcaagcc ctggaaaccg tgcaaaggtt gttgcccgtc 2040
ctttgtcaag accacggcct tacacccgag caagtcgtgg ccattgcatc aaacaacggt 2100
ggcaaacagg ctcttgagac tgttcagaga cttctcccag ttctctgtca agcccacggt 2160
ttgacacccg accaagttgt ggccattgcc agcaacatcg gagggaaaca agcattggag 2220
actgtccaac ggctccttcc cgtgttgtgt caagcccacg gtttgacccc tgcacaagtg 2280
gtcgccatcg cctccaacat cggcggtaag caggccctgg aaacagtgca acggttgctc 2340
cctgtcttgt gtcaagacca tgggctgacc cccgagcagg tggtggccat cgccagcaac 2400
ggtggcggca gacccgccct ggagagcatc gtggcccagc tgagcagacc cgaccccgcc 2460
ctggccgccc tgaccaacga ccacctggtg gccctggcct gcctgggcgg cagacccgcc 2520
ctggacgccg tgaagaaggg cctgccccac gcccccgccc tgatcaagag aaccaacaga 2580
agaatccccg agagaaccag ccacagagtg gccggcagcc agctggtgaa gagcgagctg 2640
gaggagaaga agagcgagct gagacacaag ctgaagtacg tgccccacga gtacatcgag 2700
ctgatcgaga tcgccagaaa cagcacccag gacagaatcc tggagatgaa ggtgatggag 2760
ttcttcatga aggtgtacgg ctacagaggc aagcacctgg gcggcagcag aaagcccgac 2820
ggcgccatct acaccgtggg cagccccatc gactacggcg tgatcgtgga caccaaggcc 2880
tacagcggcg gctacaacct gcccatcggc caggccgacg agatgcagag atacgtggag 2940
gagaaccaga ccagaaacaa gcacatcaac cccaacgagt ggtggaaggt gtaccccagc 3000
agcgtgaccg agttcaagtt cctgttcgtg agcggccact tcaagggcaa ctacaaggcc 3060
cagctgacca gactgaacca catcaccaac tgcaacggcg ccgtgctgag cgtggaggag 3120
ctgctgatcg gcggcgagat gatcaaggcc ggcaccctga ccctggagga ggtgagaaga 3180
aagttcaaca acggcgagat caacttcaga agctctagat ga 3222
<210> 24
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ttgtacccgt tggagaagtg acag 24
<210> 25
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gatgaactag gaaaggctca agatcac 27
<210> 26
<211> 3216
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gtagatttga gaactttggg atattcacag cagcagcagg aaaagatcaa gcccaaagtg 180
aggtcgacag tcgcgcagca tcacgaagcg ctggtgggtc atgggtttac acatgcccac 240
atcgtagcct tgtcgcagca ccctgcagcc cttggcacgg tcgccgtcaa gtaccaggac 300
atgattgcgg cgttgccgga agccacacat gaggcgatcg tcggtgtggg gaaacagtgg 360
agcggagccc gagcgcttga ggccctgttg acggtcgcgg gagagctgag agggcctccc 420
cttcagctgg acacgggcca gttgctgaag atcgcgaagc ggggaggagt cacggcggtc 480
gaggcggtgc acgcgtggcg caatgcgctc acgggagcac ccctcaacct gaccccagag 540
caggtcgtgg caattgcgag caacggcggg ggaaagcagg cactcgaaac cgtccagagg 600
ttgctgcctg tgctgtgcca agcgcacgga cttacgccag agcaggtcgt ggcaattgcg 660
agcaacatcg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 720
caagcgcacg gactaacccc agagcaggtc gtggcaattg cgagcaacat cgggggaaag 780
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cgggttgacc 840
ccagagcagg tcgtggcaat tgcgagcaac aacgggggaa agcaggcact cgaaaccgtc 900
cagaggttgc tgcctgtgct gtgccaagcg cacggcctga ccccagagca ggtcgtggca 960
attgcgagcc acgacggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 1020
ctgtgccaag cgcacggact gacaccagag caggtcgtgg caattgcgag caacggaggg 1080
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacgga 1140
cttacacccg aacaagtcgt ggcaattgcg agcaacaacg ggggaaagca ggcactcgaa 1200
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gacttacgcc agagcaggtc 1260
gtggcaattg cgagcaacaa cgggggaaag caggcactcg aaaccgtcca gaggttgctg 1320
cctgtgctgt gccaagcgca cggactaacc ccagagcagg tcgtggcaat tgcgagcaac 1380
atcgggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 1440
cacgggttga ccccagagca ggtcgtggca attgcgagca acaacggggg aaagcaggca 1500
ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggcct gaccccagag 1560
caggtcgtgg caattgcgag caacaacggg ggaaagcagg cactcgaaac cgtccagagg 1620
ttgctgcctg tgctgtgcca agcgcacgga ctgacaccag agcaggtcgt ggcaattgcg 1680
agcaacatcg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 1740
caagcgcacg gcctcacccc agagcaggtc gtggcaattg cgagcaacat cgggggaaag 1800
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggacttacg 1860
ccagagcagg tcgtggcaat tgcgagcaac aacgggggaa agcaggcact cgaaaccgtc 1920
cagaggttgc tgcctgtgct gtgccaagcg cacggactaa ccccagagca ggtcgtggca 1980
attgcgagca acatcggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 2040
ctgtgccaag cgcacgggtt gaccccagag caggtcgtgg caattgcgag caacggcggg 2100
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacggc 2160
ctgaccccag agcaggtcgt ggcaattgcg agcaacaacg ggggaaagca ggcactcgaa 2220
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gactgacacc agagcaggtc 2280
gtggcaattg cgagcaacaa cgggggaaag caggcactcg aaaccgtcca gaggttgctg 2340
cctgtgctgt gccaagcgca cggactcacg cctgagcagg tagtggctat tgcatccaac 2400
aacgggggca gacccgcact ggagtcaatc gtggcccagc tttcgaggcc ggaccccgcg 2460
ctggccgcac tcactaatga tcatcttgta gcgctggcct gcctcggcgg acgacccgcc 2520
ttggatgcgg tgaagaaggg gctcccgcac gcgcctgcat tgattaagcg gaccaacaga 2580
aggattcccg agaggacatc acatcgagtg gcaggttccc aactcgtgaa gagtgaactt 2640
gaggagaaaa agtcggagct gcggcacaaa ttgaaatacg taccgcatga atacatcgaa 2700
cttatcgaaa ttgctaggaa ctcgactcaa gacagaatcc ttgagatgaa ggtaatggag 2760
ttctttatga aggtttatgg ataccgaggg aagcatctcg gtggatcacg aaaacccgac 2820
ggagcaatct atacggtggg gagcccgatt gattacggag tgatcgtcga cacgaaagcc 2880
tacagcggtg ggtacaatct tcccatcggg caggcagatg agatgcaacg ttatgtcgaa 2940
gaaaatcaga ccaggaacaa acacatcaat ccaaatgagt ggtggaaagt gtatccttca 3000
tcagtgaccg agtttaagtt tttgtttgtc tctgggcatt tcaaaggcaa ctataaggcc 3060
cagctcacac ggttgaatca cattacgaac tgcaatggtg cggttttgtc cgtagaggaa 3120
ctgctcattg gtggagaaat gatcaaagcg ggaactctga cactggaaga agtcagacgc 3180
aagtttaaca atggcgagat caatttccgc tcataa 3216
<210> 27
<211> 3216
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gtagatttga gaactttggg atattcacag cagcagcagg aaaagatcaa gcccaaagtg 180
aggtcgacag tcgcgcagca tcacgaagcg ctggtgggtc atgggtttac acatgcccac 240
atcgtagcct tgtcgcagca ccctgcagcc cttggcacgg tcgccgtcaa gtaccaggac 300
atgattgcgg cgttgccgga agccacacat gaggcgatcg tcggtgtggg gaaacagtgg 360
agcggagccc gagcgcttga ggccctgttg acggtcgcgg gagagctgag agggcctccc 420
cttcagctgg acacgggcca gttgctgaag atcgcgaagc ggggaggagt cacggcggtc 480
gaggcggtgc acgcgtggcg caatgcgctc acgggagcac ccctcaacct gaccccagag 540
caggtcgtgg caattgcgag caacaacggg ggaaagcagg cactcgaaac cgtccagagg 600
ttgctgcctg tgctgtgcca agcgcacgga cttacgccag agcaggtcgt ggcaattgcg 660
agcaacggcg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 720
caagcgcacg gactaacccc agagcaggtc gtggcaattg cgagcaacat cgggggaaag 780
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cgggttgacc 840
ccagagcagg tcgtggcaat tgcgagcaac ggcgggggaa agcaggcact cgaaaccgtc 900
cagaggttgc tgcctgtgct gtgccaagcg cacggcctga ccccagagca ggtcgtggca 960
attgcgagca acatcggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 1020
ctgtgccaag cgcacggact gacaccagag caggtcgtgg caattgcgag caacaacggg 1080
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacgga 1140
cttacacccg aacaagtcgt ggcaattgcg agccacgacg ggggaaagca ggcactcgaa 1200
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gacttacgcc agagcaggtc 1260
gtggcaattg cgagccacga cgggggaaag caggcactcg aaaccgtcca gaggttgctg 1320
cctgtgctgt gccaagcgca cggactaacc ccagagcagg tcgtggcaat tgcgagcaac 1380
atcgggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 1440
cacgggttga ccccagagca ggtcgtggca attgcgagca acggcggggg aaagcaggca 1500
ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggcct gaccccagag 1560
caggtcgtgg caattgcgag caacggcggg ggaaagcagg cactcgaaac cgtccagagg 1620
ttgctgcctg tgctgtgcca agcgcacgga ctgacaccag agcaggtcgt ggcaattgcg 1680
agccacgacg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 1740
caagcgcacg gcctcacccc agagcaggtc gtggcaattg cgagcaacgg cgggggaaag 1800
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggacttacg 1860
ccagagcagg tcgtggcaat tgcgagcaac atcgggggaa agcaggcact cgaaaccgtc 1920
cagaggttgc tgcctgtgct gtgccaagcg cacggactaa ccccagagca ggtcgtggca 1980
attgcgagca acaacggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 2040
ctgtgccaag cgcacgggtt gaccccagag caggtcgtgg caattgcgag caacaacggg 2100
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacggc 2160
ctgaccccag agcaggtcgt ggcaattgcg agcaacaacg ggggaaagca ggcactcgaa 2220
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gactgacacc agagcaggtc 2280
gtggcaattg cgagcaacat cgggggaaag caggcactcg aaaccgtcca gaggttgctg 2340
cctgtgctgt gccaagcgca cggactcacg cctgagcagg tagtggctat tgcatccaac 2400
atcgggggca gacccgcact ggagtcaatc gtggcccagc tttcgaggcc ggaccccgcg 2460
ctggccgcac tcactaatga tcatcttgta gcgctggcct gcctcggcgg acgacccgcc 2520
ttggatgcgg tgaagaaggg gctcccgcac gcgcctgcat tgattaagcg gaccaacaga 2580
aggattcccg agaggacatc acatcgagtg gcaggttccc aactcgtgaa gagtgaactt 2640
gaggagaaaa agtcggagct gcggcacaaa ttgaaatacg taccgcatga atacatcgaa 2700
cttatcgaaa ttgctaggaa ctcgactcaa gacagaatcc ttgagatgaa ggtaatggag 2760
ttctttatga aggtttatgg ataccgaggg aagcatctcg gtggatcacg aaaacccgac 2820
ggagcaatct atacggtggg gagcccgatt gattacggag tgatcgtcga cacgaaagcc 2880
tacagcggtg ggtacaatct tcccatcggg caggcagatg agatgcaacg ttatgtcgaa 2940
gaaaatcaga ccaggaacaa acacatcaat ccaaatgagt ggtggaaagt gtatccttca 3000
tcagtgaccg agtttaagtt tttgtttgtc tctgggcatt tcaaaggcaa ctataaggcc 3060
cagctcacac ggttgaatca cattacgaac tgcaatggtg cggttttgtc cgtagaggaa 3120
ctgctcattg gtggagaaat gatcaaagcg ggaactctga cactggaaga agtcagacgc 3180
aagtttaaca atggcgagat caatttccgc tcataa 3216
<210> 28
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
ctaaaggctg ctcccactct ac 22
<210> 29
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
caaagtggaa cttgggttga gg 22
<210> 30
<211> 3216
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gtagatttga gaactttggg atattcacag cagcagcagg aaaagatcaa gcccaaagtg 180
aggtcgacag tcgcgcagca tcacgaagcg ctggtgggtc atgggtttac acatgcccac 240
atcgtagcct tgtcgcagca ccctgcagcc cttggcacgg tcgccgtcaa gtaccaggac 300
atgattgcgg cgttgccgga agccacacat gaggcgatcg tcggtgtggg gaaacagtgg 360
agcggagccc gagcgcttga ggccctgttg acggtcgcgg gagagctgag agggcctccc 420
cttcagctgg acacgggcca gttgctgaag atcgcgaagc ggggaggagt cacggcggtc 480
gaggcggtgc acgcgtggcg caatgcgctc acgggagcac ccctcaacct gaccccagag 540
caggtcgtgg caattgcgag caacaacggg ggaaagcagg cactcgaaac cgtccagagg 600
ttgctgcctg tgctgtgcca agcgcacgga cttacgccag agcaggtcgt ggcaattgcg 660
agcaacaacg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 720
caagcgcacg gactaacccc agagcaggtc gtggcaattg cgagcaacgg cgggggaaag 780
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cgggttgacc 840
ccagagcagg tcgtggcaat tgcgagcaac aacgggggaa agcaggcact cgaaaccgtc 900
cagaggttgc tgcctgtgct gtgccaagcg cacggcctga ccccagagca ggtcgtggca 960
attgcgagca acaacggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 1020
ctgtgccaag cgcacggact gacaccagag caggtcgtgg caattgcgag ccacgacggg 1080
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacgga 1140
cttacacccg aacaagtcgt ggcaattgcg agccacgacg ggggaaagca ggcactcgaa 1200
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gacttacgcc agagcaggtc 1260
gtggcaattg cgagcaacgg cgggggaaag caggcactcg aaaccgtcca gaggttgctg 1320
cctgtgctgt gccaagcgca cggactaacc ccagagcagg tcgtggcaat tgcgagcaac 1380
ggcgggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 1440
cacgggttga ccccagagca ggtcgtggca attgcgagca acatcggggg aaagcaggca 1500
ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggcct gaccccagag 1560
caggtcgtgg caattgcgag caacaacggg ggaaagcagg cactcgaaac cgtccagagg 1620
ttgctgcctg tgctgtgcca agcgcacgga ctgacaccag agcaggtcgt ggcaattgcg 1680
agcaacggcg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 1740
caagcgcacg gcctcacccc agagcaggtc gtggcaattg cgagccacga cgggggaaag 1800
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggacttacg 1860
ccagagcagg tcgtggcaat tgcgagcaac ggcgggggaa agcaggcact cgaaaccgtc 1920
cagaggttgc tgcctgtgct gtgccaagcg cacggactaa ccccagagca ggtcgtggca 1980
attgcgagca acggcggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 2040
ctgtgccaag cgcacgggtt gaccccagag caggtcgtgg caattgcgag caacaacggg 2100
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacggc 2160
ctgaccccag agcaggtcgt ggcaattgcg agcaacggcg ggggaaagca ggcactcgaa 2220
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gactgacacc agagcaggtc 2280
gtggcaattg cgagcaacaa cgggggaaag caggcactcg aaaccgtcca gaggttgctg 2340
cctgtgctgt gccaagcgca cggactcacg cctgagcagg tagtggctat tgcatccaac 2400
ggcgggggca gacccgcact ggagtcaatc gtggcccagc tttcgaggcc ggaccccgcg 2460
ctggccgcac tcactaatga tcatcttgta gcgctggcct gcctcggcgg acgacccgcc 2520
ttggatgcgg tgaagaaggg gctcccgcac gcgcctgcat tgattaagcg gaccaacaga 2580
aggattcccg agaggacatc acatcgagtg gcaggttccc aactcgtgaa gagtgaactt 2640
gaggagaaaa agtcggagct gcggcacaaa ttgaaatacg taccgcatga atacatcgaa 2700
cttatcgaaa ttgctaggaa ctcgactcaa gacagaatcc ttgagatgaa ggtaatggag 2760
ttctttatga aggtttatgg ataccgaggg aagcatctcg gtggatcacg aaaacccgac 2820
ggagcaatct atacggtggg gagcccgatt gattacggag tgatcgtcga cacgaaagcc 2880
tacagcggtg ggtacaatct tcccatcggg caggcagatg agatgcaacg ttatgtcgaa 2940
gaaaatcaga ccaggaacaa acacatcaat ccaaatgagt ggtggaaagt gtatccttca 3000
tcagtgaccg agtttaagtt tttgtttgtc tctgggcatt tcaaaggcaa ctataaggcc 3060
cagctcacac ggttgaatca cattacgaac tgcaatggtg cggttttgtc cgtagaggaa 3120
ctgctcattg gtggagaaat gatcaaagcg ggaactctga cactggaaga agtcagacgc 3180
aagtttaaca atggcgagat caatttccgc tcataa 3216
<210> 31
<211> 3216
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gtagatttga gaactttggg atattcacag cagcagcagg aaaagatcaa gcccaaagtg 180
aggtcgacag tcgcgcagca tcacgaagcg ctggtgggtc atgggtttac acatgcccac 240
atcgtagcct tgtcgcagca ccctgcagcc cttggcacgg tcgccgtcaa gtaccaggac 300
atgattgcgg cgttgccgga agccacacat gaggcgatcg tcggtgtggg gaaacagtgg 360
agcggagccc gagcgcttga ggccctgttg acggtcgcgg gagagctgag agggcctccc 420
cttcagctgg acacgggcca gttgctgaag atcgcgaagc ggggaggagt cacggcggtc 480
gaggcggtgc acgcgtggcg caatgcgctc acgggagcac ccctcaacct gaccccagag 540
caggtcgtgg caattgcgag ccacgacggg ggaaagcagg cactcgaaac cgtccagagg 600
ttgctgcctg tgctgtgcca agcgcacgga cttacgccag agcaggtcgt ggcaattgcg 660
agcaacatcg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 720
caagcgcacg gactaacccc agagcaggtc gtggcaattg cgagcaacaa cgggggaaag 780
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cgggttgacc 840
ccagagcagg tcgtggcaat tgcgagccac gacgggggaa agcaggcact cgaaaccgtc 900
cagaggttgc tgcctgtgct gtgccaagcg cacggcctga ccccagagca ggtcgtggca 960
attgcgagca acatcggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 1020
ctgtgccaag cgcacggact gacaccagag caggtcgtgg caattgcgag caacatcggg 1080
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacgga 1140
cttacacccg aacaagtcgt ggcaattgcg agcaacatcg ggggaaagca ggcactcgaa 1200
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gacttacgcc agagcaggtc 1260
gtggcaattg cgagccacga cgggggaaag caggcactcg aaaccgtcca gaggttgctg 1320
cctgtgctgt gccaagcgca cggactaacc ccagagcagg tcgtggcaat tgcgagcaac 1380
atcgggggaa agcaggcact cgaaaccgtc cagaggttgc tgcctgtgct gtgccaagcg 1440
cacgggttga ccccagagca ggtcgtggca attgcgagca acaacggggg aaagcaggca 1500
ctcgaaaccg tccagaggtt gctgcctgtg ctgtgccaag cgcacggcct gaccccagag 1560
caggtcgtgg caattgcgag caacggcggg ggaaagcagg cactcgaaac cgtccagagg 1620
ttgctgcctg tgctgtgcca agcgcacgga ctgacaccag agcaggtcgt ggcaattgcg 1680
agcaacaacg ggggaaagca ggcactcgaa accgtccaga ggttgctgcc tgtgctgtgc 1740
caagcgcacg gcctcacccc agagcaggtc gtggcaattg cgagcaacgg cgggggaaag 1800
caggcactcg aaaccgtcca gaggttgctg cctgtgctgt gccaagcgca cggacttacg 1860
ccagagcagg tcgtggcaat tgcgagcaac atcgggggaa agcaggcact cgaaaccgtc 1920
cagaggttgc tgcctgtgct gtgccaagcg cacggactaa ccccagagca ggtcgtggca 1980
attgcgagca acaacggggg aaagcaggca ctcgaaaccg tccagaggtt gctgcctgtg 2040
ctgtgccaag cgcacgggtt gaccccagag caggtcgtgg caattgcgag caacggcggg 2100
ggaaagcagg cactcgaaac cgtccagagg ttgctgcctg tgctgtgcca agcgcacggc 2160
ctgaccccag agcaggtcgt ggcaattgcg agcaacatcg ggggaaagca ggcactcgaa 2220
accgtccaga ggttgctgcc tgtgctgtgc caagcgcacg gactgacacc agagcaggtc 2280
gtggcaattg cgagcaacaa cgggggaaag caggcactcg aaaccgtcca gaggttgctg 2340
cctgtgctgt gccaagcgca cggactcacg cctgagcagg tagtggctat tgcatccaac 2400
atcgggggca gacccgcact ggagtcaatc gtggcccagc tttcgaggcc ggaccccgcg 2460
ctggccgcac tcactaatga tcatcttgta gcgctggcct gcctcggcgg acgacccgcc 2520
ttggatgcgg tgaagaaggg gctcccgcac gcgcctgcat tgattaagcg gaccaacaga 2580
aggattcccg agaggacatc acatcgagtg gcaggttccc aactcgtgaa gagtgaactt 2640
gaggagaaaa agtcggagct gcggcacaaa ttgaaatacg taccgcatga atacatcgaa 2700
cttatcgaaa ttgctaggaa ctcgactcaa gacagaatcc ttgagatgaa ggtaatggag 2760
ttctttatga aggtttatgg ataccgaggg aagcatctcg gtggatcacg aaaacccgac 2820
ggagcaatct atacggtggg gagcccgatt gattacggag tgatcgtcga cacgaaagcc 2880
tacagcggtg ggtacaatct tcccatcggg caggcagatg agatgcaacg ttatgtcgaa 2940
gaaaatcaga ccaggaacaa acacatcaat ccaaatgagt ggtggaaagt gtatccttca 3000
tcagtgaccg agtttaagtt tttgtttgtc tctgggcatt tcaaaggcaa ctataaggcc 3060
cagctcacac ggttgaatca cattacgaac tgcaatggtg cggttttgtc cgtagaggaa 3120
ctgctcattg gtggagaaat gatcaaagcg ggaactctga cactggaaga agtcagacgc 3180
aagtttaaca atggcgagat caatttccgc tcataa 3216
<210> 32
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
gggtgtagag atagattctc c 21
<210> 33
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
ggccagccat cactagtatt c 21
<210> 34
<211> 18
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 34
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 35
<211> 20
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 35
Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210> 36
<211> 681
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
atgagcgata gcactgagaa cgtcatcaag cccttcatgc gcttcaaggt gcacatggag 60
ggctccgtga acggccacga gttcgagatc gagggcgagg gcgagggcaa gccctacgag 120
ggcacccaga ccgccaagct gcaggtgacc aagggcggcc ccctgccctt cgcctgggac 180
atcctgtccc cccagttcca gtacggctcc aaggtgtacg tgaagcaccc cgccgacatc 240
cccgactaca agaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300
gaggacggcg gcgtggtgac cgtgacccag gactcctccc tgcaggacgg caccttcatc 360
taccacgtga agttcatcgg cgtgaacttc ccctccgacg gccccgtaat gcagaagaag 420
actctgggct gggagccctc caccgagcgc ctgtaccccc gcgacggcgt gctgaagggc 480
gagatccaca aggcgctgaa gctgaagggc ggcggccact acctggtgga gttcaagtca 540
atctacatgg ccaagaagcc cgtgaagctg cccggctact actacgtgga ctccaagctg 600
gacatcacct cccacaacga ggactacacc gtggtggagc agtacgagcg cgccgaggcc 660
cgccaccacc tgttccagta g 681
<210> 37
<211> 846
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagaag 720
ctcagccatg gcttcccgcc ggcggtggcg gcgcaggatg atggcacgct gcccatgtct 780
tgtgcccagg agagcgggat ggaccgtcac cctgcagcct gtgcttctgc taggatcaat 840
gtataa 846
<210> 38
<211> 1407
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
atgggccgcg gctggggatt cttgtttggc ctcctgggcg ccgtgtggct gctcagctcg 60
ggccacggag aggagcagcc cccggagaca gcggcacaga ggtgcttctg ccaggttagt 120
ggttacttgg atgattgtac ctgtgatgtt gaaaccattg atagatttaa taactacagg 180
cttttcccaa gactacaaaa acttcttgaa agtgactact ttaggtatta caaggtaaac 240
ctgaagaggc cgtgtccttt ctggaatgac atcagccagt gtggaagaag ggactgtgct 300
gtcaaaccat gtcaatctga tgaagttcct gatggaatta aatctgcgag ctacaagtat 360
tctgaagaag ccaataatct cattgaagaa tgtgaacaag ctgaacgact tggagcagtg 420
gatgaatctc tgagtgagga aacacagaag gctgttcttc agtggaccaa gcatgatgat 480
tcttcagata acttctgtga agctgatgac attcagtccc ctgaagctga atatgtagat 540
ttgcttctta atcctgagcg ctacactggt tacaagggac cagatgcttg gaaaatatgg 600
aatgtcatct acgaagaaaa ctgttttaag ccacagacaa ttaaaagacc tttaaatcct 660
ttggcttctg gtcaagggac aagtgaagag aacacttttt acagttggct agaaggtctc 720
tgtgtagaaa aaagagcatt ctacagactt atatctggcc tacatgcaag cattaatgtg 780
catttgagtg caagatatct tttacaagag acctggttag aaaagaaatg gggacacaac 840
attacagaat ttcaacagcg atttgatgga attttgactg aaggagaagg tccaagaagg 900
cttaagaact tgtattttct ctacttaata gaactaaggg ctttatccaa agtgttacca 960
ttcttcgagc gcccagattt tcaactcttt actggaaata aaattcagga tgaggaaaac 1020
aaaatgttac ttctggaaat acttcatgaa atcaagtcat ttcctttgca ttttgatgag 1080
aattcatttt ttgctgggga taaaaaagaa gcacacaaac taaaggagga ctttcgactg 1140
cattttagaa atatttcaag aattatggat tgtgttggtt gttttaaatg tcgtctgtgg 1200
ggaaagcttc agactcaggg tttgggcact gctctgaaga tcttattttc tgagaaattg 1260
atagcaaata tgccagaaag tggacctagt tatgaattcc atctaaccag acaagaaata 1320
gtatcattat tcaacgcatt tggaagaatt tctacaagtg tgaaagaatt agaaaacttc 1380
aggaacttgt tacagaatat tcattga 1407
<210> 39
<211> 684
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
atgaccagca agctcgccgt ggctctgctg gctgccttcc tgatcagcgc cgccctctgc 60
gagggcttag gtgaagttgg gaactatttc ggtgtgcagg atgcggtacc gtttgggaat 120
gtgcccgtgt tgccggtgga cagcccggtt ttgttaagtg accacctggg tcagtccgaa 180
gcaggggggc tccccagggg acccgcagtc acggacttgg atcatttaaa ggggattctc 240
aggcggaggc agctatactg caggactgga tttcacttag aaatcttccc caatggtact 300
atccagggaa ccaggaaaga ccacagccga tttggcattc tggaatttat cagtatagca 360
gtgggcctgg tcagcattcg aggcgtggac agtggactct acctcgggat gaatgagaag 420
ggggagctgt atggatcaga aaaactaacc caagagtgtg tattcagaga acagttcgaa 480
gaaaactggt ataatacgta ctcatcaaac ctatataagc acgtggacac tggaaggcga 540
tactatgttg cattaaataa agatgggacc ccgagagaag ggactaggac taaacggcac 600
cagaaattca cacatttttt acctagacca gtggaccccg acaaagtacc tgaactgtat 660
aaggatattc taagccaaag ttga 684
<210> 40
<211> 2487
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
atgaggcttc gggagccgct cctgagcggc agcgccgcga tgccaggcgc gtccctacag 60
cgggcctgcc gcctgctcgt ggccgtctgc gctctgcacc ttggcgtcac cctcgtttac 120
tacctggctg gccgcgacct gagccgcctg ccccaactgg tcggagtctc cacaccgctg 180
cagggcggct cgaacagtgc cgccgccatc gggcagtcct ccggggagct ccggaccgga 240
ggggcccggc cgccgcctcc tctaggcgcc tcctcccagc cgcgcccggg tggcgactcc 300
agcccagtcg tggattctgg ccctggcccc gctagcaact tgacctcggt cccagtgccc 360
cacaccaccg cactgtcgct gcccgcctgc cctgaggagt ccccgctgct tgtgggcccc 420
atgctgattg agtttaacat gcctgtggac ctggagctcg tggcaaagca gaacccaaat 480
gtgaagatgg gcggccgcta tgcccccagg gactgcgtct ctcctcacaa ggtggccatc 540
atcattccat tccgcaaccg gcaggagcac ctcaagtact ggctatatta tttgcaccca 600
gtcctgcagc gccagcagct ggactatggc atctatgtta tcaaccaggc gggagacact 660
atattcaatc gtgctaagct cctcaatgtt ggctttcaag aagccttgaa ggactatgac 720
tacacctgct ttgtgtttag tgacgtggac ctcattccaa tgaatgacca taatgcgtac 780
aggtgttttt cacagccacg gcacatttcc gttgcaatgg ataagtttgg attcagccta 840
ccttatgttc agtattttgg aggtgtctct gctctaagta aacaacagtt tctaaccatc 900
aatggatttc ctaataatta ttggggctgg ggaggagaag atgatgacat ttttaacaga 960
ttagttttta gaggcatgtc tatatctcgc ccaaatgctg tggtcgggag gtgtcgcatg 1020
atccgccact caagagacaa gaaaaatgaa cccaatcctc agaggtttga ccgaattgca 1080
cacacaaagg agacaatgct ctctgatggt ttgaactcac tcacctacca ggtgctggat 1140
gtacagagat acccattgta tacccaaatc acagtggaca tcgggacacc gagctcgagc 1200
ggcagcggag ccaccaactt cagcctgctg aagcaggccg gcgatgtgga ggagaatcct 1260
ggccccatga ttcacaccaa cctgaagaaa aagttcagct gctgcgtcct ggtctttctt 1320
ctgtttgcag tcatctgtgt gtggaaggaa aagaagaaag ggagttacta tgattccttt 1380
aaattgcaaa ccaaggaatt ccaggtgtta aagagtctgg ggaaattggc catggggtct 1440
gattcccagt ctgtatcctc aagcagcacc caggaccccc acaggggccg ccagaccctc 1500
ggcagtctca gaggcctagc caaggccaaa ccagaggcct ccttccaggt gtggaacaag 1560
gacagctctt ccaaaaacct tatccctagg ctgcaaaaga tctggaagaa ttacctaagc 1620
atgaacaagt acaaagtgtc ctacaagggg ccaggaccag gcatcaagtt cagtgcagag 1680
gccctgcgct gccacctccg ggaccatgtg aatgtatcca tggtagaggt cacagatttt 1740
cccttcaata cctctgaatg ggagggttat ctgcccaagg agagcattag gaccaaggct 1800
gggccttggg gcaggtgtgc tgttgtgtcg tcagcgggat ctctgaagtc ctcccaacta 1860
ggcagagaaa tcgatgatca tgacgcagtc ctgaggttta atggggcacc cacagccaac 1920
ttccaacaag atgtgggcac aaaaactacc attcgcctga tgaactctca gttggttacc 1980
acagagaagc gcttcctcaa agacagtttg tacaatgaag gaatcctaat tgtatgggac 2040
ccatctgtat accactcaga tatcccaaag tggtaccaga atccggatta taatttcttt 2100
aacaactaca agacttatcg taagctgcac cccaatcagc ccttttacat cctcaagccc 2160
cagatgcctt gggagctatg ggacattctt caagaaatct ccccagaaga gattcagcca 2220
aaccccccat cctctgggat gcttggtatc atcatcatga tgacgctgtg tgaccaggtg 2280
gatatttatg agttcctccc atccaagcgc aagactgacg tgtgctacta ctaccagaag 2340
ttcttcgata gtgcctgcac gatgggtgcc taccacccgc tgctctatga gaagaatttg 2400
gtgaagcatc tcaaccaggg cacagatgag gacatctacc tgcttggaaa agccacactg 2460
cctggcttcc ggaccattca ctgctaa 2487

Claims (42)

1.一种在宿主细胞的指定位点整合多种外源基因的方法,所述方法包括以下步骤:
1)制备“锚定”的宿主细胞,所述“锚定”的宿主细胞包含位点特异性重组酶识别序列LoxPwt、LoxP1和PGK启动子驱动的正筛选序列;
2)制备含有外源基因的定点整合载体系列,其中包括:
第一定点整合载体,其使用第一载体制备,包含第一外源基因,第一抗生素抗性基因、位点特异性重组酶识别序列LoxPwt、LoxP4和LoxP2;
第二定点整合载体,其使用第二载体制备,包含第二外源基因,第二抗生素抗性基因、位点特异性重组酶识别序列LoxPwt、LoxP1和LoxP5;
3)使用第一定点整合载体转染宿主细胞,并用第一抗生素筛选出第一抗生素抗性、第二抗生素敏感的克隆;
4)使用第二定点整合载体转染步骤3)得到的克隆,并用第二抗生素筛选出第二抗生素抗性、第一抗生素敏感的克隆;
其中,所述指定位点选自GAPDH基因的区域。
2.根据权利要求1所述的方法,其中,在步骤1)中,所述正筛选序列为Puro-T2A-d1EGFP,其氨基酸序列如SEQ ID NO:9所示。
3.根据权利要求1所述的方法,其中,在步骤1)中,所述“锚定”的宿主细胞通过打靶载体获得,所述打靶载体含有指定位点的同源左右臂、位点特异性重组酶识别序列LoxPwt、LoxP1和正负筛选序列。
4.根据权利要求3所述的方法,其中,所述打靶载体依次含有GAPDH同源左臂、Zeocin-T2A-TK的负筛选序列、Puro-T2A-d1EGFP的正筛选序列,Cre-LoxP系统中的位点特异性重组酶识别序列LoxPwt和LoxP1、GAPDH同源右臂和白喉霉素A链(DTA)的负筛选序列。
5.根据权利要求4所述的方法,其中,所述打靶载体的DNA序列如SEQ ID NO:10所示。
6.根据权利要求1所述的方法,其中,在步骤2)中,所述含有外源基因的定点整合载体系列还包括:
第三定点整合载体,其使用第一载体制备,包含第三外源基因,第一抗生素抗性基因、位点特异性重组酶识别序列LoxPwt、LoxP4和LoxP2。
7.根据权利要求6所述的方法,其中,在步骤2)中,所述含有外源基因的定点整合载体系列还包括:
第四定点整合载体,其使用第二载体制备,包含第四外源基因,第二抗生素抗性基因、位点特异性重组酶识别序列LoxPwt、LoxP1和LoxP5。
8.根据权利要求1所述的方法,其中,在步骤2)中,根据拟整合的基因制备相应的载体。
9.根据权利要求6所述的方法,其中,所述方法还包括步骤5):使用第三定点整合载体转染步骤4)得到的克隆,并用第一抗生素筛选出第一抗生素抗性、第二抗生素敏感的克隆。
10.根据权利要求7所述的方法,其中,所述方法还包括步骤6):使用第四定点整合载体转染步骤5)得到的克隆,并用第二抗生素筛选出第二抗生素抗性、第一抗生素敏感的克隆。
11.根据权利要求8所述的方法,其中,所述方法还包括步骤7):根据拟整合的基因制备相应的载体依次整合,得到在指定位点整合多种基因的宿主细胞。
12.根据权利要求1、6或7所述的方法,其中,在步骤3)和4)中,所述第一抗生素抗性基因和第二抗生素抗性基因分别选自以下的两个:
潮霉素B基因、嘌呤霉素抗性基因、遗传霉素基因、杀稻瘟菌素基因、腐草霉素基因。
13.根据权利要求1、6或7所述的方法,其中,在步骤3)和4)中,所述第一抗生素抗性基因和/或第二抗生素基因还通过自动切割肽段连接示踪蛋白的基因序列。
14.根据权利要求13所述的方法,其中,所述示踪蛋白选自d1EGFP或DsRed-E2。
15.根据权利要求1所述的方法,其中,在步骤2)中,所述第一定点整合载体按排列顺序依次是:重组酶识别序列LoxPwt、不带启动子的抗性基因HygB序列或HygB-T2A-DsRed-E2序列、重组酶识别序列LoxP4、人延长因子1a(EF1a)启动子、第一外源基因和重组酶识别序列LoxP2。
16.根据权利要求1所述的方法,其中,在步骤2)中,所述第二定点整合载体按排列顺序依次是:重组酶识别序列LoxPwt、不带启动子的抗性基因Puro序列或Puro-T2A-d1EGFP序列、重组酶识别序列LoxP1、人延长因子1a(EF1a)启动子、第二外源基因和重组酶识别序列LoxP5。
17.根据权利要求6所述的方法,其中,所述第三定点整合载体按排列顺序依次是:重组酶识别序列LoxPwt、不带启动子的抗性基因HygB序列或HygB-T2A-DsRed-E2序列、重组酶识别序列LoxP4、人延长因子1a(EF1a)启动子、第三外源基因和重组酶识别序列LoxP2。
18.根据权利要求7所述的方法,其中,所述第四定点整合载体按排列顺序依次是:重组酶识别序列LoxPwt、不带启动子的抗性基因Puro序列或Puro-T2A-d1EGFP序列、重组酶识别序列LoxP1、人延长因子1a(EF1a)启动子、第四外源基因和重组酶识别序列LoxP5。
19.根据权利要求1、6或7所述的方法,其中,在步骤2)中,所述第一载体和第二载体分别选自质粒载体pBR322、pUC57、pBluescript、pCI-neo、pcDNA3.1。
20.根据权利要求1、6或7所述的方法,其中,在步骤2)中,所述第一载体和第二载体分别为pTOG3和pTOG4;其中,所述载体pTOG3核苷酸序列如SEQ ID NO:11所示;所述载体pTOG4核苷酸序列如SEQ ID NO:12所示。
21.根据权利要求1所述的方法,其中,在步骤2)中,将两种或更多种基因的序列用自动切割肽段连接作为第一外源基因;将另外的两种或更多种基因的序列用自动切割肽段连接作为第二外源基因。
22.根据权利要求21所述的方法,其中,所述自动切割肽段选自P2A、T2A或E2A。
23.根据权利要求22所述的方法,其中,所述自动切割肽段为P2A。
24.根据权利要求23所述的方法,其中,所述P2A序列如SEQ ID NO:16所示。
25.根据权利要求1所述的方法,其中,所述宿主细胞为哺乳动物宿主细胞。
26.根据权利要求1所述的方法,其中,所述宿主细胞为中国仓鼠卵巢(CHO)细胞。
27.根据权利要求1所述的方法,其中,所述宿主细胞为CHO-K1细胞株、CHO-S细胞株、CHO-DG44细胞株、CHO-DXB11细胞株、CHOZN细胞株、CHO-MK细胞株、CHL-YN细胞株。
28.根据权利要求1所述的方法,其中,所述指定位点为GAPDH基因在CHO-K1基因组中从3574544到3575484位的区域。
29.根据权利要求28所述的方法,其中,所述位点区域的序列如SEQ ID NO:8所示。
30.根据权利要求1所述的方法,其中:
a.在宿主细胞基因组的指定位点整合外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54、内质网氧化还原酶、成纤维细胞生长因子9、β1,4-半乳糖基转移酶1和/或α2,6-唾液酸转移酶1中的一个或多个;和/或
b.在宿主细胞基因组中使用类转录激活因子效应物核酸酶敲除岩藻糖转移酶8基因和/或谷氨酰胺合成酶基因和/或α2,3-唾液酸转移酶基因4和/或α2,3-唾液酸转移酶基因6。
31.根据权利要求30所述的方法,其中,在所述步骤a.中,将人源整合外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54三个基因用自动切割肽段连接作为第一外源基因;将内质网氧化还原酶、成纤维细胞生长因子9用自动切割肽段连接作为第二外源基因;将人源β1,4-半乳糖基转移酶1和/或α2,6-唾液酸转移酶1基因用自动切割肽段连接作为第三外源基因。
32.根据权利要求30所述的方法,其中,在所述步骤b.中,采用TALEN方法进行敲除。
33.根据权利要求32所述的方法,其中,敲除Fut8基因所构建的TALEN左右臂蛋白基因序列如SEQ ID NO:18和19所示,所靶向的区域是CHO细胞Fut8基因的10号外显子;
敲除GS基因所构建的TALEN左右臂蛋白基因序列如SEQ ID NO:22和23所示,所靶向的区域是CHO细胞GS基因的7号外显子;
敲除ST3GAL4基因所构建的TALEN左右臂蛋白基因序列如SEQ ID NO:26和27所示,所靶向的区域是CHO细胞ST3GAL4基因的5号外显子;
敲除ST3GAL6基因所构建的TALEN左右臂蛋白基因序列如SEQ ID NO:30和31所示,所靶向的区域是CHO细胞ST3GAL6基因的2号外显子。
34.根据权利要求1~33中任一项所述的方法改造的宿主细胞。
35.根据权利要求34所述的改造的宿主细胞,其中,所述改造的宿主细胞携带外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54、内质网氧化还原酶、成纤维细胞生长因子9、β1,4-半乳糖基转移酶1和/或α2,6-唾液酸转移酶1中的一个或多个。
36.根据权利要求34所述的改造的宿主细胞,其中,所述改造的宿主细胞至少携带外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54、内质网氧化还原酶、成纤维细胞生长因子9。
37.根据权利要求34所述的改造的宿主细胞,其中,所述改造的宿主细胞携带外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54、内质网氧化还原酶、成纤维细胞生长因子9、β1,4-半乳糖基转移酶1和α2,6-唾液酸转移酶1。
38.根据权利要求34所述的改造的宿主细胞,其中,所述改造的宿主细胞不表达岩藻糖转移酶8基因和/或谷氨酰胺合成酶基因和/或α2,3-唾液酸转移酶4和/或α2,3-唾液酸转移酶6中的一个或多个。
39.根据权利要求34所述的改造的宿主细胞,其中,所述改造的宿主细胞不表达岩藻糖转移酶8基因和/或谷氨酰胺合成酶基因。
40.根据权利要求34所述的改造的宿主细胞,其中,所述改造的宿主细胞不表达岩藻糖转移酶8基因、谷氨酰胺合成酶基因、α2,3-唾液酸转移酶4和α2,3-唾液酸转移酶6。
41.根据权利要求1~33中任一项所述的方法改造的宿主细胞、根据权利要求34~40中任一项所述的宿主细胞用于生产目的蛋白的用途。
42.根据权利要求41所述的用途,其中,所述目的蛋白为抗体。
CN201910264952.7A 2019-04-03 2019-04-03 改造宿主细胞基因组的方法及其用途 Active CN110564772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910264952.7A CN110564772B (zh) 2019-04-03 2019-04-03 改造宿主细胞基因组的方法及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910264952.7A CN110564772B (zh) 2019-04-03 2019-04-03 改造宿主细胞基因组的方法及其用途

Publications (2)

Publication Number Publication Date
CN110564772A CN110564772A (zh) 2019-12-13
CN110564772B true CN110564772B (zh) 2022-07-05

Family

ID=68773398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910264952.7A Active CN110564772B (zh) 2019-04-03 2019-04-03 改造宿主细胞基因组的方法及其用途

Country Status (1)

Country Link
CN (1) CN110564772B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108138201A (zh) * 2015-09-04 2018-06-08 托卡根公司 包含2a肽的重组载体
CN116323939A (zh) * 2020-07-17 2023-06-23 创观(苏州)生物科技有限公司 病毒不易感动物及其构建方法
CN114107176A (zh) * 2021-12-14 2022-03-01 广东省农业科学院动物卫生研究所 一种稳定表达非洲猪瘟CD2v蛋白的CHO细胞系及其构建方法和应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109096399A (zh) * 2017-08-11 2018-12-28 百奥泰生物科技(广州)有限公司 一种由基因组被编辑的cho宿主细胞产生的具有独特糖谱的重组抗体及其制备方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010010108A1 (en) * 2008-07-23 2010-01-28 Boehringer Ingelheim Pharma Gmbh & Co. Kg Improved production host cell lines
US8080415B2 (en) * 2008-09-26 2011-12-20 Eureka Therapeutics, Inc. Modified host cells and uses thereof
CN107760650B (zh) * 2016-08-22 2020-07-24 厦门大学 一种改造的cho细胞及其用途

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109096399A (zh) * 2017-08-11 2018-12-28 百奥泰生物科技(广州)有限公司 一种由基因组被编辑的cho宿主细胞产生的具有独特糖谱的重组抗体及其制备方法

Also Published As

Publication number Publication date
CN110564772A (zh) 2019-12-13

Similar Documents

Publication Publication Date Title
US6413777B1 (en) Method for integrating genes at specific sites in mammalian cells via homologous recombination and vectors for accomplishing the same
TWI226334B (en) Monoclonal antibodies against human CD40
CN110564772B (zh) 改造宿主细胞基因组的方法及其用途
AU2021240303B2 (en) Production cell line enhancers
DK2828384T3 (en) PROCEDURE FOR SURVIVING SENSITIVITY TO CHEMICAL DNA MODIFICATIONS OF CONSTRUCTED SPEECH DNA BINDING DOMAINS
CN101213203A (zh) 在转录后水平调节核酸表达的方法和组合物
KR20190089988A (ko) I형 점액다당류증에 대한 유전자 요법
CN113166779A (zh) 调控的基因编辑系统
KR20230056630A (ko) 신규의 omni-59, 61, 67, 76, 79, 80, 81 및 82 crispr 뉴클레아제
CN110835633A (zh) 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用
CN110684804A (zh) 递送外源rnp的慢病毒载体及其制备方法
KR20220149588A (ko) 대사성 간 장애의 치료를 위한 조성물 및 방법
KR20100051632A (ko) Fsh 제조 세포 클론
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法
CN110462044A (zh) 自引导整合构建体(sgic)
CN113637672B (zh) 一种碱基编辑工具及其构建方法
CN115707778B (zh) 重组柯萨奇病毒a10病毒样颗粒及其用途
CN114134141B (zh) 一种引入非天然氨基酸的嵌合体苯丙氨酸翻译系统及其构建方法
CN113652450B (zh) 慢病毒载体的制备方法及得到的慢病毒载体和应用
CN115707777B (zh) 重组肠道病毒a71病毒样颗粒及其用途
KR20190052888A (ko) 증가된 셀룰로오스 생산능을 갖는 코마가타이박터 속 미생물, 그를 이용하여 셀룰로오스를 생산하는 방법 및 상기 미생물을 생산하는 방법
KR102543504B1 (ko) 세포 손상 관찰을 위한 형광 단백질 변이체 및 이를 이용한 약물 독성 평가 방법
CN110777147A (zh) 一种ikzf3基因沉默的t细胞及其应用
CN112852651B (zh) 一种提高酿酒酵母生物转化生产氢化可的松产量的方法
HK40058785A (zh) 一種碱基編輯工具及其構建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant