[go: up one dir, main page]

CN108473982A - 用于蛋白生产的改进的真核细胞及其制备方法 - Google Patents

用于蛋白生产的改进的真核细胞及其制备方法 Download PDF

Info

Publication number
CN108473982A
CN108473982A CN201680075813.4A CN201680075813A CN108473982A CN 108473982 A CN108473982 A CN 108473982A CN 201680075813 A CN201680075813 A CN 201680075813A CN 108473982 A CN108473982 A CN 108473982A
Authority
CN
China
Prior art keywords
sequence
cell
erv
albumen
gag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680075813.4A
Other languages
English (en)
Inventor
N·梅尔莫德
P-O·迪鲁瓦
S·博斯哈德
P·勒玛斯亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Selexis SA
Original Assignee
Selexis SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Selexis SA filed Critical Selexis SA
Publication of CN108473982A publication Critical patent/CN108473982A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/861Adenoviral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0681Cells of the genital tract; Non-germinal cells from gonads
    • C12N5/0682Cells of the female genital tract, e.g. endometrium; Non-germinal cells from ovaries, e.g. ovarian follicle cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2511/00Cells for large scale production
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/13011Gammaretrovirus, e.g. murine leukeamia virus

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Reproductive Health (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Analytical Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

公开了具有降低的过去病毒/逆转录病毒感染的残留物负载的哺乳动物细胞和哺乳动物细胞系、及其生产和使用方法。

Description

用于蛋白生产的改进的真核细胞及其制备方法
相关申请的交叉引用
本申请要求2015年12月24日提交的美国临时申请62/387,375的权益,其全部内容通过引用纳入本文。
背景技术
目前有许多用于治疗药物的重组蛋白生产的稳定、高产量的哺乳动物细胞系。方法已得到优化和改进,使细胞系开发可从8-12个月缩减至4个月,同时提高产蛋白哺乳动物细胞系的产量和稳定性。
但是,仍然需要提供具有更好安全性的哺乳动物细胞系。
特别是,一般需要设计更有效的程序来分析和记录产生重组蛋白的哺乳动物细胞系,从而提高候选药物开发的生产量、速度和效力,并降低监管审批的成本以及对蛋白治疗剂不可预见和不良影响的风险。此外,通过在操作程序中实施更有效的细胞表征过程,会降低由于未检测到的细胞系污染物(例如支原体或外来病毒因子)所导致的生产部位关闭的危险。
所有经表征的哺乳动物细胞系和生物都含有曾经病毒(包括逆转录病毒)感染的残留物,导致病毒基因被整合到细胞基因组中。这些病毒残留物通常会被削弱和突变,但其中一些仍然被表达并导致产生可通过使用例如电子显微镜检测的病毒样颗粒。
CHO细胞是最广泛使用的,因为它们可以是用于表达异源基因的稳定宿主,具有很长的安全史,可以产生类似人的翻译后修饰的蛋白,并且相对容易被改造为能够在生物反应器中的无血清合成培养基中不贴壁且快速地生长。尽管如此,对用于在生物反应器中培养的高效的克隆细胞系的开发和记录通常是缓慢的并且是劳动密集的,仍然存在一系列的瓶颈和低蛋白产量的问题。
相对于其他细胞系,CHO细胞被认为对于治疗性蛋白生产是安全的。尽管如此,它们还含有需要监管记录的感染性病毒颗粒的残留物,因为这些残留物会导致CHO细胞释放病毒颗粒(Lie,Y.S.et al.,1994)。此外,整合的前病毒基因组有可能会发生重组、突变并由此改变性质,尽管频率较低。
非常需要基因组不含表达的病毒残留物并由此提供用于治疗性蛋白生产的更安全的哺乳动物细胞宿主的CHO细胞。
最近开发出了基于高通量DNA测序(下一代DNA测序或NGS)的技术来表征用于产生蛋白的细胞(例如CHO细胞)的基因组,这使得转基因整合位点被成功表征(Kostyrko etal.,2016)。
这里用于说明本发明、特别是用于提供有关实践的其他细节的出版物和其他材料,包括专利和专利申请,通过引用并入本文。为方便起见,这些出版物在以下文本中按作者和日期引用,并在所附参考文献中按作者名字的字母顺序列出。
鉴于在治疗性生产场所使用的细胞内持续检测到外来因子,FDA等监管机构正在施加压力,以使用在遗传上被更好表征的生产细胞系。FDA对外来因子进行了定义,其包括整合到细胞基因组中的逆转录病毒(参见FDA的《在用于传染病适应症的病毒疫苗的生产中使用的细胞物质和其他生物材料的产业表征和鉴定指南》,2010年2月)。然而,目前常常缺乏各种CHO细胞亚系的基因组的完整组装以及基因组序列的分析和解释所需的分析工具和生物信息学工具。
附图说明
图1a和1b显示了内源性逆转录病毒(ERV)的产生(a)及其在宿主基因组内潜伏存在后的离开(b)。逆转录病毒的增殖需要编码逆转录酶和该病毒周期的其他组分的基因的整合。ERV几乎只存在于动物界。
图2A显示了ESCRT(转运所需的内质体分选复合物)复合物(包含细胞溶质蛋白复合物,称为ESCRT-0、ESCRT-I、ESCRT-II和ESCRT-III以及许多辅助蛋白,包括ALIX)的组分以及其与病毒p6蛋白的相互作用,随之导致病毒囊泡的释放。
图2B显示经由隐马尔可夫建模(HMM)从翻译的gag(群特异抗原)开放阅读框(ORF)确定的允许出芽的ERV的不同氨基酸基序(“萌芽基序”)。
图3显示由gag区域编码的pp12中通过HMM(隐马尔可夫模型)确定出芽基序(参见图1C)的方式。基于已知是γ逆转录病毒共有的PPXY基序,确定来自第1组和第2组的CHO细胞ERV的重叠PPYP基序,并将其用作诱变靶标。还显示了如所列出的比较序列的第一个碱基对的编号。
图4A示意性地显示了如何基于称为CHO-M的CHO-K1细胞衍生细胞系的细胞基因组序列(来自测序和基因组组装工作)与来自典型的逆转录病毒元件(gag、pol、env、LTR(长末端重复序列))的序列的比较在细胞基因组中发现ERV元件。从发明人的CHO-M细胞基因组中获得77个命中结果。选择命中结果以进一步调查和确定共有序列。
图4B显示了进一步确定和分析共有序列的不同步骤以及与已发表的中国仓鼠基因组的比较。
图4C显示了在CHO-M细胞基因组中鉴定的特异性γ逆转录病毒ERV样序列的实验验证。使用与预测的整合病毒基因组任一侧的CHO基因组序列杂交的PCR引物进行EVR的验证(使用生物信息学分析对发现的C型γ逆转录病毒的序列进行验证)。在凝胶上,较大序列(上三个圆圈)是具有整合的基因组的等位基因,而没有病毒整合的等位基因在凝胶上移动更快(下三个圆圈)。
图5显示如何可以确定潜在危险的ERV,即可能通过例如细胞/基因组应激唤醒的ERV。应激的施加可以在不同时间、在不同类型培养物中并且/或者在多次转染后。表观遗传学数据提供ERV元件是否被转录的指示(表观遗传学数据,包括iRNA评估和甲基化状态)。在这些应激期间,感染性ERV更可能被唤醒并可被检测到。
图6显示了CRISPR/Cas9系统:使用向导RNA(也称为单向导RNA或sgRNA),(a)Carrol et al.,2013的系统和(b)Guilinger et al.,2014的系统,其中基因靶向(GT)由双链制动(DSB)触发,说明核酸酶促进GT。位点定向DSB将GT增加高达10000倍,但也可能引发不需要的脱靶突变。核酸酶活性在10%-80%之间变化。
图7显示了与DSB的修复竞争的三个主要修复通路,即非同源末端连接(NHEJ)、微同源介导的末端连接(MMEJ)和同源重组(HR)。修复的通路会影响基因组编辑结果,这可能导致缺失、基因转换或有效恢复原始序列。
图8显示了使用CRISPR/Cas9系统从DG44CHO细胞基因组中编码GFP一部分的供体质粒恢复功能性GFP编码序列。结果显示CRISPR/Cas9+供体(a)、仅CRISPR/Cas9(b)和仅供体(c)。可以看出,GFP重建需要CRISPR/Cas9以及供体质粒(在(a)中转染的细胞中约0.4%的GFP被修复)。在DG44系统中,仅用CRISPR/Cas9或仅用供体质粒没有可测量的GFP。
图9显示,经由图8的供体质粒(DG44CHO细胞)的基因校正百分比取决于影响不同修复通路的基因的沉默/敲低(经由siRNA)。NHEJ通路中基因的沉默增加了校正的百分比(连接酶4和XRCC4的沉默/敲低后增加20%)。HDR(同源介导的修复通路,HR和MMEJ)中基因的沉默/敲低通常减少校正百分比。HDR中某些基因的沉默增加了校正百分比(Nbs4,MRN复合物的一部分)。(x轴显示所使用的根据修复通路组织的不同沉默RNA,*表示显著性差异)。
图10显示了来自使用CRISPR/Cas9系统从CHO-M(CHO-K1变体)细胞基因组中编码GFP一部分的供体质粒恢复功能性GFP编码序列。用CRISPR/Cas9以及供体质粒转染导致了0.7%修复的GFP。因此,CHO-M细胞比DG44细胞更容易修复。
图11显示,图10的供体质粒整合(CHO-K1细胞)的百分比取决于影响不同修复通路的基因的沉默/敲低(经由siRNA)。HDR中的基因沉默(同源介导的修复通路、HR和MMEJ)降低了基因校正的百分比。该图还显示,来自所测试的3个克隆的结果的高度可重复性。沉默Rad51(经由siRad51),并因此减慢/关闭作为修复通路的HR在所有三个克隆中导致GFP阳性细胞的显著减少,而经由siXrcc4减慢/关闭NHEJ对GFP阳性细胞的百分位基本上没有影响。
图12A显示,来自图10(CHO-K1细胞)的基因校正的增加或减少取决于影响不同修复通路的基因的沉默(经由siRNA)。HR(同源修复)中的基因沉默部分地减少了校正的百分比(Rad51沉默/敲低),并且部分地增加了校正的百分比(Mre11沉默/敲低)。(x轴显示所使用的根据修复通路组织的不同沉默RNA,*表示显著性差异)。
图12B显示,限速HR和/或MMEJ蛋白表达的增加以剂量依赖性方式刺激了基因校正。可以看出,空载体提供了基础水平1,其中提供所述限速蛋白的表达载体的某些剂量将基因校正(上调各自基因)增加超过0.05倍、超过0.1倍、0.2倍、0.3倍、0.4倍或0.5倍。
图13显示,可能整合到细胞基因组中形成γ逆转录病毒相关ERV的三类γ逆转录病毒。该图表明,在分析经由PACBIO测序、针对GAL、POL、ENV、LTR序列进行搜索(80%覆盖度、80%序列同一性)获得的CHO基因组时,被发现存在并且活跃的每个类别(I-III)中的病毒中:发现了159个IAP(池内A型颗粒)序列和144个C型鼠类ERV样序列(粗体圈出),以及与GALV(长臂猿白血病病毒)有关的6个序列。
图14显示了基于来自CHO基因组的γ-逆转录病毒样ERV的77个GAG/POL/ENV串联序列的相邻连接共有序列树。如本文其他地方所述,第1组区别于第2组。
图15显示了选择从CHO-M细胞表征的CHOγ逆转录病毒样ERV转录物进行的GAGRNA比对。对齐序列下面的标记代表GAG开放阅读框中的突变。这两个组都非常保守,成为中国仓鼠进化的最新整合。
图16显示了在CHO-M细胞中鉴定的具体ERV元件的CpG DNA甲基化状态。在这些具体实例中,5'LTR ERV是低甲基化的,表明它们对应于转录的ERV。
图17显示了基于来自CHO基因组的γ逆转录病毒样ERV的121个GAG序列的相邻连接共有序列树。第1组和第2组都含有具有转录活性的ERV。发现第2组中圈出的序列具有活性,但包含终止密码子,发现第1组中多个圈出的序列具有活性,并且编码序列中不包含终止密码子。Gag和Pol cDNA分析与功能性ERV的存在一致。可能表达的ERV用黑色矩形框出。基于这些序列,确定第1组病毒的共有序列用于CRISPR/Cas9处理。
图18显示的策略用于来自图17的序列的CRISPR/Cas9介导的ERV灭活,其中以PPYP基序和豆蔻酰化基序作为靶标(两者均干扰ERV出芽)。箭头显示进行双链断裂的位置。对于sgRNA设计,参阅材料和方法。
图19显示了ERV灭活的两个实验设置,一个没有抑制HDR修复通路,一个抑制HDR修复通路,这里经由Rad51siRNA。经由mRNA(即cDNA)验证ERV中断,如通过端点PCR的测定,或通过测序以确定阅读框。
图20显示了,相对于用非特异性阴性对照siRNA处理的细胞水平,三个单独Rad51靶向siRNA的转染对Rad51mRNA水平和同源重组修复活性的效应。方块:相对于以非特异性阴性对照siRNA处理的细胞水平(该水平被设置为数值1),这三个Rad51靶向siRNA的混合物(siRad51 3x)的转染对Rad51mRNA水平(x轴)和同源重组修复活性(y轴)的效应。实心环:以单独使用的这三个siRNA(siRad51_1,siRad51_2,siRad51_3)中的每一个进行的类似分析,以证实与这三个siRNA的混合物对Rad51和HR抑制的相似影响。可以看出,Rad51siRNA是高效且特异的。
图21显示在cDNA PCR测定中当与具体sgRNA联合使用时CRISPR-Cas9的效应,其显示采用ERV特异性引物减少了ERV表达:第一和第二CRISPR实验显示重现性,第三显示在CRISPR-Cas9处理之前额外的RAD51siRNA介导的抑制的效应。观察到随PPYP5sgRNA以及RAD51敲低有强烈ERV mRNA信号损失(上面的凝胶)。在图底部,第一ERV组共有序列显示在最上面(SEQ ID NO.30),第一对照(未处理细胞)组PPYP基序序列显示在中间(SEQ IDNO.31),从PPYP7sgRNA处理的细胞获得的框外缺失的实例示于最下面(SEQ ID NO.32)。
图22显示了来自未处理CHO细胞(CHO WT)或来自用PPYP6sgRNA编程的Cas9核酸酶处理的CHO细胞的扩增的GAG ERV序列的测序电泳图,从第一次CRISPR实验(样品1)和第二次CRISPR实验(样品1)获得,如图21所示。用垂直线表示Cas9切割位点,之后观察处理细胞的序列混合物,显示50%或更多的GAG序列发生了突变。
发明内容
在一个实施方案中,本发明涉及工程化细胞,优选哺乳动物细胞系的工程化细胞,例如工程化CHO细胞,包括工程化CHO-K1例如CHO-M细胞,所述工程化细胞包含:
所述细胞的基因组,其中所述基因组包含一个或多个改变,所述改变包括:
作为所述基因组一部分的一个或多个,通常超过10、20、30、40、50、60、80、90或100个,内源性逆转录病毒(ERV)元件中的一个或者多个核酸的
-缺失,
-添加/整合,和/或
-置换。
ERV元件可以来自γ逆转录病毒ERV,包括考拉流行病毒(KoRV)ERV、小鼠乳腺肿瘤病毒(MMTV)ERV、小鼠白血病病毒(MLV)ERV。优选地,所述一个或多个改变可抑制或消除一个或者多个,优选超过60%、70%、80%、90%、95%或100%的,所述ERV的释放,或者可适于抑制或消除一个或者多个,优选超过60%、70%、80%、90%、95%或100%,的所述ERV。
所述一个或多个改变的(ERV)元件可以是gag基因、pol基因和/或env基因或来自gag基因、pol基因和/或env基因(优选编码MA(基质)、CA(壳体)、NC(核壳)的gag基因)、编码蛋白例如pp12或p6的另外的结构域,并且/或者可以是ERV的长末端重复序列(LTR)。
具体地,所述一个或者多个ERV元件可编码Gag(群抗原)蛋白、Pol(逆转录酶)蛋白和/或Env(包膜)蛋白。
所述添加/插入、缺失或置换可以包含多于2、3、4、5、10、15、20、25、30、40、45、50、55、60、65、70、75、80、85、90、95、100、150或200个核酸。
可以使所述改变靶向所述一个或多个(ERV)元件,所述ERV元件可以是或可以来自一个或多个gag基因、pol基因和/或env基因,优选gag基因,并且可以对所述基因的序列进行例如编码标记物蛋白如GFP(绿色荧光蛋白)的转基因的靶向整合,或者可以对所述基因的序列进行导致显性负性表型的氨基酸置换。
所述ERV元件可以来自gag基因,并且所述元件中的至少1、2、3、4、5、6、7、8、9、10个或更多个,或者10%、20%、30%、40%、50%、60%70%、80%、90%、95%、98%、99%或全部可以包含所述改变。
所述改变可以在EVR元件的共有序列中,并且所述共有序列的长度可以是至少5、10、15、20、25、30、35、40、45、50个碱基对,优选15-25个,或者30-50个碱基对(比较图21B)。
所述工程化细胞可以不释放或基本不释放ERV。
所述细胞还可以包含编码、抑制或激活重组通路的一个或多个蛋白的异源核酸序列,和/或编码抑制重组通路的一个或多个蛋白表达的一个或多个序列或蛋白的异源核酸序列,所述重组通路的一个或多个蛋白优选Nbs1、Mre11、Rad51、连接酶1和/或连接酶3。
所述异源核酸序列可作为载体存在/由优选不整合到细胞基因组中的载体表达。
所述工程化细胞还可以进一步包含编码一个或多个标记物蛋白例如GFP(绿色荧光蛋白)的异源供体DNA,所述异源供体DNA优选在载体上。
所述工程化细胞可以进一步包含转基因。所述转基因可以是编码标记物蛋白如GFP的标记物基因和/或生物治疗剂,优选地,其可由整合到基因组中的载体表达。
所述一个或多个改变可以是或可以包括以非肉豆蔻酰化氨基酸对一个或多个所述ERV元件(例如gag基因或来自所述gag基因的ERV元件)中豆蔻酰化基序内的一个或者多个肉豆蔻酰化氨基酸的置换。
为此目的,对细胞进行修饰以增加HR/MMEJ表达(参见图12A和图12B),这通过在所述细胞中提供/表达至少瞬时序列,例如以编码HR和/或MMEJ蛋白如Pad51、Lig3、Ercc1、Pold3的瞬时表达载体的形式,和/或诸如siRNA序列如siMRe11的序列或其编码载体。
ERV元件例如gag基因或来自gag基因的ERV元件可以包含PPYP基序,编码该PPYP基序的(i)序列和/或(i)的序列侧翼最多达20或30个核酸的序列可以包含所述改变。
所述工程化细胞可以是CHO细胞,并且可以在一个或多个SEQ ID 1、2、3、4中或与其具有超过90%或95%序列同一性的序列中(优选在所述序列的ERV元件内)具有一个或多个缺失、添加和/或置换。
所述工程化细胞可以是CHO细胞,并且可以在第1组ERV的共有序列如SEQ IDNO.30中或在与之具有超过90%序列同一性的序列中具有一个或多个缺失、添加和/或置换,并且其中具有缺失、添加和/或置换的序列不再编码功能性Gag蛋白。
本发明还涉及一种用于改进的基因组编辑的方法,其包括:
(i)提供或引入非天然存在的/异源的系统,用于在细胞例如感兴趣的细胞的靶核酸序列中形成单链制动或双链制动,所述靶核酸序列例如ERV元件的共有序列,优选为gag基因或者来自gag基因的ERV元件的共有序列,以及进一步地
(ii)在所述细胞中提供或引入:
(a)编码或激活一个或多个所述重组通路中的一个或多个蛋白的异源核酸序列,和/或
(b)编码抑制/降低一个或多个所述重组通路中的一个或多个蛋白的表达的一个或多个序列(例如siRNA或蛋白)的异源序列,其中(i)的所述异源系统和/或(ii)(a)和/或(ii)(b)的序列优选在感兴趣的细胞中瞬时表达。
所述异源序列可编码、激活或灭活重组通路的一个或多个蛋白,特别是同源重组(HR)通路中的一个或者多个蛋白,特别是Rad51、Nbs1、Mre11、连接酶1和/或连接酶3。
标记物基因如GFP可以通过同源重组插入到靶核酸序列中。包含标记物基因的细胞可以优选地被选择。
上文(a)的异源序列可编码、激活或灭活MNR复合物的蛋白,如Nbsl和/或Mre11,和/或(b)的所述异源序列可编码抑制同源重组(HR)通路的一个或者多个蛋白例如Rad51、Nbs1、Mre11、连接酶1和/或连接酶3的表达的序列或者蛋白。
可通过非同源末端连接(NHEJ)或微同源介导的末端连接(MMEJ)将缺失或插入引入所述一个或多个ERV元件。
所述异源序列可以是整合型载体或优选非整合型载体的一部分或由整合型载体或优选非整合型载体表达。
用于将单链或双链制动物引入靶核酸序列的非天然存在的/异源的系统可以是CRISPR/Cas9系统或可以以其为基础。
所述一个或多个ERV元件中的肉豆蔻酰化基序内的一个或多个肉豆蔻酰化氨基酸可以用非肉豆蔻酰化氨基酸置换。
编码PPYP基序的序列和/或所述基序侧翼最多达10、20或30个核酸的序列可以包含改变。
抑制例如HR蛋白如Rad51的表达的序列可以仅在细胞中瞬时表达。
本发明还涉及工程化细胞,优选哺乳动物细胞,例如工程化CHO细胞,包括CHO-K1细胞,其优选不释放病毒颗粒/基本上不释放病毒颗粒,尤其是在标准培养条件下和/或应激培养条件下,并且其中所述细胞的基因组包含一个或多个改变,所述改变包括:
在一个或多个,通常超过10、20、30、40、50、60、80、90或100个,内源性逆转录病毒(ERV)元件中的一个或者多个核酸的
(a)缺失,
(b)添加/整合,和/或
(c)置换,
所述细胞的基因组优选通过本文所述方法中的任一种产生。
本发明还涉及一种试剂盒,其包含:
(i)在一个容器中的编码至少一个核酸酶的至少一个非整合载体,例如CRISPR,
(ii)在同一个或另一个容器中的一个或者多个向导RNA或编码所述一个或者多个向导RNA的序列,所述向导RNA靶向ERV元件中的基序,
(iii)在同一个或者另一个容器中的一个或者多个siRNA或者编码一个或者多个siRNA的序列,和
在另一个容器中的如何在细胞内提供(i)、(ii)和(iii)的说明书。
编码靶向ERV元件中基序的一个或者多个向导RNA和/或编码一个或者多个siRNA的序列可以是载体的一部分。本文描述的任何载体可以仅被瞬时表达和/或可以是(i)的非整合载体。ERV元件可编码Gag蛋白。该基序可以是豆蔻酰化基序或PPXY基序,特别是PPYP基序。siRNA可以针对HR通路的基因。
具体实施方式
经工程化以产生工程化细胞的本发明细胞,优选哺乳动物细胞/真核细胞,能够在细胞培养条件下得以维持。标准细胞培养条件为30-40℃,优选在37℃或在约37℃,例如在用于生产重组蛋白的全合成培养基中。这类细胞的非限制性实例是非灵长类真核细胞,例如中国仓鼠卵巢(CHO)细胞,包括CHO-K1(ATCC CCL 61)细胞和SURE CHO-M细胞(CHO-K1的衍生细胞),以及幼仓鼠肾细胞(BHK,ATCC CCL 10)。灵长类真核宿主细胞包括例如人宫颈癌细胞(HELA,ATCC CCL 2)和293[ATCC CRL 1573]以及3T3[ATCC CCL 163]和猴肾CV1细胞系[ATCC CCL 70],也由SV40转化(COS-7,ATCC CRL-1587)。术语工程化表示已被改变的细胞,例如通过用例如转基因序列转染和/或通过突变。由于本领域技术人员将容易理解,即使在如本文所述进行工程化之前,这些细胞也是非天然存在的细胞。上述细胞,特别是各种CHO细胞,通常用于生物技术应用,例如用于治疗性蛋白的生产,并且在本文中被称为感兴趣的细胞。如本领域技术人员将容易理解的,除了上述提及的细胞以外的其他细胞也可以是感兴趣的细胞,只要它们被用于生物技术应用,特别是用于表达例如治疗性蛋白。
逆转录病毒基因组中编码的三个主要蛋白是Gag、Pol和Env。由gag基因编码的Gag(群抗原)是一种多蛋白,它被加工成决定逆转录病毒核心的基质和其他核心蛋白,包括核蛋白核心颗粒。Pol是由pol基因编码的逆转录酶,具有RNase H和整合酶功能。其活性导致病毒的双链DNA预整合形式,并且通过整合酶功能将其整合到宿主基因组中,并且还通过RNase功能在整合到宿主基因组中后进行逆转录。Env是包膜蛋白,由env基因编码,位于决定病毒向性的病毒的脂质层。
内源性逆转录病毒(ERV),例如来自γ-逆转录病毒属的病毒,包括考拉流行病毒(KoRV)、小鼠乳腺肿瘤病毒(MMTV)、小鼠白血病病毒(MLV),是出现在任何动物基因组中(包括例如在仓鼠基因组中和相关物种的基因组中)的外来因子。ERV保留在基因组中,对于其基因组整合于其中的细胞可能具有某些优势,包括提供遗传多样性的来源和对抗其他病毒性病原体的保护。但是,它们会变得具有传染性。癌症和/或表观遗传(epigenetic)修饰可以增加ERV苏醒。基于与115种病毒的数据库的同源性比较,Lewis等人在CHO细胞中鉴定出了403种可能的逆转录病毒蛋白。Lewis等人报道,其mRNA的40%被表达,由此表明这其中有许多可能仍然是合成性逆转录病毒组分(Lewis et al.,2013,增刊)。在本文中,使用C型鼠逆转录病毒的序列作为比较工具(从1994年出版物获得的数据)。该组有四个物种,如SIR(瑞士生物信息学院)主办的Viralzone网站(2015年12月)所述。它们也经常在小鼠基因组中出现并且已知会在小鼠中引起癌症。然而,如本领域技术人员将理解的,许多其他逆转录病毒的序列可以用于搜索感兴趣的细胞中的ERV。
根据本发明的工程化细胞可以包含在大部分区域与其所来源细胞例如CHO-K1细胞的基因组相同的基因组。然而,作为这些基因组的一部分的至少一个或多个,通常是多个,ERV元件将包含如本文所述的改变。
根据本发明的ERV元件主要描述了在相应非整合型病毒中提供功能性实体的ERV核酸序列的区段。如本领域技术人员将会理解的,往往这些区段的一部分在整合型病毒DNA中被破坏或缺失。因此,包括在该定义中的是所有基因(gag、pol、env),其次是其下文所示和图2B所示的部分,以及存在于细胞基因组中的其截短形式和/或修饰形式。如果gag基因是它们的来源,则ERV元件被称为例如来自gag,但它们不一定编码完整的功能性Gag蛋白。据说编码Gag蛋白的ERV元件编码功能性Gag蛋白。
gag基因产生Gag前体蛋白,其由未被剪接的病毒mRNA表达。Gag前体蛋白在病毒成熟过程中被病毒编码的蛋白酶(pol基因的产物)切割为主要四个较小的蛋白,被称为MA(基质)、CA(壳体)、NC(核壳)和另一蛋白结构域(例如鼠白血病病毒中的pp12或HIV中的p6)。
MA多肽来源于前体蛋白的N-末端肉豆蔻酰化末端。大多数MA分子保持附着在病毒颗粒脂质双层的内表面上,稳定颗粒。
CA蛋白形成病毒颗粒的圆锥形核心。
Gag的NC区负责特异性识别逆转录病毒的所谓包装信号。该包装信号包含位于病毒RNA的5'末端附近的四个茎环结构,足以介导将异源RNA掺入病毒颗粒中。NC通过两个锌指基序介导的相互作用与包装信号结合。
另一个蛋白结构域介导前体蛋白Gag和辅助蛋白Vpr之间的相互作用,导致Vpr掺入到组装病毒颗粒中。HIV中的p6区还含有一个所谓的晚期结构域,这是从感染细胞有效释放出芽病毒颗粒所需的。(Hope&Trono,2000)。
病毒蛋白酶(Pro)、整合酶(IN)、RNase H和逆转录酶(RT)在Gag-Pol融合蛋白的情形下表达。Gag-Pol前体通常由核糖体移码事件产生,该事件由特定的顺式作用RNA基序(Gag RNA远端区域中的七核苷酸序列,后接短茎环)触发。当核糖体遇到这个基序时,它们在不中断翻译的情况下将大约5%的时间分配给pol阅读框。核糖体移码的频率解释了为什么Gag和Gag-Pol前体以约20:1的比率产生。
在病毒成熟过程中,病毒编码的蛋白酶将Pol多肽从Gag切割下来,并对其进一步消化以分离蛋白酶、RT、RNase H和整合酶活性。这些切割并非全部有效发生,例如,大约50%的RT蛋白保持与RNase H连接,作为单一多肽(p65)(Hope&Trono,2000)。
pol基因编码逆转录酶。在逆转录过程中,聚合酶制备存在于病毒颗粒中的单链基因组RNA的二聚体的双链DNA拷贝。RNase H从第一条DNA链中去除原始RNA模板,允许合成DNA的互补链。聚合酶的主要功能性物质是异二聚体。所有pol基因产物均存在于释放的病毒颗粒壳体内。
IN蛋白介导原病毒DNA插入感染细胞的基因组DNA中。这个过程由IN的三个不同的功能介导。
Env蛋白由单剪接的mRNA表达。Env首先在内质网中合成,随后其迁移通过在其中进行糖基化的高尔基复合体。Env糖基化通常是感染性所需要的。细胞蛋白酶将该蛋白切割成跨膜结构域和表面结构域。(Hope&Trono,2000)。
基因组的一些ERV以病毒样颗粒的形式从细胞释放,而另一些则不会。但是,通常,被释放的ERV具有较高的变得具有感染性的潜力。因此,通常有利的是,如本文所述使细胞工程化从而其能够不表达和不释放或者基本不表达和不释放ERV,优选在标准培养条件下或者应激培养条件下。如果包含如此工程化细胞的细胞培养物与其未经历本文所述ERV释放减少程序的对应物相比,释放少于50%、少于40%、少于30%、少于20%、少于10%、优选5%的ERV,则基本上不释放ERV。这样的对应物例如可以是市售的CHO-K1细胞。不表达或者基本不表达意指:通过PCR和测序分析可检测到少于50%、少于40%、少于30%、少于20%、少于10%、优选5%的未突变Gag mRNA序列。不释放意指:如通过cDNA PCR测定所评估的那样,例如如图21所示,或者从QIAGEN,QuantiTect Rev.Transcription所获得的那样,没有出现或者基本没有出现可检测到的病毒序列释放。如本领域技术人员也将认识到的那样,已经被工程化为在1、2、3、4、5、6、7、8、9、10个ERV元件中包含灭活蛋白/肽生产的核酸序列改变的细胞也可以是有利的,并且是本发明的一部分。实际上,在某些实施方案中,仅通过一个或多个突变保持(在适当情况下)ERV可能在所感兴趣的细胞内所发挥积极作用来改变作为该细胞基因组一部分的一个或者多个ERV元件是有利的。然而,如下面所讨论的,本发明的某些实施例特别适用于高拷贝数的ERV(每个细胞多于30个、40个或50个ERV),并且能够实现经改变的细胞不表现出各个ERV组分的任何表达。
异源核酸序列是在根据本发明进行工程化之前不出现在细胞中的核酸序列,而相关类型的核酸序列可能非常好地存在于细胞中。用于本发明上下文的转基因是这样的异源核酸序列,特别是编码给定成熟蛋白(在本文中也称为DNA编码蛋白)、编码前体蛋白或者编码并不编码蛋白的功能性RNA(非编码RNA)的脱氧核糖核苷酸(DNA)序列。将转基因分离并导入细胞以产生转基因产物。根据本发明的一些优选的转基因可编码标记物蛋白,例如GFP(绿色荧光蛋白)。这些可用于检测ERV元件的成功整合,由此可用于检测ERV元件的改变/灭活。其他转基因是编码例如最终由所讨论的细胞生产的蛋白的那些转基因,所述蛋白如免疫球蛋白(Ig)和Fc-融合蛋白和其他蛋白,特别是具有治疗活性的蛋白(“生物治疗剂”)。根据本发明,添加包括整合,例如靶向的整合。然而,本领域技术人员会理解,在整合过程中,某些核苷酸可能在受体基因组中丢失。这些整合是本发明的一部分,并且被认为是添加。
在编码蛋白的DNA的上下文中,本文所使用的术语转基因不应包括非转录侧翼区域,例如RNA转录启动信号、启动子或增强子。其他优选的转基因包括编码功能性RNA的DNA序列。因此,在本文上下文中使用术语转基因,此时指通过转染(其在本发明的上下文中还包括转导,即通过病毒载体引入)引入细胞例如真核宿主细胞并且编码感兴趣的产物(“转基因表达产物”,例如“异源蛋白”)的DNA序列。该转基因可以功能性连接于信号肽编码序列,该信号肽编码序列编码信号肽,该信号肽继而介导和/或促进跨内质网和/或细胞质膜的易位和/或分泌,并在分泌前或分泌过程中被除去。
启动子序列或仅启动子是被宿主细胞识别而用于表达一个或多个核酸序列的核酸序列。启动子序列含有调节多核苷酸表达的转录调控序列。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列,包括突变型启动子、截短型启动子和杂合型启动子,并且可以获自编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因。根据本发明的启动子包括诱导型启动子和非诱导型启动子。核酸序列在对所述核酸发挥其功能的启动子的控制下。本发明的细胞/载体通常含有这样的启动子。
核酸序列改变是在根据本发明工程化之前不在细胞中出现的改变,例如添加/插入、缺失和/或置换。
如本文所用,“基因组编辑”是指对基因组序列的修饰(“编辑”),并且可以包含至少一个核苷酸的缺失、至少一个核苷酸的添加/插入、或至少一个核苷酸的置换。被编辑的基因组序列在本文中称为靶核酸序列。靶向的插入是在具体的预定靶位点发生的插入。基因组编辑工具将双链或单链断裂引入基因组,例如通过核酸酶或切口酶,并且至少部分依赖于细胞重组机制(参见下面的讨论)来修复这些断裂。这些工具通常还包含序列特异性DNA结合模块。ZFN(锌指核酸酶)和TALEN(转录激活剂样效应核酸酶)通过诱导DNA双链断裂实现宽范围的遗传修饰,刺激易错的非同源末端连接(NHEJ)或具体基因组位置的同源介导修复(HDR)。
CRISPR(成簇的规律间隔短回文重复序列)系统的序列特异性由小RNA确定。CRISPR基因座由一系列由“间隔”序列分开重复序列构成,所述“间隔”序列与“噬菌体”基因组和其他可移动遗传元件相匹配。重复-间隔序列阵列被转录为长的前体,并在重复序列内被处理以形成小crRNA,其界定由CRISPR系统切割的靶序列(也称为原间隔序列)。对于切割,通常需要在紧邻靶区域的下游存在序列基序,称为原间隔序列相邻基序(PAM)。CRISPR相关(cas)基因通常位于重复-间隔序列阵列的侧翼,编码负责crRNA(CRISPR RNA)生物发生和靶向的酶促机制。Cas9是使用crRNA向导链来界定切割位点的dsDNA内切核酸酶。将crRNA向导链加载到Cas9上发生在加工crRNA前体的过程中,需要该前体的小RNA反义序列、tracrRNA和RNAse III。与使用ZFN或TALEN进行基因组编辑相反,改变Cas9靶特异性不需要蛋白工程,而只需要设计短crRNA向导链,也称为sgRNA。
迄今为止,已经在基因组编辑方案中采用了三个不同的Cas9核酸酶变体。首先是野生型Cas9,它可以位点特异性切割双链DNA,导致双链断裂(DSB)修复机制的激活。DSB可以通过细胞非同源末端连接(NHEJ)通路来修复,导致破坏被靶向的基因座的插入和/或缺失(indel)。或者,如果提供了与被靶向基因座具有同源性的供体模板(参见图7),则可以通过允许进行精确置换突变的同源介导修复(HDR)通路来修复DSB。
通过开发仅具有切口酶活性的被称为Cas9D10A的突变体形式,Cas9系统被进一步设计以提高精确度。这意味着它切割一条DNA链,而不会激活NHEJ。相反,当提供了同源修复模板时,DNA修复仅通过高保真HDR通路进行,导致indel突变减少。因此,当基因座由被设计用于产生相邻DNA缺口的配对Cas9复合物靶向时,Cas9D10A在许多应用中在靶特异性方面更具吸引力。
在本发明的上下文中,确定ERV元件的特定序列或共有序列,以通过例如以上系统之一界定切割位点。这种特定序列或共有序列的碱基对长度优选为5个至50个,优选10个至4050个、或15个至25个、或25个至50个、或30个至50个。共有序列可以含有例如1、2、3、4或5个错配(相对于彼此具有超过60%、70%、80%、90%或95%的互补性),只要仍然可以进行切割。参见例如图21。上述系统被称为非天然存在的系统或异源系统,这意味着它们在根据本发明进行工程化之前被引入到细胞中,而不是细胞的一部分。
根据本发明的载体是能够转运另一核酸例如待由该载体表达的转基因的核酸分子,所述另一核酸已与所述载体连接,通常所述另一核酸已经整合到所述载体中。例如,质粒是一种载体类型,逆转录病毒或慢病毒是另一种载体类型。在本发明的优选实施方案中,载体在转染之前被线性化。表达载体包含异源调控元件或处于所述异源调控元件的控制下,所述异源调控元件被设计用于进一步转录和/或表达由表达载体携带的核酸序列例如转基因。调控元件包含增强子和/或启动子,但还包含本文所述的多种其他元件。在非病毒载体中,转座子特别具有吸引力,因为它们能够在宿主基因组内的多个基因座处以高频率整合单拷贝的DNA序列(整合载体)。与病毒载体不同,据报道,一些转座子不优先整合至细胞基因近处,因此它们更小可能引入有害的突变。此外,转座子容易产生和处理,通常包含含有侧翼为反向重复序列的货物DNA的转座子供体载体和转座酶表达辅助质粒或mRNA。开发了几种转座子系统来动员多个细胞系中的DNA而不干扰内源性转座子拷贝。例如,最初从甘蓝蠖度尺蛾分离的PiggyBac(PB)转座子可有效将货物DNA转移到多种哺乳动物细胞中。
在本发明的上下文中,载体,特别是非整合载体,也可以用于基因或功能性RNA的瞬时表达。瞬时表达是有限时间的表达,表达的时间段取决于载体设计和培养条件。然而,瞬时表达是指至少24小时但通常不超过7天的表达。
当表观遗传调控元件被放置在质粒载体上转基因近处时,可以将它们用于保护货物DNA免于不想要的表观遗传效应。例如,被称为基质附着区(MAR)的元件被认为会增加货物DNA的基因组整合和转录,同时防止异染色质沉默,例如强效的人MAR1-68。它们还可以作为绝缘物发挥作用,由此阻止相邻细胞基因的激活。因此,MAR元件已被用于介导质粒载体或病毒载体中的高表达和持续表达。对于瞬时基因表达,可以使用非整合载体(有时称为附加型载体),例如质粒或非整合型慢病毒(NIL)载体。它们可以在宿主细胞内稳定地或瞬时地维持和复制。
载体的载体序列是不包括任何“其他”核酸(如转基因)以及诸如MAR等遗传元件的载体的DNA或RNA序列。
术语序列同一性是指核苷酸序列或氨基酸序列的同一性的量度。通常,将序列对齐以获得最高阶匹配。“同一性”本身在本领域中具有公认的含义,可以使用公开的技术来计算。(参见例如:Computational Molecular Biology,Lesk,A.M.,ed.,OxfordUniversity Press,New York,1988;Biocomputing:Informatics and Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993;Computer Analysis of SequenceData,Part I,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,New Jersey,1994;Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987;和Sequence Analysis Primer,Gribskov,M.and Devereux,J.,eds.,M Stockton Press,NewYork,1991)。虽然存在多种方法来测量两个多核苷酸或多肽序列之间的同一性,但术语“同一性”被本领技术人员充分理解为定义在序列中的给定位置处的相同核苷酸或氨基酸(Carillo,H.&Lipton,D.,SIAM J Applied Math 48:1073(1988))。
任一具体核酸分子是否与例如SEQ ID NO.1、2、3或4的γ逆转录病毒样序列或其一部分(参见例如图18中公开的序列)至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同,可以使用已知的计算机程序常规地确定,所述计算机程序例如用于初始序列比对的DNAsis软件(Hitachi Software,San Bruno,Calif.)随后采用用于多序列比对的ESEE 3.0版DNA/蛋白序列软件(cabot@trog.mbb.sfu.ca)。
氨基酸序列是否与例如由SEQ ID NO.1、2、3或4表示的蛋白或其一部分至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同,可以使用已知的计算机程序如BESTFIT程序常规地确定(Wisconsin Sequence Analysis Package,Version8for Unix,Genetics Computer Group,University Research Park,575Science Drive,Madison,Wis.5371 1)。BESTFIT使用Smith and Waterman,Advances in AppliedMathematics 2:482-489(1981)的局部同源性算法,以找到两个序列之间最佳的同源区段。
当使用DNAsis、ESEE、BESTFIT或任何其他序列比对程序来确定具体序列是否与根据本发明的参照序列例如95%相同时,设置参数,以使同一性百分数在全长的参照核酸或氨基酸序列上进行计算,并且允许最高达参照序列总核苷酸数5%的同源性缺口。
可以使用基于Brutlag等人(Comp.App.Biosci.(1990)6:237-245)的算法的FASTDB计算机程序来确定用于确定查询序列(本发明序列)和目标序列之间的最佳整体匹配的另一优选方法,也称为全局序列比对。在序列比对中,查询序列和目标序列都是DNA序列。通过将U转换成T可以比较RNA序列。所述全局序列比对的结果以同一性百分数表示。在DNA序列的FASTDB比对中使用以计算同一性百分数的优选参数为:矩阵=等价矩阵,k-tuple=4,错配罚分=1,加入罚分=30,随机化组长度=0,截止分数=1,空位罚分=5,空位大小罚分=0.05,窗口大小=500或目标核苷酸序列的长度,以较短者为准。
例如,与本发明的参照核苷酸序列具有95%“同一性”的多核苷酸与该参照序列除以下之外都是相同的:相对于编码该多肽的参照核苷酸序列,该多核苷酸序列可以包含平均每100个核苷酸最高达5个点突变。换句话说,为了获得具有与参照核苷酸序列至少95%相同的核苷酸序列的多核苷酸,该参照序列中最多达5%的核苷酸可缺失或用另一个核苷酸置换,或该参照序列总核苷酸的最多达5%的多个核苷酸可以被插入到该参照序列中。查询序列可以是完整序列、ORF(开放阅读框)或如本文所述具体描述的任何片段。
NCBI Basic Local Alignment Search Tool(BLAST)(Altschul etal.J.Mol.Biol.215:403-410,1990)可以从几个来源(包括National Center forBiotechnology Information(NCBI,Bethesda,MD))和在互联网上获得,用于与序列分析程序blastp、blastn、blastx、tblastn和tblastx结合使用。可以在NCBI网站上获得BLAST以及如何使用此程序确定序列同一性和序列相似性的说明书。
本发明包括与本文公开的序列及其任何片段(特别是跨越PPYP基序左侧和右侧最高达40bp、30bp或20bp的片段)具有80%、85%、90%或更高序列同一性、95%或更高序列同一性、98%序列同一性或完全序列同一性的核酸和/或氨基酸分子。
重组通路
重组通路也称为DNA重组通路,是导致以下结果的细胞通路:DNA损伤修复,例如染色体双链断裂(DSB)后的DNA分子末端的连接;染色体DNA分子和非染色体DNA分子之间的交换或融合,例如染色体在减数分裂过程中的交叉或淋巴细胞中免疫球蛋白基因的重排。主要的重组通路是同源重组通路(HR)、非同源末端连接通路(NHEJ)和微同源介导的末端连接(MMEJ)和可选的末端连接(Alt-EJ)通路。
在本发明的背景下,经常通过互补的核酸序列产生一个或多个所述通路的某些成员的敲除。如果例如两条单链DNA链或两条单链RNA链的核苷酸可以形成稳定的氢键,例如鸟嘌呤(G)和胞嘧啶(C)之间的氢键,则核酸序列例如DNA或RNA与另一DNA或RNA互补。在细胞中,互补碱基配对允许例如细胞将信息从一代复制到另一代。在RNA干扰(RNAi)中,互补碱基配对允许使某些靶基因沉默或被完全敲除。基本上,siRNA、shRNA或miRNA序列通过使单条RNA链(例如,siRNA中的反义链)与宿主细胞的RNA特别是mRNA对齐,从而特异性降低或敲除靶基因的表达。两条核酸链之间的互补度可以从完全互补(每个核苷酸与其相对的核苷酸相对)变化到部分互补(50%、60%、70%、80%、90%或95%)。互补度决定了复合物的稳定性,从而决定了基因可以例如被敲除的成功度如何。因此,完全或至少95%互补是优选的。
同源重组(HR)、NHEJ和MMEJ的机制
转基因使用重组机制在双链断裂处整合到宿主基因组中。
双链断裂(DSB)是生物学上最有害的基因组损伤类型,可能导致细胞死亡或广泛的遗传重排。准确的修复对遗传信息的成功维持和传播至关重要。有两种主要的DSB修复机制:NHEJ和HR。当这两种主要DSB修复机制失效时,被称为MMEJ的第三种机制通常会生效。同源重组是一种在具有同源性的DNA序列之间进行遗传交换的过程,并且主要在细胞周期的S/G2期发挥作用,而NHEJ只是将两个断裂的DNA末端简单拼接在一起,该DNA末端通常没有序列同源性,其在细胞周期的所有阶段均起作用,但在有丝分裂细胞的G0-G1和S期早期期间特别重要。在脊椎动物中,HR、NHEJ和MMEJ对DSB修复有不同的贡献,这取决于DSB的性质和细胞周期的阶段。
NHEJ:基本机制
从概念上讲,NHEJ过程的分子机制似乎简单:1)一组酶捕获断裂的DNA分子,2)形成将两个DNA末端连接在一起的分子桥,3)将断裂的分子重新连接。为了进行这样的反应,哺乳动物细胞中的NHEJ机制涉及两个蛋白复合物,即与DNA-PKcs(DNA依赖性蛋白激酶的催化亚基)缔合的异二聚体Ku80/Ku70以及DNA连接酶IV及其辅因子XRCC4(X射线补充中国仓鼠基因4)以及许多蛋白因子,如Artemis和XLF(XRCC4样因子;或Cernunnos)。NHEJ经常被认为是容易出错的DSB修复,因为它只是将通常没有序列同源性的两个断裂的DNA末端拼接在一起,并且它会产生小的插入和/或缺失。NHEJ在整个细胞周期中提供修复DSB的机制,但在有丝分裂细胞的G0-G1和S期早期期间特别重要。在从细菌到哺乳动物的生物体中观察到NHEJ修复DSB,表明它在进化过程中是保守的。
在DSB形成后,NHEJ修复通路的关键步骤是断裂的DNA末端的物理并置。NHEJ的启动通过Ku70/80异二聚体蛋白复合物与断裂的DNA分子的两端缔合,以捕获、连接这两个末端在一起,并创建用于组装其他NHEJ关键因子的支架。DNA-结合的Ku异二聚体复合物将DNA-PKcs募集到DSB,一种属于PIKK(磷酸肌醇3-激酶样蛋白激酶家族)的460kDa蛋白,并激活其丝氨酸/苏氨酸激酶功能。两个DNA-PKcs分子跨过DSB一起相互作用,从而在两个断裂的DNA末端之间形成分子桥,并抑制它们的降解。然后,DNA末端可以直接连接,尽管从DSB产生的大部分末端必须在连接之前适当处理。根据断裂的性质,可能需要不同组合的加工酶的作用来产生相容的突出端(通过填补缺口),去除损坏的DNA或断裂周围的二级结构。NHEJ过程中的这一步被认为是造成NHEJ修复相关核苷酸偶尔丢失的原因。哺乳动物NHEJ中的一种关键的末端加工酶是Artemis,它是金属-β-内酰胺酶超家族酶的成员,被发现是大多数放射敏感性严重联合免疫缺陷(SCID)患者中的突变基因。Artemis具有针对含DNA ds-ss转换和DNA发夹的DNA-PKcs依赖性核酸内切酶活性和5'→3'核酸外切酶活性(Ma et al.,2002)。它的活性还受到ATM的调控。因此,Artemis似乎可能参与多种DNA损伤反应。然而,似乎只有一部分DNA损伤被Artemis修复,因为在Artemis缺失的细胞中没有观察到DSB修复的主要缺陷。
DNA缺口必须填充以能够进行修复。向DSB的添加的核苷酸添仅限于聚合酶μ和λ。通过与XRCC4相互作用,多核苷酸激酶(PNK)也被募集到DNA末端以允许DNA聚合和连接。最后,通过连接DNA末端来完成NHEJ,该步骤由含有XRCC4、DNA连接酶IV和XLF的复合物进行。其他连接酶可以部分地替代DNA连接酶IV,因为NHEJ可以在不存在XRCC4和连接酶IV的情况下发生。此外,研究表明XRCC4和连接酶IV不具有NHEJ以外的作用,而KU在其他过程中起作用,如转录、凋亡和对微环境反应。
NHEJ可以以不同方式降低或关闭,所述方式中的许多直接地影响上述提及的蛋白(例如异二聚体Ku80/Ku70、DNA-PKcs,但特别是DNA连接酶IV、XRCC4、Artemis和XLF(XRCC4样因子;或Cernunnos)、PIKK(磷酸肌醇3-激酶样蛋白激酶家族)。然而,尽管NHEJ在许多应用中是不希望的,但双链断裂的不准确修复通常会破坏双链发生断裂的基因的功能性,这在本发明的上下文中经常是需要的。因此,本发明还包括需要增加NHEJ的实施方案。
HR:基本机制
同源重组(HR)是一种非常准确的修复机制。同源染色单体作为修复断裂链的模板。当姐妹染色单体可用时,HR在细胞周期的S期和G2期发生。经典的HR主要表征为三个步骤:1)切除5'断端,2)与同源DNA双链体的链侵入和交换,以及3)拆分(resolution)重组中间体。不同通路可以完成DSB修复,取决于进行链侵入的能力,包括合成依赖的链退火(SDSA)通路、经典双链断裂修复(DSBR)、断裂诱导的复制(BIR)或者单链退火(SSA)通路。所有HR机制相互关联,并共用许多酶促步骤。
所有HR反应的第一步对应于核酸酶借助MRN复合物(MRE11、RAD50、NBN(先前的NBS1,用于奈梅亨破裂综合征1))和CtIP(CtBP相互作用蛋白)对5'端断裂的DNA链进行切割。由此产生的3'单链DSB能够搜索同源序列。同源双链体的侵入通过由用RAD51重组酶蛋白包被的3'ss-DNA组成的核线进行。复制蛋白A(RPA)是一种异源三聚体ssDNA结合蛋白,涉及与真核生物中的ssDNA相关的DNA代谢过程,该蛋白是组装RAD51线(RAD51-filament)所必需的。然后,RAD51与RAD52相互作用,RAD52具有环状结构以取代RPA分子并促进RAD51加载。Rad52对于酵母中的重组过程很重要。然而,在脊椎动物中,BRCA2(乳腺癌2型易感性蛋白)(而不是RAD52)似乎在链侵入和交换中起重要作用。RAD51/RAD52的相互作用通过RAD54的结合来稳定。在D环形成后,RAD54在重组中间体的成熟中也起作用。另一方面,BRCA1(乳腺癌1)分别与BARD1(BRCA1相关的RING结构域1)和BACH1(BTB和CNC同源1)相互作用以发挥连接酶和解螺旋酶DSB修复活性。BRCA1也以CDK依赖的方式与CtIP相互作用,并对DNA损伤反应中发生泛素化。因此,BRCA1、CtIP和MRN复合物在细胞周期的S期和G2期激活HR介导的DNA修复中发挥作用。
核线的侵入可导致形成称为置换环(D环)的异源双链体,并涉及双链体的一条链被侵入链置换并与另一条链配对。然后,几个HR通路可以使用同源序列作为模板来置换DSB周围的序列来完成修复。根据使用的机制,同源模板和断裂DNA分子之间的相互交换(交换)可能与HR修复相关,也可能与之不相关。交换可能具有重大遗传后果,例如基因组重排或杂合性丢失。
五个Rad51种内同源基因也涉及同源重组:Xrcc2、Xrcc3、Rad51B、Rad51C、Rad51D。Rad51种内同源基因形成两个类型的复合物:一个称为BCDX2,包含Rad51B、Rad51C、Rad51D和Xrcc2;另一个包含Rad51C和Xrcc3(CX3)。第一个复合物已经被认为参与Rad51-DNA复合物的形成和/或稳定化。第二个复合物的作用似乎是避开(branch)霍利迪连结体的迁移和分解。
如先前报道的那样,相对于NHEJ增加HR(参见美国专利公布20120231449,其通过引用整体并入本文)可用于增强和/或促进转基因表达。
减少或关闭HR的优点也已有描述(WO2014/1 18619,美国专利公开20150361451,其全部内容通过引用并入本文)。HR可能以不同方式减少或关闭,其中许多方式直接影响上述的参考蛋白(也参见表C;但注意,HDR不同通路之间没有明显区别)。通常使用RNA如siRNA或shRNA来实现减少或关闭。
微同源介导的末端连接(MMEJ)
当其他重组通路失败或不活跃时,DSB可以由另一个容易出错的修复机制,即MMEJ,修复。该通路仍需要充分表征,有时也称为可选的末端连接(alt-EJ),尽管目前还不清楚这两个过程是否基于相同的机制。与NHEJ不同,该通路最突出的特点为在断裂DNA链的比对过程中使用5-25bp的微同源序列,使得目标基因组缺失更大的核酸段,例如大于20、40、60、80、100、150、200bp,该结果不同于NHEJ通路,这在本发明的许多实施方案中是有利的。
MMEJ可以在细胞周期的任何时间发生并且独立于核心NHEJ和HR因子,即Ku70、连接酶IV和Rad52基因。相反,MMEJ启动依赖于其自身的一组蛋白,最重要的是包含Mre11、Rad50和Nbs1(酵母中为Xrs2)的MRN复合物(酵母中为MRX)的组分,还参与到HR的第一步中(Ma et al.,2003)。除了MRN复合物之外,许多其他因素也被认为参与MMEJ以及相关的DNA合成依赖性SD-MMEJ机制,例如CTBP相互作用蛋白、poly(ADP-核糖)聚合酶1(PARP1)、连接酶III/Xrcd复合物、连接酶I、DNA聚合酶θ(Yu and McVey,2010)和ERCC1/XPF复合物。然而,更多的蛋白也可能参与这个过程。
有人提出,在没有其他DNA末端结合蛋白(如Ku或Rad51)的情况下,DSB被PARP1识别,PARP1然后通过MMEJ启动它们的修复。该修复过程与HR类似,从5'到3'末端切除开始,这将所述断裂的每侧的短同源区域暴露出来。该处理步骤由MRN复合物进行并由CtIP调节。将互补区域(存在于3'ssDNA片段)配对在一起并且除去非互补区段(襟翼(flap)),这可能通过ERCC1/XPF复合物。然后,通过聚合酶(例如DNA聚合酶θ或δ)填补空位(如果有的话),并通过连接酶I或连接酶III/Xrcc1复合物连接断裂。
在DNA末端不存在直接的微同源区域时,这是最常见的情况,可以使用精确DNA聚合酶(例如聚合酶θ)复制被修复分子更远距离的片段。这个被复制的区域然后参与DNA末端的比对,这导致在所产生接合处的插入。这种更复杂的微同源介导修复的变体被称为合成依赖性MMEJ(SD-MMEJ)。
尽管MMEJ被认为是一种可选的重组修复通路,但它已被证明在B淋巴细胞中的IgH类转换重组过程中非常有效,这表明它可能不仅仅是一种备份机制。同样可能的是,一些DSB,如不兼容的突出端或钝端(这不是好的NHEJ靶标和/或HR靶标),可能会被MMEJ更有效地修复。
图12B显示限速HR和/或MMEJ蛋白表达的增加以剂量依赖性方式刺激基因校正。如可以看出,空载体提供基础水平1,其中提供所述限速蛋白的表达载体的某些剂量增加了超过0.05倍,超过0.1倍、0.2倍、0.3倍、0.4倍或0.5倍,由此上调基因校正。然而,如本领域技术人员可认识到的,任何所示蛋白如表C所示蛋白,可相应地被上调。
对可能的意外外来因子如病毒的检测
对感兴趣的细胞的基因组如CHO基因组中的所有病毒样元件的表征使得可以表征来自主细胞库细胞系的可能的新外来因子。这种方法可能取代目前应用于表征生产者细胞克隆的许多分析方法,这些分析方法是对由细胞系产生的任何生物治疗剂的监管审批所需要的。表征也可用于常规分析生产批次的情况。通过经由例如同源重组的靶向基因编辑所进行的有效CHO基因组编辑,可以用于去除存在于感兴趣的培养细胞(包括CHO细胞,如CHO-K1细胞)的基因组中的表达的逆转录病毒元件,导致病毒基因组负荷减少。
目前,有几种可用的商业服务可用于基于同源重组机制的基因编辑或转基因靶向整合。这些包括例如美国的SAFC-SANGAMO、法国的CELLECTIS和英国的HORIZON的锌指、Talen和CRISPR/Cas9核酸酶和腺病毒载体等。然而,这些工具中的两个工具,即锌指和Talen,仍难以获得和使用,因为必须针对被编辑的每个基因组序列工程化特定的核酸酶和/或载体,而第三种工具(CRISPR)的可获得性仍然很不确定。此外,同源重组仍然是细胞中相当低效的过程,要求筛选许多候选细胞系。因此,使给定基因的两个等位基因缺失通常需要多轮诱变和细胞克隆的分离和表征。因此,这些现有技术通常太慢且太昂贵,以至于不能实现对细胞基因组的系统工程化,其被要求例如以去除分散在CHO基因组中的多个表达的病毒基因残留物。CHO细胞中代谢通路和重组机制的工程化为通过重组通路之一实现更有效的基因组编辑方法铺平了道路,其中在大多数情况下,同源重组是优选的。
为了鉴定表达的ERV元件,CHO细胞系(例如SELEXIS'S CHO-K1衍生的CHO-M细胞)的基因组序列使用PACBIO(Pacific Bioscience Inc.)技术、以大约120倍的覆盖度来确定。基因组测序可以例如在PacBio RS II TM长读段测序仪中进行。
CHO基因组组装成大约7200个的叠连序列,显示为6.1Mb的N50大小。
CHO基因组中表达的ERV元件的鉴定和表征
将与已知的鼠逆转录病毒序列呈现序列相似性的CHO基因组序列使用BLAST算法进行鉴定,所述BLAST算法搜索病毒GAG、POL和ENV元件编码序列(序列保守度为至少80%),以及病毒长末端重复序列(LTR)的存在情况。
如图13所示,已经鉴定了三类γ逆转录病毒,所有这些都可能构成存在于感兴趣细胞中的ERV元件或ERV元件。经表达产生功能性蛋白的ERV元件在本文中特别有意义。感兴趣的细胞内的病毒序列,特别是逆转录病毒序列和/或微生物样序列,的数据库作为起点。那些细胞各自RNA序列的相应数据库可提供关于哪个DNA元件被实际表达并且可以编码功能性蛋白的信息。
构建相关DNA元件的数据库
鉴定了感兴趣的细胞(例如在生物治疗剂的生产中使用的细胞)的基因组中分散的来自过去的病毒和逆转录病毒的整合和逆转录事件的重复序列,特别是那些仍在表达的元件。
作为鉴定被表达的ERV元件的第一步,以大约120倍覆盖度确定CHO细胞系(SELEXIS'S CHO-K1衍生的CHO-M)的基因组序列。为此,使用了PACBIO(PacificBioscience Inc.)技术。这种广泛的测序可以例如在PacBio RS II TM原始长读段测序仪中进行。然而,如本领域技术人员可理解的,其他单分子DNA测序技术和装置也可以很好地使用。进行了相关基因座的特异性PCR扩增和靶向DNA测序,以获得例如CHO-M基因组序列版本3.0。
CHO-M基因组组装成大约7200个叠连序列,显示为6.1Mb的N50大小。
为构建潜在的外来微生物污染物的DNA或cDNA指示物序列的数据库,如根据FDA等机构目前要求筛选的外来因子列表,鉴定了与已知的鼠逆转录病毒序列呈现序列相似性的基因组序列。
为了绘制出它们在CHO-M基因组支架中的位置,将与已知的鼠逆转录病毒序列(例如ML2G序列,Lie et al,2014)呈现序列相似性的CHO-M基因组序列使用BLAST算法进行鉴定,所述BLAST算法以至少80%的序列保守性搜索病毒GAG、POL和ENV编码序列。对于这些编码序列中的每一个序列分别进行Blast比对。另外,还通过Blast以80%的阈值研究了病毒长末端重复序列(LTR)的存在情况。ML2G序列与病毒GAG、POL和ENV之间的平均序列同一性被确定为92%。GAG、POL和ENV与小鼠白血病病毒之间的平均序列同一性为66%。在某些情况下,ERV并不完整,只存在某些ERV元件。
所鉴定的ERV序列包括159个池内A型颗粒(IAP)II类逆转录病毒的成员,144个C型γ逆转录病毒(I类ERV),以及8个其他γ逆转录病毒,特别是GALV(主要类别和这些病毒序列的系统发生关系见图13)。在图4A中概述了对CHO细胞中的C型鼠类逆转录病毒序列的典型搜索。
进一步研究C型γ逆转录病毒ERV序列,ERV元件数目参见表A:
表A:
基因 GAG基因 Pol基因 包膜基因 LTR
提取的序列 124 138 98 191
在通过比对发现序列后,设计引物,并使用这些引物搜索相应的序列,用于使用PCR和DNA测序的实验验证。搜索基因、特异性整合标记、DNA甲基化和表达等的边界序列。
只有77个被分析的ERV序列具有产生ERV的所有元件(gag基因、pol基因、env基因)。这些ERV序列被进一步分析,结果如图14所示。还对这77个ERV序列进行了系统发生分析,可分为两组,即第1组(52)ERV和第2组(14)ERV。在这些组内具有97-99%的序列同一性,在这些组之间具有84-97%的序列同一性。两组的LTR不同。GAG编码序列非常保守。序列比较表明,在中国仓鼠进化期间,最近可能出现过两次逆转录病毒感染爆发,导致这些非常保守且可能具有功能的ERV(图15)。
此外,发现还存在编码对GAG功能重要的PPXY相关的PPYP基序的DNA序列。第1组ERV显示基因组中有1到12个差异或30bp整合,与相关功能性gag基因相比,第2组ERV显示gag基因中0到6个差异。
被鉴定的DNA元件的潜在表达的研究
为了评估哪个(些)ERV元件可被转录,使用PACBIO序列数据(Suzuki et al.,(2016))分析了它们的CpG DNA甲基化状态。这允许鉴定其LTR序列低甲基化的几个ERV,如对于表达允许性染色质结构和转录活性LTR启动子序列所预期的那样,如图16所例示。
RNA数据库的构建
对库存细胞(例如CHO-M主细胞)的若干独立mRNA制备物的进一步测序和分析可以被进行,以构建绘制到所述基因组和/或绘制到指示剂外来序列数据库的RNA(即cDNA)序列的数据库。该产品是表达的逆转录病毒/病毒的逆转录转座子以及细菌标记物基因和家族的集合,提供了每种类型元件的相对表达水平的表格。
不能归于基因组或线粒体基因组DNA的丰富RNA序列通过RT-qPCR实验验证。就可能的反式剪接事件搜索经实验验证的序列。将剩余的无法解释的序列与病毒序列、原核生物序列和真核生物序列的已有基因组进行同源性搜索,以可能将它们归于已鉴定的微生物种。相关的命中结果被添加到表达序列的数据库中。
专门构建由鉴定的DNA元件表达的RNA的RNA数据库的实例
在这里,具体ERV元件的转录进一步通过它们与使用总CHO(这里CHO-M)cDNA、细胞RNA的逆转录和PCR扩增产生的GAG cDNA的序列进行直接比较来进一步评估。这表明,第1组和第2组ERV元件都具有转录活性。基因组序列和cDNA序列的比较进一步表明,一个第2组ERV被转录,然而由于终止密码子,它不能表达功能性GAG蛋白(图17)。然而,几个被鉴定出的第1组ERV序列被表达,它们的RNA序列没有提前的终止密码子,因此它们似乎介导功能性GAG蛋白的表达。对相邻POL编码序列的分析显示它们也是功能性的,导致鉴定了作为用于从CHO细胞表达和释放逆转录病毒颗粒的非常强候选物的几个表达且保守的ERV。这些功能性第1组ERV的完整共有DNA序列显示在SEQ ID NO.1中,而在本文鉴定的第2组ERV的共有序列、IAP元件和其他γ逆转录病毒序列提供于SEQ ID NO 2、3和4。
从全基因组/游离基因测序表征外来元件:
提供了一个生物信息学软件包,用于快速鉴定(i)新的可移动遗传元件和外来元件(从全基因组/游离基因测序)以及(ii)已知微生物样基因的表达水平的显著变化,因为这些可能表明外来因子对细胞培养物的污染。污染需要与染色体重排区分开来。
在这里,基因组比较程序被用来设计自动化过程,以将小的基因组变化(如转座或病毒基因组整合)与大的染色体重排(例如大的染色体易位或重复事件)或者其他培养细胞所致污染区分开。
对上述区分过程的参数的确定使用从库存细胞(如CHO-M细胞)和从其衍生的细胞克隆获得的基因组序列和RNA序列,使用之前通过常规手段验证不存在外来因子的克隆。
将上述过程与上文获得的数据库一起使用,以鉴定在新的CHO细胞克隆分离期间引发的潜在基因组变化。相关的命中结果通过PCR和小规模DNA测序进行实验验证。
使用例如CHO-M细胞克隆的转录组进行类似的分析。使用生物信息学分析鉴定新的RNA序列或其表达水平显著改变的RNA序列。这些命中结果通过RT-qPCR进行实验验证。
首先通过生物信息学建模对检测过程的灵敏度进行验证,然后用已知量的逆转录病毒样序列或细菌(例如支原体)序列以及用参照材料实验性地掺入CHO-M核酸制剂。这提供了可依据“下一代测序”的给定深度(或基因组覆盖度)揭示的以病毒基因组数目/细胞基因组当量为单位的灵敏度阈值。
更有效编辑CHO细胞基因组和/或转录组的过程
经敲低或过表达重组活性中涉及的蛋白,对HR和HDR靶向的转基因整合和从CHO细胞基因组去除进行定量测定。
在此,构建含有单个基因组整合的GFP转基因(例如通过转座子载体)的几个独立的指示物CHO细胞系,并通过定量PCR和整合位点作谱来验证转基因整合。通过用对应于GFP编码序列末端的序列包围dsRed表达盒来构建指示物质粒。使用荧光测定和qPCR测定,对相对于正确靶向整合的GFP序列的自发突变的频率以及dsRed表达盒的非靶向整合的频率进行记录。或者,将一个或几个缺失的GFP编码序列整合到细胞基因组中,并且使用HR或HDR相关机制修复它们以恢复功能性GFP编码序列和荧光细胞。
在瞬时的siRNA介导的MMEJ蛋白和NHEJ蛋白敲低之后使用上述测定,以鉴定可能阻碍有效HR机制的限制性活性。在存在Cas9和靶向GFP的CRISPR向导RNA的表达载体的情况下,进行类似的测定,以评估HDR。平行地,编码CHO HR蛋白和HDR蛋白的cDNA被克隆并整合到表达载体中。这些cDNA与dsRed指示物质粒共转染,以鉴定限制CHO-M细胞中HR或HDR效率的活性。
进行上述敲低或过表达的组合以改善HR样事件的频率(参见图9至12)。基于以下各项评估和选择最有效的组合:i)上述单活性测定的结果,ii)CHO-M细胞中具体重组基因的mRNA水平,和iii)重组通路中的相对位置和由蛋白形成的多聚体结构。对这些组合进行测试,以去除整合到GFP中的dsRed序列,恢复功能性GFP,以鉴定使表达序列从CHO基因组有效地缺失的方法。
CHO-M基因编辑或表观遗传学编辑以去除感染因子DNA或RNA残余物
此处,来自CHO细胞系的表达的病毒基因组残余物被去除或沉默。如上测定的由CHO-M细胞表达的病毒样元件和逆转录病毒样元件使用上述优化方法进行HR或HDR靶向,以破坏功能性病毒序列,优选介导病毒颗粒释放的gag序列。
或者或伴随地,介导HR或HDR的机制被抑制,从而通过促进DNA切割位点处缺失的修复机制(例如NHEJ介导的机制和MMEJ介导的机制)促进病毒序列中DSB的修复,从而使病毒颗粒释放所需的gag序列缺失。
进行多轮基因组编辑,基因组病毒和RNA序列的减少将随后进行定量PCR。细胞分裂时间将在每轮后进行表征,以确保另外的基因组变化不会损害细胞的代谢特性。
测试合适工程化的细胞,如CHO-M细胞群,的稳定性和表达标志物(例如GFP)或治疗性(例如免疫球蛋白)蛋白的能力。产生亚克隆并对其进行类似的测定。使用本文所述的检测方法记录缺乏可能的附加外来因子的合适亚克隆。
确定和组装最有效细胞如CHO-M亚克隆的基因组序列,以记录基因组变化以及外来病毒样序列的减少。
为了使用CRISPR/Cas9基因组编辑方法特异性切割和突变表达的第1组ERV,设计了向导RNA以优先识别PPYP基序周围的序列或GAG序列的豆蔻酰化序列(图18和SEQ ID No5至12)。选择PPYP基序用于敲除方法,由此非HR DNA修复机制可导致GAG编码序列的缺失,这可能损害介导病毒颗粒出芽的该蛋白的功能性形式的表达。肉豆蔻酰化基序被靶向,以通过同源介导的HR DNA修复由不可修饰的对应物置换肉豆蔻酰化的氨基酸,从而产生显性负性版本的GAG,其两者均可以是非功能性的并且可以抑制可能保留的未突变GAG蛋白的功能,这基于HIV出芽已知需要HIV1GAG蛋白豆蔻酰化(Abdusetir Cerfoglio et al.(2014))。单个向导RNA(sgRNA)被设计为适合单体形式的CRIPR/Cas9,如图6所示(Carrol2013)。
将Cas9和sgRNA表达载体与dsRed表达载体共转染到CHO细胞中,并分选dsRed表达细胞以富集被有效转染并表达转基因的细胞(图19)。或者,用三个靶向Rad51的siRNA的混合物转染细胞,以降低Rad51的表达并减少通过同源重组机制的DNA修复。Rad51敲低效率的评估在Rad51mRNA水平、通过同源重组修复抑制突变GFP转基因的功能的恢复来进行,表明所有设计的siRNA特异性抑制Rad51表达和HR(图20)。
为了直接评估CRISPR/Cas9处理是否已正确靶向表达的ERV,将GAG RNA逆转录并进行PCR扩增。虽然,如所预期那样,GAG RNA容易从对照细胞中检测到,但用PPYP5sgRNACas9处理的细胞在独立转染实验中始终产生低的或不可检测的水平(图21的第1和第2CRISPR实验)。由于用PPYP6和PPYP13编程的Cas9处理在单独使用时不显著改变GAG RNA水平,因此评估了siRNA介导的Rad51活性的敲低是否可以增加这些CRISPR/Cas9处理的效应,这可能是可预期的,条件是这会阻止HR机制对被切割的gag基因有效修复,并因此可能导致容易发生缺失的可选的DNA修复通路。这被观察到是这种情况,因为先前的Rad51敲低在PPYP6或PPYP13和Cas9处理时(图21的第3次CRISPR实验)产生GAG mRNA信号的消失。
以前尝试过使用CRISPR/Cas或其他基于核酸酶的诱变系统来突变基因,但未使编码的mRNA消失,甚至对于低拷贝基因。对于高拷贝数ERV,包括细胞中拷贝数超过30、40或50的ERV,如在哺乳动物基因组中存在的,则预期其更加困难。因此,观察到在用PPYP5sgRNACas9核酸酶处理(图21的第1轮CRISPR实验)的细胞中不能检测到逆转录病毒RNA,这是非常令人惊讶的。此前尝试过使用瞬时转染来缺失或突变62个相关内源性逆转录病毒元件的POL基因,但是还是不能从猪细胞中去除它们,导致使用转座载体或病毒载体的CRISPR/CAS9元件的稳定表达(Yang L.et al.,2015)。即便如此,CRISPR/Cas持续17天的活性仅导致细胞37%的最大靶向频率,这可能是因为CRISPR/CAS的延长活性可导致毒性的脱靶切割效应。
所进行的实验表明,HR蛋白例如Rad51的敲低可用于通过有害的缺失以不转染siRNA的情况下观察不到的频率增加GAG基因失活的频率。
尽管提供了Rad51的敲低作为一个实例,但本领域技术人员会理解,其他HR蛋白的敲低将具有相当的结果。
因此,具有其他HR蛋白敲低的CHO细胞也在本发明的范围内。但是,具有53BP1、CtIP、Mre11、Rad50、连接酶III、Pold3(DNA聚合酶δ亚基3)、Xpf和BIm(布卢姆综合征RecQ样解旋酶)敲低的细胞(参见图9)特别包括在本发明中。表C提供了可被敲低的HR蛋白,以及可能被敲低或过表达的其他重组通路的蛋白的实例。然而,如本领域技术人员会理解的,表C是一种简化形式:表C中提及的一些蛋白具有双重功能(例如连接酶III),并且可以以不同类别列出。
不受任何特定理论的限制,可以通过同源重组来修复Cas9切割的ERV,以所述许多其他ERV之一作为同源模板,其可以通过使基于同源性通路的蛋白如Rad51的失活而被抑制。相反,在CRISPR/Cas9组分表达之前敲低Rad51表达的一些先前的尝试已经导致同源性指导的DNA修复通路的增加,这在当期望导致基因失活的缺失时必须避免(Davis,L.,andMaizels,2014和2016年)。其他研究发现,在CRISPR/Cas9-介导的DNA切割或TALEN-介导的DNA切割之后,Rad51过表达可增加靶向的基因整合(即敲入)研究中的同源性指导的DNA修复(Song J et al(2016))。在这里,显示RAD51有利于在多种类型CHO细胞中的HDR基因校正(图9和12),并且抑制同源重组活性,当在与ERV特异的DNA核酸酶结合使用时,能够大大增加ERV的突变。因此,当准备使多个等位基因失活时,例如在高拷贝数ERV的情况下,通常优选的实施方案是,相对于单独使用CRISPR/Cas9——这是本发明的另一个实施方案,将siRNA敲低(特别是HR通路的siRNA敲低)与具体CRISPR/Cas9方法相结合。
总体而言,与现有技术相比,CRISPR/Cas9组分的非常高的诱变活性出人意料地升高。不受限于任何特定理论,原因可能是Cas9核酸酶特异性地靶向表达的ERV,而不是非活性的ERV。然而,这不可能解释在最有效的环境中病毒RNA降低至检测不到的水平。因此,可能是具体的DNA切割事件能够导致表达的ERV的转录沉默。
最后,带有提前终止密码子的非编码突变的RNA通常通过无义介导的RNA衰变(NMD)机制在细胞内降解(Baker and Parker,(2004))。因此,接下来评估PPYP sgRNA是否可以介导可导致NMD介导的GAG RNA降解的框架外突变。作为一个实例,图21显示了这种移码突变,由第1组ERV的PPYP基序缺失11个核苷酸产生。
图22显示CRISPR/Cas-处理的CHO细胞的多克隆群体中所含的GAG基因的PCR扩增和测序结果。结果清楚地表明,在瞬时转染CRISPR/Cas9核酸酶组分的表达载体后,大部分GAG编码序列发生了突变,即使在使用中等活性的PPYP6sgRNA和不存在siRAD51处理时。
总之,得出的结论是,所提出的靶向CHO细胞内源性ERV的CRISPR/Cas9方法可用于根除或降低介导病毒颗粒释放的GAG蛋白的表达,并且这不需要延长的CRISPR/Cas表达或它们的表达载体稳定整合到细胞基因组中,并且对细胞培养没有潜在负面影响。因此,该方法可用于产生不能表达此类逆转录病毒蛋白的更安全的CHO细胞系。
材料与方法
细胞系
被编辑的细胞系是SURE CHO-M细胞系TM(SELEXIS SA,瑞士)(参见美国专利No.7,129,062和8,252,917以及公开的申请2011006117、20120231449和20130143264,其公开内容是通过引用并入本文)。
CRISPR/Cas9系统
对于基因组编辑,发明人使用哺乳动物密码子优化的化脓链球菌(Streptococcuspyogene)Cas9核酸酶。如前所述(Fu et al,2013)将单链向导RNA(sgRNA)序列克隆到哺乳动物gRNA表达载体MLM3636中。为了实现高敲除效率,测试了几个sgRNA靶位点/靶位点(PPYP:n=5;Myr:n=3)。使用发明人专用CHO-M基因组作为参考序列,使用CRISPRseek R软件包(Zhu et al.,2014)来鉴定具有最小脱靶位点的ERV特异性sgRNA。sgRNA序列被设计为杂交至靶位点附近,更准确地说是Myr基序和PPYP基序,以最大化CRISPR/Cas9对这些基因座的诱变潜能。含有5'20nt NGG 3'序列结构并且介导与突变位点隔开不超过25bp的DSB的所有可能sgRNA序列均使用CRISPRseek R软件包(Zhu et al.,2014)来检索。在所有潜在的sgRNA序列中,使用包括CRISPRseek(Zhu et al.,2014)、CRISPR序列扫描(SSC;Dana FaberInstitute crispr网站)和sgRNA评分器1.0(Dana Faber Institute crispr网站)在内的多种评分工具预测sgRNA效率。此外,使用发明人专用CHO-M基因组作为参照基因组,使用CRISPRseek R软件包(Zhu et al.,2014)鉴定具有脱靶位点最小的ERV特异性sgRNA。最终选择并测试了几个sgRNA序列/靶位点(Myr:n=3,PPYP:n=5),以鉴定具有最大突变潜能的sgRNA。Cas9(#43861)和gRNA表达质粒(#43860)购自ADDGENE(Cambridge,MA,USA)。
表B列出了许多示例性sgRNA
RNA干扰
由MICROSYNTH AG(Balgach,瑞士)设计并合成抗Rad51CHO同源物的小干扰RNA(siRNA)。使用三种具体Rad51siRNA的混合物使Rad51mRNA水平沉默,以使脱靶效应最小化。
BLAST分析排除了与其他靶点的同源性。使用三种非靶向siRNA(siNeg)的混合物作为对照。
对CHO-M基因组的修饰
根据制造商的方案使用Neon(INVITROGEN)转染CHO-M细胞。简言之,用100nM siRNA混合物转染400,000个细胞,48小时后,使用dsRed编码质粒作为转染对照,用CRISPR/Cas9系统重新转染700,000细胞。为了富集转染的细胞,使用流式细胞术在转染48-72小时后对大约100,000个dsRed阳性细胞进行多克隆分选。
如本领域技术人员可认识到的,上述描述不是限制性的,而是提供了本发明的某些实施例的示例。通过以上提供的指导,本领域技术人员能够设计出未在此具体阐述的多个替代方案。
表C列出了三个通路每一个中的一些关键基因(也参见美国专利公开20120231449,其全部内容通过引用并入本文)。表中还包括DNA修复蛋白,如MDC1和MHS2。在DNA损伤反应中需要MDC1来激活S期和G2/M期细胞周期检查点。然而,通过将Rad51保留在染色质中,MDC1还在Rad51介导的同源重组中起作用。(对于序列,参见WO 2014/118619、美国专利公开20150361451,其全部内容通过引用并入本文)
某些重组通路的选定的基因
参考文献:
Abdusetir Cerfoglio et al.,Structural elements in the Gag polyproteinof feline immunodeficiency virus involved in Gag self-association andassembly,Journa/of General Virology 95,2050-2059(2014).
Baker,K.E.;Parker,R.,Nonsense-mediated mRNA decay:Terminatingerroneous gene expression″.Current Opinion in Cell Biology 16:293-299(2004).
Carrol et al.,Staying on target with CRISPR-Cas,Nature Biotechnology31,807-809(2013).Davis,L.,and Maizels N.,Homology-directed repair of DNAnicks via pathways distinct from canonical double-strand breakrepair.Proc.Natl.Acad.Sci.USA 111,E924-E932(2014).
Davis,L.,and Maizels,N.,Two Distinct Pathways Support Gene Correctionby Single-Stranded Donors at DNA Nicks.Cell Reports 17,1872-1881(2016).
Food and Drug Administration(FDA),FDA’s Guidance for lndustryCharacterization and Qualification of Cell Substrates and Other BiologicalMaterials Used in the Production of Viral Vaccines for Infectious DiseaseIndications,February 2010,available at the Fda.gov website.
Fu et al.,High-frequency off-target mutagenesis induced by CRISPR-Casnucleases in human cells.Nat.Biotechnol.31,822-6(2013).
Guilinger et al.,Fusion of catalytically inactive Cas9toFokl nucleaseimproves the specificity of genome modification,Nature Biotechnology 32,577-582(2014)
Hope&Trono,HIV,Structure,Expression,and Regulation of the HIV Genome,Site Knowledge Base Chapter November 2000.
International Patent Publication WO 2014/118619(2014).
Kostyrko et al.,MAR-Mediated transgene integration into permissivechromatin and increased expression by recombination pathway engineering,Biotechno/ogy&Bioengineering,3October 2016online edition.
Lewis et al.,Genomic landscapes of Chinese hamster ovary cell linesas revealed by the Cricetulus griseus draft genome,Nature Biotechnology 31,759-765(2013),Supplement)
Lie,Y.S.et al.,Chinese hamster ovary cells contain transcriptionallyactive full-length type C proviruses.J.Virol.68:7840-7849(1994).
Ma et al.,Hairpin opening and overhang processing by an Artemis:DNA-PKcs complex in V(D)J recombination and in nonhomologous end joining.Cell108,781-794(2002).
Song J et al.,RS-1enhances CRISPR/Cas9-and TALEN-mediated knock-inefficiency,Nature Communicatiohs 7:10548(2016).
Suzuki et al.,Agln:measuring the landscape of CpG methylation ofindividual repetitive elements.Bioinformatics 32:2911-2919(2016).
US Patent Publication 20120231449(2012).
US Patent Publication 20150361451(2015).
Yang L.et al.,Genome-wide inactivation of porcine endogenousretroviruses(PERVs),Science 350:1101-1104(2015).
Zhu et al.,CRISPRseek:A Bioconductor package to identify target-specific guide RNAs for CRISPR-Cas9 genome-editing systems.PLoS One.9(2014).
序列表
<110> 思兰克斯有限公司
<120> 用于蛋白生产的改进的真核细胞及其制备方法
<130> IF180171S/P
<150> US62/387375
<151> 2015-12-24
<160> 32
<170> PatentIn version 3.5
<210> 1
<211> 8366
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> CHO-K1细胞的第一组类型ERV
<222> (1)..(8366)
<400> 1
tgtaccagac accagacctt gagaatatgc tgatctggaa tggctctgtg tctcatttga 60
accatccaat ggaaatgatt ctgtatttcg cctcatttga aagactctgt gtttcacctc 120
atttgaataa ctctgtactt tacctcattt gaataaccct gtatagcgcc tcatatacat 180
tgaccaatgg gaatagctct gtataatgcc tcattagaat tatccaatag aatccttgct 240
cctagcttgc gccttttttc ctatataagg accccttttc ccttggctcg gggcgcttag 300
ccacacagaa gctaagtcgc cccaggtacc tgcgtctcca ataaagcctc ttgtttttac 360
atccagttcg tggcctcgct gattcctggg tgtgtgggtc tccctctacg aaagtgcctc 420
ttcggggtct ttcatttggg ggctcgtccg ggattgagac ccgcccaggg accaccgacc 480
cacgtctggg aggtaagtgt tgtgcggatc cgctgttttg tcttgtctgg tctgagtctg 540
tcttgtgaat tgcgcttgcg tttgtagtat acagctgtgt acatttgtag gcggatccga 600
ggagggactg acgggtccga actcccgacc gcggctccag gagacgtcct ggtagcgttt 660
gaagccctca ggaagaggga tttgtatttt gaacttggga agccctcagg gtgagagatt 720
tgtactttga acttagatct atgactggac attttcccag tctctttgga gaaggccctc 780
ggcttgaggg atttgcaatc tttactgggg acgaggaagg agggccccct tcctcgactc 840
tctctcaatt ccttctgtcg actctctgtc gaaaccgcgc tgcgaaagtc tgttctgtgt 900
tattcggtct ttgtcttgta gctgtcattt gtgccctcct aagcctagaa actatgggca 960
aactgtcacc actcctttgt ccctaacact ctcccactgg aaagatgtac aggaatatgc 1020
tcataaccaa tctgttaatg tgcgtaaacg caaatggatt actctttgtt cttcagaatg 1080
gccgaccttt gatgtaggct ggccgcgaga tggtaccttt aacccccaga ctatattcca 1140
gataaaagag aagattatgg atcctggacc acacgggcat cccgatcaag tggcttatat 1200
cgtcacttgg gaggctttgg ttcaggaccc ccctccctgg gtacgtcctt tcttacatcc 1260
caagggcccc tctctccttc cccctctaac cgctccaacc gacccattcc ttcggcccta 1320
cacctcccac tcctttgatt cctcccaacc cccttcccat tccaaccttt accctaccgt 1380
gatgaaagac actaaggcta aagaaaagaa gacacctaag gtactccctc cgggagaaga 1440
ccagttggtt gatctattaa cggaggagcc cccgccatat ccgccactgc cgcccccacc 1500
agaggcagaa gcggactccg ccgctgcctt ggcggaagcg gccctgaccc ttcaccaatg 1560
gcttatcgac taagaggtcg tagggagcag cccgttccag attcaaccac tctgcccctc 1620
cgaactgggc tgaacggcca acctcagtat tggccattct cagcatcgga cctctataac 1680
tggaaaaata ataatccttc tttttctgca gaccccgtga ggctgacatc tctcatagag 1740
tcggtactca cgactcacca acccacctgg gatgattgtc agcagctttt gcaggtcctt 1800
ttaacctcgg aagagaaaca gcgcgtgcta ctagaagcac gaaaaaatgt cccaggagta 1860
aacgggcagc ccacccagct acccaatgaa attgatgcgg cttgccctct tgaaagacct 1920
gaatgggatt ttaccaccga agcaggtagg acccacctgc gtctctatcg ccagttgctg 1980
gtagcgggac tccgggggca ggacgcagac ccactaattt ggcccaggtg aagcagataa 2040
tacagggtgc ggaggaatca cctgccgctt ttctagagag attgaaagaa gcgtacagga 2100
tgtatactcc ctataatccg gaagatccag gtcaggccac caacgtttct atgtccttta 2160
tttggcaatc agccccggac ataagaaaca agcttcaaag gctagaaaat ctacagggat 2220
atacactcca agatttgttg aaggaagcag aacgtatttt taataagagg gaaacacaga 2280
cagaaagaga agaacgttgg agaaggaaac tcaggagaga gaggaaagac taagacagga 2340
agctgaggaa aaagaggttg cgagagaccg taagcggaat aaagaaatga gcaggttatt 2400
ggccacagta gtgacaggcc agagacagaa tagacagagg gatgacagaa gggggcccca 2460
cctggacagg gaccaatgtg cttactgtaa agaaaaagga cattgggcaa gagaatgccc 2520
taagaacccc cggccaagct tccaccgcca agggtttctg acctcctgaa cctagaagat 2580
tagaggagtc ggggccagga gcccccccct gagccaggat aacactgcaa gtcggggggc 2640
atccggtcac cttcctagtc gatacagggg cacaacattc cgttctgaat cggtcacccg 2700
gacccctgag tcacaggact gcatgggtac agggagctac aggcggaaag cagtaccatt 2760
ggactacaaa tcggcagctc cagctcgcga ccggtaaggt tatgcattct ttcctccatg 2820
tgccagactg cccctacccc ttactagacg ggacctattg accaaattaa aagctcaaat 2880
acactttgag aggtcagaag tcaaagtcac agggccagag ggaattcccc ttaccatctt 2940
gacaatgtcc atagaagatg aatatagact ccatgaaaag aggactaatt cgaacaatca 3000
ggaaaccctt gatcactggc ttgcggaatt tccccaagcc tgggctgaaa caggaggaat 3060
gggccttgcc attaaccagg ccccaattat agtaacctta aaagctgcca tccttcctgc 3120
atccgtcaga cagtatccaa tgcctaaaga agcccgcgaa ggaattcggc cacatattaa 3180
aaggttactt gaacaaggga ttctggtgcc ctgtaaatct ccttggaata cacccttgct 3240
acccgttagg aagccgggaa ctaatgacta ccggccagta caggacctga gagaagtcaa 3300
taaaaggata gaggacatac accctactgt ccccaaccct tacaatttgc tgagtggatt 3360
gccacctaac tatacctggt acacagtctt agatcttaaa gacgctttct tctgcctccg 3420
cctgcatccc accagccagc ctatatttgc ctttgaatgg caggacgcgg cccttggaat 3480
ctctgggcag ctgacttgga ctaggctacc tcaagggttt aagaacagcc ctaccctttt 3540
tgatgaagct ttacatcagg acctggcaga attccggtta ggtaccccgc tctaatcctc 3600
ttacaatatg tagatgacat tctcctggca gccaaaacca aagggaaatg caaggaaggc 3660
actcaagccc tcctccagac tcttgggagc ctaggtaccg ggcatccgcc aagaaggccc 3720
agatatgtca gaaacaggtg acctatttag gatacaagat aaaggatgga cgtcgatggc 3780
taacggaagc ccgtatgcga gccatcttag acattcccac cccacaaaat ccccgccaac 3840
tgagagaatt cttgggaacg gcaggcttct gccgcctatg gatccctggg tttgccgaaa 3900
tggcggctcc cctctacccc ctcactcggc caggggttgc ttttaaatgg gaagagcccc 3960
aaaagaaagc cttcaccgac atcaaaaagg ctctccttga atcaccagcc ctgggtctac 4020
cggacttagc taagccattt gaacttttta tagatgagaa ggagggctat gctaagggag 4080
tcctcaccca aaatctgggg ccttggagaa ggcccactgc atacctctcc aagaaattgg 4140
atcctgtggc atcgggatgg ccaccctgcc ttcgaatgat tgctgctata gccctgctgg 4200
taaaagattc tcacaagcta accttggggc agcctttgac catacatgcc cctcatgcag 4260
tagaggcagt catcagacag cctccagata gatggcttac taatgcccga atgactcatt 4320
accagactat gctgttagac aaagaccggg tccacttcgg gcctttggtg actctgaacc 4380
cagccaccct gctccccctc cctggggagc ccgaggctca tgattgctta caggtattgg 4440
ccgaggccca tggagcgaga tccgacctga ctgaccagcc tctacctagc ccggaccaca 4500
tctggttcac ggatggaagc agctttttgc atcaaggaga acgaaaggcg ggcgcggcag 4560
tcaccacaga gaatcaggtc gtctgggccc aggcactccc cctggaactt ccgcacagag 4620
ggcagaactc atagcactca cgcaggctct aaaattggca gaaggtaaga ggctcaccgt 4680
gtatacagac agtcgttatg cctttgccac tgcccatata catggagaaa tttacagacg 4740
gagggggctg cttacctccg aagggaaaga cattaaaaat aaggaggaaa tcctcgctct 4800
cttaagggct cttcatctgc ccgctgcctt aagtatcata cattgccctg gacaccaaaa 4860
agggattctt tcgaagcaag ggcaatcgaa gggcagactt ggctgcccga gaggcggccc 4920
tgaccacaga caccactaac ctcctggctc tagagcccac caacgaccat cccttcccct 4980
catgggacta tgaacaaaga gacatccaaa ccctagagaa attgggagcc gcaaaggaac 5040
caaacgggga ttggacttat gaaggaaaga ctgtcatccc ctaccgggta accaagtacc 5100
tagtgacatt tttacataag atgacacatc tgagctccaa gaagatgcgg gagctcctcg 5160
aacgagaaga ggaattcaat ttccttttgg gaaagaacga tattctaaaa caggtaactg 5220
agcaatgtga tgcgtgcgcc cgagtcaacg catccagact gaagcttcct cccgggaacc 5280
gggtcagagg ctaccggccc ggaacacatt gggagataga tttcactgag attaaaccag 5340
gaaaatatgg atacaagtat ctattaattt ttgtagacac cttttcagga tgggttaaag 5400
ccttccctac taaacatgaa acagccaaga tcgttactaa gaaattgctt gaagaaatct 5460
ttccccgtta tgggatgcct caggtattgg gaacagacaa tgggcccgcc ttcgtctccc 5520
aggtaagtca gtcagtggcc accttattgg ggattgattg gaaattacat tgtgcttata 5580
gaccccaaag ttcaggacag gtagaaagga tgaatagaac aatcaaggag actttaacaa 5640
aattgtcgct tgcaactggc actagagact gggtcctcct actcccccta gcactctacc 5700
gcgctcgtaa tacccctgga ccacatgggc tcacaccctt tgagatcctg tatggagtac 5760
ctactcctat cattaacttt cttgatcaag atgtctcaga ttttgctaac tccccttctc 5820
tccaagctca tttacaggcc tccaactagt acaacgggag gtctggaaac cccttgctca 5880
agcttataaa gaccagaggg accatcccac catcccccat tcctaccaga tcgggacact 5940
gtttgggtcc ggcgtcacca ggccaagaac cttgaacccc gctggaaggg accctacatc 6000
gttttgctta ccactcccac cgcactcaag gtagacggca ttgcagcttg gatacatgct 6060
tcacatgtaa agccagccca acccaccgat tcagccactg catcagaatg gaccgcacac 6120
cgcactcaaa atcctttaaa gataagactc tctcgtacac cctcctgttg attggttgtc 6180
tgtttacccc ccatgtagca actaaccccc acagggttta taatatcacc tggaaaatag 6240
ccaatctagg gaccggggaa atagccaacc tcagcactta tatagggact ctacatgatg 6300
ggttccctcc tctctatgtc gacctatatg acttagtagg gtctgattgg gatccctctg 6360
accaggaacc attcccaggg tacggatgcc accaccctgg ggaaggatag gaacaagaag 6420
caaggatttt tatgtttgcc ccggccataa accaactcat ggctgcgggg gccgcaggaa 6480
gggtactgtg caagatgggg atgtgaaacc acaggggagg cttactggaa accctcttcc 6540
tcttgggatt tcatcactct caaacggagg gagatcccag ggtacgcagg gaaaggacca 6600
tggagatgtg ggcaaagagc ctgcggacct tgttatgata gtgccggagg gggaggtttt 6660
caaggcgcca cccccggagg aaaatgcaac cctctcatcc taaggttcac agatgctgga 6720
aaaagaacta cttgggatag tcctaaggtc tggggactca ggctgcaccg agcagggaaa 6780
gatccggtga ctttattctc cctgtacaga caaattactc ccctaagcca acaatcagtt 6840
gggccaaaca tagtaatagc ggaccagaga tcccaaccca ttttcaagtc cctaaacccc 6900
ctaccgttcc taaagctatc actcctacac caggtgctgt caccttctcc cccaccccag 6960
atgccctaaa catcgagata accagagacc ctccaggtac cagagataga ttattacaat 7020
taatccaagg agtttaccaa gccttaaatt tttcagaccc caacaagact caggaatgct 7080
ggttatgcct agtttcccgg cccccatatt atgaaggcgt ggcaatactg ggcaactact 7140
ccaaccagac ctcagcacct accagttgcg gagctgctat gcagcacaag ctcacaatat 7200
ctgaggtctc aggaaagggg ctatgcatag gcaggattcc ttcctcacat caagaattat 7260
gtaaccaagt agagccatta tctcaggaca gccgatacct tgttgcccct tatggaactt 7320
attgggcttg cagtactggg ttgactccct gtgtctctac cactgttctc aacaccacca 7380
ttgacttttg tatattgata gaactttggc ccaaagtcac ataccaccaa cctgaatatg 7440
tttacagcgt actagagaaa tcaacccgat ataagaggga gccactaaag caaatagatc 7500
cagagtatct agagacctct gaatgaaaga ttccattcag ttacaagaga aatgggggaa 7560
tgaaagaccc ctctccctta gccctttctt tctcaagttt gtctcctctt cctcctgtcg 7620
gcggcttccc cgatccccac ccccggtggc ctttccccgc ccggcccgag aacaagcacc 7680
gggtggggcc ggcccgagaa caagcaccgg gtggggccgg cccgagaatg agcaccaggt 7740
gggccagccc gagaacgagc accgggtggg ctggcacgag ggcgagcacc aggtgggtca 7800
gcacgaggac aaacaccgag tgagccggcc tggagctctg cccctgagcc cccgccccgc 7860
ccgaagagaa acactccgtc ccaaggtctc cgccccaagg tcagccatca ggaaaagggg 7920
ggaattgagt ctgctgtacc agacaccaga ccttgagaat atgctgatct ggaatggctc 7980
tgtgtctcat ttgaaccatc caatggaaat gattctgtat ttcgcctcat ttgaaagact 8040
ctgtgtttca cctcatttga ataactctgt actttgcctc atttgaataa ccctgtatag 8100
cgcctcatat acattgacca atgggaatag ctctgtataa tgcctcatta gaattatcca 8160
atagaatcct tgctcctagc ttgcgccttt tttcctatat aaggacccct tttcccttgg 8220
ctcgggcgct tagccacaca gaagctaagt cgcccaggta cctgcgtctc caataaagcc 8280
tcttgttttt acatccagtt cgtggcctcg ctgattcctg ggtgtgtggg tctccctcta 8340
cgaaagtgcc tcttcggggt ctttca 8366
<210> 2
<211> 8667
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> CHO-K1细胞的第二组类型ERV
<222> (1)..(8667)
<400> 2
ctctctctct ctctcttggg ctagctaaat tacagaccaa gagaccaaga ccacccagaa 60
ccatttctga gaatagaagg tcagggcgtt atgactactt gtttgccaca caggatatct 120
gtggtcagcc atctggacgc ggagggagga actgccgggt ctgttgtaac cactgtgtac 180
ccaagataga gccaagtcag cttcgtctga ttaccagacc ttgagaactt gctaacctga 240
aataactctg tgcctcattt gaattgtcca atagagtccc tgtaactatg cttttcgctt 300
ctgtactatg ctttttgcta tataaggacc cctctccctt ggctcggcgt gcttggcctc 360
acagaagcta agtcgcccca ggtacccgtg tatccaataa agcctcttgc tgtttgcatc 420
caagttcatg gtctcgctga ttcctgggta cgggtctcct tctgtgaaag tacctcttct 480
gggggtcttt catttggggg ctcgtccggg atcgaaaccc cccgcccagg gatcaccgac 540
ccacgtctgg gaggtaagcg ttgtgcggat ccgctgtctt gtctgtcttg tcttgcctgt 600
ctgtctgaat ctgtcttatg aactgcgctt gcgtctgtag tacacagctg cgtacatctg 660
tatctggcgg ctccgaggaa aaactgaaga gttcagactc ccgaccacgg ctccaggaga 720
cgtcctggta gcgtctagag cctcagtggg ctcactcttt tttctgacta gggtagatgc 780
ctaggcatct tcccaatctg tttggggaag cccctcagat tgagggattt gctatcctca 840
tcggggacga ggaagggagg cccccttctt cggccccatc tgaagtttta ctttcgacct 900
tgtgtcgaaa ccgcgccgca aaagcctgtt ctgtgttgct cggtctttgt cttgtaacca 960
tcatttgtgt cctcctaggt ctagaaacta tggggcaaac tgtcaccact cctttgtccc 1020
taacactctc gcactggaga gatgtgcagg attatgctca taaccagtct gttgatgtgc 1080
ataaacgcaa atggattact ctttgttcct cagaatggcc aacctttgac gtgggctggc 1140
cgcgagatgg tacctttaac ccccaaacta tatttcaggt gaaagagaag actatggatc 1200
ctggaccaca ggggcatccc gaccaggtgg attacatagt cacttgggag gccttggttc 1260
aggaccctcc ccctgggtac gtcctttctt acaccccaag ggcccctcct tcctttcccc 1320
ctctaactgc tccagccgac ccactccctc ggcccctacc cttcccaatc cctcgacacc 1380
cactcctccc taccctcctc cccattccaa cctttaccct acagcggtaa aagacgctaa 1440
agctgaagaa aagaagacac ctgaggtact cccccgggag aagaactgtt ggttgactta 1500
ctgactgagg aacccccgcc atatccagca ccgccaccgc ccccaccaga ggcagaagcg 1560
gcccccgccg cctcggtgga ggtggcccca gctcccccac ctgacccttc cccaatggct 1620
caccgactga gaggtcgcag ggagcagccc gctccagatt caaccactct gcccctcaga 1680
actggaccga acggccattc tcagcctcgg acctctataa ctggaaaaat aacaatcctc 1740
ctttctctgc agaccctgtg aggctgacat ctctcataga atcggtcctc acaactcacc 1800
aacctacctg ggatgattgt gaacagattt tgcaggttct cttaacctcg gaggagaaac 1860
agcgcgttct actagaggca cgaaagaatg tcccaggagc caacgggcag cccacccagc 1920
tgcccaatga aatcgatgcg gcttgccctc ttgaaagacc tgaatgggat tttaccactg 1980
aagcaggtag gacccatcta cgtctctatc gccagttgct cgtagcgggt ctccgggggg 2040
caggacaccc acccaccaat ttggcccagg taaagcaggt aatacagggg gcggaggaat 2100
cgcccgccac ttttctagag agactaaaag aagcgtatag gatgtatact ccctatgatc 2160
cggaagatcc agggcaggcc accagcgttt ctatgtcctt tatttggcag tcagccccgg 2220
acataagaaa caagcttcaa aggctagaaa atttgcaggg atatacactc caagatttgt 2280
tgaaggaagc agaacgtatt tttaataaga gagagacaca gacagaaaga gaagaacgct 2340
ggagaaagga aacccaggag agagaggaaa gactgagaaa agaagctgag gaaaaagagg 2400
ctgcaagaga ccgtaagcgg aatagagaga tgagcaggct attggccaca gtagtgacag 2460
gtcagagaca gaataggcag agggatggca gaagggggcc ccacctggac agggatcaat 2520
gtgcttactg caaggaaaaa ggacattggg caagagattg ccctaagaac cccgggccaa 2580
gcctccacgg ccaagaacct ctgaccttct aaacctagaa gattagagaa gtcagggcca 2640
ggagcccccc cccctgagcc caggataaca ctgcaagtcg gggggcatcc ggtcaccttc 2700
ctagtcgata caggggcaca acattccgtt ctgaatcagt cacccggacc cctgagtcac 2760
cggactgcat gggtacaggg ggctacaggc ggaaagcagt accgttggac cacagatcgg 2820
cagctccagc tcgcgaccgg taaggtcatg cactctttcc tccatgtgcc tgattgcccc 2880
taccctttac taggacggga cctattgacc aaactaaaag ctcaaataca ctttgagaaa 2940
tcaaaagtca aagtcacagg gccagaagga attcccctta ccatcttgac aatgtccata 3000
gaagatgaat atagactcca tgaaaaagag actaactcgg gcaaccagga aacccttgac 3060
cactggctcg cggaatttcc ccaaacctgg gctgagacag gcggaatggg ccttgccagc 3120
aaccaggccc caattatagt aaccttaaaa gctgccgccc ttcctgcatc cgtcaagcag 3180
tacccgatgc ctaaagaggc ccgcgaagga aacatattaa aaggttactt gaacaagaga 3240
ttctgacgcc ctgtaaatct ccttggaata cacccttgtt gcccgttagg aagccaggaa 3300
ccaatgacta tagaccagtg caggatctga gagaagtcaa taaaaggata gaggacatac 3360
accctactgt ccctaaccct tacaatttgc tgagcggatt gccacctgac tatacctggt 3420
atacagtctt agatcttaaa gatgccttct tctgcctcca cctgcatccc accagccagc 3480
ctatatttgc ctttgaatgg caggacgctg accttggaat ctctgggcag ctaacttgga 3540
ctaggttacc tcaagggttt aagaacagcc ctaccctttt tgatgaagct ttacatcagg 3600
acctggcagg attccaggtt cggtacccgg ctctaatcct cttacaatat gtagatgaca 3660
tcctcctggc agccaaaacc caggggaatg taaggagggc actcaagccc tcctccagac 3720
tcttgggagc ctagggtacc gagcatccgc caagaagtcc cagatatgtc agaagcaggt 3780
gacctattta ggatacaaga taaaggacgg actgcgatgg ctaacggaag cccgtatgtg 3840
agccatctta gaccttccca ccccgcaaaa tccccaccaa ctaagagagt tcttgggaac 3900
ggcaggtttc tgccgcctat ggatccccgg gtttgctgaa atggcggctc ccctctaccc 3960
cctcactcgt ccagggattg cttttaaatg ggaagagccc caaaagaaag ccttcaccaa 4020
catcaaaaag gctctccttg aatcaccagc cctgggacta ccggacttgg ctaagccatt 4080
tgagttcttt gtagatgaga aagagggcta tgccaaggga gtcctcaccc aaaaactggg 4140
gccttggaga aggcccactg catacctctc caagaaattg gatcctgtgg catcgggatg 4200
gccaccctgc ctccaaatga ttgccgccat agccttgtta gtaaaagact ctcacaaact 4260
aaccttgggg cagcctttga ccatacatgc ccctcatgcg gttgaggcag tcatcagaca 4320
gcctccagac agatggctca ctaatgcccg aatgactcat taccagacta tgctgttgga 4380
caaagaccgg gtccactttg gccctttggt gactctgaac ccagccacct tgcccccctc 4440
cctggggagc ccgaggctca tgattgcttg caggtactgg ctgaggccca tgggacaaga 4500
cccgacctaa ctgaccagcc tctacccagc ccggaccaca tctggttcac ggatggaagc 4560
agctttttgc atcaaggaga acggagggct ggtgcagcgg tcacctcaga ggatcaggtc 4620
gtctgggccc aggcactccc tcccggaacc tccgcgcaga gggcggagct cattgcactc 4680
acgcaagctc taaagttggc agaaggtaag aggctcaccg tgtacacaga cagtcgttat 4740
gccttcgcca ctgcccacat acatggagaa atttacagac ggagggggta gcttacctca 4800
gaagggaagg acattaagaa taaggaggaa atcctcgctc tcctaagagc tcttcatctg 4860
ccctccgcct taagtatcat acattgcccc ggacatcaaa aaggggattc tcttgaagcg 4920
aggggcaatc gaagggcaga tttggccgcc caagaggcgg ccctggccac agaaaccact 4980
aacctcctgg ctctagaacc caccaacgac cgtccctccc cctcatggga ctatgaacaa 5040
agagacatcc agaccctaga gaaattggga gccaccaagg aatcaaacgg ggattggact 5100
tatgaaggaa agactatcat cccctaacgg gtaaccaagt acctagtgac atttttacat 5160
aagatgacac atctgagctc caagaagatg cgagaactcc tcgagcgaga agacgaattc 5220
aatttccttt tggggaagaa taacattcta aaacaggtaa ctgaacaatg tgatgcgtgc 5280
gcccgagtca acgcatccag actgaagctt cctcccggga accgggtcag aggctaccgg 5340
cccggaacac attgggagat agatttcact gagattaaac caggtaaata tggatacaag 5400
tatctattag tttttataga caccttttca ggatgggttg aagccttccc tactaaacat 5460
gaaacagcca agatcgttac taagaaattg cttgaagaaa tctttccccg ttatgggatg 5520
cctcaggtac tggggacaga caatgggccc gccttcgtct cccaggtaag tcagtcagtg 5580
gccaccttgt tggggattga ttggaaatta cattgtgctt atagacccca aagttcagga 5640
caggtagaaa ggatgaatag aacaattaag gagactttaa caaaattgtc gcttgcaact 5700
ggcactagag actgggtcct cctactcccc ctagcactct accgcgctcg caatacccct 5760
gggccacatg ggctcacacc ttttgagatc ctgcatggag tatctacccc tatcattaac 5820
ttccttgatc aagatgtctc agattttgct aactcccctt ctctccaagc tcatttacag 5880
gccctccaac ttgtacaacg ggaggtctgg aaaccccttg ctcaagctta taaagaccag 5940
agggaccatc ctaccattcc ccattcctac cagatcgggg acaccgtctg ggtccggcgt 6000
caccagtcca agaacctcga accccgctgg aagggaccct acatcgtttt gcttaccacc 6060
cccaccgcac tcaaagtaga cagcattgca gcttggatac atgcttctca tgtaaagcca 6120
gcccgaccca ccgattcagc cactgcatcg gaatggactg cgcactgcac tcaaaatcct 6180
ttaaagataa gactctctcg tacaccctcc tattgattgt ttgtctgttt atcccccatg 6240
tagcaaccag cccctatacc attcatgcgt taacctggca ggtactttcc cagtcagggg 6300
aggtcattta tgagaccacc aaaaaccatg cccttggtgt atggtggcct acattgacac 6360
ccgatttctg tgacttggtc gctggtctag acacctggga catctcacac tgttacccta 6420
aggcttgtag caacgaaaac gatttgccac gatttcgcag gtcactccaa agttcgagag 6480
acaccactcc tggatgtagc agtcaacagg ccaaagacca actgtcgggt agtgactttt 6540
atgtctgtcc cagagacgga cgggcctgga agaagactca gacttgtggg ggttatgaac 6600
agtttttctg tgccacttgg ggatgtgaaa cgacagggga tgcttactgg aagccttcat 6660
cctcatggga caagattcaa gtaaccagag gatggcaaaa gggctccacc ggcaccacct 6720
ctatgcctct ccttatttcc tttacggatg agggtaagaa agcaacagaa tggcagaacg 6780
gatatgcttg gggccttcgc tggtacctgt cgggaccaga ccggggggcc atctttaaaa 6840
ttagactcaa agtaaaaact atcaccaaaa ccatgggccc aaacccagtt ctggcagacc 6900
agaaaccccc accaagcctc atgggtctcg gccccatagg cctctatccc atctcccacc 6960
ctcatcaaca ccctcatcca atactgccac ccttactctt acgactccag ttcacacccc 7020
cacctcccca tatccaggga caagggacag attacttgaa ctaatacaag gggcttactt 7080
ggccctcaat tcctcagacc ccaacaagac tcaggaatgc tggctatgcc tagtttcccg 7140
gcccccatat tatgaaggca tagcagtact gggcaactac tctaaccaga cctcagcgcc 7200
taccagttgt ggagctgcca tgcagcacaa gctcacaatg tctgaggtct caggaaaggg 7260
gctatgcata ggcagggttc ctccctcaca tcaagagtta tgtaaccaaa cagagccatt 7320
atctcaagac agccgatacc ttgttgcccc ttatggaact tattgggctt gcagtactgg 7380
tttgacaccc tgcgtctcta ccactgtcct caatgccacc attgactttt gtatattgac 7440
agaactttgg cccaaagtca cataccacca acctgagtat gtttacagcg tactagagaa 7500
atcaacccga catcagaggg agccaatgtc cttaaccgtg gccctattat taggaggaat 7560
aacaatgggg ggtatagcag ctggaagagg gaccagtacg gttgccttgc aggaaactag 7620
ttatttcaaa cttctacaac aagccatgca tacagatatc caggccctag aagagtcagt 7680
cagcgcactc gagaaatcct taacatcact ctctgaggta gtcctgcaga acagacgaga 7740
gttagattta ttatttctac aggaacgggg actatgtgct gccctcaagg aagaatgctg 7800
cttttatgca gaccacacag gaatagttag ggacagcatg gccaaactta gagaaagact 7860
taagcagagg caacaactat ttgagtctca acagggatgg ttcgaaggat ggttcgctaa 7920
gtccccctgg ttcactaccc ttatatccat tctcatggga cctctgatta ttctattttt 7980
aatccttata tttggtacct gcattctaaa taagatgact caattcatca gagaacgact 8040
atctgtcata caggccttag tcttaactca acaataccat cagctaaagc aaatagatcc 8100
agaatatcca gagacctctg aatgaaagat tccattcagt tacaagagaa atgggggaat 8160
gaaagaccac tgccccttaa gctctctctc tctctctctt gggctagcta aattacagac 8220
caagagacca agaccaccca gaaccgtttc tgagaataga aggtcagggc gttatgacta 8280
cttgtttgcc acacaggata tctgtggtca gccatctgga cgcggaggga ggaactaccg 8340
ggtctgttgt aaccactgtg tacccaagat agagccaagt cagcttcgtc tgattaccag 8400
accttgagaa cttgctaacc tgaaataact ctgtgcctca tttgaattgt ccaatagaat 8460
ccctgtaact atgcttttcg cttctgtact atgctttttg ctatataagg acccctctcc 8520
cttggctcgg tgcgcttggc ctcacagaag ctaagtcgcc ccgggtaccc gtgtatccaa 8580
taaagcctct tgctgtttgc atccaagttc gtggtctcgc tgattcctgg gtacgggtct 8640
ccttctgtga aagtacctct tctgggg 8667
<210> 3
<211> 8181
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> CHO-K1细胞的池内A颗粒反转录病毒样序列
<222> (1)..(8181)
<400> 3
ctgtagagag ctgcagaaaa ccgcacccaa aagatggcgc tggtttccgc cttccgccag 60
cccgacggcg agcgctctct gtggtaaaca actccaaata tggtagaggt catgtatcct 120
cttaattctg cttggagaca acctatcctg gcgcgccacg tagggttagg tgattggtag 180
atgtagacta tatcaggccc cgtctccctc ggcctggggc cgccgcctcc attatacatt 240
gtacaaaagc aaagaggttc ccgattaaac tgtgtttgaa gaagattcct cggtgtggcg 300
tctttcttgc tggtcaaggg tggacgccgc aagtggtggc ccgtacgggg aattcagaac 360
ttctcacagt cggggcggcg ccggtaagtt cccaaggtaa gtggaactgt aaagtccgcg 420
gtgaatgcgg agataggtct ccggtaaagg agcaccaagg tcctcaggaa agaggagata 480
ggtctcagta aaagagtacc aaagccctcg gggaagaggc agtaaagtct ccggaaagga 540
gcaacattgt tcgcgacaaa agcgaaccga aagtaaaaaa ccctcgcttc tgctttaatt 600
tgcagagtga aagtaagtta atggaccccg ctattatagt ggtgatttgg ttgcttttta 660
atatcgcagt gtgggctttt gttttctggt ggtgttatcc gacttgcaca ccttcggagc 720
gcgctaatta agacaaaagc acaatgggat cgtcacaatc acatccaatt tttctggctc 780
ttcaagagct acttcattct aacaatttaa ggttaactaa agccacatta cagaggttcc 840
tgagtgaatg cgacaccatt gcaccctggt ttgcagcctc gggcaatctc actgtggata 900
gttgggataa attagggaaa gacctggatt ttgcctggga gcaaggagcg ttgaagccga 960
gtgttcgccc ggtttggcgc ctggtgcgca gctgtctaga ggacaaaggg ggaaataaga 1020
aagctatagc aaatggacag gctgcccttg aaatgctcca agaagaaagg tcagaacagt 1080
cagaaagtga gagaacaaag gagaaacaga aaagggataa gaagcgagtc tatccttctc 1140
taggaaggtt gaggaaggaa ttaaaagaac caggagagga ttcagaatca gaggaggata 1200
tatgtgagga tgaggacatc atggaggaag aggaggaaga gattattgag ctcatggaaa 1260
aacattcatt aaaagtatca gaaaaacagc gtcctaaaat ggcgactgta aagcaagggc 1320
accgccctat cgctcctccc cctactgctc gaaagaggaa gtaggaggtc ctggttgttc 1380
caccttctgt ccggaagtgt ggcgtacggt tcgcactgag tttcgggtta ctcgaccact 1440
ggcttatcca gtttttacag acggtaacca acagagatat catgaaccaa ttgactttaa 1500
aatagtcaaa gctctggcag aatcggtacg cacctatggg gtgacggcag cttttacaat 1560
tgctcaggta gaggcgctcg gtcgctactg tatgacaccc agtgattgga caaatttggt 1620
aagagcttgc ttatcaccag gacaatattt ggattggaga gcttttcaaa ttgagtttgc 1680
caatgatcaa ggtgcgatta atcgtgcagc tggtgatcaa tattgggatg tggacatgct 1740
tcttggtcaa ggacgttttg cacagcaaca aacaggatat cctcctcaag tgtatgatca 1800
gattaatcaa atagccatta gggcttggag gtctctgcct aacaaaggtg aggtcagtgg 1860
aaatcttaca aagatattac agggtcctat ggaacccttt tcagactttg tggcaagaat 1920
ggtagaagct gcaggaagag tgtttgggga tccagatgct gctatgcctt tgatcaaaca 1980
gctgatttat gaacagtgta caaaagagtg tagagctgca ataactccat ataagggtaa 2040
aggccttgaa gtctggatga aagtctgtag ggagttaggg ggtccgctga ctaatgctgg 2100
actagcagct gctgtgatgc aattaactaa gaaaggtgga ggttcaggag cttgctttaa 2160
atgcggcaag caagggcatt tgaaaaagca atgccccgag ggaggaaaca ctaaagtcaa 2220
taactttgct ccgcgcccta agcaacctgg cttatgtcct agatgtaaaa aaggaaatca 2280
ttgggctaag gattgtagat cagtaaaaga catcagtgga cagcctcttg ttcaggggta 2340
tggaggagcc cgttcaaaaa acggacgacg gggcccacga ccccagggcc cacaaatata 2400
tggggccatg gaggatcaga accaggagca gagtcccgaa acctggccct ctcttcgtca 2460
tccgagggac cgaggagagc cactacaggc tccgcggggc tggacttacg ctccaccacc 2520
agactcgtat taactcccag aatgggggtc cagcttgttg acaccgattt taagggaccc 2580
cttgagcctg gcacagtagg tttgcttata ggaagatcat ctgcagcatt gaaaggttta 2640
cgagtacatc ctggagttat agatcctgat tacatgggtg tagtaaagat catggtagaa 2700
tctcctagag ggattacggc catttctcct ggagacagga tagcacagtt actgcttttg 2760
ccaagcttgc atgacaagtt tccagcacaa gccagagaga gaggagaggg aaactttggc 2820
tccactggat caaacttaac tttcctagct ttagaccttg atcaacgtcc aacccttgag 2880
ttaatagtga atggtaagaa aatcttaggc ttactagatt ctggagctga taagagcatc 2940
atagccacta aagattggcc ctctggctgg cctatacagg tttcttctca aagtttacaa 3000
ggtttaggct atgctaaggc tcctgatatg agtgctagac aattgccttg gaaagatcag 3060
gaagggcatt cagggaccat gcaaccttat gtgttagact taccaatttc attatgggga 3120
agagatttgt taaaggatat gggttttaaa ctcacaaatg aatactcaga aacatctcaa 3180
ggtatcatga aacgaatggg atacgtccca ggccgaggcc tcgggaaaca tctgcagggt 3240
cgtaccagtc ctattattcc acaaccgaga ccaaagaatc taggtctggg tttttcctag 3300
gggccactga gggaggtatt cctattacct ggaaaacaga ggagccggta tgggttcctc 3360
agtggccact ttcctctgaa aaactggaag ctgctaagac tctagtgcgg gagcagctgg 3420
atctggggca tataaaatcc tctgtatctc catggaatac tcctattttt gtcattaaga 3480
aaaaatctgg taaatggaga ctgcttcacg atcttagagc tattaatcaa cagatgcaaa 3540
ttatgggccc tgtacaacgt ggtcttccac ttttaacttc tttacctgca tcatggccta 3600
tcatctctat agatattaaa gattgcttct tttccatacc tttgtgtgcc aaggattcag 3660
ggcgttttgc gtttacgctg ccctcttgta atcatgaaca acctgattta aggtatgaat 3720
ggatagtgtt gccacagggg atggccaata gtcctactat gtgtcagttg tttgtagcag 3780
aagcaattgc tcctttgaga gtggactttc caaagattag atgtgttcat tatatggatg 3840
atattttatt ggctgccaaa gatgataaaa cgcttaataa ggcatataca aaattggtaa 3900
aattgcttga gatgcataat ttagtcatag cctcagaaaa ggtacaaaag gacactgttg 3960
ttaactatct aggggctaag attctccctc atacaattat tccacaaaag atagagatta 4020
gaaaagataa tttaaaaact cttaatgatt ttcaaaagtt gttgggagat ataaattgga 4080
taagatgtta tttaaaatta ccaaattatg agttgaagcc attgtataat attctcaatg 4140
gtgattcagc attagattca cctaggcagt taactgctga agccagagaa gctttaaaga 4200
aagtggagac agaattacaa aatgccagcc ttaaaaggct aatagaaaat atggatattc 4260
ttttgtgtgt gcttcctaca ttctcccagc ctacagcttt gctgtggcaa gatggtccgt 4320
tactatggat ttattctaaa tcctccccag gaaaaactat tgaatactat cctgcagcgg 4380
ttgctgactt ggctcaaaat gggatacagc aatgtattca atattttggg aaattaccaa 4440
ttaagatcat aatcccttat actgctcaac aagttaagat actttgtgga actgtggatg 4500
attgggcaat tcttcaatgt ggattttcag gagaaataga taatcattat ccaaaacacc 4560
ctctaatgtc attttttaaa gaacatccag tcatttttcc taaaatgact gcagcagctc 4620
ctattgctgg agccgcaaat attttcactg atggatccaa gacgggctgt ggagcctaca 4680
tgatagagca tcaggatcca gtgcaatttc aatatcagcc tggctccccc caaattattg 4740
aatgtaaaat tgttcttgaa gtgtttagaa attgcccgtt ctcctttaat ctgatttctg 4800
attcggcata tgttgtgaat gctgttaagg ccctggaggt tgcaggacct attaaaccta 4860
atagtacagt ttgcaaactc ttacaggagt tgcaaaagtt gatctggcat cgcgatcaga 4920
aattttttat acaacatatt agagctcata ccaacttgcc tggacctcta tcaaaaggca 4980
atgagatcgt agatctctgt actagagggg aatatgtatt tttcgcttcc tctatggaac 5040
gagcacagca ctttcacaaa caatttcatg tatctgcaaa aactttacag caaaggtttc 5100
agctatctcg agcagaagct agacagatag tattgaattg tcaacagtgt ataaccttct 5160
tgcaccccct agcctggggg tcaatcccag agggttattg cccttgaaga tctggcaaat 5220
ggacgtaact catttttcag gatttggaac tcttaaatat atccatgtgt ctgtggatac 5280
ctgttcaggc atcatccatg ccacccctat gagtggggaa aaggctcgca atgtcattgg 5340
acattgcctt gaggcgtggg ctgcctgggg aaaacctcag caattaaaga ctgacaatgg 5400
tcctgcttat acagctcaat cttttacctc cttctgtaaa cagatggaag tccaattaaa 5460
ccatggcctg ccttataatc cccaaggaca aggaatagtt gaaagagccc atcgcacatt 5520
gaaagaatgt ttactaaaac aaaaagggga ataggccatg gtagaacacc aaaggaacaa 5580
ctatctttgg ctctctttac tctgaatttt ttaaatttgg attctcaagg cctttctgct 5640
gccgataggc accagactcg ggcacctgct cagaagggct atgtaaaatg gaaagatatc 5700
cttacgggtc tatggcatgg accggacccg gtattagcat gggcgagagg ttctgtttgt 5760
gttttccctc aggatcagca agacccggtg tggattccag agagactaac gaggaggtgc 5820
aacaaacaag atgaagcctc cgatattgat cctgctgctg atcttgacaa caccgtggct 5880
gatccaggcc agagaacaaa tcctgtgggc catagcgaaa gcgtggccaa ttcctttgcc 5940
tgttcatagc acatctaaag ttttgcctgt tttcttttct actagttgtg aattgggttt 6000
gccttgtgtc aatttagatc ctgacactgc ccagtattca gccactaata tttctctcaa 6060
tggagcatta tgcttctccc ttattaataa ttctaaccca tgcatttggt tgaagaatgg 6120
ttctattggc aattggcttg atcctcttac taataaccag atctcgagtg ctatgctcac 6180
tgaagccctg tctcagttta gtacaggcgc tagttctggc tctggcactg gtacaaatgg 6240
aaccaaagat gtaaatatca ctacatttct gatgctgatg gaggggctcc gaccctcaaa 6300
ttcacgcttt agtcaagaga actccactgc tcgacaagtc ttgccttatt gtgcacccaa 6360
tcgaggctat ccacctcatt ggacgccttg tcagagtccg gatcacaaac ttaagcaaat 6420
agctccaggt tttgaattta ctccccctct tggcaagtac cagtataacc taactcaggg 6480
aggttcccaa agaacaggca gtaaaaacac ctggccatgg tttcaatggg tactctccaa 6540
cgagcgtgaa acatttactt ctcttgaacc ttttgcagtt ctccagaatc tctgcataag 6600
acttcttaat gtttctggta caagggatga gaagggacct tctcttaaga atctatcaat 6660
acataaagct ttgaataatc tcactgttcc agctagccca gtatgcttaa aagctccttt 6720
tttctttctg ctctctaatg ctattgatgc taccaaagaa gtgatctcgt gcaattcgac 6780
tgatgtctcc tgcattgcta gccaatgttg gaatggttct gctaatacag cagtagtgat 6840
gaggattcct atgtatgttc ctattccagt caaagtggat acaggaacgt ttcccattac 6900
ggaaatcatc agaaccaaac gggattttgg cataactgca gcattggtta ctgccattac 6960
cctttctgca gcagcggcta cgactgccac cgttgccatg gctgctcagg tccaatcagc 7020
tgagacagtc aatgatattg tggaaaaaac agctacaaca ttaactacct tgagatctat 7080
tgatggccac ttaaaagctg gcattctaac tgtgaaccaa agagtggacc tgttgcagga 7140
acaggtggat gatttagtaa ccttaacttc cataggatgc attcattcct tttcttcttt 7200
gtgtatcacc tccaggatgg ccaataattt cacggagaac agcaacctga gttggcagct 7260
gagtgcctac cttcagggaa attggagtca acagttcgag aacctgacag acaccctgac 7320
acaacagatt attgccgtga atgctacacg cctgagcctg cccactgtta ataccctctt 7380
aactaccctt aagcgagcct ttagtttagt taaggaatgg gctggaatag gggttatgtt 7440
ttccatgatg ctgttagcca tttttgtttg cttgtggtgc ctatgcagga tcaggaagtc 7500
gcaaaaatcc caagctgcta tgttggtaca ggcctttgct gctgtggaag caggacagtc 7560
ccctcaagca tggttatcca tgctgacaga caaatagatg tctgtctcgc ccttgctgag 7620
tgagtaatgc gtatctgaat cagtcatgct caatgacggg cacctaccct catgctgagc 7680
gaataagcat acgtgtgttg ccttcaacct aagacatgag cctgtgaggg cgacacagtg 7740
actctttgac gggtaagata gggacactgg ggttgaacct aagacagaga tgactgaaat 7800
ctgacaacag atagatactg ctactcctat aatattaaaa caaaaagggg gaactgtagg 7860
gagctgcaga aaaccgcacc caaaagatgg cgccggtttc cgccttccgc cagcccgacg 7920
gcgagcgctc tctgtggtaa acaactccaa atatggtaga ggtcatgtat cctcttaatt 7980
ctgcttggag acaacctatc ctggcgcgcc acgtagggtt aggtgattgg tagatgtaga 8040
ctatatcagg ccccgtctcc ctcggcccgg ggccgccgcc tccattatac attgtacaaa 8100
gcaaagaggt tcccgattaa actgtgtttg aagaagattc ctcggtgtgg cgtctttctt 8160
gctggtcaag ggtggacgcc g 8181
<210> 4
<211> 8369
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> CHO-K1细胞的长臂猿白血病病毒样ERV
<222> (1)..(8369)
<400> 4
aaaaaaaaaa aaagaaaaga aaagaaaaga aaaaacagtt cccagaataa ctacccgagg 60
ttctgatgac ctctatggaa tgtttcaacg ccctaagtgt gcctcaggtg tatgattcat 120
gtgacacatg gtttatggtt taactgaaga atactgtatg actctgatat ttccccattc 180
ttttgtgggt tttttgcctt tataagcctg ttacaaattc agaccggggt cgaactcctc 240
tacccctgtg tggtgtatgg gtttcgaccc cagcatgctg gtctgagatc tcgttccgtt 300
tcactctcaa taaacttcct cgtgtgattg cagcaagtct ggtcttggtg cctactgggt 360
gcgcgccttt cccgaggctt gagtgagggg tctcccttcg ggggtctttc atttgggggc 420
tcgtccggga tttgcgcgac cacccagggg tcctagaccc acttggaggt aaggattttc 480
attcctcgtt gttctgttgt gattctgtgt ttgtggattg ttcagagatc tggtgcgatc 540
gcagttctgg tttttgcaaa cgctctaatc gagtctgctc ctccagaggg gggagcagag 600
tggacgggga tagacgtatc cgggtgtcca ccgtttgttc gccctgggag acgtcccagg 660
aggacagggg aaggaccagg gacgcctggt ggaccccacg aggaaagtcc ggggattagt 720
ttcctccttg acaatctgta gaccgtctga ctcttttcag gatttctggt cgactcaagg 780
tcggcgattt tgtctctctg ttttgttgtc tttgtgattg ttctttttgt gaagtgtgat 840
agaaccagga atgggacaga ccgtgacgac cccgctaaca ctgaccctgg accattggac 900
ggacgttaag acgagggctc ataatctttc tgttgaagtc agaaaagggc catggcagac 960
tttctgctcc tctgagtggc cgagttttgg cgtaggatgg cctccggagg gaacttttaa 1020
cctgtctctc atttccgctg tcaagcgaat tatctttcag gcctcagggg gacaccctga 1080
tcaggttcca tacattatcg tatgggagga cctggtccaa aatccgacac cctgggtgag 1140
accctggacg acaggggcag aaacggtgac ggtggccgtg gccgccaaac cgaaagtacc 1200
ccctccagat aaaccggtac ctgctccatc ggcccctacg aagatttatc ctgaaattga 1260
tgatggttcc cttctcctcg actaccctcc acccccgtat cctcaaccag cttcccacgc 1320
acgtccccca caggtgtcgc cccccgccga ctcccggacg gcctctgaaa caggaccggt 1380
ggccggaacc cgaagccgcc ggggtcgtag cccaggggag aaggcgcggg gtttgactct 1440
gctactgccc tacctttacg agcttatgga cccgccccgg ctccgggaga actggtcccg 1500
ctacagtact ggccgttctc atcagccgat atgtataact ggaaaactaa ccactcctct 1560
ttttcagaga atccctcagg cctgacaggg cttcttgagt ccctaatgtt ttctcatcag 1620
cccacctggg atgattgcca gcagcttttg caagtccttt ttaccacgga agagagggag 1680
agaatcctcc tagaagctag aaaaaatgtt ccgggaccag atggagcccc caccaacctc 1740
cctaacctta tagatgcagc ttttcccttg atccgccctg actgggatta taactctgca 1800
gaaggtaggg agcgtctcac ggtctaccgc cgggctctag tggcaggtct caagggagct 1860
gcaaggcgac ccacgaattt ggctaaggta agggaggtcc tacaaggtcc ggtggagcca 1920
ccctctgtct ttttagagcg cttaatggag gcttacagga gatatactcc atttgatccc 1980
tcctcagagg gacagtgggc ggctgtagct atggctttta taggacaatc agcccctgat 2040
atcaagaaga agttacaaag attagagggg ctccaagatt atactttaca ggatttagtg 2100
aaggaagcag agaaagtgta tcacaagagg gagactgagg aagagaagca ggagagagaa 2160
aaaagagaga cggaagaaag ggagaaacgg cgtgaccgcc gccaagagaa gaatctgact 2220
aggattttgg ccgcagtagt aggtgaagaa agggtagaga aaagacagtt agggcacctg 2280
ggcaacaaag caaatagacc cgtgggcgga cagagaccac gacttgaaaa ggaccaatgt 2340
gcatactgca aagagaaagg acattgggcc agagaatgcc ccaaaaagaa acagaagggc 2400
cctaaggtac tggcccttga agaagattag gggagtcggg gctcggtccc cctccccgag 2460
cccagggtaa ctctctctgt ggaggggaac cccgttgact tcttagtgga cactggggct 2520
gaacactcgg tcttgactga accattagga caattaggat caagaaggac tctggtcaca 2580
ggagccactg gtagtaaact ttatccctgg acaacaaaaa gaagtttaaa aataggaaaa 2640
agccaagtga ctcactcttt ccttgtaatc cctgagtgcc ctgcaccgct tctgggcagg 2700
gacttgctga ctaaactaaa ggctcaggtc cagttcacct cgacagggcc ggaagtcacc 2760
tggggggaga cacctatagc atgtttagtc ctaaatctag aagaagaata tcgcctccat 2820
gaacccaaga ttgagaattt gccctccaag gaatggttgg tagcttttcc aggagtttgg 2880
gcagagcaag cgggaatggg actggctaag cgggtaccgc cagtggtggt cgaattaaaa 2940
gcagctgcta cccccatctc agtcaggcag taccccatga ctcaggaggc taaagaaggc 3000
attcgaccac acatccagag gctattacaa caaggtatac tgattcattg ccagtcccct 3060
ggaatactcc cctcttgccg gtacgtaagc ctggaactaa tgactatcga cctgtccagg 3120
acttgagaga ggtcaacaag cgggtactgg acatccaccc gacagtgccc aatccctaca 3180
atttgctaag ttccctgcca ccggagcggt cctggtacac tgttctggat ttaaaagatg 3240
cttttttctg cctcagacta catccaagta gccaactcct gtttgccttc gaatggcggg 3300
accccgacgg aggacacacc ggtcagctga cctggaccag gcttccacag ggattcaaga 3360
actcgccaac tctcttcgat gaagcgctcc actgtgacct tgcgcccttc agggcacgaa 3420
acccccaaat ctctctctta cagtatgtag atgatttgct gcttgcagcc tcgacctggg 3480
aactgtgcct taatgggacc aaagagcttc taaaagaatt gggtgagttg gggtaccggg 3540
tgtccgcaaa aaaggcccaa ttatgctgtc cagaagttac ctacctggga tacaccctcc 3600
gagaagggaa gcggtggctc actgaagccc gaaagaaaac tgtgatgcag atcccgaccc 3660
ccaccactcc acgacaagta cgtgagtttc tgggaacggc gggcttttgt agactctgga 3720
taccaggatt cgccactttg gcggcccctt tgtaccctct gactaaagac aaagtcccat 3780
ttacatggaa agaagaacat cagaaagcct ttgaaaaaat aaagactgcc ctgctcacag 3840
cccctgcttt gactctgcca gacttgacca aaactttcac cttatacgtt gatgaacggg 3900
ctggaatagc tcggggagtc ctgactcagg ccctgggtcc ttggaagcgg ccggtggctt 3960
acttgtcaaa gaaactagac ccggtagcca gcggttggcc ctcttgtctg aaagccattg 4020
ccgcagtagc cttgcttgtc aaagatgctg acaagctgat cctgggtcaa catgtgacta 4080
taatcgcccc tcatgcctta gagagtattg tacggcagcc ccccgaccgc tggatgacaa 4140
actctcgaat gactcattac cagagcttgt tactaactga tcgaataact tttgctaccc 4200
ctgctatcct caaccctgcc accctactcc ctgaagcaga tgactctact cctgtgcatc 4260
gatgcgctga tatcctggcg gaggagactg gagtcagaac ggacctgact gatcaacctt 4320
ggccaggtgt gcctagctgg tatacggatg gcagcagctt cgtggtggaa ggaaaaagaa 4380
aagcaggagc agcggtggta gatgggaaac aggtgctgtg ggccagcagc ctcccagagg 4440
ggacgtctgc tcaaaaagcc gaacttttgg cactaattca agctctgcgc ctggcagaag 4500
gtaaggctgt caacatctat actgatagcc gctacgcctt tgctaccgcc cacattcatg 4560
gagctatcta taggcagagg gcctactcac atcggcaggg aaagacatta aaaacaaaga 4620
agaaatcctg gctcttctag aagccataca cctacccaag aaattggcca ttgtccattg 4680
tccaggacat caaaagggga ctgacccagt tacacgggga aaccagatgg cagatcagac 4740
agccaagcaa gctgcccatg gaactacggt gctaatagaa gaaatcagaa atcacccacc 4800
agagcccccg gagcacacac ataaaggctg tgccttgact gaagatgggc aaattgtctt 4860
accagctaaa gaagggcagg actatgtaaa aaggttacat caactaactc acctcggaac 4920
tgaaaaactt aaacaactaa ttaaaagttc caaatactgt gttcaagacc tacacaccac 4980
aacaaaacag gtagtggagg catgccaagc ctgtactatg accaatgcgg cccgaccgtt 5040
caaggagcct ggaaaaagaa tgaggggaga ccgaccagga gtctattggg aagtagactt 5100
tactgaagtt aagccaggaa aatatggtaa taaatatctt ctagttttta tagacacttt 5160
ttcaggatgg gtggaagcct ttcccacaaa atctgaaact gctcagatgg tgaccaagaa 5220
gatactagaa gaaattctgc ccagattcgg gattcccaag gtaatcgggt ctgataacgg 5280
cccagctttt gttgcccagg taagtcaaga attggccact caactgggga ttaattggaa 5340
attacattgt gcttacagac cccagagctc aggacaggta gaaaggatga atagaactct 5400
aaaagagacc cttactaaat tagctattga gaccggcggc aaggactggg tgaccctcct 5460
cccctttgca cttcttagag tccgaaactc gcccgggcgt ttcggcctca ccccttatga 5520
aatcctacat gggggaccgc cccccttaac ggagtcgtgc gggatattgg atcctagcac 5580
ttactccccc tcctcttctg ctttatttac tcacttaaag gccttagaag ttattaaaac 5640
acagatctgg agtcgaatta aagaagccta cgctccagga accatcacgg tgccccacgg 5700
gttccaggtc ggagactcag tcctggtcag acgacatcgc gctggcacgc ttgagccccg 5760
gtggaaggga ccctacctgg tgctgttgac taccccctca gcagtcaagg tcgacgggat 5820
tgctgcctgg gtccatgctt cccatgtcaa gaagacaccc agtcagggca agaataacca 5880
tgaagaaaat tggacagtgg caaccagtga caatcctctt aagctgcgcc ttcgccgtag 5940
ccccaacctt gggtaataac ccccatgccc ccaaaaacta acctgggaag tgcttaacga 6000
agagggcgac gtcgtatggt caacaaccgc agtgcatccc ctttggactt ggtggcctga 6060
tcttgcaccc gatgtctgta agttagcagc cggctctatg gcttgggatc tttccagtta 6120
cactgactta gaaaagccac ccccagaaga acagtgtgtc cctcatggca tagggagcac 6180
attggggtgt tcaggacagt ttttccgagc caacctacag gcagcagact tctatgtctg 6240
ccccgggcag ggacaatcca gagaaatgaa gagacggtgc ggaggagctg cagactattt 6300
ttgtaataaa tggggatgtg agactacagg agaggcctac tggaaccctt cctcctcttg 6360
ggatctaatt atggttaaga agggtcgtaa gccagaagag ccagaaaaag gagaaagaga 6420
tccctccaaa tacccagctt ataggactgg gtgtgcctct ggaagctcgg atggccctca 6480
ggggccttgc aaaaacaatt attgtaaccc cttaaatatc agctttaccc cacagggaaa 6540
acaggatcgt caatgggtaa gaggaaatcg gtggggatgg agagtctata ctggcagcgg 6600
ggaccctgga ttcgtttttg tcattaagat aaaaatagaa agtccaccca cacgacccgt 6660
aggccccaat tcggtgcttg ataaccccat acccaggcct gagaggcctc ctcctcccac 6720
cctgtcacca aaggaaggct catattctct ctggactgca cccccacgtg tccctatggg 6780
gactgaggac cttctgttca atctgcttga tagtgcattt gttgttttaa atcgcactaa 6840
ccctgctgct actcagtcct gctggctgtg ttttacttcc aatccccctt actatgaagg 6900
aatagctcag ctacgtagct ataatgttac ttctgatcac tcacattgcc cctggggaag 6960
ccaacgaaag ttaaccctgt ctgcagtgtc aggaactgga ctgtgtatag gaaaagtacc 7020
taccaggcat cagcccctct gtaatgtaac tatctccaac ctgacaactg gcccagataa 7080
atacttagta ccccctctca atacctggtg ggcttgtggt accagcttga cccctgcctc 7140
catacttcac tttttgacaa tactaaagac ttttgtattt tagtccaatt ggtacctagg 7200
gtcatttatc atgatgatgc ctcgtttata gatgaatttg accaccgtgc tcgctacaag 7260
agagaaccta taaccttgac cttagctgtt ttgttaggac tcggagtggc ggcaggaatt 7320
ggaacaggag cagctgccct catccaacag ccctattact ataatgaact cagagcagct 7380
atggatgcgg acttgggagc cttagaacag tccataacca aactggaaga gtcattgact 7440
tcattatcag aggtagtatt acagaacagg aggggattag acctgctttt tctaaaagaa 7500
ggagggctct gtgctgccct aaaagaagaa tgttgctttt acgtagatca ttctggtgtc 7560
ataagagact ctatggcaaa gctcagagat agactagaaa ccagaaaaaa agaaagagaa 7620
acacaccagg gatggtatga aaattggttt aaccggtcac cctggttctc tacgctagtc 7680
tccactttgg tcgggccttt actcatattg ttgctaatcc tgacctttgg gccgtgcatc 7740
ctcaataaac tagtagcctt tgtaaaagaa agagtgagcg ctgtgcaggt aatggtccta 7800
agacaacaat atcaggtatt acaagaagct gagggatcgc tctaagatta gagcttttac 7860
aaaaagaaaa aggagggaat gaagagtaaa aacaaaactt tcaaagaaca ctagcccctg 7920
ccctagggcc ctcttctctg taggtaatca cacccggaac tttcttaaaa aaaaaaaaaa 7980
aaaagaaaag aaaagaaaaa acagttccca gaataactac ccgaggttct gatgacctct 8040
atggaatgtt tcaacgccct aagtgtgcct caggtgtatg attcatgtga cacatggttt 8100
atggtttaac tgaagaatac tgtatgactc tgatatttcc ccattctttt gtgggttttt 8160
tgcctttata agcctgttac aaattcagac cggggtcgaa ctcctctacc cctgtgtggt 8220
gtatgggttt cgaccccagc atgctggtct gagatctcgt tccgtttcac tctcaagaaa 8280
cttcctcgtg tgattgcagc aagtctggtc ttggtgccta ctgggtgcgc gcctttcccg 8340
aggcttgagt gaggggtctc ccttcgggg 8369
<210> 5
<211> 24
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> 肉豆蔻酰化靶序列2 (Myr2), 正向链
<222> (2)..(24)
<220>
<221> 原间隔序列相邻基序
<222> (22)..(24)
<400> 5
gtcctaagcc tagaaactat gggg 24
<210> 6
<211> 24
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> 肉豆蔻酰化靶序列4 (Myr4), 反向链
<222> (2)..(24)
<220>
<221> 原间隔序列相邻基序
<222> (22)..(24)
<400> 6
gcatagtttc taggcttagg aggg 24
<210> 7
<211> 23
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> 肉豆蔻酰化靶序列8 (Myr8), 反向链
<222> (1)..(23)
<220>
<221> 原间隔序列相邻基序
<222> (21)..(23)
<400> 7
gagtgttagg gacaaaggag tgg 23
<210> 8
<211> 23
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> PPYP5靶, 正向链
<222> (1)..(23)
<220>
<221> 原间隔序列相邻基序
<222> (21)..(23)
<400> 8
gttggttgat ctattaacgg agg 23
<210> 9
<211> 23
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> PPYP6靶, 正向链
<222> (1)..(23)
<220>
<221> 原间隔序列相邻基序
<222> (21)..(23)
<400> 9
gccactgccg cccccaccag agg 23
<210> 10
<211> 23
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> PPYP7靶, 正向链
<222> (1)..(23)
<220>
<221> 原间隔序列相邻基序
<222> (21)..(23)
<400> 10
gcccccacca gaggcagaag cgg 23
<210> 11
<211> 23
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> PPYP13靶, 反向链
<222> (1)..(23)
<220>
<221> 原间隔序列相邻基序
<222> (21)..(23)
<400> 11
ggcagtggcg gatatggcgg ggg 23
<210> 12
<211> 23
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> PPYP20靶, 反向链
<222> (1)..(23)
<220>
<221> 原间隔序列相邻基序
<222> (21)..(23)
<400> 12
gcttctgcct ctggtggggg cgg 23
<210> 13
<211> 1020
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Rad51
<400> 13
atggctatgc agatgcagct tgaagcaaat gcagatactt cagtggaaga agaaagcttt 60
ggtccacaac ctatttcacg gttagagcaa tgtggcataa gtgccaatga tgtgaagaaa 120
ttagaagaag ctggtttcca tacggtggag gctgttgctt atgcaccaaa gaaggaactc 180
ataaatatta agggaattag tgaagccaaa gcagacaaaa ttctggctga ggccgctaaa 240
ttagttccaa tgggtttcac cactgcaact gaatttcacc aaaggcgttc agaaatcata 300
cagattacta ctggctccaa agagcttgac aaactgcttc aaggtggaat tgagactgga 360
tctatcacag agatgtttgg agaattccga actgggaaga cacagatctg tcatacattg 420
gctgtaacat gccagcttcc cattgatcgt ggtggaggtg aaggaaaggc catgtacatt 480
gacaccgagg gtacgtttag gccagaacgg ctgctagcag tggctgagag gtatggtctg 540
tctggcagcg atgtcctaga taatgtagca tatgctcgag ggttcaacac agaccaccaa 600
acccagctcc tttatcaagc atcagccatg atggtagaat ccagatatgc actgcttatt 660
gtagacagtg ctactgccct ctacagaaca gactactcag gtcgaggaga gctttcagcc 720
aggcaaatgc atttggccag atttctgagg atgctgctgc gacttgctga tgagtttggt 780
gtagcagtgg taatcaccaa ccaggtagta gcccaagtgg atggagcagc catgttcact 840
gcagatccca aaaaacccat tggaggaaac atcattgccc atgcatcaac aaccaggctg 900
tacctgagga aaggaagagg ggagaccaga atctgcaaag tctatgactc tccctgtctc 960
cctgaagctg aagccatgtt tgccattaat gcagatggag taggagatgc caaggactga 1020
<210> 14
<211> 1053
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Rad51b
<400> 14
atgagcaaca agaaactaag acgagtaggt ttatcacaag agctgtgtga ccgtttgagc 60
agacatcaga ttgttaattg tcaggacttt ttaggtcttt ccccactgga acttatgaaa 120
gtgactggcc tgagttatgg aggtgtccag gagcttctgt atatggtcag cagggcctgt 180
gccccacaga tgcaaacagc ctatgatata aagatgcgga ggtctgctga actctcccca 240
gcgttcctgt ctactaccct ttctgctttg gacaaagccc tgcatggtgg tgtggcttgt 300
ggatcgctca cagagattac aggtccgcca ggttgtggga aaactcagtt ttgtataatg 360
atgagtgttt tagctacatt gcccaccaac atgggaggat tagaagggac tgtcgtgtat 420
attgacaccg agtctgcgtt tactgctgaa agactggtcg agattgcaga atcccgtttt 480
ccactctatt ttaacacaga agaaaaactg cttttgatga gcagtaaagt tcatcttcac 540
cgggaactca gctgtgaggc agttctgcaa aggcttgaat ctttggagga agagattatt 600
tccaaaggag ttaagcttgt gattgttgac tctattgctt ctgtggtcag aaaggagttc 660
gatcctcagc ttcagggcaa catcaaagaa aggaacaagt tcttggccaa acaagcatcc 720
ttgctgaagt acctggctga ggaattttca ctcccagtta tcttgacgaa tcaaattacg 780
acccatctga gtggagccct cccttctcaa gcagacctgg tgtctccggc tgatgatttg 840
tccctgtctg aaggcacttc tggatccagc tgtgtggtag ccgcactggg aaactcatgg 900
agtcactgtg tgaacacccg gctgattctc cagtaccttg actcagagag aaggcagatt 960
ctcattgcca agtcacctct ggctgccttc acctccttca tctataccat caagggggaa 1020
ggcctagttc ttcaaggcca agaaaggcca tag 1053
<210> 15
<211> 1101
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Rad51c
<400> 15
atgcagcggg agctagtgag tttcccgctg tctcccacgg tgcgagtgaa gctggtggct 60
gcgggtttcc agacggccga ggacgtcctg ggggtgaagc cctctgagct cagcaaagaa 120
gttgggatat ctaaagagga agctttagaa actctacaaa ttgtaagaag agagagtctc 180
acagacaaac ccagatgtgc tggtgcatct gtggcaggca agaagtacac cgcactggaa 240
cttcttgagc aggagcacac ccagggcttc ataatcacct tctgctcagc gctagataac 300
attcttgggg gtggaatacc cctaatgaaa acaacggaag tttgtggtgt accaggtgtt 360
ggaaaaacac agttatgtat gcagttggca gtggatgtgc agattccaga gtgttttgga 420
ggagtggcag gtgaagcagt gtttattgat acggagggaa gttttatggt tgatagagtg 480
gtcacccttg caaatgcctg cattcagcac cttcacctta tagcaggaac acacaaggat 540
gaagaacacc agaaagcctt ggagggcttt actcttgaaa atattctttc tcatatttat 600
tatttccgtt gtcatgatta tactgagttg ctggcacaag tctatctcct tccagatttc 660
ctttcaaatc attcaaaggt gcagttagtg ataatagatg gcattgctct tccttttcga 720
catgaccttg atgatctatc ccttcgtact cgattactaa atggccttgc ccaacaaatg 780
atcagcctgg caaataatca cagattagct gttattttaa ctaatcagat gacaacaaag 840
attgataaaa atcaagcatt gcttgttcct gcattagggg aaagctgggg acatgctgct 900
acaataagac ttatttttca ctgggagcaa aagcaaaggt ttgcaacatt gtacaagtca 960
ccaagccaga aggagtccac aataccattt cagatcacac cacagggatt tagagatgct 1020
gctgtcactg cttcttcatc acagacagaa ggttcttcaa atctccggaa acggtcacga 1080
gaaccagagg aaggatgctg a 1101
<210> 16
<211> 1002
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Rad51d
<400> 16
aaacatgggc gtgctcaggg tggggctgtg cccgggcctc accgaagaga tcgtccagct 60
tctgaagggc caaaggatca agacagtggc ggacctggca gctgctaacc tggaggaggt 120
agcccagaag tgtggcttgt cctacaaggc cctggttgcc ctgaggaggg tattgctggc 180
gcagttctcg gctttcccat taaacggagc agacctatat gaggaactga agacttccac 240
tgccatcctg tccacaggca ttggaagcct ggacaaacta cttgatgctg gcctctatac 300
aggggaggtg actgaaattg taggaggtcc aggtagcgga aaaacccagg tgtgcctgtg 360
tgtggctgca aatgtggccc atagcctgca gcagaatgta ctgtatgttg attccagtgg 420
aggaatgaca gcatcccgcc tcctgcagct actacaggct agaacccaag atgaggagaa 480
acaggcaggt gctctccaga ggatacaggt ggtgcatgta tttgacatct tccagatgct 540
ggatatgcta caggaccttc ggggctccat ggcccagcag tcgacatctt cttcaggcac 600
tgtgaaggtt gtgattgtgg attctgtcac tgccgtgatt gccccacttc tgggaggtca 660
gcagagggaa ggcctggcct tgatgatgca gctggcccga gagctcaaga tcctggcccg 720
ggacctagct gtggcagtgg tggtgaccaa ccacttgacc cgagacaggg atggtaggag 780
gttcaaacct gctctgggac gctcctggag ctttgtgccc agtacccgga ttctcctgga 840
tgtcaccaaa ggggctggaa cattaggcag aggccaacgc acagtgtgtc tgaccaagtc 900
tccccgccag ccaacaggtc tacaggaggt gatagacatt gggacattgg ggactgagga 960
gcagagccca gaattgcctg ccaaacagac atgatgctgt tt 1002
<210> 17
<211> 1257
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Rad52
<400> 17
atggctggag ctgaggaaac agtccgtgga ggctgtgaca cccatcctcc ctttgctggt 60
gggaaatctg tgctgtgctt tgggcagagc cagtacacag cagaggaata ccaggctatc 120
cagagggctc tgaggcagcg gctgggcccg gagtacatca gcagccgcat ggctggagga 180
ggccagaagg tgtgttatat tgaaggtcat cgagtaatta acctggccaa tgagatgttt 240
ggttacaatg gctgggcaca ctccatcacc cagcagaatg tggattttgt tgacttcaac 300
aatggcaaat tctacgtggg agtctgtgca tttgtaaggg tgcagttaaa ggatggttcc 360
tatcatgagg acgtgggtta tggagttagt gagggcctaa ggtcaaaggc cttgtcactg 420
gagaaggcca ggaaggaggc tgtgactgac gggctgaagc gggcactcag gagttttgga 480
aatgcacttg gaaactgcat tctggacaaa gactatctga ggtcactaaa taagcttcca 540
cgacagctcc ctcttgaagt ggatttaact aaagcaaaga gagaagattt tgaaccatct 600
gtggaacagg caagatataa tagctgccta cagaatgaag caccgggacc cccaaaacca 660
caagaagcgg cttccccttg cagaccaagc cacccacatg attcgaacat taggctgcag 720
ggggctaagg actgcagcag ctcctgcagt ctggccgccc ccatggagag tgatgccatt 780
caccagcgca agctccggaa gctccggcag aaacagctgc agcagcagtt ccggcagcag 840
atggaggccc acctacaggg ccacacacct gccgtaaaag tgaaagccga gcgtgaggca 900
gtgcttccag accttcctcc aaaacacagt acccctgtaa ctgctgcctc agaactcctc 960
agggagaaag ccatttttcc agataaccct gaagacaacc ttgaaatgtg ggacctgact 1020
ccggatttag aggacatcat taagcccttg tctagaccag aaccacctca aacctctgcc 1080
accagagtcc aggtgatcca ggatggtgtc ctacacggcc tttgccacca gatgccacca 1140
gaaaaacatg aagctggtca cctgcaggcc cacagcactc accagcatgt attaggaaac 1200
tctgactctc ataggaagag ccaggacctg aagaaaagga aactggatcc atcctga 1257
<210> 18
<211> 2235
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Rad54
<400> 18
atgaggagga gcttagctcc cagccagttg gccaggagga aaccagaagg cagatcatct 60
gatgatgaag actggcagcc tgggacagta actcctaaga aacaaaaatc cagtaatgag 120
acccagtgct tcctgtctcc ttttcggaaa cctttgactc agttaatcaa ccgaccgcct 180
tgtctggata gcagtcaaca tgaagcgttt attcgaagca ttttgtcaaa gcctttcaag 240
gtccccattc caaattatca aggtcctctg ggctgtcgag cattgggctt gaaaaaggct 300
ggtattcgtc gtgccctcca tgaccctctg gaagaaggtg ccttggttct gtatgagcct 360
cccccactaa gcgtccatga ccaactgaag ctggacaagg agaaactccc tgtccacgtg 420
gttgttgatc ctattctcag taaggtgttg cggcctcatc agagagaggg agtgaagttc 480
ctatgggagt gtgtcaccag tcgtcgaatc cctggaagcc atggctgtat catggctgat 540
gagatgggcc tgggaaagac actacagtgc atcacattga tgtggacact tttacgccag 600
agcccagagt gcaagccaga aattgagaaa gcagtggtag tgtcaccttc cagcttggtg 660
aagaactggt acaatgaggt tggaaagtgg cttggaggca ggatccaacc tctggccatc 720
gacggaggct ctaaggacga gatagaccga aaactggaag gattcatgaa ccagcgtgga 780
gcgagagtgc cttctcctat tctcatcatt tcctatgaga cttttcgcct tcatgtcgga 840
gtccttaaaa aaggaaatgt tggactggtc atatgtgatg agggacacag gcttaaaaac 900
tctgagaatc agacttacca ggccctggac agcttgaata ccagtcgtcg ggtgctcatc 960
tctgggaccc ccatccaaaa tgacttgctt gaatatttca gcttggtgca cttcgttaat 1020
tcaggcattt tgggaactgc ccaggagttc aagaagcatt ttgagctgcc aattttgagg 1080
agtcgagatg cagctgccag cgaggcagac aggcagctag gggaggaacg tcttcgagag 1140
ctcatcagta tagtgaatag gtgcctgata cggagaacat cagatatcct ctctaaatat 1200
ctgccagtga agattgagca ggtggtttgt tgtaggctga caccccttca aactgagtta 1260
tataagagat ttctgagaca ggctaagcct gaagaagaat tgcgtgaagg caagatgagc 1320
gtgtcttccc tgtcttctat cacctctcta aagaagctat gtaaccatcc agccctaatc 1380
tatgacaagt gtgtgtcagg ggaagatggc tttgaggata ctttggatat cttcccacct 1440
ggttatactt ctaaagctgt agaaccacag ctttcaggta aaatgctggt ccttgattac 1500
attctggcca tgactcgaag ccgcagcagt gataaagttg tgctggtgtc taattatact 1560
caaacgttgg atctctttga aaagctgtgc cgagctcgaa ggtacttgta tgttcgcctg 1620
gatggtacaa tgtccattaa gaagcgagcc aaggttgtgg agcgcttcaa tagtccatcg 1680
agtcccgatt ttgtcttcat gctgagcagc aaagctgggg gctgtggact taatctcatt 1740
ggtgctaacc ggctggtcat gtttgatcct gactggaacc cagccaatga tgaacaagct 1800
atggcccgag tctggcgtga tggtcaaaag aagacctgct atatttaccg actgctatct 1860
gctggaacca tagaagagaa gatctttcag cggcagagcc ataagaaggc actgagcagc 1920
tgtgtggttg atgaggagca agatgtagag agacatttct ctcttggcga gctcaaagag 1980
ctgtttaccc tggatgaagc tagcctcagc gacacacatg acaggctgca ttgccgccgt 2040
tgtgtaaaca gacgccaggt ctggccaccc cctgacggtt ctgactgtac ttcagatctg 2100
gctcagtgga accatagcac agataaacgg ggactccagg atgaggtact ccaggctgcc 2160
tgggatgctt cacctacagc catcaccttc gtcttccatc atcgttctca tgaggagcag 2220
cggggtctcc actga 2235
<210> 19
<211> 837
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Xrcc2
<400> 19
atgtgcagcg actttcgtaa ggccgagtcc gggacggagc tccttgcccg gcttgaaggc 60
agaagctccc tgaaagaact agaacccaac ctgtttgctg atgaagattc accagtacat 120
ggtgatgttc ttgaatttca tggtccagaa ggaacaggaa aaacagaaat gctttatcat 180
ttaacagccc gatgtatact tccaaaatca gagggtggac tgcaaataga agtcttattt 240
attgacacag attaccactt tgacatgctc cggcttgtga cagtgctcga gcacagactg 300
tctcgaagct ccgaggagac catcaagctc tgcctgggaa gattgttcct ggcctactgc 360
agcagcagct tgcagctact gctcacgctg cactcactgg aagccctgtt ctgtagtcac 420
ccctctctct gccttctcat tgtggatagc ctgtcggctt tttactggac agaccgcgcc 480
agtggaggag agagtgtggc cctgcaggaa tccactctga agaagtgttc tcagctccta 540
gagaggcttg tcactgagta ccgcttggtg cttttcacaa caacacaaag tctaatgcag 600
aaagcctctg actcagcgga gcagcctgct tcctccaagc tcccaggtga cggagacaca 660
gactacagag cctatctctg caaggcctgg cagaaggtgg tgaagcacag agtcatcttc 720
tccagagagg acgaggctaa gagcagccgc ttctcattag tttcacgtca tttaaaaagt 780
aacagtttaa aaaaacatgc ttttatgatc agagaaagtg gggtggaatt ctgttga 837
<210> 20
<211> 1050
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Xrcc3
<400> 20
atggacttgg atcaactgga cctaaatccc agaattactg ctgcaattaa gaaggggaga 60
ctgaggtcag tgaaggaggt tctgtgctac tcgggaccag acctgcagag gctcaccagc 120
ctgtccaccc acgatgtgca gcacctactg agagtggccg ctctgcacct ccagggcagc 180
cgggtcctca cagcactgca gctgttccag cagagggaga gcttccccga gcagcatcaa 240
cgcctgagcc tgggctgccc ggtcttggat cagttcctgg gtggcggcct gcccctggag 300
ggcatcactg acctggctgg tcgaagctct gcagggaaga cccagctggg gctacagctc 360
tgcttgactg tgcagttccc acgacaatat ggaggcctgg aggctggggc tgtctacatc 420
tgcacagagg atgccttccc cagcaagcgg ctgtggcagc tcattgaaca gcaacagcag 480
ctgcggacgg atgttcctgg ggaggtgatc cagaagatca gattcagcaa ccacatcttc 540
atcgagcatg cggccgacgt ggacgccttg ctggagtgtg tgagcaagag ggttcccatt 600
ctgctgtcaa gggggatggc ccgcctggta gtggttgact ctgttgctgc cccattccgt 660
tgtgagtatg atgctcaggc cttggccacc agggccaagc acctgcagtc tctgggagcc 720
gcgctccgca gactgagcag taccttccgg agccctgtgc tgtgcatcaa ccaggtgatg 780
gaaacggtgg aggagcaaga gtctatgccc aggccactgg gggcctggga tgagcacctc 840
tctccagccc ttggcatcac ctgggccaac cagatcctga tgagactgat ggttgaccgg 900
gcacatgagg acgatgcctc catgggctta cccagaagcc cggcacggac catacgggtg 960
ctctctgccc cgcacctgcc cctctcctcc tgctgctaca cggtcagtgc ggaaggcatc 1020
agagggatac cgggaaccga gtcctgctaa 1050
<210> 21
<211> 5373
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Brca1
<400> 21
atggatttat ctgctgttca aatcgaagaa gtacaaaatg tccttcatgc tatgcagaaa 60
atcctggagt gtccaatctg tttggaattg atcaaagaac ccatttccac aaagtgtgac 120
cacatatttt gcaaattttg tatgctgaaa cttcttaacc agaagaaagg gccttcacaa 180
tgtcctttgt gtaagaatga gataaccaaa aggagcctgc aaggaagcac gaggtttagt 240
cagcttgttg aagagctgtt gaaaatcact gatgcttttg agcttgacac aggaatacag 300
tatgcaaacg gttacagtat ttcaaaattg aaaaattctt ctgaaccttt gaatgaggaa 360
gcttccatca tccagagtgt gggctaccga aaccgcggca aaagacttag acagattgaa 420
tctggaaatg ccaccttgaa ggacagtctc agtgtccagc tgtctaacct tggaattgtg 480
agatcaacaa agaaaaatca tcagacacag cctcgaaata aatctgtgta cattgaatta 540
gagtctgatt cttctgaaga gacagttagt aaaccagatg actgcagtgt gagagaccag 600
gaactgttac aaaccacctc tctgggagct ggagatgaag tcagtttgga ttcttcaacc 660
agagctgctt gtgagttttc tgaggacgta acaaatattg atctgcacca gtgcagtaat 720
aaagatttgg accccattga gaatcatgca actggaagat atccagaaaa atgtcaggat 780
atttctgttt caaacttaca tgtggagcca tgtggcacag atattcatgc cagctcgtta 840
cagcatgaga acagcagctt attactcact gaagacagaa tgaatgtaga aaaggctgag 900
ttctataata aaagcaaaca gtctggctta gccaggagcc aacagaacag atgggctgaa 960
agtaaagaaa catgtaatga taggcagatt cccagcactg agaaaaaggt agatccaaat 1020
actgattcct tctgtgggag aaaaaaatgg aaaaatcaga aaagtctgtg tcctgagaat 1080
tctagagcta cccaggatgt tccttggatg acactgaata gcagcattca gaaagtcaac 1140
gagtggtttt ccaaaactgg tgaaatgcta acttgtgatg gcacatctga caggaggcat 1200
gagtcaaatg ctggagcagc tgttgtgtta gaagtttcag atgaagtaga tggatgttcc 1260
agttcttcaa aagaaatgga cttagtggcc tctgatcccc ataatgcttt aaagtgtaaa 1320
agtgaaagcg acctctccaa accagtagag aacaatatcc gagataaaat atttgggaaa 1380
acgtatcaga gaaagggaag tctccctcac ttgaaccacg taactgaaat tataggcaca 1440
tttattgcag aaccacagat aacacaagaa caccccttca caaataaatt aaaacgtaaa 1500
aggagaacta catgccttca tcctgaggat tttatcaaga aagcagattt aacagttact 1560
caaaagactt ctaaaaatgt aaatcaagga actgaccaaa tggagccaga tggcctagtg 1620
atgggtatta ccagtaatgg tcaagagaat gaaacacaag gtaataatct tcagaaagag 1680
aaaaatgcta atccagtgaa gtccttggaa aaggggtctg tttccacaac taaagccaaa 1740
actataagca acagtataag tgatttggag ctagaattaa atgtccacaa ttcacaggca 1800
cctaagaaaa gtcggctgag gaggaagtct tcaaccagat gtgttcttgc actggaacca 1860
gtcagtagga atccaagccc acctgcttgt actgaatttc aaattgatag ttgtagcagc 1920
agtgaagaaa cagagaaaaa caattccaac ccaacaccag tcaagaacat tagaaagcct 1980
caactcacgg aggacacaga acctgcagca gattccaaga agaataaaga gccaaatgaa 2040
caaagaagga agagaagggc cagtgatcct ttcccagaag agaaatttat gcctggctta 2100
ttaactaact gtccaagttc tagtaaacct caaggacctg ccaatcctag ccctcagaga 2160
aaggaagtag agaaacttga aacaagccaa atgtctgaca gtaccaaaga cctgagggat 2220
ctgttgctgg atggagaaca gggtttgccc actgagaggt cggaggagag taccagtgtt 2280
tcattggtgc ctgacactga ttatgacact cagaacagtg tgtcattgct ggaagctaat 2340
gctgtcagat atgcaaaaac agtatcaagc cagtgtatga cccagtttgt agcaagtgat 2400
aaccctaacg aactggtcca tggttctaaa gatgctggaa gtggcacaga gtgcttcaag 2460
catccattga gacacgaact tagccacatt caggagacca tagaaatgga agagagtgaa 2520
cttgatactc agtatttaca gaatacattt caagcttcaa agcgtcagtc atttacttta 2580
ttttcaaaac caagagatcc ccaagaggag tgtgtaacag cttgtgcttc ctctgtgtcc 2640
ttaagggaca tgagtccaaa agtgacttct gaaggtgaac aacaagaaga aagtcgggga 2700
cacgaagagg ctgaaatcag tcacatacag gcagggcctg cgacagtggg cgtgcctctg 2760
cctcgtcagg aaggtgatcc aggcgctgat acaatgcatg ctgcagtgtg cagcctttgt 2820
ccatcatctc agtacagaag caatgaaaac tcacatccta aacaatcagc ttctcccatc 2880
atgtcttcta taaaaactgg ccatgggaaa accctgtcag aggaacaatc tgagaaacat 2940
acattgtcaa atgaaaaggc aatgggaaat gagacctttg ttcaaagcac aatgcacaca 3000
attagccaaa accacagaaa aaatggttgt caagaagcca actcaggcag tattaatgaa 3060
gtgccttcca gtggtgaaaa cttccaagga cagctaggcc gaaacagaag gactaagtta 3120
aacactgtgc ttccactagg tcttatgcaa cctggagtct gtaagcatag ttttcctgtc 3180
agtgattata aatatcttga aataaaaaag caggaaggtg agaatgttgg tgcacacttc 3240
tcttcgtgtc tgttttcaga taagctcgaa caacctgtag ggagtggtaa tgtttttcag 3300
atttgttctg agacacctga tgacctgttg gatgatgttg aaatacagga aaatactagc 3360
tttggtgaag ttgacataat ggagaagtct gctgttttta acgggagtgt ccagagacga 3420
gagctcagta ggagccctag ccctttaacc catgcatcgc tggctcggaa tctccagaga 3480
cggtctagga agttagagtc ctcagaagac agcggatctt gtgaggatga agaccttccc 3540
tgcttccaac acttacttgg ccaagtaagc aaaacacctg aacctagcag tgttgtgaca 3600
cagcctctgt cagagaaagc agaggggacc caagtgccat ggaagagtag tgttggtgac 3660
tctgataacg aggtgatctt gatagaggca tctcaggaac atcaccctag tgaggatgca 3720
aaatactctg gcagcatgtt ctcttctcag cccagtgctg tacaaggttc aactgcaaat 3780
acaagctccc aggacccctt gtttaacctt tccaaacaaa agagtcacca gtctgaggat 3840
gaggaagatt ttctaagtga caaggaattg atttcagatg atgaggaaat gggaacttgc 3900
ctagaagaag ataatgatca agaagaggat attataatcc cagattcagc tgaagcggca 3960
tctggatatg agagtgaaac aaacctttct gaagattgct cacagagtga tattttaacc 4020
actcagcaga gggccaccat gaaggataac ctgataaagc tccagcagga gatggcccac 4080
ctggaggctg tgctagaaca gcaaggggac cagccttctg tccactcctc gtctctcaca 4140
gctgaacctt gtgcccctga agacctacca aacgcagaac aaaacttatc aggaacagca 4200
attttaactt caaagaatat taatgaaaat cctgtaagcc ggaatccagc atgcgtttct 4260
gctgacaagt tccaaccaca acctccagac agttccagca gtgaaaataa agagtcaagg 4320
gaaggaaggc cttccctttt taaatctccg ttggcaggca gtaggtgctc tgcacacagc 4380
cgctctggga gtcttcaaaa cagaaactgc ccatctcaag aggagctcct ttggactgtt 4440
gaagcaggga agtcagaagg aacgccatac ctggaatctg gaatcagcct tttctctaat 4500
agagaccctg aatctgagtc ccctaaagag ccagcttatg tttgcaccac accagcttca 4560
acctctgcac ggacaatatc ccagtatcag gtttctgact ctttcgagag tccggctgct 4620
actcatgctc atactgcagt gatagaaact gtgagcaaga aaaagccaga attgacatct 4680
tcaaaaggaa gagccaataa aggaatatcc atggtggtgt caggcttgac ccccaaagaa 4740
gtaatgattg tgcaaaagtt tgctgaaaaa taccgcctca ctttaactga tgcaattact 4800
gaggagacta cccatgtcat tatgaaaaca gatgctgagc ttgtgtgtga acggacactg 4860
aaatattttc tgggaattgc aggaggaaaa tggatagtta gctattcatg ggtgattcag 4920
tctattcaag aaagaaaact tctgagtgtg catgaatttg aagtcagagg agatgttgtg 4980
actggaagaa accaccaagg tccaaagcga tccagagaat cccaggaaaa gctcttcaaa 5040
ggcctaacaa tctgttgttg tgagcccttc accaacatgc ccaaagatga gctggagaag 5100
atgctgcagc tgtgtggggc ttccgtggtg aaggagcttt cgtcactcac ccctgacacc 5160
ggtgttcatc caattgtgat tgtacagcca agtgcctgga cagaagagaa tggctgccct 5220
gagattgacc agctgtgtgg ggcgcacctg gtgatgtggg actgggtgtt ggacagtata 5280
tccgtctacc ggtgtcggga tctggacgcc tacctggtac agaatatcac ccatggccac 5340
gacagcagcg agccacagga ccccaatgat tag 5373
<210> 22
<211> 10098
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Brca2
<400> 22
atgtccaatg aatacaaaag gagaccaact ttttttgaaa tttttaaggc acgatgcagc 60
acagcagact taggacctat aagcctgaat tggtttgaag aactttcttc agaagcccca 120
ccatataatt ttgagcctcc agaagaatat gaatataaga ccaacaatta tgagccacag 180
ctgtttaaaa cgccacagag gaagctctct taccatctgt tggcttcaac tccaataata 240
ttcaatgaac aaggtcaaac tctaccagta gaccagtcgc ctttcaaaga actagggaag 300
actcttggaa atagtagaca taaaaatcac cacagaacca aggccaaaat ggactccatg 360
gttgatgttg ccagtccacc tctgaagtct tgtctcagtg aaagccctct tactctgcga 420
tgcacacagg ttgtaccaca aagagaaaag ccagtgatgt gtggaagttt attttctaca 480
ccaaaaatcg aggagggtca gacacctaaa cctatttctg aaagtctggg agttgaggtg 540
gatcctgata tgtcttggtc cagttcatta gctacaccac caacccttag ttccactgtg 600
ctcatagccc gagatgggga agcacgagga attgtgtttc ctgaagactc ccccgctgtt 660
ttgaaaagct acttttccag ccacaatgaa agtctgaaaa agagtggtat atcagttccc 720
tctgtgactg acagcgagaa caaaaaccag agggaagctt ttagtcatgg attggggaaa 780
acgttagagg attcatctgg caaaacaaac agcttcaaag attgccttag gcagtcaata 840
ccaaatgttc tagaagatgg ggagacagct gcagatactt ctgaagaaga tagtttctca 900
ttatgttttc ctaagcataa aaccagaaaa atgcaaaaaa tgagaatggg caagaccagg 960
aagaaaattt tcagtgaaat aagaactgat gaattaagtg aagaaactag aagtggagct 1020
gatggaaaac attcatttgc acttgaaatt gacccaagag atagtgatcc cttagatcca 1080
gatgtgacaa accagaaatg ctttgacaat gggaatgagg aaatctgcga ggaagttgta 1140
cagtcttcag acactcgatg gtctcagcta accctttctc gtctaactgg tacccagaag 1200
ggaaaaatac ctctacctcc tatttcttct tgtaaccaaa ataattcaga aaaagacttc 1260
atagatacga aggaagaagg tattgactct gttactttag aaaattcttt gcctcatatt 1320
tctagttttc cagaaccaga aaagatgttc tgtgagaaaa ctctggtaga taaggaacat 1380
gagggacagc atcttgaatc acatgagaac tccattgcag ggaagcaagt ggtatctgga 1440
acttgtcaag cagcttgcct attgagagag ccacttgaag agtctctggg taatctcttc 1500
tcagagagtg tgactagctc agcctttaca gaagaaccca gtgcctctgc aagtggattg 1560
ggaatatgtg ctgtgtcctc acagagagag gattctttgt gtcctagttc aggtgacact 1620
ggaaactggc catcaactct cactcacact tctgcaactg tgaacaatac aggtttaata 1680
tccagtctaa aaactaaaag aagaaagttt atttactctg tcggtgacag tgcatctcat 1740
caaggaaaaa tactacaggc agacagaaag tcagagctca ctaacacttc tgctcagttc 1800
gaaacaagtg cttttgaagc gccattcacg tttacaaatg ggaattcagg tttatcagat 1860
tcttctctcc aaagaagctg tttacagaat gatgctgaag agccatcttt gtccttatcc 1920
acctcatttg tgactgcttc caagaaagaa agtagttata gtaatgcatt gatatctcag 1980
gatctccatg acaaagaagc aatagtcagt gaagaaaaac tgcagccaca tacagccctg 2040
gaaactgatt gtctgtcgtg cttgccagaa agacaatgtg aatatgatcc aaagggtccc 2100
aaagtttcag atggaaaaga agaagtctta gtctcagcat gtcatcctgc aggacagcac 2160
acagcagcag cacagcccag cagcattagc tttgaattac aggaagaccc tgtcaatggc 2220
cacaatagta caagtcctaa agaaactcct agcttgaagg tgcttctgtc aaagccagtt 2280
gtgctttcta gaggaaaagt gtcatgtaaa atgccagaga aactgcagtg tgagagttat 2340
aaagataata ctgaattaag caaaagcatt cccttgggag gaaataaaat acacatccta 2400
agtgaaaatt ctaaacctcc tgagcttctg ccacctggaa aatatgtaac agaagcatcc 2460
cccacagtga agtctcagtt caatcagaat acaaatctag cagtcaaaaa aaatgaccaa 2520
gaagaaacgc cttttatttc agaagtaaca gtcaatgtga gttctggaga acttttccca 2580
gacaatgaga ataatttcgc ctttcaagta actcatgaaa ataataagac tgccttagga 2640
agtactgtgg aactgcagga agaagacctc cgccatgcta aagggcctaa tctcaacaac 2700
tctcccacag cagtagatgg agacataggt gatgagcaag cagctcatgc actgattatg 2760
gaagactccg attcctcagc tttagtccat gagtgtgcaa agaagagcag aaatactata 2820
gagcagcatc tgaaaggaac cacagacaaa gatttcaatt cctccttgga tgtgaaatca 2880
gatgggaaca atgactatac agacaaatgg ccaggatttt tggatccagt ttttaagcat 2940
aaatttggag gtagcttcag aacagcttcc aataaagaaa taaaactttc agaacataat 3000
gttaagaaaa gcaaaatgtt cttcaaagat attgaagagg agtatcctac tagtttaacc 3060
tgtattgaca tagttaatgc ctcaccatta gcaaaccagg agatactaag tggaccttat 3120
acatttgatt tgcagtcagt cactaccatg tctgcccatc cacagagtca ggcatctgtt 3180
tcttgtgaag atactcacac atcacttcag gtgttacctt caaagcaaga ttttcattcg 3240
aatcacaatt taacacccag ccaaaaggca gaaattacag aactttctac tatcttggaa 3300
gaatcaggaa gtcagtttga attcacacag ttcaaaaagc caagccatgt agcacagaat 3360
aatatacctg aagtgcctgg aaaacagacg gttgccataa atactacttc tgaggggtgg 3420
aaaaggattg gtcttcatct cacagtggat cctgcctctg tagctcagac agatgacagc 3480
aagaaatttg aaggttctgc tggatttaga caaagctttc cttgcctgtt gaaaagcagt 3540
tgtaacaaaa atacatctag ttttttagca aatgtaaatg aaatggagtt tcgaggattt 3600
cgttctgctc ttggcacaaa gcttagtgtg tctagtgagg ctctgcaaaa agctgtgaaa 3660
ctcttcagtg acattgaaag tggtagtgag gagacttcca caaaagtcga cccaagagct 3720
ttgtcttcag gtgctcgtca tgattctggt gcttctgtgt ttaagataag gaaacaaaac 3780
agtggtaaaa gttttgatga gaaaactagt aagtgccaag taacattaca gaataatacc 3840
gaagtgacta ctggtatttt tgttgacaga aatcctgaaa attatgcaag aaatacaaaa 3900
tgtgaagata acaactctac tggttttcaa agaagtcctt ataaattaaa aaactcggag 3960
gatagtgaat caagtacaag cggcacagtt tctgttcatc aagatgatgg tgacttacca 4020
tgtgctgctg atcactgcag caagtaccct gagtcgtgtt cccaatatgt aagggaggaa 4080
aacacacaaa ttaaggaatg tgtatcagat ttaacatgtt tggaagtcat gaaagctgag 4140
gaaacatgct atattcaacc ttcagataaa gaacaattac cttcaggtaa gatggaacaa 4200
aatagaaaag attttaatat atcctttcag actgcaagtg ggaaaaatgt cagagtctct 4260
gaggagtcat taagtaaaag tatgaatatt ttaaatcaag taacagatga atcgatcatc 4320
tcttcagatt ctttgaattc taaatttcat tgtggcacaa ataacaacaa gatgggtatt 4380
tcacatcaca aggaaactac cagtactaaa aaggtatttg aagaacgttt cccagttggg 4440
actgtcagtc aattaccaac tctccagcag catcctagat gtgaaataga aagtatcaaa 4500
gaacctgctc tgttgggttt tcataccgct agtggaaaaa aagtcaaaat tatgcagaaa 4560
tctttagaca aagtgaaaaa cctttttgat gagacacagt atgttagtca tcaagggtca 4620
aaacccttga aggacagaga gaactgcaaa gaaggacttg cattaggatg tgagacaatt 4680
gaaatacctg cctccaagtg tgaagaaatg cagaagagct ttctctctaa ggagtctgaa 4740
gtgctatcta agcaaagtga tcgtttgtat aggtcgactg aaaatctcag aacatcaaat 4800
ggtacctctt ctaaagctaa tgtacatgga aacatagaaa gtgaaataga aaaaagtcct 4860
acaacttgct gcattagtca tttatcttat tcagtcactg aagattctgc tttgacatgt 4920
gacacaggac acggtagaaa aacttgtgtc agtgagtctt ctctatccaa agacagaaaa 4980
tggcttagag accgactggg tgataagctt caaaaaagag atgctgccga aattgaatgt 5040
gtaaaagaac atactgaggg ttatgctgga gatgcctcat gtgagcatag tttagacagt 5100
atcagaaatg aagttgatat aaattgtgtc tctgaaaatc aaacttcagc cctctttagt 5160
gaccctagca tgtgtcatag ctgtccatcc cattttggtt gtcattgtga taacaagcat 5220
aatgactcag gatatttctc aaaaaataaa atttattctg atactcagcc agacacgaag 5280
aatgaagaca ctgccaattt ttccagtgta tatgctacaa aagaagtaaa tatatacccg 5340
ccaactgtaa atgaagatat ttgtgttcag aaacttgaga ctaactcttc accacataca 5400
aataaaaatg tagccattga cttggctata gcagattcaa ggaattgtaa ggtatgccca 5460
tccaagttca ttacagatca ctcacaagaa actgtgaaaa cagtaaaagc aatatttaca 5520
cataacagtg ataaaacaat taagcaaaac acaaagagta aaccagatac ttgccggaca 5580
agctgtcaga aagcattgga taattcagag gattttatat gtcctagctc tttagaagat 5640
gactatatga actcacataa gacttctgtt tatacccacg atgaacaaat attacagcat 5700
aacctaagtg tgtctggact ggagaaagct caaataccac ctgttcactt ggaaacttgg 5760
gataagtgta aatctacaag ggaacttgca caggcagcct gttcttcaca catgccgggg 5820
atttttagca cagcaagtgg aaaagctgta caggtatcag acgcttcatt agaaaaggca 5880
aggcaagtgt tttctgagat ggatggtggt gctaaacagt tactttccac attgtctctg 5940
gaaagtcatg aacaatcaga ccactctggg agaagagaaa actctgtgac acataaccct 6000
gaggatgtat tgtcactccc aaaaaccttt gcaagcaatg ccaattcatc tgtattctct 6060
ggatttagta cagcaggtgg taaacgggtc acagtttcag aaagtgcctt acacaaagtt 6120
aagggaatgt tagaggaatt tgatttgatc ggaactgaac atactctcca gtgtccacct 6180
acatctgaag gtgtatcaaa aatacttcct caatattgtg ttgaaaagag aaccccagaa 6240
taccctataa actctaaatt gcagaaaacc tatgatgata aattcagttt accaaacaac 6300
tataaagaaa gtgcttcttt ggggaatact cattctcttg aagcttctcc ccaactctct 6360
cagtttaagc aagacacacg gttggtatta ggaaccaaag tatcccttct ggaaaaagaa 6420
caaaccttcc ctcaaaatat aaaaacagaa agtggtgtaa tggaaacttg tcctgatgtc 6480
cctgtgagaa caaatgtagg agactgttct gctttcgaca aaaagccaga gaactgtttt 6540
gaaacagaag cggtggagat tgccaaagct tttatggaag atgatgagct gacggattct 6600
gaaccaagtc acgacaaata ctcattgttt acctgccccc aaaatgaggc tttgttaaat 6660
ttgagaacta gaaagagaag aggaatggct gttgatgcag ttggacaacc cccaatcaaa 6720
agaagcttat taaatgagtt tgacaggata atagaaaata aaggaaaatc cttaaagcct 6780
tcaaaaagtg ctccagatgg tacaataaaa gacagaagat tgttcacgca ccacatttct 6840
ctagagccag ttacctgtgg acccttctgc tctaccagag aaaggcaaga aatgcagagt 6900
ccacatttca ctgcacctgc tcaaggactt ctgtctaaag ggcatccttc tgtgcgttcg 6960
gctttggaaa aatcttcaag caattctaca gtttcagtcc agccgactca taaagtttct 7020
gctacaagga atgaaaggac aggatgctca gtcacaggca aatcccacaa agtcttcgtc 7080
ccacctttca aaatgaaatc acagtttcac agagataaac atttgaataa caagaatatt 7140
aattcagagg aaaagaacca aaagagcaga gatggagaca gtgaagatgt gaacgacggt 7200
gacattcgtc aatttaaaaa aggcagcttc catcaagagg ccgctagaat tgtcacagag 7260
tgtgaagaag agcctttaga tttaatgaca agccttcaga atgccagaga cctacagaat 7320
atacgaatta aaaagaaaga aaggcatcag ctctgtccac agccaggcag tctgtatctt 7380
accaagtcat ccactctgcc tcggatctct ctgcaggccg cagtaggagg ccggcttccc 7440
tctgcgtgtt ctcataagca gctctatatg tatggcgttt ctaaagagtg cataagcatt 7500
aacagcaaaa atgcggaata ttttcagttt gacattcagg attattttgg taaagaggac 7560
ctgtgtgctg gaaagggcat tcagctggct gatggtggat ggctgatccc ctccaatgaa 7620
gggaaggctg gaaaagaaga attctatagg gctctgtgtg acactccagg tgtggatcca 7680
aagcttattt ctagcctctg ggtctctaat cactaccggt ggattgtgtg gaaactggca 7740
gctatggaat ttgcttttcc taaggaattt gctaacagat gcctaacccc agaaagagtg 7800
ctgcttcaac taaaatacag atacgatgtg gaaattgaca acagcagcag atcagcccta 7860
aagaagatcc tggaaaggga tgatactgct gcaaaaacac tcgttctctg tgtttctgac 7920
gtcatgtcac taagcacaac tggatcagaa acttcaggcg gcaaaactag tggtgcagat 7980
cccaagagca tagacacgat cgaactcaca gacggatggt atgctgtcaa ggcccagcta 8040
gaccctccac ttgtggctct tgtaaagagc aggagactga ctgtgggtca gaaaatcatt 8100
acccaagggg cagaactggt gggatctcct gatgcctgcg cacctctgga agcaccagac 8160
tctcttagac tgaagatttc tgccaacagc acacggcctg ctcgctggca cagcaaactg 8220
gggttctttc atgaccccag gcctttccct ctgcccttgt cctcactgtt cggtgatgga 8280
ggaagcgttg gctgtgtgga catcattgtt cagagagtgt accctttaca gtgggtggag 8340
aagacggcat caggattgta catattccgt aatgagagag aagaggagaa ggaagcagtg 8400
agatttgcag cggcccaaca gaagaaactg gaggccttgt tcaccaaaat ccaggcagag 8460
tttaaagacc atgaagaaga ctcagcgcag cggcgcgtgc tgtcccatgc actcacaagg 8520
cagcaggtct atgctctgca agatggtgca gagctctatg cagcggtgca gagtgcattg 8580
gatccagatc accttgaggg ttgtttcagt gaagagcagc tgagagcctt gaacaaacac 8640
agacaaatgt tgaatgataa gaagcaagca cagatccaat cagaattccg gaaggccgtg 8700
gagtccgctg agcaagagga gggcttatca agggatgttt caactgtgtg gaagcttcga 8760
gttacaagct acgagagaaa agaaaagtca gctctgctga gtatctggcg tccatcatca 8820
gacttacact ccctgttaac agaaggaaag agatacagaa tctatcatct ggcagtatca 8880
aaatctagga gtacatttga acgacctagc atccagttaa cagctacgaa aagaactcag 8940
tatcagcagc taccggctgc cagtgaaacc gtattccagg tttaccagcc gagggagccg 9000
cttgacttca gcagactgtt agagacagcc tttcagcctc cttgttctga agtggacctc 9060
gtaggagctg tagtttctgt tgtaagaaca acaggtcttg ctcctttggt ctacctatca 9120
gacgaatgcc ttaatttatt agtggtaaag tttgggatag accttaatga agacataaag 9180
ccacatgtgc taattgctgc aagcaacctc cagtggcacc cagaatccag atcaggagtg 9240
ccaacgttat ttgccgggaa tctttccata gtttctgcca gtccaaagga ggtctacttc 9300
cagaagcgag tcaacagaat gaggcaaact gttgagaata tcgatacatt ttacaaggag 9360
gcagaaaaga agcttttaca tctgcttaat ggaaacagtc ccaagtggtc caccccaaat 9420
aaagactcta ctcagccggc ctacacttgc cctgcttcag agctccttgc tacaggaggt 9480
cagctaatga ggttctcacc taatagtgag caaagttatc caagtccttt atcacattgc 9540
acaccaaaag aaaagtctac acccctggct cggtcagccc agatggcatc aaagtcttgt 9600
aacagggaga gagagactga tgaccgaaaa acctgcagaa aaagaagagc cttggatttt 9660
ctgagtcggc tgcccttacc tcccccggtc agtcccattt gtacctttgt ctctccggct 9720
gcacagaagg cttttcagcc gccacggagt tgtggcacca aatatgcaac acctatgaag 9780
aaaaaagaac ccagttcccc tcagaggagg acgccatttc agaaggacag tggcatttct 9840
cttctggaac aagattcggt agctgatgaa gaacttgcct tcctcaatac ccaagctctt 9900
gtacctggct caccagaaga aaatcaacaa gtacttcctg gtgactccac aagaacctct 9960
gtgccccaca acaaaagaac ccccagccag cacagaggcc agaccagcat gtaggacccc 10020
gatccaggaa ggggagtcta tctcagggat tacagaggtg gcaagggcag tgatggaaaa 10080
ttagctgtcg agtcttag 10098
<210> 23
<211> 888
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Cyclin D1
<400> 23
atggaacacc agctcctgtg ctgcgaagtg gagaccatcc gccgcgcgta ccctgacacc 60
aacctcctga acgaccgagt gctgcgagcc atgctcaaga ccgaggagac ctgcgcgccc 120
tccgtgtctt acttcaagtg cgtgcagagg gagattgtgc cgtccatgcg gaaaatcgtg 180
gccacctgga tgctggaggt ctgcgaggag cagaagtgcg aagaggaggt cttccctctg 240
gccatgaact acctggaccg tttcctgtct ctggagcccc taaaaaagag ccgcctgcag 300
ctgctagggg ccacctgcat gttcgtggcc tccaagatga aggagaccat tcctttgacc 360
gccgagaagt tgtgcatcta cactgacaac tctatccggc ccgaggagct gctgcaaatg 420
gaactccttc tggtgaacaa acttaagtgg aacctggccg ccatgactcc ccacgatttc 480
atcgaacact tcctctccaa aatgccagag gcggatgaga acaagcagat catccgcaag 540
catgcgcaga cctttgtggc cctctgtgcc acagacgtga agttcatttc caacccgccc 600
tccatggtgg ctgccgggag cgtggtggct gcaatgcaag gcctgaacct gggcagcccc 660
aacaactacc tgtcctgcta ccgcacaacg cactttcttt ccagagtaat caagtgtgac 720
ccggactgcc tccgcgcctg ccaggaacag attgaggccc ttctggagtc cagcctgcgc 780
caggcccagc agaacatcaa ccccaaggcc accgaggaag agggagaagc agagggagag 840
actgacctgg cctgcacacc caccgatgta cgagatgtgg acatctga 888
<210> 24
<211> 882
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Ercc1
<400> 24
atggaccttg ggaaagacga gggaagcctg ccgcagccca ccaggaagaa gtttgtgatc 60
ccactggaag acgaggcccc tcctgcaggg gccaagccct tattcagatc ctcacggaac 120
cccagcacca cggccccctc ggtcccagcg gcccctcaga cgtacgccga gtatgccatt 180
gcccagcctc caggaggggc tgggcccaca gggcccacag gctctgaacc tgtgaaggga 240
gagaaccccg gccagacggt gaaaacggga gcgaaatcca atagcatcct tgtgagcccc 300
cggcagaggg gcaaccctgt gttgaagttc gtgcgcaacg tgccctggga attcggcgag 360
gtgacccctg actatgtgct gggacagagc acttgcgccc ttttcctcag cctccgctac 420
cacaatctcc atccagacta catccacgaa cggctgcaga gcctggggaa gagctttgcc 480
ctgcgtgtgc tgttggtcca agtggatgtg aaagatcctc agaaggccct gaaggacctg 540
gctaaaatgt gtatcttagc ggactgcacc ctggtcctgg cctggagtgc cgaggaagca 600
ggacggtacc tggagaccta caaggcatat gagcagaagc ccgctgacct cctcatggag 660
aagctggagc agaacttcct gtcccgggcc accgagtgtc tgaccaccgt gaagtcagtc 720
aacaaaaccg acagccagac cctcctggct acatttggat cccttgaaca gctcttgacg 780
gcatcacggg aggacctagc cttgtgcccc ggcctgggcc cccagaaggc ccgcaggctc 840
tttgacgtcc tccatgaacc cttcctcaaa gtgccccgat ga 882
<210> 25
<211> 4473
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> MDC1
<400> 25
atggaaaaca cccaggttat tgactgggat gctgaagagg aggaggagac agaaataccc 60
agtgggtcct tggggtatag cttggagcct atagggcagc tgcgtctctt cagtagtact 120
catggaccag aaagagattt cccactctac cttggcaaga atgtaattgg ccgaagcccc 180
gactgctctg tggccctgcc ttttccatcc atctctaaac agcatgcagt aattgaaatc 240
tcagcttgca acaaagcccc tatcctccag gattgtggga gcctcaatgg cactcaactg 300
gtaaagcccc caaaggtcct aacccctgga gtgagccatc gtctgaagga ccaggaatta 360
attctgtttg cagactttcc ctgccagtac cgtcgcttgg atgtccctcc acctttggtc 420
tctcggggac ttctaactat agagaagacc cccagaatac agggagggtc ccaaacctcc 480
agagttttgt tggctgagga ttcggaggag gaagtagatt ttccttctgg aaggtatgtg 540
gcaaatggat caaggaatcc aacgtctcca tcagcaacag tagtaccaga aagtgatgaa 600
gaggggtctt ctccagccca aagtgtccgt gggccgtctt tgccctttga cttgggcagt 660
gacacagatg aagagctatg tccacagcca gcagttgggg agtcctcttc agttgccagg 720
gatggtgctg ctgcagaggc caagcagctg gaagctaatg gagtgacatc tggtatccag 780
ctggtactgg ctcagcctgc tgagcaaaag ctcagagatg caaaagtcaa gagtgaggct 840
ggcaatggag cggctgtggt tgggaggggc tccactgtgg gtaaggacag caacacggaa 900
atgggtgaag aacaccagcc ttccggcttt gtggacagcg atacagacgt ggaagaagac 960
aggatccctg tgaccccccc tgtagttccg gggaagaagc aagtcctgct tggagttggt 1020
aaaaaggacc ctggagcacc tgtcgtgacc catctgcagg acagcccagc tggtcgtggc 1080
acaggtgtgg aagaaggcaa gactccagtg gctggccctc cagagagaaa ccacacggcc 1140
atggtgatca gcagcgacac agatgaggaa gatggagtct cagcagcagt caccttggcc 1200
catctgaaag acagggggat ggctctgtgg agcagggagc caggcatgga agaggtcaag 1260
tcccaaccac aggtcctcgt agaacgaagc cagagtgcct ctgggaaaga cagtgacaca 1320
gacgtggagg aggaaaagag agaagtggtc cctgacagcc ccatggacac agatgaggct 1380
cttactgtcc cacattcaga gagccaagct ccccatagag ccagtgatga tgtagaccag 1440
ggtgtggata tgggctcccc tggtggtcag ctagagggaa accaggcctc ctctgccaca 1500
gtagaagaca gtagtgcaca agcagggaag gaagtcctgc ctcctgagga ggcctgggaa 1560
acagctgtgg aggaaggctc atcttcagca gcggcagatg taagacaaag caagcagcca 1620
ggagtagaag atgctgggac agagtgggct gcaactgttt gtgagcaggc gagcatgctt 1680
gaggtggggg tccaaggcag gtcacctgct acactggtag agccagtggt ggtgcctaca 1740
gctactctgg gggatcccac tcagccacag agagagggag cccagacccc cacaggaaag 1800
gagagaggag tacaaatggg caggaccaag aatgccaaag actgccgtga tgcagagtct 1860
gaagatgtgt gccttccggc tacccagtgc tttgtagaca gggagggcca gagctcagaa 1920
gctgtccaga gtttggaaga tgagcctacg caagtctttc catgcactct tccccaagag 1980
cctgggcctt cccacctcag cctgcagacg ccaggtccag gtgcccagga tgtgccttgg 2040
gaagtcttag ctacacagcc gttttgtctg agagaagctg aggcctctga actgcagctc 2100
atggacaccc accctgcagc tcatgaatcc cacccatctg tgtctagtgc atcagcagga 2160
cagcagcatc tggttcacac agagccgctg ggaattgaag gcggagagat gcaaactgtg 2220
gagaaagcca tgggccaatt gagttgcaag atggcatctg ctggagagga ctcaaggggt 2280
gatccagaac cctcggccca tcgcctgctt tctccagttc ctgaagcttc ttctccacct 2340
cagagtctgc tcacctctca gagccaaaag ccgtctacac cccagtctct gttacttacc 2400
tctccccctt ctgagctaca ccttcctgaa actcctcaca ccaagcctaa tgtcaggcct 2460
cggcggtcct ccaggatgac ctcctcccca cactcctctg ctgcccttaa gccctatact 2520
acctgcccca caaacctgcc tgctgcccct agaccaacat ctcgggctac tcggggcagg 2580
ggcagggcaa ataggtcctc taccaggacc ccggaaccag ttgtccctac agactctgag 2640
cttcaacctc ccacctccac agaacagtct gtcatcccca aacccacatc tccagtcact 2700
cagggcagca taaatggttc ctttgttaaa acgcctgaac cagttgttct cacaggtccc 2760
aaaatccagc ctcccacctc cacagaacag cctgttaccc caaaccccac acctcaggcc 2820
actcggggca ggccacatag gtcttccatc cagaccccag aaccacttac tcccactggt 2880
cctgacctcc agcctcccac ctccacagaa cagcctgtca tacctaaacc cacatctcgg 2940
gctgctcggg gcaggtcacg taagtcttct accaggaccc cagaaccagc tgtccccact 3000
ggtcctgacc tccagcctcc cacctccaca gaacagcctg tcacacctaa acccacatct 3060
cgggccactc ggggcaggtc acgtaagtct gtcagaaccc cagaaccagc tgtccccact 3120
ggtcctgacc tccagcttcc cacctccaca gctctgggca ctttgggaag ggcatgtaag 3180
tcctccattg aggattctga atcagttgga ccagtagcct ctgattttga acctcccatc 3240
tccacagacc ttgttgcccc tgaggtgaca ggtcagagca taacactaaa gtcttcacca 3300
ctaagtgctt ctccagtttc tgccacctct gaactccagc cacctgtccc cacagcccag 3360
cctgttctcc tggagcccat tcctcaagcc aaccaccgaa ggcggcggaa ggctgctggg 3420
aaacggggct cccacacagt tcccattggc caaaagcctt actctgcacc ctctgaacct 3480
ggttcccaat cttcaatcaa tcaaggcttg gcattggaag ccgctgagtc tattactgtt 3540
gctcctgagc ctgctgtttc ccaggctcca gagacctcca ctcagaatcc cgtggtgcaa 3600
aatgaagcag ctgggagatc agggctcatt cccaagcccc agcctgaggt ttctcgatcc 3660
cgcaagaagc cttctactac cacaacctca ccaattcaaa aacgtccccg aagacaaata 3720
ccccagaaga caatagtccc caaggaagaa gatcctgagg aaatgccagt gaaggaagag 3780
cctcaggaga tagcaattcc aacacccggc aaaagaaaga gggaccgtgt agaggatgag 3840
acccagggaa acccaagtcg gagccggcgg gctaaaccta accaagaagc agcagccccc 3900
aaggtactgt tcacaggagt tgtggattct cggggagagc gtgcagtcct ggctctgggt 3960
ggcagtctag ccagctcagt aaatgaggcc tcccacttgg tcactgatcg catccgaaga 4020
acggtcaagt tcttgtgtgc cctggggaag ggcatcccta tcctctccct gaactggctg 4080
tatcagtcca gaaaggctgg tcacttcctg ccacctgatg actacttggt gactgaccct 4140
gaacaagaga agaactttag cttcagcctt cgggactccc tgagccgggc tcggcaacaa 4200
aaactgctgg agggctatga gatttacgtg acccctggag tgcagccacc cccacctcag 4260
atgggcgaga tcatcagctg ctgtgggggc accaacctgc ccagcatgcc ccagtcctat 4320
aagccttacc gagttgtcat aacttgcact gaagacctac ctcgctgcgc tatcccatct 4380
cgactggggc tgcccctcct ctctcctgag ttcctcctga ctggagtgct aaagcaggaa 4440
gtcacaccag aggcctttgt cctttcaaat tag 4473
<210> 26
<211> 2412
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Bard1
<400> 26
atgcaacttt ctgagtctgt ggttggacta ctaggtaggt acacaagccc tgctcgggaa 60
cgaaacccac gaggagcccc gccccttggc gttgagggcg tggccttggg ccgcgctcct 120
ctcagaaatt cgagcgcgct ctcattgcct ctcccctccc tcttacttgc tataaaggag 180
caacccagga tggtctgctg tctgcttcgg ctcatcatca tccagagtgt cgagttcttt 240
gaaatcatca ctaatattct gaaggagcca gtatgcttag gagggtgtga gcacatcttc 300
tgtagtgtgt gtataagtga ttgcgttgga tcaggatgtc ccgtgtgtta cacaccagcc 360
tggatcctag acctcaagat aaacagacaa ttggacaaca tgattcagct ttataggaag 420
cttcaaaatt tgctacatga caataaactt tcagatccaa aagacaacac atctaggaca 480
ggttcatttg atgatgcaga aagcaagaag aattcaataa aaatgtggtt tagtcctcga 540
agtaagaagg ttagatgtgt tgtgaataaa gtatcagtgc caacccagcc tcaaaagaca 600
aaagatgaca aagcccagga agcctccata tacgaatttg tttccacaag tccccctgaa 660
gttgtttcta agagggctaa aacagcttct agaacatctg caaaaaagca gcagaagaaa 720
tctttagctg agatcaacaa gaaggggaat tcaaggccag aaacagaaga tagcaggttt 780
gattctaaag aggaactgaa agaggagagg gttgtctcct gtagccaaat accagttatg 840
gaaagtccac aggtaaatgg tgaaatagac ttgttagcta gtggttctgt tgcagaatct 900
gaatgttctg gaagattgac cgaagtttct ttaccattgg ctgagcatat agtatctcca 960
ggcactgtga gcaagagtga agagactcct gagaagaaag tctgtgtaaa agatcttctt 1020
tcagtagggc gtaatgaaaa tcacaaatac tgtagcaggc ctcctgatcc tacttctaag 1080
aattgtgaga gaagcattcc gagcaccagc agagatgtca ttaaaccaac agtgcttgca 1140
gaaaatatac tgttggttga ctgttcttca ctgccttcag accagcttca agttgatgtc 1200
acactcagga gaaagagtaa catatcagat aactccctta gcctttcacc aggcacaccc 1260
ccaccactgc tgaataattc aactcccaga caaatgatgt caaaaccctc catagtgaag 1320
ctgtcaccca gcattaccgc caggaaaaga aaccacagag gagagactct gcttcatatt 1380
gcttctatta agggcgatat accttctgtt gaatacctct tgcaaaacgg aaacgacccc 1440
aatgttaaag accatgctgg atggacacca ttgcatgaag cctgcagtca tgggcacctg 1500
aaggtagtgg aattgctgct ccagcataac gctttggtga ataccacagg ctatcagaat 1560
gacacaccac tgcacgatgc agtcaagaac ggccatgtgg atatagtcag ggtgttactg 1620
tccaatggcg cctccaggaa tgctgttaac atatttggtg tacggcctgt ggattataca 1680
gacaatgaaa atataagatc attattgctg ctaccagaga agagtgaatc atcctcaact 1740
agccagtgtg cagttgtgac tgctggacag cgaagaaatg ggcctctggt gcttataggc 1800
agtgggcttt cttcccaaca gcagaaaatg ctcagcaaac ttgagacagt tctcaaggct 1860
aaaagatgtg ctgagtttga cagtacagta actcatgtca ttgttcctga tgatgaagct 1920
caaagtactc tgaagtgtat gcttgggatt ctcaatgggt gttggatcct gaagtttgac 1980
tgggtgaaag cttgtttgca cagcaaagta cgtgaacagg aagaaaagta cgaagttcct 2040
ggaggtccgc agaagagcag gctcaacaga gagcagctgt tgccaaagct atttgatgga 2100
tgctacttct ttttgggggg aaacttcaaa catcatccaa agaatgatct ccttaagctc 2160
attactgcag caggaggcaa ggtgctcagt agaaagccca agccagacag tgacgtgact 2220
cagaccatca acactgttgc ataccatgcc aaccctgact ctgaccagcg cttctgtaca 2280
cagtacatcg tctatgaaga tctgtttaat tgtcgcccag aaagggttcg gcagggcaaa 2340
gtctggatgg ctccttccac ttggcttatc agctgtgtga tggcctttga attgcttcct 2400
cttgacagct ga 2412
<210> 27
<211> 2796
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Lig1 (连接酶1)
<400> 27
atgagaaaaa aagaaccaga gaggaaaggg gagaactctg ctgccaccat gcagaaaagt 60
atcaggtcat ttttccaacc catgaaagag ggtaaagcac agaagccgga gaaggagaca 120
gctaacagca ccaaagagaa ggagccacct ccaaaggtgg cactgaagga gaggaatcga 180
gcagtgcctg agagtgattc tccagtgaag aggcctggaa ggaaggcagc ccaggtccta 240
agcagcgaag gggaggagga agatgaagcc cccagcaccc ctaaagtcca gaagtctgtg 300
tcagactcca aacaaagctc tcctcccagc cctgacgcat gtcctgagaa cagtcctttc 360
cacagtagcc cctccatgga gatctcccca tcaggattcc cgaagcgtcg cactgctcgg 420
aagcagctcc cgaaacggac aattgaggac actgtggagg agcagaatga ggacaaaggc 480
agagcagcca agaaaaggaa gaaggaagaa gaagcacaga ctccaatgga aagcctcaca 540
gagagtgaag atgtaaaacc caaggaagaa aaggaggagg gcaagcatgc tgaggcttcc 600
aagtcccctg agtcgggaac cttgacaaag acagagacca tcccagtgtg taaggccggc 660
gtgaaacaga agcctcagga agaggagcag agcaagcctc ctgccagagg cgccaagaca 720
ctcagcagct tcttcactcc ccggaagcca gcagagaaag ccatagtgaa acaagaagag 780
ccaggtactc cagggaagga agagaccaag ggagccctgg atccaacaaa ttacaatcct 840
tccaagagaa actaccaccc cattgaagat gcctgctgga aacatggcca gaaagtccct 900
tttctcgctg tggcccggac ctttgagaag attgaggagg tttctgctcg gctcaagatg 960
gtggagacac tgagcaactt gctgcgctcg gtggtggccc tgtcacctcc agacctgctt 1020
cctgttcttt acctcagcct caaccgcctt gggccacctc agcagggact agagctgggt 1080
gttggtgatg gtgtcctcct taaggcagtt gcccaggcca caggccgtca gctggagtcc 1140
atccgggctg aggtagctga gaagggtgac gtgggactgg tggccgagaa cagccgcagc 1200
actcagagac tcatgctgcc ccctcctccg ctcaccacct ccggggtctt taccaaattc 1260
tgtgacattg cccggctcac tggcagtgct tccatggcca agaagttgga tgtcatcaag 1320
ggcctgtttg ttgcctgccg tcactcggaa gcccggttca ttgccaggtc cctaagtgga 1380
cgcctgcgcc tcgggctggc tgagcagtcc gtcttggctg cccttgccct ggctgtgagc 1440
ctcacacccc ctggccaaga atttccccca gctgttgtgg atgctgggaa gggcaagacc 1500
acagaggcca gaaagacatg gttggaagaa caaggcatga tcttgaagca gaccttctgt 1560
gaggtacctg acctggaccg aatcatcccg gtgctgctgg aacatggcct ggaacgcctc 1620
ccagagcact gcaggctgag cccaggggtc cctcttaaac caatgctggc tcatcccact 1680
cggggtgtca gcgaggtact gaaacgcttt gaggaggtgg actttacctg cgagtacaaa 1740
tatgacgggc agcgggccca gattcatgtt ctggaaggtg gagaggtgaa gatcttcagt 1800
aggaaccagg aagacaacac aggaaagtac ccggacatca tcagccgcat ccccaagatt 1860
aaactcccct cggtcacctc ctttatcctg gacactgagg ctgtggcctg ggaccgggaa 1920
aagaagcaga tccagccatt ccaagtgctc accacacgca agcgcaagga ggttgacgcc 1980
tcggagatac aggtgcaggt gtgtctgtat gcctttgatc tcatctacct caacggagag 2040
tccctgattc gccagcccct gtctcgacgt cggcagctgc tccgggagaa ctttgtggag 2100
acagagggtg agtttgtctt cgccacctcc ctggacacca aggacatcga gcagatcgct 2160
gagttcttgg agcagtccgt gaaggactcc tgtgagggac tgatggtgaa gaccctggat 2220
gttgatgcca cctatgagat tgccaagagg tctcacaact ggctcaagct aaagaaggac 2280
taccttgacg gtgtgggcga cactctggac cttgtggtga ttggcgccta cctgggccgg 2340
gggaagcgtg ccggccggta tgggggcttc ctcttggctg cctatgatga ggagagtgaa 2400
gagctgcagg ccatatgcaa gctgggaact ggattcagtg atgaagagct ggaggagcat 2460
caccagagcc taaaggccct agtgttgccg accccacgcc cctatgtgag gatcgatggg 2520
gcagttgccc cagaccactg gctggaccca aaggtcgtat gggaggtgaa gtgtgcggat 2580
ctctccctgt cccctatcta ccctgctgcg cggggcctgg tggacaaaga gaaagggatc 2640
tcccttcgtt tccctcggtt cattcgtgtc cgtgaagaca agcagccaga gcaggccacc 2700
accagtgacc aggtggcctg tttgtaccgg aagcagagtc agatacagaa ccagcacaac 2760
tcagacttgg actccgactt tgaggactgc tattaa 2796
<210> 28
<211> 2121
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> Mre11
<400> 28
atgagccctg cagatccact tgatgatgaa gacactttta aaatcctggt tgccactgat 60
attcaccttg gatttatgga gaaagatgca gttcgaggaa atgatacatt tgtgacactt 120
aatgaaattt taaaacttgc cctggaaaat gaagtggatt ttattttgtt aggtggtgat 180
cttttccatg aaaacaagcc ctcaaggaaa actcttcata gttgcttgga gttgcttagg 240
aagtactgta tgggtgatcg ccctgtgcag tttgagatca tcagtgacca gtcagtcaac 300
tttggtttta gtaggtttcc atgggtgaac tatcaggatg gcaatctcaa catttccatt 360
ccagtgttta gtatccatgg caaccatgac gatcccacag gggcagatgc cctctgtgcc 420
ctggatattt taagctgtgc tgggtttgtg aatcactttg gacggtcaat gtctgtggag 480
aagattgaca ttagtccagt tctgctgcag aaaggaagca caaaacttgc tctgtacggc 540
ctagggtcca ttcctgatga aaggctctat cggatgtttg tcaataaaaa agtaacaatg 600
ctgagaccaa aggaagatga gaactcatgg tttaacttat ttgtgattca tcagaacagg 660
agtaaacatg gaagtaccaa cttcatccca gaacagtttt tggatgactt cattgacctc 720
gttatctggg gccatgaaca cgagtgtaaa attggcccaa ccaaaaatga gcagcagctc 780
ttctatgtgt ctcagcctgg aagctcagtg gtgacttctc tttcccctgg agaagctgtt 840
aagaaacacg tgggcttgct gcgcgttaaa gggaggaaga tgaacctgca gaagctgcct 900
ctccgcacag tgcggcagtt cttcatggag gatgtggttc tcgctaacca cccaaacctg 960
ttcaaccctg acaatcctaa ggtgacccag gccatccaga gcttctgctt ggagaagatt 1020
gaagaaatgc ttgaaaatgc cgagcgcgaa cggctaggga attctcttca accagagaag 1080
cctcttatcc gactacgggt ggactacagt ggaggctttg aaccttttag tgttcttcgc 1140
tttagccaga aatttgtgga tcgggtcgct aaccccaaag atatcatcca ctttttcagg 1200
catagggagc aaaagggaaa aacaggtgaa gagatcaact ttgggaagct tgtttcaaaa 1260
tctccttcgg aaggaacgac actcagagta gaagacctgg tgaagcagta tttccagact 1320
gcggagaaga atgttcagct ctcactgctg acagaaagag ggatgggtga agccgttcaa 1380
gaatttgtgg acaaggaaga aaaagatgcc atcgaggaat tagtgaagta ccagctggag 1440
aaaacacagc ggtttcttaa ggagcgccat atcgatgctc tggaagacaa gattgacgaa 1500
gaggtccggc gtttcagaga aagcagacag agaaatacca acgaagaaga cgatgaagtg 1560
cgagaggcca tgagcagggc ccgggcgctc agatcgcagt cagagaactc tgcctcagcc 1620
ttcagtgctg acgacctgag tttcgatata gcagaacaga cagcaaatga ctctgatgac 1680
agcctgtcag cagtgcccag cagaggccgg ggccgaggcc gaggtcgaag aggaggcaga 1740
gggcagagca ccgcatcaag aggaggatct cagagaggcc gagacactgg gcaggagacg 1800
gctactcgag gcagatgctc aaaggccact acatcgacct ctagaaatat gtccattcta 1860
gacgctttca gatctactcg acagcagcct tccagaaaca ctgccactaa aaattactca 1920
gagactattg aagtggatga atctgatgaa gatgacattt ttcctaccag ttccaaggct 1980
gatcaaaggt ggccaggcac aacatctagc aaacggatgt cccagagcca gatagccaag 2040
ggggttgact ttgaatcaga tgaggacgat gacgatgacc ctttcatgag cagtagttct 2100
ctaagaagcc gaagataata a 2121
<210> 29
<211> 5973
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> misc_feature
<223> 53BP1
<400> 29
atgccagggg agcagatgga ccctactgga agtcagttgg attcagattt ctctcagcaa 60
gatactcctt gcctgataat tgaagattct cagcctgaaa gccaggttct ggaagaagat 120
gcgggctctc acttcagtgt gctgtctcga caccttccca atctgcagat acacaaagag 180
aaccctgtgt tggatattgt gtccaatccg gaacaagcag ctgcagaaga gcaaggagac 240
aataatagct ccttcaatga acatctgaaa gagaacaaag ctgctgcaga tcctgtggat 300
tccactcatt tgggcacatg tgattccatc agtcaggtca tagaacagtt gcctcagcca 360
aacaggacaa gcagtgttct gggagtgaca gtggaagctg cttctcttcc agaagaggag 420
aaggaggaag agctggaaga ggagaatgaa gaggtgggag cagatgctgc tgatgccgct 480
ccgtgctccc ttggtgctga agattctgct tcatcacagt tgggctttgg ggttctggaa 540
ctgtcccaga gccaggatgt tgaagaacat acagtgccat atgatgtcaa ccaagaacat 600
atgcagttgg ttaccaccaa ctcgggttct tcccagctgt ctgacatgga tgcaaataat 660
gttaaatgtg aagaacagtc cactgaagat acctccatgg cagaacaacc taacaaagac 720
atccctgtta cagtcgagca cagtaaaggt atccctgtgg tagatgagca aaatctacca 780
ccggcaaggc cagaggatct gccttccagt cctcaagcct ctgctgcagc tgtggaaaca 840
aaggaagagg tacctgccca agagttgcca gaaggggcgc tggaggttca gatgtcctcg 900
gagcctgagg tctcgtccac tcaggaggac ttgtttgagc agagtagtaa aacagcttct 960
gatggttgtt ctactccttc aagggaggaa ggtgggtgtt ctccggtttc cacacccgcc 1020
accaccctgc aactcctgca gctgtctggt cagaggcccc ttgtccagga cagtctttcc 1080
acgaattcct cagatcttgt tgctccttcc cctgatgctt tccgacctac cccttttatc 1140
gttcctagca gtcccacaga gcaaggaggg agaaaagttg agcccttgga tatgtcagtg 1200
atgcctgaag aaggagggga gactttgcag aagcttcagg atgacgaagc agtggagata 1260
gaaaagcccc atctcccatc tcagccggct gtttccccac aagtgtcaac accagtgtct 1320
cagagcacac ctgtcttcac tccaggctct cttcccatcc cgtcccagcc tgaattttct 1380
catgacattt tcattccatc accaagtttg gaagaaccat caagtgatgg gaagaaaggt 1440
ggcgatttgc acagctcatc tttgactgtg gagtgttcta agacttcaga gagtgaacca 1500
aagaatttca ctgctgatct tgggctctcc ttgacagggg agtcttgcaa actgatgctt 1560
tcttcaagtg agtatagtca atcctcaaag atggagagct tggcttctcc caggagtgag 1620
ggagatggag agaataccca gattgaggac actgaaccgt tgtctccagt caccaattct 1680
aaacttcctg ctgaaagtga tgatgtcctg atgaatccag caccagatga ccaagtagaa 1740
atgaatcaga atgatgacaa agtaaaagag ggtgacacag agaacacagg tgaccatggt 1800
gttttagctg ctggtagtaa aggcagagaa gaaaccgttg ctgaagatgt ttgcattgat 1860
ctcacttgtg attctgggag tcaggcagtt ccgtctcccg ctactcggtc cgaggcactt 1920
tctagtgtct tagatcagga ggaagctatg gaaattaaag aacagcatcc agaggagggg 1980
ttttcgggat ctgaggtaga agaagtcccc gagactccct gtgaaagtca cagagaggag 2040
cccaaggaag aaacgatgga gagtatccca ctgcaccttt ctcttactga aacacagtcc 2100
caggcattgt gtcttcagaa ggaaatgccc aaagaagaat gcccagaggc catggaagtg 2160
gaaccctctg tgattagtgt tgactctccc cagaagctgc cggtactcga ccaggagtca 2220
gagcataagg agccagaggc ctgggaagaa gccgcgtcgg aggactcaag tgtggaggac 2280
tcaagtgtgg ttatcgttga tgtgaaggag ccctcgccaa gagttgtccc ctgcgaacct 2340
ttggagggag cagagaaatg ctcagattcc cactcctggg aggatgtggt gcccgaggtg 2400
gaaccgtgtg ctgcaaatag agtagacact ccggaggaaa agattgtaga atgtgacgga 2460
gatgtgaaag cagagaccac aagaaaggac tctgtagagg aagactcccc acagcctcct 2520
ttgccttcag tgaaagacga gcctcccaga gacgagcctc ccagacccga ccaggagatg 2580
cagcagtccc agcttcaaga gaaagagagc ccagtgacca tagatgcaaa agtggctgat 2640
gccaagcagc tggagtcaga gggagcatcc cagcagcttt cgaaagcccc tgcccgcgac 2700
tcacaaagtt tctgtgaaag ttctagtgaa accccatttc atttcacttt gcctaaagaa 2760
ggtgatatta tcccaccatt gactggtgca accccacctc acattgggca cctaaaattg 2820
gatcgcaaca gacatagtac tccaattggg attggcaact atccagaaag caccatagca 2880
accagtgatg tcatgtctga aagcatggtg gagatcaatg atcctctact tgggagtgaa 2940
aaaggagatt ctgagtctgc cccagaaatg gacggaaaac tgtatctgaa aatgaaactg 3000
gttagtcctg agacagaggc cagtgaagaa tctttgcagt ttagcctgga aaagcctgct 3060
actgctgaga gaaaaaatgg atcaactgct gttgctgagc ctgttgcaaa aaatggatca 3120
actgctgttg ctgagcctgt tgccagtccc cagaagaccg tgcctgtgtt tagctgcagg 3180
caagaggagg tttggagtga ggaccctccc tctgtaccca tcagggcaaa cttgctccat 3240
tttccaagtg ttgaagaaga ggacaaagaa aaactggatg gtaccccaaa gcttaggcag 3300
agtgaacagc ctgtgaggcc cgttgggctg gtcaaggatg ctgctacttc tgaggactct 3360
gcttcttctg ttccccagca gagagcaaca caggggtcat tcagccctca aggagaagtg 3420
atggaaacag acctgctaga aggactgagt gctaaccagg aaaaaccgtg taaggtcttg 3480
atggaaaggc ccacccagag taacatagga atccagacca tggaccattc cctgtgtgct 3540
ccagaaactg tttcagcagc aacccagact gtgaagagtg tatgtgaaca agggaccagt 3600
acagtggacc agaactctgg gaaacaagat gccactgtgc agaccgagag ggggggtgtc 3660
gagaaacagg cccctgtgga cgatacagaa tccctccaca gccagggaga agaagaattt 3720
gaaatgcccc agcctccaca tggccatgtc ttgcatcgtc acatgagaac catccgtgaa 3780
gtccggacac ttgtcacccg tgtcatcaca gatgtttact atgtggatgg gacagaagtg 3840
gaaaggaaag taactgagga gactgaagaa ccaattgtag aatgtcagga atgtgaaaca 3900
gaggtttccc cttcccagac tggaggctct tctggagacc tgggagacat cagttccttc 3960
tcctccaaag catccagctc acaccataca tcaagtggga caagtctctc agccatgcat 4020
agcagtggca gctcaggacg aggagccggg ccactcaaag ggaaaaccag cgggacagaa 4080
cctgcagatt ttgctttacc cagttcccga ggaggcccag gaaaactgag tcctagaaaa 4140
gggatcaatc agacaggggc accagtgtgt gaggaagatg gtgatgcagg ccttggcatc 4200
agacagggag ggaaggctcc tgtcacacct cgtggtcgtg gtcgaagggg ccgcccacct 4260
tctcggacca ctggaacaag agatgcagtt gtgtctggtc cgttgggcat agaagacatt 4320
tcacctagca tgtcaccaga tgacaagtcc ttcacccgaa ttgtgccccg tgtaccagac 4380
tctaccaaac gaattgatac cagttctact gttttgaggc ggagtgattc cccagagatt 4440
ccttttcagg ctgctactgg gtcttctgat ggcttggatg cctcatctcc aggaaatagc 4500
tttgtcgggc tccgtgttgt agccaagtgg tcatccaatg gctattttta ctctgggaaa 4560
atcacacggg atgttggagc tgggaagtat aagctgctct tcgatgatgg gtatgaatgt 4620
gatgtgctgg gcaaagacat tctcctgtgt gaccctatac ccctggacac tgaagtgaca 4680
gccctctcag aagatgagta tttcagtgca ggagtggtca aaggacacag aaaggagtct 4740
ggggagctgt actacagcat tgaaaaagaa ggccaaagga agtggtataa gcggatggca 4800
gtcatcctgt ccttggaaca aggaaacagg ttaagagagc aatatgggct tggcccatat 4860
gaagctgtta cacccctcac aaaggcagca gacatcagcc tagataattt ggtggaagga 4920
aagcggaaac gtcgcagtaa catcagctcc ccagccaccc ccactgcctc cagcagcagc 4980
agcagcagca gcacaacacc cacccgtaaa accacagaga gtccccgtgc ttccacggga 5040
gttccatcag gcaaaaggaa actcatcact tctgaagagg aacggtcccc agctaagcga 5100
ggccgcaagt ctgtcaccgt gaaacctggt acagtggggg caggagaatt tgtgagcccc 5160
tgcgagagtg gagacaacac aggtgaacct tctgtcctgg aagagccaag agggcctttg 5220
cccctcaaca agaccttgtt tctgggctat gcctttctcc ttaccatggc cacaaccaat 5280
gacaagctgg ccagccgctc taaactgcta gatggtccta caggaagcag tgaagaagag 5340
gaggaatttt tagaaattcc tcctttcaac aagcagtata cagaatgcca gcttcgagca 5400
ggagctgggt atatccttga agacttcaat gaagcccagt gtaacacagc ctaccagtgt 5460
ctcctaattg ctgatcagca ttgtcgaacc cggaagtact tcctgtgcct tgccagtgga 5520
attccttgtg tgtctcatgt ctgggtccat gacagctgcc atgccaacca gctccaaaac 5580
taccgtaatt atctgctgcc tgctgggtat agccttgagg agcagcgaat tctggattgg 5640
caacctcgtg aaaacccttt ccagaatctg aaggtactct tggtgtcaga tcaacaacag 5700
aacttcctgg agctctggtc tgagatcctc atgactggag gggcagcctc tgtgaagcag 5760
caccattcaa gtgcccataa caaagacatt gctttagggg tatttgatgt ggtggtgaca 5820
gacccctcat gcccagcctc ggtgctcaag tgtgctgaag ccttgcagct gcctgtggtg 5880
tcacaagagt gggtgatcca gtgcctcatt gttggggaga gaattggatt caagcagcat 5940
ccaaaatata aacatgatta tgtttctcac taa 5973
<210> 30
<211> 47
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> ERV第一组共有序列
<222> (1)..(47)
<400> 30
gcccccgcca tatccgccac tgccgccccc accagaggca gaagcgg 47
<210> 31
<211> 47
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> 第一组PPYP基序序列
<222> (1)..(47)
<400> 31
gcccccgcca tatccgccac tgccgccccc accagaggca gaagcgg 47
<210> 32
<211> 37
<212> DNA
<213> 黑线仓鼠(Cricetulus griseus)
<220>
<221> 具有经由PPYP7 sgRNA的框外缺失的PPYP基序序列
<222> (1)..(36)
<400> 32
gcccccgcca tatccgcccc accagaggca gaagcgg 37

Claims (34)

1.一种工程化细胞,优选哺乳动物细胞系的工程化细胞,例如工程化CHO细胞,包括工程化CHO-K1,其包含:
所述细胞的基因组,其中所述基因组包含一个或多个改变,所述改变包括:
作为所述基因组一部分的一个或者多个,通常超过10、20、30、40、50、60、80、90或100个,内源性逆转录病毒(ERV)元件中的一个或者多个核酸的
-缺失,
-添加,和/或
-置换。
2.权利要求1的工程化细胞,其中所述ERV元件来自γ逆转录病毒ERV,包括考拉流行病毒(KoRV)ERV、小鼠乳腺肿瘤病毒(MMTV)ERV、小鼠白血病病毒(MLV)ERV,并且其中所述一个或多个改变适于抑制或消除一个或多个,优选超过60%、70%、80%、90%、95%或100%的,所述ERV的释放。
3.如以上权利要求任一项的工程化细胞,其中所述一个或多个(ERV)元件是或来自gag基因、pol基因和/或env基因,优选来自编码MA(基质)、CA(壳体)、NC(核壳)的gag基因;编码蛋白例如pp12或p6的另外的结构域;并且/或者是ERV的长末端重复(LTR)。
4.权利要求3的工程化细胞,其中所述一个或多个ERV元件编码Gag(群抗原)蛋白、Pol(逆转录酶)蛋白和/或Env(包膜)蛋白。
5.上述权利要求任一项的工程化细胞,其中所述缺失、添加或置换包括多于2、3、4、5、10、15、20、25、30、40、45、50、55、60、65、70、75、80、85、90、95、100、150或200个核酸。
6.上述权利要求任一项的工程化细胞,其中所述改变是靶向整合形式的添加,并且所述一个或多个(ERV)元件是或者来自gag基因、pol基因和/或env基因的一个或多个,优选gag基因,并且对所述基因的序列进行转基因优选编码标记物蛋白如GFP(绿色荧光蛋白)的转基因的靶向整合,并且/或者当所述一个或多个改变导致显性负性表型时。
7.上述权利要求任一项的工程化细胞,其中所述ERV元件来自gag基因,并且至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、或10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或全部的所述元件包含所述改变。
8.上述权利要求任一项的工程化细胞,其中所述改变位于所述ERV元件的共有序列中,其中所述共有序列的长度为至少5个、10个、15个或20个碱基对,优选15个至25个、或30个至50个碱基对。
9.上述权利要求任一项的工程化细胞,其中所述工程化细胞不释放或基本不释放ERV。
10.上述权利要求任一项的工程化细胞,其中所述细胞包含编码、抑制或激活重组通路的一个或者多个蛋白的异源核酸序列,以及/或者编码抑制所述重组通路优选HR的一个或者多个蛋白的表达的一个或者多个序列或蛋白的异源核酸序列,所述重组通路的一个或多个蛋白甚至更优选Nbs1、Mre11、Rad51、连接酶1和/或连接酶3。
11.权利要求10的工程化细胞,其中所述异源核酸序列以不整合到所述细胞的基因组中的载体形式存在。
12.上述权利要求任一项的工程化细胞,进一步包含编码一个或者多个标记物蛋白例如GFP(绿色荧光蛋白)的异源供体DNA,优选载体上的异源供体DNA。
13.上述权利要求任一项的工程化细胞,其中所述细胞进一步包含转基因。
14.上述权利要求任一项的工程化细胞,其中所述转基因是编码标记物蛋白例如GFP(绿色荧光蛋白)的标记物基因和/或生物治疗剂,其优选整合在所述基因组中。
15.上述权利要求任一项的工程化细胞,其中所述细胞是CHO细胞,并且其中所述一个或多个改变是非豆蔻酰化氨基酸对一个或多个所述ERV元件,如gag基因或来自所述gag基因的ERV元件,中的豆蔻酰化基序内的一个或多个肉豆蔻酰化氨基酸的置换,其中所述工程化细胞包含至少瞬时的:
-序列,例如以编码HR蛋白和/或MMEJ蛋白例如Pad51、Lig3、Ercd、Pold3的瞬时表达载体形式;和/或
-序列,例如siRNA序列,如siMRe11或编码其的载体。
16.上述权利要求任一项所述的工程化细胞,其中所述细胞是包含在一个或多个所述ERV元件,例如gag基因或来自所述gag基因的ERV元件,中包含PPYP基序的CHO细胞,并且其中(i)编码所述PPYP基序的序列和/或(i)的序列侧翼最多达20个核酸的序列包含所述改变。
17.上述权利要求任一项的工程化细胞,其中所述工程化细胞是CHO细胞,并且在一个或多个SEQ ID 1、2、3、4或与之具有超过90%或95%序列同一性的序列中,优选在所述序列的ERV元件内,具有缺失、添加和/或置换。
18.上述权利要求任一项的工程化细胞,其中所述工程化细胞是CHO细胞,并且在ERV组1共有序列如SEQ ID NO.30或与之具有超过90%序列同一性的序列中具有缺失、添加和/或置换,并且其中具有缺失、添加和/或置换的序列不编码功能性Gag蛋白。
19.一种用于改善基因组编辑的方法,包括:
(i)将用于将单链或双链制动引入到靶核酸序列的异源系统引入细胞优选感兴趣的细胞中,所述靶核酸序列例如ERV元件的共有序列,所述ERV元件优选为gag基因或来自gag基因,以及进一步
(ii)将以下引入所述细胞中,
(a)编码或激活一个或多个所述重组通路的一个或多个蛋白的异源核酸序列,和/或
(b)编码一个或多个序列,例如siRNA或抑制一个或多个所述重组通路的所述一个或多个蛋白表达的蛋白,的异源序列,其中(i)的所述异源系统和/或(ii)(a)和/或(ii)(b)的序列优选至少在所述感兴趣的细胞中瞬时表达。
20.权利要求19的方法,其中所述异源序列编码或激活重组通路的一个或多个蛋白,特别是同源重组(HR)的一个或多个蛋白,特别是Rad51。
21.权利要求19的方法,其中通过同源重组将标记物基因如GFP插入所述靶核酸序列中,并且其中优选选择包含所述标记物基因的细胞。
22.权利要求19或以下权利要求任一项的方法,其中(a)的异源核酸序列编码或激活MNR复合物的蛋白,如Nbsl和/或Mre11,且/或其中(b)的所述异源序列编码抑制所述HR通路的一个或多个蛋白例如Rad51的表达的序列或蛋白。
23.权利要求19或以下权利要求任一项所述的方法,其中通过非同源末端连接(NHEJ)或微同源介导的末端连接(MMEJ)将缺失或插入引入所述一个或多个ERV元件。
24.权利要求19或以下权利要求任一项的方法,其中所述异源序列是整合载体的一部分或非整合载体的一部分。
25.权利要求19或以下权利要求任一项的方法,其中用于将单链或双链制动引入靶核酸序列中的非天然存在的系统是CRISPR/Cas9系统或基于其的系统。
26.权利要求19或以下权利要求任一项的方法,其中所述细胞是CHO细胞,并且其中一个或多个所述ERV元件的肉豆蔻酰化基序内的一个或多个肉豆蔻酰化氨基酸被非肉豆蔻酰化氨基酸所置换,所述方法优选在瞬时表达编码HR蛋白和/或MMEJ蛋白例如Pad51、Lig3、Ercc3、Pold3和/或序列例如siRNA序列如siMRe11或编码其的载体期间进行。
27.权利要求19或以下权利要求任一项所述的方法,其中所述细胞是在一个或多个所述ERV元件中包含PPYP基序的CHO细胞,并且其中(i)编码所述PPYP基序的序列和/或(i)的序列侧翼最多达20个核酸的序列包含改变,所述方法优选在瞬时表达抑制HR蛋白如Rad51表达的RNA序列期间进行。
28.一种工程化细胞,优选哺乳动物细胞,例如工程化CHO细胞,包括CHO-K1,并且其中所述细胞的基因组包含一个或多个改变,所述改变包括:
在一个或者多个,通常超过10、20、30、40、50、60、80、90或100个,内源性逆转录病毒(ERV)元件中的一个或多个核酸的
(a)缺失,
(b)添加,和/或
(c)置换,
并且通过权利要求19-27任一项的方法产生。
29.一种试剂盒,包括:
(i)在一个容器中的编码至少一种核酸酶的至少一个非整合载体,例如CRISPR,
(ii)在同一个或另一个容器中的一个或多个向导RNA或编码所述一个或多个向导RNA的序列,所述向导RNA靶向ERV元件中的基序,
(iii)在同一个或另一个容器中的容纳一个或多个siRNA或编码一个或多个siRNA的序列,和
在另一个容器中的如何在细胞内提供(i)、(ii)和(iii)的说明书。
30.权利要求29的试剂盒,其中编码靶向ERV元件中基序的所述一个或多个向导RNA的序列和/或编码一个或多个siRNA的序列是载体的一部分。
31.权利要求30的试剂盒,其中所述载体是(i)的非整合载体。
32.权利要求29至31任一项的试剂盒,其中所述ERV元件编码Gag蛋白。
33.权利要求30的试剂盒,其中所述基序是豆蔻酰化基序或PPXY基序,特别是PPYP基序。
34.权利要求29至33任一项的试剂盒,其中所述siRNA针对所述HR通路的基因。
CN201680075813.4A 2015-12-24 2016-12-23 用于蛋白生产的改进的真核细胞及其制备方法 Pending CN108473982A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562387375P 2015-12-24 2015-12-24
US62/387,375 2015-12-24
PCT/EP2016/082567 WO2017109177A1 (en) 2015-12-24 2016-12-23 Improved eukaryotic cells for protein manufacturing and methods of making them

Publications (1)

Publication Number Publication Date
CN108473982A true CN108473982A (zh) 2018-08-31

Family

ID=57906589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680075813.4A Pending CN108473982A (zh) 2015-12-24 2016-12-23 用于蛋白生产的改进的真核细胞及其制备方法

Country Status (13)

Country Link
US (2) US11739351B2 (zh)
EP (1) EP3394257A1 (zh)
JP (1) JP7370702B2 (zh)
KR (1) KR102799049B1 (zh)
CN (1) CN108473982A (zh)
AU (1) AU2016375159B2 (zh)
CA (1) CA3003538A1 (zh)
HK (1) HK1253900A1 (zh)
IL (1) IL259221B (zh)
RU (1) RU2752529C9 (zh)
SG (1) SG11201805132YA (zh)
WO (1) WO2017109177A1 (zh)
ZA (1) ZA201804763B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113544257A (zh) * 2018-12-24 2021-10-22 思兰克斯有限公司 中国仓鼠卵巢细胞中内源性逆转录病毒的表征及灭活
CN115151558A (zh) * 2019-12-24 2022-10-04 思兰克斯有限公司 哺乳动物序列中的靶向整合增强基因表达

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ776899A (en) 2015-10-08 2025-03-28 Harvard College Multiplexed genome editing
WO2020047353A1 (en) * 2018-08-31 2020-03-05 Yale University Compositions and methods for enhancing triplex and nuclease-based gene editing
GB201909439D0 (en) * 2019-07-01 2019-08-14 Artios Pharma Ltd Novel construct

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030053991A1 (en) * 2000-10-04 2003-03-20 Kingsman Alan John Retinoic acid receptor beta-2, its agonists, and gene theraphy vectors for the treatment of neurological disorders
CA2522067C (en) * 2003-04-09 2010-07-06 Canadian Blood Services Detection, characterization and treatment of viral infection and methods thereof
CN102575264A (zh) 2009-09-18 2012-07-11 瑟莱克斯公司 增加的转基因表达和加工的产品和方法
PL2951309T3 (pl) 2013-02-01 2019-06-28 Selexis S.A. Wzmocniona ekspresja transgenu i przetwarzanie
NZ776899A (en) 2015-10-08 2025-03-28 Harvard College Multiplexed genome editing

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CARLOTTA RONDA等: "Accelerating genome editing in CHO cells using CRISPR Cas9 and CRISPy, a web-based target finding tool", 《BIOTECHNOL BIOENG》 *
JAE SEONG LEE等: "CRISPR/Cas9-mediated genome engineering of CHO cell factories: Application and perspectives", 《BIOTECHNOL J》 *
LUHAN YANG等: "Genome-wide inactivation of porcine endogenous retroviruses (PERVs)", 《SCIENCE》 *
Y S LIE等: "Chinese hamster ovary cells contain transcriptionally active full-length type C proviruses", 《J VIROL》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113544257A (zh) * 2018-12-24 2021-10-22 思兰克斯有限公司 中国仓鼠卵巢细胞中内源性逆转录病毒的表征及灭活
CN115151558A (zh) * 2019-12-24 2022-10-04 思兰克斯有限公司 哺乳动物序列中的靶向整合增强基因表达

Also Published As

Publication number Publication date
US20240093244A1 (en) 2024-03-21
JP7370702B2 (ja) 2023-10-30
US11739351B2 (en) 2023-08-29
IL259221B (en) 2022-09-01
CA3003538A1 (en) 2017-06-29
KR102799049B1 (ko) 2025-04-23
US20190194694A1 (en) 2019-06-27
JP2018537986A (ja) 2018-12-27
RU2018118204A (ru) 2020-01-24
AU2016375159A1 (en) 2018-05-10
AU2016375159B2 (en) 2022-12-15
WO2017109177A1 (en) 2017-06-29
KR20180091099A (ko) 2018-08-14
RU2018118204A3 (zh) 2020-11-06
HK1253900A1 (zh) 2019-07-05
IL259221A (en) 2018-07-31
RU2752529C9 (ru) 2021-12-29
SG11201805132YA (en) 2018-07-30
RU2752529C2 (ru) 2021-07-29
EP3394257A1 (en) 2018-10-31
ZA201804763B (en) 2019-07-31

Similar Documents

Publication Publication Date Title
US10557151B2 (en) Somatic human cell line mutations
US11396664B2 (en) Replicative transposon system
KR102799049B1 (ko) 단백질 제조를 위한 개선된 진핵 세포 및 이들을 제조하는 방법
KR20220019794A (ko) 표적화된 유전자 편집 작제물 및 이의 사용 방법
JP2019514379A (ja) Rna誘導型ヌクレアーゼ活性のインビボ高スループット評価のための方法
EP4263819A1 (en) Programmable transposases and uses thereof
US20230046668A1 (en) Targeted integration in mammalian sequences enhancing gene expression
WO2019041344A1 (en) METHODS AND COMPOSITIONS FOR THE TRANSFECTION OF SINGLE STRANDED DNA
JP2022516449A (ja) チャイニーズハムスター卵巣細胞における内在性レトロウイルスの特性評価および不活性化
Frisbie Neurofibromin 2 (NF2) Is Necessary for Efficient Silencing of LINE-1 Retrotransposition Events in Human Embryonic Carcinoma Cells
RU2832109C2 (ru) Конструкции для направленного редактирования генов и способы с их применением
KR20240155953A (ko) 진핵 유전자 편집을 위한 조성물, 시스템 및 방법
Chung Genomic Transformation by Mobile Genetic Elements
Morrish Endonuclease-independent LINE-1 retrotransposition
Vink A hybrid lentivirus-transposon vector for safer gene therapy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1253900

Country of ref document: HK