CN101918560B - 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 - Google Patents
在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 Download PDFInfo
- Publication number
- CN101918560B CN101918560B CN200880124194.9A CN200880124194A CN101918560B CN 101918560 B CN101918560 B CN 101918560B CN 200880124194 A CN200880124194 A CN 200880124194A CN 101918560 B CN101918560 B CN 101918560B
- Authority
- CN
- China
- Prior art keywords
- plant
- recombinant dna
- plants
- construction body
- dna construction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
尤其可用于在氮限制条件下改变植物农学特性的分离的多核苷酸和多肽以及重组DNA构建体,包含这些重组DNA构建体的组合物(如植物或种子)、以及利用这些重组DNA构建体的方法。所述重组DNA构建体包含可操作地连接在植物中有功能的启动子的多核苷酸,其中所述多核苷酸编码LNT2多肽。
Description
发明领域
本发明领域涉及植物育种和遗传学,具体地讲涉及植物中可用的赋予氮利用效率和/或氮限制条件耐受性的重组DNA构建体。
发明背景
世界范围内非生物胁迫显著地限制了作物产量。据评估这些因素累积地造成平均70%的农业产量减少。植物是固着的,必须适应它们周边的主要环境条件。这已经导致它们发展出基因调控、形态发生、和代谢的高可塑性。适应和防御机制策略涉及激活编码对适应或防御不同胁迫重要的蛋白。
植物氮吸收在它们的生长中起到重要作用(Gallais等人,J.Exp.Bot.55(396):295-306(2004))。植物从环境中的无机氮合成氨基酸。因此,氮肥已经成为提高栽培植物如玉米和大豆的产量有力工具。为了避免硝酸盐污染并保持足够的利润率,如今农民期望减少氮肥的使用。如果能提高植物的氮同化能力,然后就能期望植物生长和产量的提高。概括地说,具有更好的氮利用效率(NUE)的植物品种是所期望的。
可利用激活标记来鉴定能影响性状的基因。已经在模型植物拟南芥属中使用该方法(Weigel等人,Plant Physiol.122:1003-1013(2000))。插入转录增强子元件能够显著激活和/或提高附近内源基因的表达。该方法能被用于鉴定某一性状(例如植物的氮利用效率)的受关注的基因,当所述基因经转基因进入生物中时能改变该性状。
发明概述
本发明包括:
在一个实施方案中,在其基因组中包含重组DNA构建体的植物,所述重组DNA构建体包含可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,并且其中所述植物在与不包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。
在另一个实施方案中,在其基因组中包含重组DNA构建体的植物,该重组DNA构建体包含:
(a)可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;或
(b)抑制DNA构建体,所述构建体包含至少一个调控元件,所述调控元件可操作地连接至:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)核酸序列(b)(i)(A)的全长互补序列;或(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽,并且其中在与不包含所述重组构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。
在另一个实施方案中,增加植物氮胁迫耐受性的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与不包含该DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性;并且任选地,(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体,并且在与不包含该DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性。
在另一个实施方案中,评估植物氮胁迫耐受性的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)评价该转基因植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;以及任选地,(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及任选地,(e)评价该子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
在另一个实施方案中,评估植物氮胁迫耐受性的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)评价该转子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;
在另一个实施方案中,测定植物农学特性改变的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)确定该转基因植物在与不包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变;以及任选地,(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及任选地,(e)确定所述子代植物任选地在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,测定植物农学特性改变的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,基于Clustal V比对方法,所述多肽的氨基酸序列具有至少50%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)确定所述子代植物任选地在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,确定植物农学特征改变的方法,该方法包括:
(a)将包含至少一个调控元件的抑制DNA构建体引入到可再生的植物细胞中,该调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)核酸序列(b)(i)(A)的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;
(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及
(c)确定该转基因植物在与不包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变;
以及(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;
以及任选地,(e)确定所述子代植物任选地在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,确定植物农学特征改变的方法,该方法包括:
(a)将包含至少一个调控元件的抑制DNA构建体引入到可再生的植物细胞中,该调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)核酸序列(b)(i)(A)的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;
(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物进行比较时表现出至少一种农学性状的改变;
(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及
(d)确定该子代植物在与不包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
以及任选地,(e)确定所述转基因植物任选地在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
在另一个实施方案中,本发明涉及分离的多核苷酸,所述多核苷酸包括:(a)编码多肽的核苷酸序列,其中所述多肽的氨基酸序列和SEQID NO:18、24、或26的氨基酸序列基于Clustal V比对方法具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(b)所述核苷酸序列的互补序列,其中所述核苷酸序列及其互补序列包含相同数目的核苷酸并且是100%互补的。在一个实施方案中,所述多肽包含SEQ ID NO:18、24、或26的氨基酸序列,并且该核苷酸序列包含SEQ ID NO:17、23、或25的核苷酸序列。
附图简述图表以及序列表
根据以下的详细描述和附图以及序列表,可更全面地理解本发明,以下的详细描述和附图以及序列表形成本申请的一部分。
图1示出pHSbarENDs2活化标记构建体的图谱,该构建体用于制备拟南芥属种群(SEQ ID NO:1)。
图2示出载体pDONRTM Zeo(SEQ ID NO:2),GATEWAY供体载体的图谱。attP1位点位于核苷酸570-801;attP2位点位于核苷酸2754-2985(互补链)。
图4示出载体pBC-yellow(SEQ ID NO:4)的图谱,该载体是用于构建拟南芥属表达载体的目的载体。attR1位点位于核苷酸11276-11399(互补链);attR2位点位于核苷酸9695-9819(互补链)。
图5示出载体PHP27840(SEQ ID NO:5)的图谱,该载体是用于构建大豆表达载体的目的载体。attR1位点位于核苷酸7310-7434;attR2位点位于核苷酸8890-9014。
图6示出载体PHP23236(SEQ ID NO:6)的图谱,该载体是用于构建Gaspe Flint来源的玉米品系的表达载体的目的载体。attR1位点位于核苷酸2006-2130;attR2位点位于核苷酸2899-3023。
图7示出载体PHP10523(SEQ ID NO:7)的图谱,该载体是存在于农杆菌菌株LBA4404中的质粒DNA(Komari等人,Plant J.10:165-174(1996);NCBI通用标识符59797027)。
图8示出PHP23235(SEQ ID NO:8)的图谱,它是用于构建目的载体PHP23236的载体。
图9示出载体PHP20234(SEQ ID NO:9)的图谱。
图10示出目的载体PHP22655(SEQ ID NO:10)的图谱。
图11示出用于筛选的五个品系(标记为1至5,每个品系有-十一个个体),加上野生型对照品系C1(九个个体)的典型网格图案。
图12示出通过图像分析测定的若干个不同硝酸钾浓度对植物颜色的效应。绿色区(色调50至66)对氮剂量的响应证明该区能被用于指示氮同化作用。
图13为实施例18中用于半水栽玉米生长的培养基。
图14A和14B示出拟南芥LNT2多肽(SEQ ID NO:28)和LNT2同源物(SEQ ID NO:18、20、24、26、30、32、33、和34)的全长氨基酸序列的多重比对。
图15示出图14A和14B中显示的每对氨基酸序列的序列同一性百分比和趋异值的图表。
图16示出在氮减少条件下(1mM KNO3)和最佳氮(6.5mM KNO3)条件下筛选Gaspe Flint来源的玉米品系的结果。评估四个包含PHP29689的事件的多个性状。事件平均值与分离无效植物的平均值比较。使用P值≤0.1作为临界值。
图17示出在氮减少条件下(1mM KNO3)和最佳氮(6.5mM KNO3)条件下筛选Gaspe Flint来源的玉米品系的结果。分析中考虑了所有包含PHP29689的事件。将每个变量的构建体平均值和无效构建体的平均值比较。使用P值0.1作为临界值。
图18示出包含PHP28840的植物在低氮条件下的产量试验。用灰色显示的产量值代表显著的增加,用黑色显示的产量值代表显著的减少。剩余的值代表非显著的差异。
图19示出包含PHP28841的植物在低氮条件下的产量试验。用灰色显示的产量值代表显著的增加,用黑色显示的产量值代表显著的减少。剩余的值代表非显著的差异。
图20示出包含PHP28840的植物在标准氮条件下的产量试验。用灰色显示的产量值代表显著的增加,用黑色显示的产量值代表显著的减少。剩余的值代表非显著的差异。
图21示出包含PHP28841的植物在标准氮条件下的产量试验。用灰色显示的产量值代表显著的增加,用黑色显示的产量值代表显著的减少。剩余的值代表非显著的差异。
图22示出包含PHP28840(表达盒=lnt2-3)或PHP28841(表达盒=lnt2-2)的植物的NUE幼苗测定结果。
序列描述以及相关联的序列表遵循如37 C.F.R.§1.821-1.825中所列出的管理专利申请中的核苷酸和/或氨基酸序列公开的规则。序列表包含核苷酸序列字符的单字母码以及氨基酸的三字母码,如遵照IUPAC-IUBMB标准所定义的,该标准在Nucleic Acids Res.13:3021-3030(1985)以及在Biochemical J.219(2):345-373(1984)中描述,将这两篇文献以引用的方式并入本文。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C.F.R.§1.822中示出的规则。
表1列出了本文所述的某些多肽、包含编码多肽全部或其主要部分的核酸片段的cDNA克隆的命名、以及在所附序列表中使用的对应标识符(SEQ ID NO:)。
表1
耐低氮蛋白(LNT)
SEQ ID NO:1是pHSbarENDs2激活标记载体(图1)的核苷酸序列。
SEQ ID NO:2是pDONRTMZeo构建体的核苷酸序列(图2)。
SEQ ID NO:3是pDONRTM221构建体的核苷酸序列(图3)。
SEQ ID NO:4是pBC-yellow载体(图4)的核苷酸序列。
SEQ ID NO:5是PHP27840载体(图5)的核苷酸序列。
SEQ ID NO:6是目的载体PHP23236的核苷酸序列(图6)。
SEQ ID NO:7是PHP10523载体(图7)的核苷酸序列。
SEQ ID NO:8是PHP23235载体的核苷酸序列(图8)。
SEQ ID NO:9是PHP20234载体的核苷酸序列(图9)。
SEQ ID NO:10是目的载体PHP22655的核苷酸序列(图10)。
SEQ ID NO:11是用于替代在pHSbarENDs2的位点5775处的PacI限制性位点的多接头核苷酸序列。
SEQ ID NO:12是attB1序列的核苷酸序列。
SEQ ID NO:13是attB2序列的核苷酸序列。
SEQ ID NO:14是入门克隆PHP23112的核苷酸序列。
SEQ ID NO:15是实施例5中的正向引物VC062。
SEQ ID NO:16是实施例5中的反向引物VC063。
SEQ ID NO:17-22(参见表1)。
SEQ ID NO:23是重叠群的共有核苷酸序列,本文称为PSO415619,它包含BI316280(NCBI通用标识号14990607)、CD401485(NCBI通用标识号31459457)和sfl1n1.pk002.j1(SEQ ID NO:21)。
SEQ ID NO:24是由PSO415619(SEQ ID NO:23)编码的多肽的核苷酸序列。
SEQ ID NO:25是重叠群的共有核苷酸序列,本文称为PSO415620,它包含CX548557(NCBI通用标识号57575582)和sds1f.pk001.k5(SEQID NO:22)。
SEQ ID NO:26是由PSO415620(SEQ ID NO:25)编码的多肽的核苷酸序列。
SEQ ID NO:27是编码拟南芥“unknown蛋白”(LNT2)(At5g50930;NCBI通用标识号145359102)的基因的核苷酸序列。
SEQ ID NO:28是拟南芥“unknown蛋白”(LNT2)(At5g50930;NCBI通用标识号15241317)的氨基酸序列。
SEQ ID NO:29是At5g50930的选择性剪接变体(本文称为“lnt2-2”)的核苷酸序列。
SEQ ID NO:30是由lnt2-2(SEQ ID NO:29)编码的多肽的氨基酸序列,本文称为“LNT2-2”。
SEQ ID NO:31是At5g50930的第二选择性剪接变体(本文称为“lnt2-3”)的核苷酸序列。
SEQ ID NO:32是由lnt2-3(SEQ ID NO:29)编码的多肽的氨基酸序列,本文称为“LNT2-3”。SEQ ID NO:32基于Clustal V比对方法,使用预设参数与EP1033405中的SEQ ID NO:52198进行比对,结果100%相同。
SEQ ID NO:33是水稻“unknown蛋白”(NCBI通用标识号38347162)的氨基酸序列。
SEQ ID NO:34是葡萄“假定蛋白”(NCBI通用标识号147791927)的氨基酸序列。
SEQ ID NO:35是At5g50930-5’attB正向引物的核苷酸序列。
SEQ ID NO:36是At5g50930-3’attB反向引物的核苷酸序列。
其它实施方案的具体描述
本文中所列出的每篇参考文献的公开内容的全文均以引用的方式并入本文。
如本文所用的并在所附权利要求书中的单数形式“一个”和“所述”包括复数涵义,除非上下文中清楚地另有指明。因此,例如,“一株植物”的涵义包括多株该类植物。“一个细胞”的涵义包括一个或多个细胞及其本领域的技术人员已知的等同物,等等。
如本文所用:
“氮限制条件”指其中可用氮总量(例如来自硝酸盐、氨、或其它已知氮源的氮)不足以维持植物的最佳生长和发育的条件。本领域的技术人员将会识别其中总可用氮足以维持植物最佳生长和发育的条件。本领域的技术人员将会识别什么组成足够量的总可用氮,什么组成用于向植物提供氮的土壤、培养基和肥料输入。取决于许多因素,氮限制条件将发生变化,包括但不限于特定的植物和环境条件。
“农学特性”是可测量的参数,包括但不限于绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物游离氨基酸含量、营养组织游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、耐旱性、氮摄取、根倒伏抗性、收获指数、茎倒伏、植株高度、穗高、和穗长。
“收获指数”指粒重除以总株重。
“lnt2”指拟南芥基因位点At5g50930(SEQ ID NO:27)。“LNT2”指由SEQ ID NO:27编码的蛋白(SEQ ID NO:28)。
“lnt2-2”(SEQ ID NO:29)和“lnt2-3”(SEQ ID NO:31)是天然存在的At5g50930基因的选择性剪接变体。“LNT2-2”(SEQ ID NO:30)和“LNT2-3”(SEQ ID NO:32)指分别由“lnt2-2”和“lnt2-3”编码的蛋白。
“lnt2样”指拟南芥“lnt2”位点At5g50930(SEQ ID NO:28)的来自不同物种的核苷酸同源物,如玉米和大豆,并且不受限制的包括任何以下核苷酸序列:SEQ ID NO:17、19、23、和25。
“LNT2样”指拟南芥“LNT2”(SEQ ID NO:28)的来自不同物种的蛋白同源物,如玉米和大豆,并且不受限制的包括任何以下氨基酸序列:SEQ ID NO:18、20、24、和26。
本文所用的“选择性剪接变体”指由基因转录的RNA的供选择的替代形式。剪接变体作为供选择的位点在单个转录RNA分子内或在分开转录的RNA分子之间被剪接的结果天然发生,并且可导致从相同基因转录的mRNA的若干个不同形式。因此,剪接不同可编码具有不同氨基酸序列的多肽,它们在生物体内可具有相似功能也可不具有相似功能。
“氮胁迫耐受性”是植物的性状,指植物在氮限制条件下存活的能力。
植物“提高的氮胁迫耐受性”相对于参照或对照植物进行测量,并意指植物的氮胁迫耐受性在与参照或对照植物进行比较时提高的任何量或量度。
“氮胁迫耐受性植物”是指表现出氮胁迫耐受性的植物。在一个实施方案中氮胁迫耐受性植物是在氮限制条件下相对于对照植物至少在一种农学特性上表现出提高的植物。
“环境条件”指植物生长的条件,例如水的可用性、营养物质(例如氮)的可用性或者昆虫或病害的存在。
“转基因”指其基因组因异源核酸(如重组DNA构建体)的存在而发生改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初的转基因事件以及从最初的转基因事件通过有性杂交或无性生殖而产生的那些。如本文所用的术语“转基因”不涵盖通过常规植物育种方法或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。
“基因组”在用于植物细胞时不仅涵盖存在于细胞核中的染色体DNA,而且还包括存在于细胞的亚细胞组分(如线粒体、质粒)中的细胞器DNA。
“植物”包括整个植株、植物器官、植物组织、种子和植物细胞以及同一植株的子代。植物细胞包括但不限于得自下列物质的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。
“子代”包括植物的任何后续世代。
“转基因植物”包括在其基因组内包含异源多核苷酸的植物。在一个实施方案中,将异源多核苷酸稳定地整合进基因组内以便该多核苷酸连续传代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。
针对序列而言的″异源″意指来自外来物种的序列,或者如果来自相同物种,则指通过蓄意的人为干预而从其天然形式发生了组成和/或基因座的显著改变的序列。
“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用,并且指作为单链或双链的RNA或DNA聚合物,任选含有合成的、非天然的或改变的核苷酸碱基。-核苷酸(通常以它们的5′-单磷酸形式存在)通过如下它们的单个字母名称来指代:“A”为腺苷酸或脱氧腺苷酸(分别对应RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,并且“N”表示任何核苷酸。
“多肽”、“肽”、“氨基酸序列”和“蛋白质”在本文中可互换使用,指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。术语“多肽”、“肽”、“氨基酸序列”和“蛋白质”还可包括修饰,包括但不限于糖基化、脂质连接、硫酸盐化、谷氨酸残基的γ羧化、羟化和ADP-核糖基化。
“信使RNA(mRNA)”指无内含子并且可以通过细胞翻译成蛋白质的RNA。
“cDNA”指与mRNA模板互补并且利用逆转录酶从mRNA模板合成的DNA。cDNA可以是单链的或者可用DNA聚合成酶I的Klenow片段转化成双链形式。
“表达序列标签”(“EST”)是得自cDNA文库的DNA序列,并且因此是已经被转录的序列。EST通常通过cDNA插入序列单程测序获取。将完整的cDNA插入序列称为“全长插入序列”(“FIS”)。“重叠群”序列是由选自,但不限于EST、FIS和PCR序列的两个或更多个序列装配成的序列。将编码完整或功能性蛋白的序列称为“完全基因序列”(“CGS”),该序列能得自FIS或重叠群。
“成熟”蛋白质指经翻译后加工的多肽;即已经去除了存在于初级翻译产物中的任何前肽或原肽的多肽。
“前体”蛋白质指mRNA的翻译初级产物;即具有仍然存在的前肽和原肽。前肽和原肽可以是并且不限于细胞内定位信号。
“分离的”指物质,例如核酸和/或蛋白质,该物质基本上不含在天然存在的环境中通常伴随该物质或与其反应的组分,或者说是该物质被从所述组分移出。分离的多核苷酸可从它们天然存在于其中的宿主细胞纯化。技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。该术语也涵盖重组多核苷酸和化学合成的多核苷酸。
“重组体”指(例如)通过化学合成或者通过用基因工程技术操纵分离的核酸片段来实现的两个原本分离的序列片段的人工组合。“重组体”也包括指已经通过引入异源核酸而进行了修饰的细胞或载体,或源于经这样修饰的细胞的细胞,但不涵盖由天然发生的事件(如自发突变、自然转化/转导/转座)对细胞或载体的改变,例如没有蓄意人为干扰而发生的那些。
“重组DNA构建体”指在自然界中通常不会一起存在的核酸片段的组合。因此,重组DNA构建体可包含源于不同来源的调控序列和编码序列,或源于相同来源但以不同于通常天然存在的方式排列的调控序列和编码序列。
术语“入门克隆”和“入门载体”本文可互换使用。
“调控序列”和“调控元件”可互换使用,并且指位于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。
“启动子”指能够控制另一核酸片段转录的核酸片段。
“在植物中有功能的启动子”指能够控制植物细胞中的转录的启动子,无论其是否来源于植物细胞。
“组织特异性启动子”和“组织优选启动子”可以互换使用,并且指主要但非必须专一地在一种组织或器官中表达,但是也可以在一种特定细胞中表达的启动子。
“发育调控启动子”指其活性由发育事件决定的启动子。
术语“可操作地连接”指核酸片段连接成单一片段,使得其中一个核酸片段的功能受到另一个核酸片段的调控。例如,在启动子能够调节核酸片段的转录时,该启动子与该核酸片段进行了可操作地连接。
“表达”指功能产物的产生。因此,核酸片段的表达可指核酸片段的转录(如生成mRNA或功能RNA的转录)和/或RNA翻译成前体或成熟蛋白质。
“表型”是指细胞或生物体的可检测的特征。
有关将核酸片段(例如重组DNA构建体)插入细胞内的“导入”是指“转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原核细胞中,在该细胞中核酸片段可以整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内,转变成自主的复制子或瞬时表达(如转染的mRNA)。
“转化细胞”是将核酸片段(如重组DNA构建体)引入其中的任何细胞。
本文所用的“转化”指稳定转化和瞬时转化两者。
“稳定转化”指将核酸片段引入宿主生物体的基因组中,导致基因稳定遗传。一旦稳定转化,核酸片段稳定地整合进宿主生物体和任何连续世代的基因组中。
“瞬时转化”指将核酸片段引入宿主生物体的核中或包含DNA的细胞器中,引起基因表达而没有基因稳定遗传。
“等位基因”是占据染色体上给定位点的基因的几种供选择形式的其中一种。当二倍体植物中一对同源染色体上给定基因座上存在的等位基因相同时,该植物在该基因座处是纯合的。如果二倍体植物中一对同源染色体上给定基因座上存在的等位基因不同,则该植物在该基因座处是杂合的。如果转基因存在于二倍体植物中一对同源染色体中的其中之一上,则该植物在该基因座处是半合子的。
序列比对和同一性百分比可用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASERGENE生物信息计算包(DNASTARInc.,Madison,WI)的Megalign程序。除非另外说明,本文提供的序列的多重比对用Clustal V比对方法(Higgins和Sharp,1989,CABIOS.5:151-153)采用默认参数(空位罚分=10,空位长度罚分=10)执行。用Clustal V方法进行成对比对和蛋白质序列的同一性百分比计算的默认参数为KTUPLE=1、空位罚分(GAP PENALTY)=3、窗口(WINDOW)=5和DIAGONALS SAVED=5。而对于核酸,这些参数为KTUPLE=2,空位罚分=5,窗口=4和DIAGONALS SAVED=4。用Clustal V程序比对序列后,可通过查看同一程序中的“序列距离”表来获得“同一性百分比”和“趋异度”值。除非另外说明,本文提供的和申明的同一性百分比和趋异度是以该方式计算。
本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.and Maniatis,T.,Molecular Cloning:A Laboratory Manual;Cold Spring HarborLaboratory Press:Cold Spring Harbor,1989(下文称为“Sambrook”)。
现在转向若干个实施方案:
其它实施方案包括分离的多核苷酸和多肽、重组DNA构建体、包含这些重组DNA构建体的组合物(例如植株或种子)以及利用这些重组DNA构建体的方法。
其它的分离的多核苷酸和多肽
本发明包括如下其它分离的多核苷酸和多肽:
分离的多核苷酸,包括:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性;或(ii)(i)的核酸序列的全长互补序列;其中(i)的核酸序列的全长互补序列由相同数目的核苷酸组成并且是100%互补的。任一上述分离的多核苷酸可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。多肽可以是LNT2或LNT2样蛋白。
分离的多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性。多肽可以能是LNT2或LNT2样蛋白。
分离的多核苷酸,包括:(i)基于Clustal V比对方法在与SEQ IDNO:17、19、23、25、27、29、或31进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性的核酸序列;或(ii)(i)的核酸序列的全长互补序列。任一上述分离的多核苷酸可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。所述分离的多核苷酸可以编码LNT2或LNT2样蛋白。
其它重组DNA构建体和抑制DNA构建体
在一个方面,本发明包括重组DNA构建体(包括抑制DNA构建体)。
在另一个实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸包括(i)核酸序列,所述核酸序列编码的氨基酸序列基于ClustalV比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(i)核酸序列的全长互补序列。
在另一个实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸包括(i)核酸序列,所述核酸序列基于Clustal V比对方法在与SEQ ID NO:17、19、23、25、27、29、或31进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(i)核酸序列的全长互补序列。
图14A和14B示出以下氨基酸序列的多重比对:SEQ ID NO:18、20、24、26、28、30、32、33、和34。用LASERGENE生物信息计算包(DNASTARInc.,Madison,WI)的MEGALIGN程序进行序列多重比对;具体地讲,使用Clustal V比对方法(Higgins和Sharp(1989)CABIOS.5:151-153),多重比对预设参数为空位罚分=10,空位长度罚分=10,成对比对预设参数为KTUPLE=1,空位罚分=3,窗口=5以及DIAGONALS SAVED=5。
图15是图14A和14B中显示的每对氨基酸序列的序列同一性百分比和趋异值的图表。
在另一个实施方案中,重组DNA构建体包含可操作地连接至少一个调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码LNT2或LNT2样蛋白。
在另一方面,本发明包括抑制DNA构建体。
抑制DNA构建体能包含至少一个调控序列(在一个实施方案中是在植物中有功能的启动子),该调控序列可操作地连接至:(a)以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)核酸序列(a)(i)的全长互补序列。或者(b)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样蛋白;或(c)以下序列的全部或部分:(i)核酸序列,所述核酸序列基于ClustalV比对方法在与SEQ ID NO:17、19、23、25、27、29、或31进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%%、9、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(c)(i)核酸序列的全长互补序列。在一个实施方案中,该抑制DNA构建体包含共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制性构建体、茎环抑制性构建体、产生双链RNA的构建体、RNAi构建体或小RNA构建体(如,siRNA构建体或miRNA构建体)。
应当理解(正如本领域技术人员将会理解的),本发明不仅仅涵盖这些具体的示例性序列。导致给定位点处产生化学上等价的氨基酸但不影响所编码多肽的功能特性的核酸片段中的改变是本领域众所周知的。因此,氨基酸丙氨酸(一种疏水性氨基酸)的密码子可被编码另一个疏水性较弱的残基(例如甘氨酸)或疏水性较强的残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子取代。类似地,导致一个带负电荷的残基替换为另一个带负电荷的残基(例如,天冬氨酸替代谷氨酸)或者一个带正电荷的残基替换为另一个带正电荷的残基(例如,赖氨酸替换精氨酸)的改变也可预期产生功能上等价的产物。导致多肽分子的N-末端和C-末端部分改变的核苷酸变化也将预计不会改变多肽的活性。所提出的修饰中的每一种均完全在本领域常规技术内,如测定所编码的产物的生物活性的保留。
“抑制DNA构建体”是在转化或稳定整合进植物基因组时,导致该植物中的靶基因“沉默”的重组DNA构建体。对该植物来说,该靶基因可以是内源性的或是转基因的。如本文针对靶基因所使用的,“沉默”通常指在由靶基因表达的mRNA或蛋白质/酶的水平上的抑制,和/或在酶活性或蛋白质功能性的水平上的抑制。本文中可交换使用的术语“抑制”、“抑制性”以及“沉默”包括降低、减少、减退、减小、抑制、消除或防止。“沉默”或“基因沉默”不确定机理并且包括(并且不限于)反义、共抑制、病毒抑制、发夹抑制、茎环抑制、基于RNAi的方法以及基于小RNAi的方法。
抑制DNA构建体可以包含源自所关注的靶基因的区域并且可以包含所关注的靶基因的有义链(或反义链)的核酸序列的全部或部分。取决于所要利用的方法,该区域可与所关注基因的有义链(或反义链)的全部或部分100%相同或者具有少于100%同一性的同一性(如,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的同一性)。
抑制DNA构建体是本领域所熟知的,一旦选定所关注的靶基因就很容易构建,并且包括但不限于共抑制构建体、反义构建体、病毒-抑制构建体、发夹抑制性构建体、茎-环抑制性构建体、产生双链RNA的构建体,以及更通常的是,RNAi(RNA干扰)构建体和小RNA构建体,例如siRNA(短干扰RNA)构建体和miRNA(微RNA)构建体。
“反义抑制”指产生能够抑制靶基因或基因产物表达的反义RNA转录物。“反义RNA”指与靶初级转录物或mRNA的全部或部分互补,并阻断分离的靶核酸片段表达的RNA转录物(美国专利号:5,107,065)。反义RNA可以与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。
“共抑制”指产生能够抑制靶基因或基因产物表达的有义RNA转录物。“有义”RNA指包括mRNA和在细胞内或体外能被翻译成蛋白质的RNA在内的RNA转录物。此前,已通过着眼于以有义方向过表达与内源mRNA具有同源性的核酸序列(其导致与过表达的序列具有同源性的所有RNA减少)设计出了植物中的共抑制构建体(参见Vaucheret等人,Plant J.,16:651-659(1998);以及Gura,Nature 404:804-808(2000))。
另一种变型描述了将植物病毒序列用于引导对近端mRNA编码序列的抑制(于1998年8月20日公开的PCT专利公开WO 98/36083)。
此前描述的是“发夹”结构的利用,该结构以互补方向整合mRNA编码序列的全部或部分,导致已表达的RNA形成潜在的“茎-环”结构(于1999年10月21日公开的PCT专利公开WO99/53050)。在这种情况下,茎由对应相对于启动子以有义或反义方向插入的相关基因的多核苷酸形成,并且环由一些相关基因的多核苷酸形成,在构建体中该多核苷酸不具有互补序列。这增加了获得的转基因植物中的共抑制或沉默频率。关于发夹抑制的综述,参见Wesley,S.V.等人,2003,Methods inMolecular Biology,Plant Functional Genomics:Methods and Protocols236:273-286。
其中茎由至少30个来自待抑制基因的核苷酸形成而环由任意的核苷酸序列形成的构建体也已经有效地用于抑制(于1999年12月2日公开的PCT专利公开No.WO 99/61632)。
使用聚-T和聚-A序列产生茎-环结构中的茎已经有所描述(于2002年1月3日公开的PCT专利公开No.WO 02/00894)。
然而另一种变型涉及使用合成的重复序列来促进茎-环结构中的茎的形成。用这种重组DNA片段产生的转基因生物体已经显示由形成茎环结构的核苷酸片段编码的蛋白质的水平降低,如于2002年1月3日公开的PCT专利公开WO 02/00904中所述。
RNA干扰是指由短干扰性RNA(siRNA)介导的动物中序列特异性转录后基因沉默的过程(Fire等人,Nature 391:806 1998)。在植物中的对应过程通常称为转录后基因沉默(PTGS)或RNA沉默,并且在真菌中也称为阻抑作用(quelling)。据信转录后基因沉默过程是用于防止外来基因表达的进化保守性细胞防御机制,并且通常由不同植物区系和门所共有(Fire等人,Trends Genet.15:358(1999)).这种防止外来基因表达的保护作用可能是通过特异性破坏病毒基因组RNA的同源单链RNA的细胞反应,响应源自病毒感染或源自转座因子随机整合到宿主基因组内的双链RNA(dsRNA)的生成而进化而来。dsRNA在细胞中的存在通过还没有完全表征的机制引发了RNAi反应。
细胞中长dsRNA的存在刺激了称为dicer的核糖核酸酶III的活性。Dicer涉及使dsRNA加工成称为短干扰RNA(siRNA)的短dsRNA片段(Berstein等人,Nature 409:363 2001)。源自dicer活性的短干扰性RNA的长度通常是约21至约23个核苷酸,并且包含约19个碱基对双链体(Elbashir等人,Genes Dev.15:188(2001)).还有人提出Dicer参与从保守结构的前体RNA上切下21-和22-核苷酸小分子时序RNA(stRNA),所述小分子时序RNA参与翻译控制(Hutvagner等人,2001,Science 293:834)。RNAi响应还涉及内切核酸酶复合物,通常称为RNA诱导沉默复合物(RISC),其介导具有与siRNA双链体的反义链互补的序列的单链RNA的裂解。靶RNA的裂解在与siRNA双链体的反义链互补的区域中间发生。此外,RNA干扰还涉及小RNA(如miRNA)介导的基因沉默,可推定是通过调节染色质结构并由此防止靶基因序列转录的细胞机制(参见例如Allshire,Science 297:1818-1819(2002);Volpe等人,Science 297:1833-1837(2002);Jenuwein,Science 297:2215-2218(2002);以及Hall等人,Science 297:2232-2237(2002))。这样,本发明的miRNA分子可用于通过与RNA转录物相互作用或者作为另一种选择通过与特定基因序列相互作用来介导基因沉默,其中这样的相互作用导致在转录或转录后水平上的基因沉默。
已经在多种系统中研究了RNAi。Fire等人(Nature 391:806(1998))首次在秀丽隐杆线虫(Caenorhabditis elegans)中观察到RNAi。Wianny和Goetz(Nature Cell Biol.2:70(1999))描述了在小鼠胚胎中由dsRNA介导的RNAi。Hammond等人(Nature 404:293(2000))描述了在用dsRNA转染的果蝇(Drosophila)细胞中的RNAi。Elbashir等人,(Nature411:494 2001)描述了通过在包括人胚胎肾和HeLa细胞的培养的哺乳动物细胞中导入合成21-核苷酸RNA的双链体而诱导的RNAi。
小RNA在控制基因表达中起重要作用。很多发育过程(包括开花)的调节是由小RNA控制的。现在有可能通过使用在植物中产生小RNA的转基因构建体来以工程手段改变植物基因的基因表达。
小RNA似乎是通过与互补RNA或DNA靶序列碱基配对来行使功能的。当与RNA结合时,小RNA或者引发靶序列的RNA裂解或者引发翻译抑制。当与DNA靶序列结合时,据信小RNA可介导靶序列的DNA甲基化。无论具体机制是什么,这些事件的后果是基因表达受到抑制。
据认为,小RNA和它们的RNA靶标之间的序列互补性有助于确定采用了哪种机制(RNA裂解或翻译抑制)。据信,优选与它们的靶标互补的siRNA通过RNA裂解起作用。一些miRNA与它们的靶基因具有完全或几乎完全的互补性,并且对于至少一些这样的miRNA,已经证实了RNA裂解。其他miRNA与它们的靶标具有若干错配,并且在翻译水平上明显抑制了它们的靶标。同样,无需坚持特定的作用机理,出现了这样一种一般规律:完全或几乎完全的互补性引起RNA裂解,而当miRNA/靶标双链体含有许多错配时倾向于翻译抑制。对于此规律的一个明显例外是植物中微RNA 172(miR172)。miR172的其中一个靶标是APETALA2(AP2),尽管miR172与AP2具有几乎完全的互补性,但其表现出引起AP2的翻译抑制而不是引起RNA裂解。
微RNA(miRNA)是长度为约19至约24个核苷酸(nt)的已经在动物和植物中鉴定出的非编码RNA(Lagos-Quintana等人,Science294:853-858 2001,Lagos-Quintana等人,Curr.Biol.12:735-739(2002);Lau等人,Science 294:858-862(2001);Lee和Ambros,Science294:862-864(2001);Llave等人,Plant Cell 14:1605-1619(2002);Mourelatos等人,Genes.偏差(Dev.)16:720-728(2002);Park等人,Curr.Biol.12:1484-1495(2002);Reinhart等人,Genes.偏差(Dev.)16:1616-1626(2002))。它们是由大小为大约70至200nt的较长的前体转录物加工生成的,并且这些前体转录物能够形成稳定的发夹结构。在动物中,涉及加工miRNA前体的酶称为Dicer,这是一种核糖核酸酶III样蛋白(Grishok等人,Cell 106:23-34(2001);Hutvagner等人,Science293:834-838(2001);Ketting等人,Genes.偏差(Dev.)15:2654-2659(2001))。植物也具有Dicer-样酶,DCL1(以前称为CARPELFACTORY/SHORT INTEGUMENTS1/SUSPENSOR1),并且最近的证据表明,其象Dicer一样也涉及发夹前体的加工以产生成熟miRNA(Park等人,Curr.Biol.12:1484-1495(2002);Reinhart等人,Genes Dev.16:1616-1626(2002))。此外,最近的研究已经清楚地表明,至少某些miRNA发夹前体最初是作为较长的聚腺苷酸化转录物存在,并且在单个转录物中可存在几种不同的miRNA以及相关发夹(Lagos-Quintana等人,Science 294:853-858(2001);Lee等人,EMBO J.21:4663-4670(2002))。最近的研究还测定了从dsRNA产物的miRNA链选择,所述dsRNA产物是通过DICER加工发夹而产生的(Schwartz等人,Cell115:199-208(2003))。看起来,经加工的dsRNA的两端的稳定性(即G∶C对A∶U的含量比,和/或错配)影响链选择,具有低稳定性的末端更容易因解旋酶活性而解旋。低稳定性末端的5′末端链被整合至RISC复合物内,而另一条链被降解。
微RNA(miRNA)看起来通过与位于由这些基因产生的转录物中的互补序列结合来调节靶基因。就lin-4和let-7而言,靶位点位于靶mRNA的3′UTR中(Lee等人,Cell 75:843-854(1993);Wightman等人,Cell 75:855-862(1993);Reinhart等人,Nature 403:901-906(2000);Slack等人,Mol.Cell 5:659-669(2000)),并且在lin-4和let-7miRNA与其靶位点之间有几个错配。结合lin-4或let-7miRNA似乎引起由靶miRNA编码的蛋白的稳态水平的下调,而不影响自身的转录物(Olsen和Ambros,Dev.Biol.216:671-680(1999))。另一方面,最近有证据表明,在某些情况下,miRNA可以引起靶转录物在靶位点内特异性RNA裂解,并且该裂解步骤看起来需要miRNA与靶转录物之间具有100%的互补性(Hutvagner和Zamore,Science 297:2056-2060(2002);Llave等人,Plant Cell 14:1605-1619(2002))。看起来有可能miRNA可进入至少两条靶基因调控途径:(1)当靶互补性<100%时,蛋白下调;并且(2)当靶互补性是100%时,RNA裂解。进入RNA裂解途径的微RNA与在动物中RNA干扰(RNAi)期间以及在植物中转录后基因沉默(PTGS)期间产生的21-25nt短干扰RNA(siRNA)类似,并且可能整合进与在RNAi情况中观察到的复合物类似或相同的RNA-诱导的沉默复合物(RISC)内。
用生物信息学鉴定miRNA的靶标在动物中没有成功,这可能是因为动物miRNA与它们的靶标具有低水平的互补性。另一方面,生物信息学方法已经成功地用于预测植物miRNA的靶标(Llave等人,Plant Cell14:1605-1619(2002);Park等人,Curr.Biol.12:1484-1495(2002);Rhoades等人,Cell 110:513-520(2002)),因此,看起来植物miRNA与它们的推定靶标的整体互补性高于动物miRNA。植物miRNA的这些预测靶标中的大部分编码涉及植物发育模式或细胞分化的转录因子家族的成员。
调控序列:
本发明的重组DNA构建体(包括抑制DNA构建体)可能包含至少一个调控序列。
调控序列是启动子。
多种启动子可用于本发明的重组DNA构建体(及抑制DNA构建体)中。可以根据所需结果来选择启动子,并且可以包括用于在宿主生物体中表达的组成型启动子、组织特异性启动子、诱导型启动子或其他启动子。
虽然候选基因当通过组成型启动子驱动表达时可预测其效应,但候选基因在35S或UBI启动子控制下的高水平、组成型表达可以(或可以不)具有多重效应。使用组织特异和/或胁迫特异启动子可消除不需要的效应但保留氮耐受性的能力。在拟南芥中已经观察到了对干旱和寒冷耐受性的这种类型的效应(Kasuga等人,Nature Biotechnol.17:287-91(1999))。
适用于植物宿主细胞的组成型启动子包括(例如)Rsyn7启动子的核心启动子和在WO 99/43838和美国专利6,072,050中公开的其他组成型启动子;CaMV 35S核心启动子(Odell等人,Nature 313:810-812(1985));稻肌动蛋白启动子(McElroy等人,Plant Cell 2:163-171(1990));泛素启动子(Christensen等人,Plant Mol.Biol.12:619-632,1989,以及Christensen等人,Plant Mol.Biol.18:675-689(1992));pEMU(Last等人,Theor.Appl.Genet.81:581-588(1991));MAS(Velten等人,EMBO J.3:2723-2730(1984));ALS启动子(美国专利5,659,026)等。其他组成型启动子包括例如在美国专利5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611中公开的那些启动子。
在选择启动子用于本发明方法时,可能有利的是使用组织特异性启动子或发育调节启动子。
另一种组织特异性启动子或发育调节启动子是这样的DNA序列,该序列调节DNA序列选择性地在对雄穗发育、结籽或两者重要的植物细胞/组织中表达,并限制这种DNA序列只在植物的雄穗发育或种子成熟期间表达。任何引起所需时空表达的可鉴定启动子均可用于本发明的方法中。
可用于本发明的种子或胚芽特异性启动子包括大豆Kunitz胰蛋白酶抑制剂启动子(Kti3,Jofuku和Goldberg,Plant Cell 1:1079-1093(1989))、马铃薯块茎特异蛋白启动子(patatin启动子)(马铃薯块茎)(Rocha-Sosa,M.等人,EMBO J.8:23-29(1989))、convicilin启动子、豌豆球蛋白启动子、豆球蛋白启动子(豌豆子叶)(Rerie,W.G.等人,Mol.Gen.Genet.259:149-157(1991);Newbigin,E.J.等人,Planta 180:461-470(1990);Higgins,T.J.V.等人,Plant.Mol.Biol.11:683-695(1988))、玉米蛋白启动子(玉米胚乳)(Schemthaner,J.P.等人,EMBO J.7:1249-1255(1988))、菜豆蛋白启动子(菜豆子叶)(Segupta-Gopalan,C.等人,Proc.Natl.Acad.Sci.U.S.A.82:3320-3324(1995))、植物血球凝集素启动子(菜豆子叶)(Voelker,T.等人,EMBO J.6:3571-3577(1987))、B-伴球蛋白启动子和大豆球蛋白启动子(大豆子叶)(Chen,Z-L等人,EMBO J.7:297-302(1988))、谷蛋白启动子(大米胚乳)、大麦醇溶蛋白启动子(大麦胚乳)(Marris,C.等人,Plant Mol.Biol.10:359-366(1988))、麦谷蛋白启动子和麦醇溶蛋白启动子(小麦胚乳)(Colot,V.等人,EMBO J.6:3559-3564(1987))、和甘薯贮藏蛋白启动子(甘薯块根)(Hattori,T.等人,Plant Mol.Biol.14:595-604(1990))。可操作地连接至嵌合基因构建体异源编码区的种子特异性基因的启动子在转基因植物中保持它们的时空表达模式。这样的实施例包括在拟南芥属和甘蓝型油菜(Brassicanapus)种子中表达脑啡肽的拟南芥2S种子储藏蛋白基因启动子(Vanderkerckhove等人,Bio/Technology 7:L929-932(1989))、表达荧光素酶的菜豆凝集素和β-菜豆蛋白启动子(Riggs等人,Plant Sci.63:47-57(1989)),以及表达氯霉素乙酰转移酶的小麦谷蛋白启动子(Colot等人,EMBO J.6:3559-3564(1987))。
可诱导启动子响应内源性或外源性刺激的存在,例如,通过化合物(化学诱导剂),或响应环境、激素、化学信号和/或发育信号而选择性表达可操纵连接的DNA序列。可诱导的或受调控的启动子包括(例如)受光、热、胁迫、水涝或干旱、植物激素、创伤或诸如乙醇、茉莉酮酸酯、水杨酸或安全剂之类的化学品调控的启动子。
其它启动子包括如下启动子:1)胁迫诱导型RD29A启动子(Kasuga等人,Nature Biotechnol.17:287-91(1999));2)大麦启动子B22E;B22E的表达是发育中的玉米籽粒中的柄所特异性的(“Primary Structureof a Novel Barley Gene Differentially Expressed in Immature AleuroneLayers(在未成熟糊粉层中差异表达的新大麦基因的一级结构)”,Klemsdal等人,Mol.Gen.Genet.228(1/2):9-16(1991));以及3)玉米启动子Zag2(“Identification and molecular characterization of ZAG1,the maize homolog of the Arabidopsis floral homeotic gene AGAMOUS(ZAG1-拟南芥属花同源异形基因AGAMOUS的玉米同系物的鉴定和分子表征)”,Schmidt等人,Plant Cell 5(7):729-737(1993);“Structuralcharacterization,chromosomal localization and phylogenetic evaluation oftwo pairs of AGAMOUS-like MADS-box genes from maize”,Theissen等人,Gene 156(2):155-166(1995);NCBI GenBank Accession X80206))。Zag2转录物可在授粉前五天至授粉后(“DAP”)七至八天被检测到,并且引导Ciml在发育中的雌花序心皮中表达,Ciml对发育中的玉米籽粒的籽仁而言是特异性的。Ciml转录物在授粉前四至五天至授粉后六至八DAP被检测到。其他可用的启动子包括可源自其表达与发育中的雌小花母系相关的基因的任何启动子。
用于调控本发明的核苷酸序列在植物中表达的其它启动子是茎特异性启动子。这种茎特异性启动子包括苜蓿S2A启动子(GenBank登记号:EF030816;Abrahams等人,Plant Mol.Biol.27:513-528(1995))和S2B启动子(GenBank登录号:EF030817)等等,将这些文献以引用的方式并入本文。
启动子可以整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包括合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。还应认识到,由于在大多数情况下还不能完全确定调控序列的确切范围,一些变型的DNA片段可能具有相同的启动子活性。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。目前不断在发现可用于植物细胞中的不同类型的新启动子;在Okamuro,J.K.和Goldberg,R.B.,Biochem.Plants 15:1-82(1989)的汇编中可找到许多实例。
其它启动子可包括:RIP2、mLIP15、ZmCOR1、Rab17、CaMV 35S、RD29A、B22E、Zag2、SAM合成酶启动子、泛素启动子、CaMV 19S、nos、Adh、蔗糖合成酶启动子、R-等位基因启动子、维管组织其它启动子S2A(Genbank登录号EF030816)和S2B(Genbank登录号EF030817)及来自玉米的组成型启动子GOS2。其它启动子包括根启动子,例如玉米NAS2启动子、玉米Cyclo启动子(US公布2006/0156439,公开于2006年7月13日)、玉米ROOTMET2启动子(WO 2005/063998,公开于2005年7月14日)、CR1BIO启动子(WO 2006/055487,公开于2006年5月26日)、CRWAQ81(WO 2005/035770,公开于2005年4月21日)和玉米ZRP2.47启动子(NCBI登录号U38790;NCBI GI No.1063664)。
本发明的重组DNA构建体(及抑制DNA构建体)也可包括其他调控序列,包括但不限于翻译前导序列、内含子和多腺苷酸化识别序列。在本发明的另一个其它实施方案中,本发明的重组DNA构建体还包括增强子或沉默子。
内含子序列可以加至5’非翻译区、蛋白编码区或3’非翻译区以增加积聚在胞浆中的成熟信息的量。已经显示,在植物和动物两者的表达构建体的转录单位中包含可剪接内含子可使基因表达在mRNA和蛋白质水平上均增强高达1000倍(Buchman和Berg,Mol.Cell Biol.8:4395-4405(1988);Callis等人,Genes Dev.1:1183-1200(1987))。这种内含子对基因表达的增强通常在将其设置接近转录单位的5’端时为最大。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的使用是本领域已知的。通常参见The Maize Handbook,第116章,Freeling和Walbot(编辑),Springer,纽约(1994)。
如果期望进行多肽表达,则通常希望在多核苷酸编码区的3′-端处包含有多腺苷酸化区。该多腺苷酸化区可源自天然基因,源自多种其他植物基因或源自T-DNA。要加入的3′端序列可源自(例如)胭脂碱合成酶或章鱼碱合成酶基因,或作为选择源自另外的植物基因,或在一个实施方案中是源自任何其他真核基因。
“翻译前导序列”指位于基因启动子序列和编码序列之间的DNA序列。翻译前导序列存在于翻译起始序列的经完全加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录过程、mRNA稳定性或翻译效率。翻译前导序列的实例已经有所描述(Turner,R.and Foster,G.D.,Mol.Biotech.3:225(1995)).
任何植物都可以选择用来鉴定将用于本发明重组DNA构建体的调控序列和基因。适用于分离基因和调控序列的靶植物的实例应该包括但不限于苜蓿、苹果、杏、拟南芥属植物、洋蓟、芝麻菜、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、卡诺拉、香瓜、胡萝卜、木薯、蓖麻、菜花、芹菜、樱桃、菊苣、芫荽、柑桔类、克莱门氏小柑橘类、三叶草、椰子、咖啡、玉米、棉、蔓越莓、黄瓜、花旗松、茄子、菊苣、茅菜、桉树、茴香、无花果、大蒜、葫芦、葡萄、柚子树、白兰瓜、豆薯、猕猴桃、生菜、韭葱、柠檬、酸橙、火炬松、亚麻子、玉米、芒果、甜瓜、蘑菇、油桃、坚果、燕麦、油棕、油菜、秋葵、橄榄树、洋葱、橙、观赏植物、棕榈、木瓜树、欧芹、欧洲防风草、豌豆、桃树、花生、梨树、胡椒、柿树、松树、菠萝、大蕉、李树、石榴树、白杨、马铃薯、南瓜、温柏、辐射松、红菊苣、萝卜、油菜、树莓、稻、黑麦、高粱、南方松、大豆、菠菜、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、枫香树、柑橘、茶、烟草、蕃茄、黑小麦、草皮草、芜菁、葡萄树、西瓜、小麦、薯蓣和西葫芦。用于鉴定调控序列的特别其它植物是拟南芥属植物、玉米、小麦、大豆和棉。
其它组合物
本发明的其它组合物是其基因组中包含本发明的任何重组DNA构建体(包括任何抑制DNA构建体)(例如上面所讨论的任何一种其它构建体)的植物。其它组合物也包括任何植物的子代,以及获取自植物或其子代的任何种子,其中所述子代或种子在其基因组中包含重组DNA构建体(或抑制DNA构建体)。子代包括通过植物的自花授粉或异型杂交而获得的连续世代。子代也包括杂交种和自交系。
在一个实施方案中,在杂交种子繁殖的农作物中,成熟的转基因植物可以自花授粉而产生纯合的自交系植物。该自交系植物产生含有新引入的重组DNA构建体(或抑制DNA构建体)的种子。这些种子可以生长而产生将会表现出改变的农学特性(如,在氮限制条件下农学特性增加)的植物,或者可以用于育种程序以产生杂交种子,这些杂交种子可以生长而产生将会表现出如改变的农学特性的植物。在一个实施方案中,种子是玉米种子。
在一个实施方案中,植物是单子叶植物或双子叶植物,是玉米或大豆植物,是玉米植物,例如玉米杂种植物或玉米自交系植物。植物还可以是向日葵、高梁、卡诺拉、小麦、苜蓿、棉花、水稻、大麦或黍。
在一个实施方案中,重组DNA构建体稳定地整合进植物的基因组中。
其它实施方案尤其包括但不限于如下其它实施方案1-8:
1.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。在一个实施方案中,在与该对照植物比较时,该植物还表现出至少一种农学特性的改变。
2.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含:
(a)可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性;或
(b)抑制DNA构建体,所述构建体包含至少一种调控元件,所述调控元件可操作地连接至:
(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%的序列同一性,或(B)核酸序列(b)(i)(A)的全长互补序列;或
(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当基于Clustal V比对方法与所述区域所来源的有义链或反义链的全部或部分进行比较时,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽,
并且其中所述植物在与不包含所述重组DNA构建体的对照植物比较时表现出至少一种农学特性的改变。
3.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码LNT2或LNT2样多肽,并且其中在与未包含所述重组DNA构建体的对照植物比较时,所述植物表现出增加的氮胁迫耐受性。在一个实施方案中,在与该对照植物比较时,该植物还表现出至少一种农学特性的改变。在一个实施方案中,该LNT2多肽来自拟南芥(Arabidopsis thaliana)、玉米(Zea mays)、大豆(Glycine max)、烟豆(Glycine tabacina)、野大豆(Glycine soja)或短绒野大豆(Glycine tomentella)。
4.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控序列的多核苷酸,其中所述多核苷酸编码LNT2或LNT2样多肽,并且其中在与未包含所述重组DNA构建体的对照植物进行比较时,所述植物表现出在氮限制条件下至少一种农学特性的改变。在一个实施方案中,该LNT2多肽来自拟南芥(Arabidopsis thaliana)、玉米(Zea mays)、大豆(Glycine max)、烟豆(Glycine tabacina)、野大豆(Glycine soja)或短绒野大豆(Glycine tomentella)。
5.在其基因组中包含重组DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一个调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出在氮限制条件下至少一种农学特性的改变。
6.在其基因组中包含抑制DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该抑制DNA构建体包含至少一个可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域的调控元件,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽,并且其中在与未包含所述抑制DNA构建体的对照植物进行比较时,所述植物表现出在氮限制条件下至少一种农学特性的改变。
7.在其基因组中包含抑制DNA构建体的植物(在一个实施方案中是玉米或大豆植物),该抑制DNA构建体包含至少一个可操作地连接至以下序列的全部或部分的调控元件:(a)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性;或(b)(a)的核酸序列的全长互补序列,并且其中在与未包含所述抑制DNA构建体的对照植物进行比较时,所述植物表现出在氮限制条件下至少一种农学特性的改变。
8.上述其它实施方案1-7中的植物的任何子代、上述其它实施方案1-7中的植物的任何种子、上述其它实施方案1-7中的植物的子代的任何种子以及来自上述其它实施方案1-7中的植物以及它们的子代的细胞。
在上述其它实施方案1-8或本发明的任意其他实施方案中的任意一项中,重组DNA构建体(或抑制DNA构建体)在一个实施方案中包含至少一个在植物中有功能的启动子作为其它调控序列。
在上述其它实施方案1-8或本发明的任意其他实施方案中的任意一项中,至少一种农学特性的改变是增加或减少,在一个实施方案中是增加。
在任一前述的其它实施方案1-8或本发明的任何其他实施方案中,至少一种农学特性选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织中的含氮量、总植物氨基酸含量、营养组织游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、耐旱性、氮摄取、根倒伏抗性、收获指数、茎倒伏、植株高度、穗高、和穗长。产量、绿度和生物量尤其是其它进行改变的农学特性(在一个实施方案中是增加)。
在任意上述其它实施方案1-8或本发明的任意其他实施方案中,在与不包含所述重组DNA构建体(或抑制DNA构建体)的对照植物在氮胁迫条件下进行比较时,在一个实施方案中植物表现出至少一种农学特性的改变。
本领域的普通技术人员熟悉模拟氮条件(限制性的或非限制性的)的规程,以及用于评估已经经受过模拟的或天然存在的氮条件(限制性的或非限制性的)的植物的规程。例如,技术人员能够通过向植物提供比正常需求更少的氮或在一定时期内不提供氮来模拟氮条件,并且技术人员能够通过寻找农学特性的差异来评估此类植物,例如在生理学和/或物理条件上的变化,包括(但不限于)活力、生长、大小、或根长、或具体地讲叶片颜色或叶片面积大小。用于评估此类植物的其它技术包括测量叶绿素荧光、光合作用速率、根生长或换气速率。
下面的实施例描述了一些用于模拟氮限制条件和/或在此类条件下评估植物的代表性规程和技术。
技术人员也能够通过植物在田间测试中,在模拟的或天然存在的低氮或高氮条件下保持足够产量的能力(例如通过测量在低氮或高氮条件下,与标准氮条件下相比基本上等同的产量,或通过测量在低氮或高氮条件下与对照或参照植物相比更少的产量损失)来评估氮胁迫耐受性(在一个实施方案中至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的产量)。
在评估或测量其中利用了对照或参照植物的本发明任何实施方案(如,如本文描述的组合物或方法)中的转基因植物的农学特性或表型时,本领域的普通技术人员将很容易认识到要利用的合适对照或优选植物。例如,通过如下非限制性示例来说明:
1.转化植物的子代,该植物对于重组DNA构建体(或抑制DNA构建体)来说是半合子的,使得该子代分离成包含或不包含该DNA构建体(或抑制DNA构建体)的植株:包含该重组DNA构建体(或抑制DNA构建体)的子代将通常相对于未包含该重组DNA构建体(或抑制DNA构建体)的子代来进行测量(即,未包含该重组DNA构建体(或抑制DNA构建体)的子代是对照或参照植株)。
2.重组DNA构建体(或抑制DNA构建体)基因渗入至自交系中,例如在玉米中,或基因渗入进变体中,例如在大豆中:基因渗入品系将通常相对于亲本自交系或变种品系进行测量(即,亲本自交系或变种品系是对照或参照植物)。
3.双杂交系,其中第一杂交系由两个亲本自交系产生,而第二杂交系由相同的两个亲本自交系产生,不同的是其中一个亲本自交系含有重组DNA构建体(或抑制DNA构建体):第二杂交系通常将相对于第一杂交系进行测量(即第一杂交系为对照植物或参照植物)。
4.包含重组DNA构建体(或抑制DNA构建体)的植株:该植株可以相对于这样的对照植株进行评估或测量,该对照植株不包含重组DNA构建体(或抑制DNA构建体),但具有与该植株相当的遗传背景(例如,与包含重组DNA构建体(或抑制DNA构建体)的植株相比较,核遗传物质具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性)。存在许多可用于分析、比较和表征植物遗传背景的基于实验室的技术;其中这些技术是同工酶电泳、限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、任何引物聚合成酶链反应(AP-PCR)、DNA扩增指纹(DAF)、序列特异扩增区域(SCAR)、扩增片段长度多态性(AFLP)和也称为微卫星的简单序列重复(SSR)。
此外,本领域的普通技术人员将容易认识到,评估或测量转基因植物的农学特性或表型时合适的对照或参照植物将不包括先前已经针对所需的农学特性或表型,通过诱变或转化而选择的植物。
其它方法
其它方法包括但不限于用于提高植物氮胁迫耐受性的方法、用于评估植物氮胁迫耐受性的方法、用于改变植物农学特性的方法、用于测定植物农学特性改变的方法、和用于制备种子的方法。在一个实施方案中,植物是单子叶植物或双子叶植物,是玉米或大豆植物,甚至在一个实施方案中是玉米植物。植物还可以是向日葵、高梁、卡诺拉、小麦、苜蓿、棉花、水稻、大麦或黍。种子可以是玉米或大豆种子,可以是玉米种子,并且甚至在一个实施方案中可以是是玉米杂交种种子或玉米自交系种子。
其它方法尤其包括但不限于如下方法:
增加植物氮胁迫耐受性的方法,所述方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;和(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与不包含该重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含抑制DNA构建体并且在与未包含该重组DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性。
增加植物氮胁迫耐受性的方法,所述方法包括:(a)将包含至少一个调控序列(在一个实施方案中是植物中有功能的启动子)的抑制DNA构建体引入到可再生的植物细胞,该调控序列可操作地连接至以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)(a)(i)的核酸序列的全长互补序列;和(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性。
增加植物氮胁迫耐受性的方法,所述方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;和(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含抑制DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出增加的氮胁迫耐受性。
评估植物氮胁迫耐受性的方法,所述方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)评价该转基因植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。该方法还可包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(e)评价该子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
评估植物氮胁迫耐受性的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(a)(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)评价该转基因植物在与不包含该抑制DNA构建体的对照植物进行比较时的氮胁迫耐受性;该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)评价该子代植物在与不包含该抑制DNA构建体的对照植物进行比较时的氮胁迫耐受性。
评估植物氮胁迫耐受性的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至来源于所关注的靶基因的有义链或反义链的全部或部分的区域,当基于Clustal V比对方法与所述区域所来源的有义链或反义链的全部或部分进行比较时,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)评价该转基因植物在与不包含该抑制DNA构建体的对照植物进行比较时的氮胁迫耐受性;该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)评价该子代植物在与不包含该抑制DNA构建体的对照植物进行比较时的氮胁迫耐受性。
评估植物氮胁迫耐受性的方法,所述方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)评价该转子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;
评估植物氮胁迫耐受性的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(a)(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)评价该转子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;
评估植物氮胁迫耐受性的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至来源于所关注的靶基因的有义链或反义链的全部或部分的区域,当基于Clustal V比对方法与所述区域所来源的有义链或反义链的全部或部分进行比较时,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)评价该转子代植物在与不包含该重组DNA构建体的对照植物进行比较时的氮胁迫耐受性;
确定植物农学特性改变的方法,所述方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含所述重组DNA构建体;以及(c)确定所述转基因植物在一个实施方案中在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法还可包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(e)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)确定所述转基因植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)确定所述转基因植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;(b)在步骤(a)后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含所述重组DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含可操作地连接至少一个调控序列(在一个实施方案中是在植物中有功能的启动子)的以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:18、20、24、26、28、30、或32进行比较时,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;或(ii)(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
确定植物农学特性改变的方法,所述方法包括(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一个调控序列(在一个实施方案中是植物中有功能的启动子),该调控序列可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码LNT2或LNT2样多肽;(b)在步骤(a)之后从该可再生的植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)确定所述子代植物在一个实施方案中在氮限制条件下与不包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。
产生种子(在一个实施方案中可以作为提供氮胁迫耐受性的产品销售的种子)的方法,该方法包括任意上述的其它方法,并且还包括从所述子代植物获得种子,其中所述种子在它们的基因组中包含所述重组DNA构建体(或抑制DNA构建体)。
在任一前述的其它方法或本发明方法的任何其它实施方案中,测定转基因植物中农学特性改变的步骤(如果适用的话)在一个实施方案中可包括测定在改变的环境条件下与不包含重组DNA构建体的对照植物进行比较时该转基因植物是否表现出至少一种农学特性的改变。
在任一前述的其它方法或本发明方法的任何其它实施方案中,测定子代植物中农学特性改变的步骤(如果适用的话)可包括测定在改变的环境条件下与不包含重组DNA构建体的对照植物进行比较时该子代植物是否表现出至少一种农学特性的改变。
在任何前述的其它方法或本发明方法的任何其它实施方案中,在所述导入步骤中所述可再生的植物细胞可包括愈伤组织细胞(在一个实施方案中是胚胎)、配子细胞、分生细胞或未成熟胚芽细胞。可再生的植物细胞在一个实施方案中来自自交玉米植物。
在任意上述的其它方法或本发明方法的任意其他实施方案中,所述再生步骤在一个实施方案中包括:(i)在包含促进胚发生的激素的培养基中培育所述转化的植物细胞直至观察到愈伤组织;(ii)将所述步骤(i)的转化的植物细胞转移至包含促进组织机体形成的激素的第一培养基;以及(iii)在第二培养基上传代培养步骤(ii)后的所述转化的植物细胞,以允许嫩芽伸长、根发育或这两者同时发生。
在任意上述的其它方法或本发明方法的任意其它实施方案中,至少一种农学特性选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物氮含量、果实氮含量、种子氮含量、营养组织中的氮含量、总植物氨基酸含量、营养组织中的游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织中的蛋白质含量、耐旱性、氮摄取、根倒伏抗性、收获指数、茎杆倒伏、植物高度、穗高、以及穗长。产量、绿度和生物量尤其是其它进行改变的农学特性(在一个实施方案中是增加)。
在任意上述其它方法或本发明的方法的任意其它实施方案中,在与不包含所述重组DNA构建体(或抑制DNA构建体)的对照植物在氮胁迫条件下进行比较时,在一个实施方案中植物表现出至少一种农学特性的改变。
在任一前述的其它方法或本发明方法的任何其它实施方案中,存在供选择的替代方案用于将包含可操作地连接至少一种调控序列上的多核苷酸的重组DNA构建体导入可再生的植物细胞。例如,可将调控序列(例如一种或多种增强子、在一个实施方案中作为转位因子的部件)导入可再生的植物细胞,然后筛选其中将所述调控序列可操作地连接至编码本发明多肽的内源基因的事件。
将本发明的重组DNA构建体引入植物可通过任何合适的技术来进行,这些技术包括但不限于DNA直接摄取、化学处理、电穿孔、微注射、细胞融合、感染、病毒介导的DNA转移、轰击或农杆菌介导的转化。
其它技术如下文实施例所示,用于转化玉米植物细胞和大豆植物细胞。
用于转化双子叶植物(主要通过利用根瘤农杆菌(Agrobacteriumtumefaciens))以及获得转基因植物的其它方法包括公开的用于棉花的那些(美国专利5,004,863、美国专利5,159,135、美国专利5,518,908);用于大豆的那些(美国专利5,569,834、美国专利5,416,011、McCabe等人,Bio/Technology 6:923(1988),Christou等人,Plant Physiol.87:671674(1988));用于芸苔属植物(Brassica)的那些(美国专利5,463,174);用于花生的那些(Cheng等人,Plant Cell Rep.15:653 657(1996),McKently等人,Plant Cell Rep.14:699 703(1995));用于番木瓜的那些;以及用于豌豆的那些(Grant等人,Plant Cell Rep.15:254-258(1995))。
用电穿孔、粒子轰击和农杆菌转化单子叶植物也已有报道并且作为其它方法包括(例如)如在天门冬属(asparagus)中实现的转化和植物再生(Bytebier等人,Proc.Natl.Acad.Sci.U.S.A.84:5354,(1987));在大麦中实现的转化和植物再生(Wan和Lemaux,Plant Physiol.104:37(1994));corn(Rhodes等人,Science 240:204(1988),Gordon-Kamm等人,Plant Cell 2:603 618(1990),Fromm等人,Bio/Technology 8:833(1990),Koziel等人,Bio/Technology 11:194(1993),Armstrong等人,Crop Science 35:550-557(1995));在燕麦中实现的转化和植物再生(Somers等人,Bio/Technology 10:1589(1992));在野茅(orchardgrass)中实现的转化和植物再生(Horn等人,Plant Cell Rep.7:469(1988));在稻中实现的转化和植物再生(Toriyama等人,Theor.Appl.Genet.205:34(1986);Part等人,Plant Mol.Biol.32:1135 1148,(1996);Abedinia等人,Aust.J.Plant Physiol.24:133 141(1997);Zhang和Wu,Theor.Appl.Genet.76:835(1988);Zhang等人,Plant Cell Rep.7:379,(1988);Battraw和Hall,Plant Sci.86:191 202(1992);Christou等人,Bio/Technology 9:957(1991));裸麦(De la Pena等人,Nature325:274(1987));在甘蔗中实现的转化和植物再生(Bower和Birch,Plant J.2:409(1992));高羊茅(Wang等人,Bio/Technology 10:691(1992));以及小麦(Vasil等人,Bio/Technology 10:667(1992);美国专利5,631,152)。
存在多种用于从植物组织再生植物的方法。再生的具体方法将取决于起始植物组织以及待再生的具体植物物种。
从单植物原生质体转化体或从多种经转化的外植体再生、发育和培育植物是本领域所熟知的(Weissbach和Weissbach(编辑),载于:Methods for Plant Molecular Biology,Academic Press,Inc.San Diego,CA,(1988))。该再生和生长方法通常包括如下步骤:选择转化的细胞、培养这些单独化的细胞通过胚发育的通常阶段以及通过生根小植株阶段。转基因胚以及种子以类似的方式再生。随后将所得的转基因的生根小苗种植在诸如土壤之类的合适植物生长培养基中。
含有编码所关注蛋白质的外来的外源性分离核酸片段的植物的发育或再生是本领域所熟知的。在一个实施方案中,将再生的植物进行自花授粉以产生纯合的转基因植物。或者,将得自再生植物的花粉与农学上重要的品系的产生种子的植株进行杂交。相反,将来自这些重要品系的植物用于给再生植物授粉。利用本领域技术人员所熟知的方法培育含有所需多肽的本发明的转基因植物。
实施例
本发明将在下面的实施例中进一步说明,其中份数和百分比是以重量计并且度数是摄氏度,除非另外说明。应该理解,尽管这些实施例说明了本发明的其它实施方案,但仅是以例证的方式给出的。根据上面的论述和这些实施例,本领域的技术人员可以确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下,可对本发明做出多种改变和修饰,以使其适用于多种用法和条件。此外,除了那些本文所示和描述的那些之外,根据前文所述,本发明的各种修改形式对本领域的技术人员来说将是显而易见的。这些修改形式也旨在属于附加的权利要求书的范围内。
实施例1
制备具有激活标记基因的拟南芥种群
构建18.49kb的T-DNA基二元构建体,pHSbarENDs2(SEQ ID NO:1;图1)包含四个来源于花椰菜花叶病毒35S启动子的四个多聚增强子元件(对应于序列-341至-64,如Odell等人Nature 313:810-812所述(1985))。该构建体也包含允许质粒救援的载体序列(pUC9)和多接头(SEQ ID NO:11)、再动员T-DNA的转座子序列(Ds)、以及允许草胺磷选择转基因植物的bar基因。原则上,仅将从右边界(RB)至左边界(LB)包含的10.8kb片段转移到寄主植物基因组中。因为增强子元件位于靠近RB处,它们可诱导T-DNA整合后的基因组位点顺式激活。
通过整个植株的农杆菌转化制备拟南芥激活标记种群。将pHSbarENDs2构建体转化到根癌农杆菌菌株C58中,在25℃下在溶菌肉汤培养基中培养至OD600~1.0。然后离心沉淀细胞,并重悬在相等体积的5%蔗糖/0.05%Silwet L-77(OSI Specialties,Inc)中。在早期抽薹时,培育拟南芥属生态型Col-0的土壤使用农杆菌悬浮液进行顶部灌溉。一周后,相同植株再次用在蔗糖/Silwet中的相同农杆菌菌株进行顶部灌溉。然后将该植物的种子设为标准。所得T1种子在土壤中播种,通过喷洒草胺磷(FINALE;AgrEvo;Bayer Environmental Science)选择转基因幼苗。选择了总计100,000个草胺磷抗性T1幼苗。分开保存来自每个品系的T2种子。
实施例2
筛选以鉴定具有低氮耐受性的品系
来自每个100,000个分离T1激活标记品系的十一个T2植物可种植在方板(15mm×15mm)上,方板包含0.5xN-Free Hoagland’s,0.4mM硝酸钾,0.1%蔗糖,1mM MES和0.25%PhytagelTM(低氮培养基)。每个板种植五个品系,并且每个板包括9个野生型个体以使总计64个个体排列成8×8的网格图案(参见图11)。在暗处、4℃条件下保持平板三天以使种子分层,然后在22℃光照和20℃黑暗交替条件下水平放置九天。光周期为十六小时光照和八小时黑暗,平均光照强度为~200mmol/m2/s。每天旋转并振动每个架子中的平板。在第十二天(生长九天),对整个板拍照以评估幼苗状态。
在掩蔽该平板图像以移除背景颜色后,每个个体收集两个不同的测量数据:总罗赛塔面积和进入绿色区的颜色百分比。使用色调、饱和度和强度数据(HSI),绿色区由色调50至66组成。总罗赛塔面积用作植物生物量的量度,而绿色区通过剂量-响应研究已经显示指示氮同化作用(参见图12)。
将在与野生型对照植物进行比较时具有显著的总罗赛塔面积和/或绿色区增加的品系命名为Phase 1 hits。在相同分析条件下进行Phase 1hits的重复试样再筛选(Phase 2 筛选)。还通过Phase 3筛选以进一步验证通过Phases 1和2的突变体。在Phase 3中,将每个品系分开种植在低氮培养基中,使得32个T2个体紧邻着32个野生型个体生长,为分析提供更高的统计学严谨性。如果一个品系显示与Phase 3中对照的显著差异,然后可认为该品系是经验证的氮缺乏抗性品系。
实施例3
鉴定激活标记基因
使用下述两个标准程序中的一个或两个鉴定侧接导致氮耐受性的T-DNA插入序列的基因:(1)热不对称交错(TAIL)PCR(Liu等人,Plant J.8:457-63(1995));以及(2)SAIFF PCR(Siebert等人,NucleicAcids Res.23:1087-1088(1995))。至于复杂的多聚T-DNA插入序列,TAIL PCR和SAIFF PCR可能均不足以鉴定候选基因。在这些情况下,可使用包括反式PCR、质粒拯救和/或基因组文库构建在内的其他程序。
成功的结果是其中单个TAIL或SAIFF PCR片段包含T-DNA边界序列和拟南芥属基因组序列。一旦获取侧接T-DNA插入序列的基因组序列标记,通过与公开可用的拟南芥属基因组的序列比对来鉴定候选基因。具体地讲,最靠近35S增强子元件/T-DNA RB的注释基因是激活的基因的候选基因。
为了验证鉴定的基因真的靠近T-DNA并排除TAIL/SAIFF片段是嵌合伪克隆的可能性,用一个T-DNA中的寡核苷酸和一个候选基因特异性的寡核苷酸进行对基因组DNA的诊断PCR。将提供PCR产品的基因组DNA样本理解为表示T-DNA插入序列。该分析也验证了其中一种以上的插入事件发生在相同品系中的情况,例如,在TAIL和/或SAIFF PCR分析中鉴定是否有多个不同基因组片段。
实施例4
鉴定激活标记LNT2基因
进一步分析显示氮缺乏耐受性的激活标记品系(品系111786)。提取来自该品系的DNA,并且在突变品系中侧接T-DNA插入序列的基因通过连接介导PCR(Siebert等人,Nucleic Acids Res.23:1087-1088(1995))进行鉴定。鉴定一个单独扩增的片段,它包含T-DNA边界序列和拟南芥基因组序列。一旦获取侧接T-DNA插入序列的基因组序列标记,通过与完全拟南芥属基因组的序列比对鉴定候选基因。具体地讲,最靠近35S增强子元件/T-DNA RB的注释基因是品系中激活的基因的候选基因。就品系111786而言,最靠近35S增强子的基因是At5g50930(SEQ ID NO:27),它编码拟南芥“unknown蛋白”,本文称为LNT2(SEQ ID NO:28;NCBI GI 15241317)。
实施例5
通过转化拟南芥验证候选拟南芥基因(At5g50930)
可将候选基因转化到拟南芥属中并在35S启动子作用下过表达。如果在转基因品系中观察到与亲本激活标记品系相同或相似的表型,则将该候选基因认为是拟南芥属中验证过的“前导基因”。
通过以下方法测试拟南芥At5g50930基因(SEQ ID NO:27)的赋予氮缺乏耐受性的能力。
通过RT-PCR扩增At5g50930cDNA,使用以下引物:
1.At5g50930-5’attB正向引物(SEQ ID NO:35)
正向引物包含attB1序列(ACAAGTTTGTACAAAAAAGCAGGCT;SEQ ID NO:12)和共有的Kozak序列(CAACA)的所述cDNA蛋白编码区上游的前21个核苷酸(以ATG起始密码子开头)。
2.At5g50930-3’attB反向引物(SEQ ID NO:36)
反向引物包含attB2序列(ACCACTTTGTACAAGAAAGCTGGGT;SEQ ID NO:13),该序列邻近所述cDNA蛋白编码区的反向互补序列的后21个核苷酸(以终止密码子的反向互补序列开头)。
RT-PCR反应生成两个产物,本文称为lnt2-2和lnt2-3(分别是SEQID NO:29和31)。将这些产物鉴定为At5g50930基因的剪接变体。
使用INVITROGENTM GATEWAYCLONASETM技术,用pDONRTMZeo(SEQ ID NO:2;图2)进行每个RT-PCR产物的BP重组反应。这种方法将细菌致死ccdB基因以及氯霉素抗性基因(CAM)从pDONRTMZeo移除并定向地克隆了该在旁侧具有attB1和attB2位点的PCR产物而得到入门克隆(entry clone)。如下所述,将每个剪接变体序列的一个鉴定为阳性的入门克隆与一个目的载体一起用于随后的LR重组反应。
用紧接INVITROGENTM GATEWAY C1转化插入序列上游的1.3-kb35S启动子构建称为pBC-yellow(SEQ ID NO:4;图4)的16.8-kb T-DNA基的二元载体(目的载体),所述插入序列包含ccdB细菌致死基因以及侧接attR1和attR2序列的氯霉素抗性基因(CAM)。该载体也包含RD29a启动子,该启动子驱动基因表达ZS-Yellow(INVITROGENTM),它赋予转化过的种子黄色荧光。使用INVITROGENTM GATEWAY技术,使用包含lnt2-2和pBC-yellow载体的入门克隆进行LR重组反应。该扩增允许快速定向克隆lnt2-2(SEQ ID NO:29),克隆发生在pBC-yellow中的35S启动子之后。还使用包含lnt2-3和pBC-yellow载体的入门克隆进行LR重组反应。
申请人然后使用如实施例1所述的相同农杆菌介导转化程序,将35S启动子:At5g50930表达构建体导入野生型拟南芥生态型Col-0。转基因T1种子通过黄色荧光进行选择,并且将32个这些T1种子紧邻着32个野生型拟南芥生态型Col-0种子种植在低氮培养基上。所有随后的生长和拍照条件均如实施例1所述。发现来自激活标记的、对氮限制条件具有耐受性的初始表型能在用其中At5g50930基因通过35S启动子直接表达的构建体转化过的野生型拟南芥植物中重现。
实施例6
cDNA文库的组成、cDNA克隆的分离和测序
cDNA文库可通过许多可用的方法中的任一种制备。例如,通过首先根据生产商的说明书(Stratagene Cloning Systems,La Jolla,CA)制备载体中的cDNA文库,可将cDNA引入质粒载体中。根据Stratagene提供的说明书,将文库转换成质粒文库。当转换的时候,将把cDNA插入序列包含于质粒载体rBLUESCRIPT中。此外,可使用T4连接酶(New England Biolabs)将cDNA直接导入预切过的BluescriptII SK(+)载体(Stratagene)中,随后按照制造商规程(GIBCO BRL Products)转染DH10B细胞。一旦cDNA插入序列处于质粒载体中,从随机选取的含重组pBLUESCRIPT质粒的细菌菌落制备质粒DNA,或者用对插入的cDNA序列旁侧的载体序列特异性的引物,通过聚合酶链式反应扩增插入的cDNA序列。将扩增的DNA插入序列或质粒DNA在引物标记法测序反应(dye-primer sequencingreaction)中进行测序,以产生部分cDNA序列(表达序列标记或“EST”;参见Adams等人,1991,Science 252:1651-1656)。用Perkin Elmer Model377荧光测序仪分析所得的EST。
用改进的转座规程产生全长插入序列(FIS)数据。从归档的甘油原种作为单一菌落回收确定了FIS的克隆,并通过碱性裂解分离质粒DNA。将分离的DNA模板在基于PCR的测序反应中与载体引物M13正向和反向寡核苷酸反应并上样至自动化的测序仪上。通过与对其进行FIS查询的初始EST序列进行序列比对来确认克隆鉴定。
将确认的模板通过基于酿酒酵母(Saccharomyces cerevisiae)Tyl转座因子(Devine和Boeke,1994,Nucleic Acids Res.22:3765-3772)的Primer Island转座试剂盒(PE Applied Biosystems,Foster City,CA)进行转座。该体外转座系统在整个一组大DNA分子中随机地放入独特的结合位点。随后将转座的DNA用于通过电穿孔转化DH10B电-感受态细胞(Gibco BRL/Life Technologies,Rockville,MD)。转座因子含有另外的可选标记(称为DHFR;Fling和Richards,1983,Nucleic AcidsRes.11:5147-5158),使得能在琼脂平板上仅双重筛选含有整合的转座子的那些亚克隆。从每次转座反应随机地选择多个亚克隆,通过碱性裂解制备质粒DNA,并用对转座子内的结合位点特异性的独特引物从转座事件位点向外进行测序(ABI Prism dye-terminator ReadyReaction mix)。
收集序列数据(ABI PRISMCollections)并用Phred和Phrap(Ewing等人,Genome Res.8:175-185(1998);Ewing等人,Genome Res.8:186-194(1998))进行装配。Phred是一种公用软件程序,该程序再次读取ABI序列数据,再次调出(recall)碱基,赋质量值,并将碱基序列(base call)和质量值写入可编辑的输出文件中。Phrap序列组装程序使用这些质量值来增加组装的序列重叠群的准确度。通过Consed序列编辑器(Gordon等人,1998,Genome Res.8:195-202)检查装配序列。
在一些克隆中,cDNA片段对应基因的3’-端的一部分并且不会涵盖整个开放阅读框。为了获得上游信息,使用两种不同规程中的一者。这两种方法中的第一种方法导致产生含有所需基因序列的部分的DNA片段,而第二种方法导致产生含有整个开放阅读框的片段。这两种方法均使用两轮PCR扩增以从一个或多个文库获得片段。有时基于以前的知识(特定的基因应该存在于某些组织中)选择文库,有时则进行随机地选择。获得相同基因的反应可平行地在若干文库中进行,或者在文库池中进行。文库池通常用3至5个不同的文库制备并且使其归一化而成为一致的稀释度。在第一轮扩增中,两种方法均使用载体特异性的(正向)引物,同时还使用基因特异性的(反向)引物,该正向引物对应位于克隆5’-端处的载体的一部分。-第一种方法使用与已知基因序列的一部分互补的序列,而第二种方法使用与3’-非翻译区(也称为UTR)的一部分互补的基因特异性引物。在第二轮扩增中,两种方法均使用套式引物组。按照生产商的说明书,用市售试剂盒将所得DNA片段连接进pBLUESCRIPT载体中。该试剂盒选自可得自包括InvitrogenTM(Carlsbad,CA)、Promega Biotech(Madison,WI)和Gibco-BRL(Gaithersburg,MD)在内的一些供应商的许多试剂盒。如上所述,将质粒DNA通过碱性裂解方法分离并进行测序和用Phred/Phrap进行装配。
实施例7
cDNA克隆的鉴定
编码LNT2样多肽的cDNA克隆通过这样鉴定:进行BLAST(基本的局部比对搜索工具);Altschul等人,J.Biol.215:403-410,1993;还可参见国立卫生研究院国家医学图书馆的国家生物技术信息中心的万维网址上对BLAST算法的解释)进行鉴定,寻找与BLAST“nr”数据库中所包含氨基酸序列(包括所有非冗余GenBank CDS翻译序列、源自3-维结构Brookhaven蛋白质数据库(Protein Data Bank)、SWISS-PROT蛋白质序列数据库的最新的主要版本、EMBL和DDBJ数据库的序列)的相似性。在所有的阅读框中翻译来自克隆的DNA并用NCBI提供的BLASTX算法(Gish和States,Nat.Genet.3:266-272(1993))。采用国家生物技术信息中心(NCBI)提供的BLASTP算法,分析cDNA序列编码的多肽与包含在“nr”数据库中的所有可公开获得的氨基酸序列的相似性。为方便起见,通过BLAST计算仅仅偶然观察到cDNA序列与所搜索的数据库中所包含序列的匹配的P值(概率)或E值(期望值),在本文报导为“pLog”值,它代表所报导的P值或E值的负对数。-因此,pLog值越大,cDNA编码的序列和BLAST的“匹配”代表同源蛋白的可能性就越大。
EST序列能与如上所述的Genbank数据库进行比较。通过使用BLASTn算法(Altschul等人,Nucleic Acids Res.25:3389-3402(1997))对杜邦专利数据库比较具有序列同源共有区域或重叠区域的核苷酸序列,可找到含更5′端或3′端序列的EST。在两个或更多个核酸片段之间存在共有或重叠序列时,该序列可装配成单一的连续核苷酸序列,从而使最初的片段在5′或3′初始方向上延伸。一旦确定了最5′的EST后,可以通过全长插入序列来确定其完整的序列。
可用tBLASTn算法,通过将已知基因(来自专有来源或公开数据库的已知基因)的氨基酸序列对EST数据库进行比较,可找到属于不同物种的同源基因。tBLASTn算法对所有6个阅读框都翻译了的核苷酸数据库进行氨基酸查询的搜索。该搜索允许不同物种之间的核苷酸密码子使用的差异,并且允许密码子简并。
实施例8
表征编码LNT2样多肽的cDNA克隆
制备提供来自玉米(Zea mays)、水稻(Oryza sativa)、和大豆(Glycinemax)不同组织的mRNA的cDNA文库。下面描述了该文库的特征。
表2
来自玉米、大米、和大豆的cDNA文库
文库 描述(组织) 克隆
玉米(Zea mays L.),用与RNA、DNA合成相关
cpg1c cpg1c.pk013.o6:fis
的化学制品处理过的收集的BMS
归一化的水稻(Oryza sativa L.,Nipponbare)愈伤
rca1n rca1n.pk001.f6:fis
组织
sfl1n1 归一化的大豆(Glycine max L.,Wye)未成熟的花。 sfl1n1.pk002.j1
大豆(Glycine max,Wye)11天龄幼苗的全长文
sds1f sds1f.pk001.k5
库,使用海藻糖
如表3、图14A-14B、和图15所示,表2中鉴定的cDNA编码的多肽类似于来自拟南芥的LNT2多肽(At5g50930;NCBI通用标识号15241317;SEQ ID NO:28)和来自水稻(GI No.38347162,对应于SEQID NO:33)以及葡萄(GI No.147791927,对应于SEQ ID NO:34)的LNT2样多肽。
表3(非专利文献)和表4(专利文献)中所示的分别是单独的EST(“EST”)BLASTP结果、包含标明的cDNA克隆的整个cDNA插入物的序列(“FIS”)、由两个或更多个EST、FIS或PCR序列装配而成的重叠群序列(“Contig”)、或编码源自FIS或重叠群的完整蛋白或功能性蛋白的序列(“CGS”)。表3和表4也显示了使用Clustal V比对方法、使用默认参数计算的每对氨基酸序列的序列同一性百分比值(如下所述)。
表3
多肽的BLASTP结果
与LNT2多肽的同源性
序列 %同一性 BLAST
状况 NCBI GI
(SEQ ID NO:#) pLOG打分
cpg1c.pk013.o6:fis 38347162
CGS 77.4 17.8
(SEQ ID NO:18) (SEQ ID:33.
rca1n.pk001.f6:fis 38347162
CGS 100.0 15.8
(SEQ ID NO:20) (SEQ ID:33.
PSO415619 147791927
重叠群 58.7 13.0
(SEQ ID NO:24) (SEQ ID:34.
PSO415620 147791927
重叠群 57.1 11.8
(SEQ ID NO:26) (SEQ ID:34.
表4
多肽的BLASTP结果
与LNT2多肽的同源性
序列 BLAST
状况 参照序列 %同一性
(SEQ ID NO:#) pLOG打分
cpg1c.pk013.o6:fis SEQ ID NO:224380
CGS 92.3 21.0
(SEQ ID NO:18) 在US2004214272-A1中
rca1n.pk001.f6:fis SEQ ID NO:188525
CGS 100.0 15.7
(SEQ ID NO:20) 在US2004123343-A1中
PSO415619 SEQ ID NO:183694
重叠群 92.1 21.4
(SEQ ID NO:24) 在US2004031072-A1中
PSO415620 SEQ ID NO:183694
重叠群 84.9 19.8
(SEQ ID NO:26) 在US2004031072-A1中
图14A和14B提供如SEQ ID NO:18、20、24、26所示的氨基酸序列和来自拟南芥(分别是SEQ ID NO:28、30、和32)的LNT2(At5g50930;NCBI通用标识号15241317)、LNT2-2、以及LNT2-3多肽的氨基酸序列的比对。也包括来自水稻(GI No.38347162,对应于SEQ ID NO:33)以及葡萄(GI No.147791927,对应于SEQ ID NO:34)的LNT2样多肽的比对。图15是图14A和14B中显示的每对氨基酸序列的序列同一性百分比和趋异值的图表。
用LASERGENE生物信息计算包(DNASTARInc.,Madison,WI)的MEGALIGN程序进行序列比对和同一性百分比计算。用带默认参数(空位罚分=10,空位长度罚分=10)的Clustal比对方法(Higgins和Sharp,1989,CABIOS.5:151-153)进行序列的多重比对。使用Clustal方法的成对比对的默认参数为KTUPLE 1,空位罚分=3,窗口=5,DIAGONALS SAVED=5。
实施例9
制备含有拟南芥属前导基因的同源物的植物表达载体
可使用诸如BLAST(基本的局部比对搜索工具(Basic LocalAlignment Search Tool;Altschul等人,J.Mol.Biol.215:403-410,1993;也参见美国国家卫生研究院(National Institutes of Health)国立医学图书馆(National Library of Medicine)的国家生物技术信息中心(NationalCenter for Biotechnology Information)的万维网网址上对BLAST算法的解释)之类的序列比较算法,鉴定与前导LNT2基因同源的序列。同源LNT2样序列,如实施例8所述的序列,可通过任何一种以下方法进行PCR扩增。
方法1(基于RNA的方法):如果LNT2同源物的蛋白编码区域的5’和3’序列信息是可用的,可如实施例5A所述设计基因特异性引物。可将RT-PCR用于植物RNA来获得含有蛋白编码区的核酸片段,该EXST蛋白编码区旁侧为attB1(SEQ ID NO:12)和attB2(SEQ ID NO:13)序列。引物可含有起始密码子上游的共有Kozak序列(CAACA)。
方法2(基于DNA的方法):作为另外一种选择,如果LNT2同源物的cDNA克隆是可用的,可以PCR扩增完整cDNA插入序列(含有5′和3′非编码区)。可设计正向引物和反向引物,使它们分别或者含有attB1序列和在该cDNA插入序列前面的载体特异性序列或者含有attB2序列和在该cDNA插入序列后面的载体特异性序列。对于克隆进载体pBluescript SK+中的cDNA插入序列,可使用正向引物VC062(SEQ IDNO:15)和反向引物VC063(SEQ ID NO:16)。
方法1和方法2可根据本领域技术人员已知的步骤进行修改。例如,方法1的引物可含有限制性酶切位点而不是attB1和attB2位点,用于后来将PCR产物克隆进含有attB1和attB2位点的载体内。另外,方法2可涉及从cDNA克隆、λ克隆、BAC克隆或基因组DNA扩增。
可利用BP重组反应将通过任一种上述方法获得的PCR产物与GATEWAY供体载体(例如pDONRTM Zeo(SEQ ID NO:2;图2)或pDONRTM221(SEQ ID NO:3;图3)组合。这种方法将细菌致死ccdB基因以及氯霉素抗性基因(CAM)从pDONRTM Zeo或pDONRTM221移除并定向地克隆了该在旁侧具有attB1和attB2位点的PCR产物而得到入门克隆(entry clone)。使用INVITROGENTM GATEWAYCLONASETM技术,然后可将来自入门克隆的编码同源LNT2多肽的序列转移到合适的目的载体中(如pBC-Yellow(SEQ ID NO:4;图4)、PHP27840(SEQID NO:5;图5)、或PHP23236(SEQ ID NO:6;图6))以获得植物表达载体,所述载体分别用于拟南芥、大豆、和玉米。
图2和3中分别示出了供体载体pDONRTM/Zeo或pDONRTM 221的attP1和attP2位点。图4、5和6分别示出了目的载体pBC-Yellow、PHP27840、和PHP23236的attR1和attR2位点。
作为另外一种选择,可进行多个入门克隆和合适的目的载体之间的MultiSite GatewayLR重组反应以产生表达载体。
实施例10
制备大豆表达载体并用验证过的拟南芥前导基因转化大豆
为了检查所得表型,可将大豆植株转化以过表达每个验证过的拟南芥属(Arabidopsis)基因或来自不同物种的对应同源物。
然后可用包含编码本多肽的序列的表达载体转化大豆胚。
为了诱导体细胞胚,可将子叶(长度为3-5mm,从大豆品种A2872的表面灭菌的未成熟种子解剖出来)于26℃在光下或黑暗下培养六至十周。然后切取体细胞胚(其产生次生胚)并将其置于合适的液体培养基内。在重复选择增殖为早期球形阶段胚的体细胞胚的簇后,按下面的描述保持该悬浮液。
可将大豆胚发生悬浮培养物在26℃下在摇床(150rpm)上的35mL液体培养基中保持,荧光光照采用16∶8小时(白天/黑夜)的时间表。通过将大约35mg组织移植进35ml液体培养基中,每两周将培养物进行传代培养。
然后可通过基因枪轰击方法(Klein等人,Nature(London)327:70-73(1987),美国专利4,945,050)转化大豆胚发生悬浮培养物。杜邦公司的BIOLISTICTM PDS1000/HE仪器(氦气改进型)可用于这些转化。
可用于帮助大豆转化的可选标记基因是由来自花椰菜花叶病毒的35S启动子(Odell等人,Nature 313:810-812(1985))、来自质粒pJR225(来自大肠杆菌;Gritz等人,Gene 25:179-188,1983)的潮霉素磷酸转移酶基因以及胭脂碱合成酶基因的3′区构成的嵌合基因,该胭脂碱合成酶基因来自根癌农杆菌(Agrobacterium tumefaciens)Ti质粒的T-DNA。可用于帮助大豆转化的另一种可选标记基因是来自大豆或拟南芥属的除草剂抗性乙酰乳酸合成酶(ALS)基因。ALS是支链氨基酸缬氨酸、亮氨酸和异亮氨酸的生物合成中的第一共用酶。已经鉴定出ALS中的突变导致对三类ALS抑制剂中的某些或全部具有抗性(美国专利5,013,659;其全部内容以引用的方式并入本文)。除草剂抗性ALS基因的表达可处于SAM合成酶启动子(美国专利申请US-2003-0226166-A1;藉此将其全部内容以引用的方式并入本文)的控制下。
将如下物质(依次)加入50μL 60mg/mL的1μm金颗粒悬浮液:5μL DNA(1μg/μL)、20μL亚精胺(0.1M)和50μL CaCl2(2.5M)。然后搅拌该颗粒制备物三分钟,在微量离心机(microfuge)中离心10秒并移除上清液。然后将DNA包覆的颗粒在400μL 70%乙醇中洗涤一次并再悬浮于40μL无水乙醇中。可将DNA/颗粒悬浮液用超声波处理三次,每次一秒钟。然后将五μL该DNA-包覆的金颗粒装载至每个宏载体盘上。
将大约300-400mg两周大的悬浮培养物置于60×15mm的空培养皿中并用吸管将残留的液体从组织移除。对于每次转化实验,大约5-10板的组织受到正常轰击。膜破裂压力设定为1100psi并将腔室抽成28英寸汞柱的真空。将组织置于离阻挡网大约3.5英寸的地方并轰击三次。轰击后,可将组织分成两份并放回液体培养基中,如上所述进行培养。
轰击后五至七天,用新鲜培养基更换该液体培养基,并在轰击后七至十二天,用含有50mg/mL潮霉素的新鲜培养基更换。可每周更换这种选择培养基。轰击后七至八周,可观察到绿色的转化组织从未转化的坏死的胚芽发生簇长出来。移出分离的绿色组织并将其移植进单独的烧瓶中以产生新的、无性繁殖的、转化的胚发生悬浮培养物。可将每一新品系当成是独立的转化事件。然后可将这些悬浮培养物作为未成熟胚进行传代培养和维持,或者通过使单独体细胞胚成熟并萌发而再生成整株植株。
可分析用验证过的基因转化大豆植株以研究相对于对照或参照植株的农学特性。例如,能够分析在低氮和高氮条件(如氮限制条件和氮充分条件)下的产量增加和/或稳定性。
实施例11
使用粒子轰击用验证过的拟南芥前导基因转化玉米
为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥属前导基因或来自不同物种的对应同源物。
可以将实施例5中所述的相同GATEWAY入门克隆用于将每种相应的基因定向克隆进玉米转化载体中。在玉米转化载体中的基因的表达可以处于组成型启动子的控制下,例如玉米泛素启动子(Christensen等人,Plant Mol.Biol.12:619-632,1989,以及Christensen等人,Plant Mol.Biol.18:675-689,1992)。
然后可通过下面的方法将上述重组DNA构建体引入玉米细胞中。可从源于自交玉米系H99和LH132杂交的发育中的颖果切取未成熟的玉米胚。在授粉后10至11天分离胚,这时它们长为1.0至1.5mm。然后将胚以轴线侧朝下放置并与琼脂糖硬化的N6培养基(Chu等人,Sci.Sin.Peking 18:659-668,1975)接触。将胚在27℃下保持在黑暗中。从这些未成熟胚的胚鳞增生出易脆的胚发生愈伤组织,该愈伤组织由未分化的细胞块构成,在胚柄结构上长有体细胞原胚状体和胚状体。可将从该原外植体分离的胚发生愈伤组织在N6培养基上培养,并每两至三周在这种培养基上进行传代培养。
可将质粒p35S/Ac(得自Peter Eckes博士,Hoechst Ag,Frankfurt,Germany)用于转化实验以便提供可选标记。该质粒含有pat基因(见欧洲专利公布0 242 236),该基因编码草胺膦乙酰转移酶(PAT)。酶PAT赋予对除草性谷氨酰胺合成酶抑制剂例如草胺膦的抗性。p35S/Ac的pat基因处于来自花椰菜花叶病毒的35S启动子(Odell等人,Nature313:810-812(1985))和胭脂碱合成酶基因的3′区的控制下,该胭脂碱合成酶基因来自根癌农杆菌Ti质粒的T-DNA。
可将粒子轰击法(Klein等人,Nature 327:70-73(1987))用于将基因转移至愈伤组织培养细胞。根据该方法,利用下面的技术用DNA包覆金颗粒(直径1μm)。将十μg质粒DNA加到50μL金颗粒的悬浮液(60mg每mL)中。将氯化钙(50μL的2.5M溶液)和亚精胺游离碱(20μL的1.0M溶液)加入到该颗粒中。再加入这些溶液过程中涡旋该悬浮液。10分钟后,将试管粗略地离心(以15,000rpm进行5秒钟)并移除上清液。将该颗粒再悬浮于200mL的无水乙醇中,再次离心并移除上清液。再次进行乙醇冲洗并将颗粒再悬浮于终体积为30μL的乙醇中。可将DNA包覆的金颗粒等分试样(5μL)置于KAPTON飞行圆盘(Bio-Rad Labs)的中心。然后使用BIOLISTIC PDS-1000/He(Bio-Rad Instruments,Hercules CA),采用1000psi的氦气压、0.5cm的间隙距离以及1.0cm的飞行距离,将颗粒加速射入玉米组织中。
对于轰击,将胚发生组织置于琼脂糖硬化的N6培养基上的滤纸上。组织布置成薄薄一层,并覆盖直径为约5cm的圆形区域。然后可将包含组织的培养皿置于离阻挡网大约8cm的PDS-1000/He的腔室内。然后将该腔室中的空气抽出至28英寸汞柱的真空。利用在击波管中氦气压力达到1000psi时破裂的可破裂膜,宏载体被氦气冲击波加速。
轰击后七天,可将组织转移至N6培养基中,该培养基含有双丙氨磷(每升5mg)并缺少酪蛋白或脯氨酸。组织继续在这种培养基上缓慢生长。另外两周后,可将组织转移至含有bialaphos的新鲜N6培养基上。六周后,在某些装有补充了双丙氨磷的培养基的盘上,可辨别直径约1cm的区域上有活性生长的愈伤组织。当在选择培养基上传代培养时,这些愈伤组织可继续生长。
可以通过以下方法由愈伤组织再生出植物:首先将组织簇转移到N6培养基中,所述培养基补充了0.2mg 2,4-D/升。-两周后,可将组织转移至再生培养基中(Fromm等人,Bio/Technology 8:833-839(1990))。
可再生出转基因的T0植株并按照下面的HTP步骤确定它们的表型。可收集T1种子。
可在氮限制条件下(例如1mM硝酸盐)栽培T1植株并分析表型变化。利用图像分析可定量下面的参数:可收集并定量植株面积、体积、生长速率以及颜色分析。超表达构建体与合适的对照植物比较导致绿度(绿色区)、产量、生长速率、生物量、成熟时的鲜重或干重、果实或种子产量、总植物氮含量、果实或种子氮含量、营养组织的氮含量、总植物游离氨基酸含量、营养组织中的游离氨基酸含量、果实或种子中的游离氨基酸含量、果实或种子中的蛋白质含量、营养组织中的蛋白质含量发生变化,可认为它是拟南芥前导基因在玉米中发挥功能提高对氮缺乏耐受性(增加的氮耐受性)的证据。此外,可通过直接转化或者从单独转化的品系基因渗入而将含有证实的拟南芥基因的重组DNA构建体导入玉米自交系内。
实施例12
电穿孔根癌农杆菌LBA4404
(概述)
将电穿孔感受态细胞(40μL),例如根癌农杆菌(Agrobacteriumtumefaciens)LBA4404(含有PHP10523)在冰上解冻(20-30分钟)。PHP10523含有用于T-DNA转移的VIR基因、农杆菌属的低拷贝数质粒复制起始区、四环素抗性基因以及用于体内DNA生物分子重组的cos位点。同时,将电穿孔管(electroporation cuvette)在冰上冷却。将该电穿孔仪的设置调节至2.1kV。将DNA等分试样(0.5μL亲代DNA,在低盐缓冲液或双蒸H2O中的浓度为0.2μg-1.0μg)与解冻的根癌农杆菌LBA4404细胞混合,同时仍然保持在冰上。将该混合物转移至电穿孔管的底部并静止保持在冰上1-2分钟。通过按下“pulse(脉冲)”键两次(理想的是获得4.0毫秒的脉冲)对细胞进行电穿孔(Eppendorf电穿孔仪2510)。随后,将0.5ml室温下的2xYT培养基(或SOC培养基)加入到电穿孔管并转移至15mL按压盖管(例如FALCONTM管)中。将细胞在28-30℃、200-250rpm下培养3小时。
将250μL的等分试样散布在包含YM培养基和50μg/mL奇放线菌素的板上并在28-30℃下培养三天。为了增加转化体的数目,可进行如下两个可选步骤中的其中一个:
选择1:用30μL 15mg/ml的利福平覆盖平板。LBA4404具有针对利福平的染色体抗性基因。这种附加的选择消除了在使用较差的LBA4404感受态细胞制备物时观察到的一些污染克隆。
选择2:进行两次重复的电穿孔以补偿较差的电感受态细胞。
转化体的鉴定:
选取四个独立的克隆并划痕接种在包含AB基本培养基和50μg/mL奇放线菌素的平板上用于分离单个克隆。将平板在28℃下孵育二至三天。对于每个推定的共整合体选取单个克隆并将其接种在4ml的10g/L细菌蛋白胨,10g/L酵母提取物,5g/L氯化钠,和50mg/L奇放线菌素中。将该混合物在28℃下摇动培养24小时。采用QIAGEN Miniprep和可选的PB缓冲液洗涤,从4ml培养物分离出质粒DNA。DNA在30μL中洗提。如上所述,将2μL的等分试样用于电穿孔20μL DH10b+20μL双蒸H2O。可任选地,可将15μL等分试样用于转化75-100μL的INVITROGENTM Library Efficiency DH5α。将细胞散布在包含LB培养基和50μg/mL奇放线菌素的平板上并将其在37℃下培养过夜。
对于每个推定的共整合体选取三至四个独立克隆并将其接种在4ml的2xYT培养基(10g/L细菌蛋白胨,10g/L酵母提取物,5g/L氯化钠)和50μg/mL奇放线菌素中。将细胞在37℃下摇晃培养过夜。接下来,使用QIAprepMiniprep,用任选PB缓冲液洗涤液(稀释成50μL)从4mL培养物中分离质粒DNA。8μL质粒DNA用SalI(使用亲本DNA和PHP10523作对照物)进行消化。对于4个质粒利用限制性内切酶BamHI、EcoRI和HindIII再进行三次消化(使用亲代DNA和PHP10523作为对照),这4个质粒代表2种具有正确SalI消化模式的推定共整合体。推荐电凝胶(Electronic gel)用于比较。
作为另一种选择,对于高通量应用,例如针对Gaspe Flint衍生的玉米品系(实施例16)所描述的,代替通过限制性酶切分析来评价所得的共整合载体,可将三个克隆同时用于如实施例13(经由农杆菌转化)所述的感染步骤。
实施例13
使用农杆菌属(Agrobacterium)细菌转化玉米
为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥属前导基因或来自不同物种的对应同源物。
农杆菌属细菌介导的玉米转化基本上按照以下文献中描述的方法进行:Zhao等人,in Meth.Mol.Biol.318:315-323(2006)中描述的方法进行(还可参见Zhao等人,Mol.Breed.8:323-333(2001)和1999年11月9日公布的美国专利5,981,840,以引用的方式将该文献并入本文)。该转化过程涉及细菌接种、共培养、静息、选择和植物再生。
1.未成熟胚芽制备:
将未成熟胚芽从颖果上切下来,并且放置在含有2mL PHI-A培养基的2mL胃管中。
2.未成熟胚芽的农杆菌属细菌感染和共培养:
2.1 感染步骤:
用1mL微吸移管将(1)的PHI-A培养基取出,并且加入1mL农杆菌属细菌悬浮液。将该管轻轻地倒置以混合。将该混合物在室温下培养5分钟。
2.2 共培养步骤:
用1mL微吸移管将农杆菌属细菌悬浮液从感染步骤中取出。使用无菌刮刀将胚从管中刮出并转移到100×15mm培养皿中的PHI-B培养基的平板中。确定胚的朝向,使得胚轴在培养基表面上朝下。将具有胚芽的平板在20℃于黑暗中培养3天。L-半胱氨酸可用于共培养阶段。采用标准二元载体,补充有100-400mg/L L-半胱氨酸的共培养培养基对于回收稳定的转基因事件是至关重要的。
3.选择推定的转基因事件:
向在100×15mm培养皿中的PHI-D培养基的平板中转移10个胚芽,保持朝向,并且用parafilm将培养皿密封。将平板在黑暗中于28℃培养。预计在6-8周将看见作为黄色胚芽组织的主动生长推定事件。不产生事件的胚可能是棕色和坏死的,并且几乎看不见脆性组织生长。以2-3周的间隔将推定的转基因胚芽组织转移到新鲜的PHI-D平板上进行传代培养,时间间隔取决于生长速度。记录事件。
4.T0植株的再生:
将在PHI-D培养基上繁殖的胚芽组织转移到在100×25mm培养皿中的PHI-E培养基(体细胞胚芽成熟培养基)中进行传代培养,在28℃于黑暗中培养直至体细胞胚芽成熟,培养大约10-18天。将具有良好限定的盾片和胚芽鞘的个体成熟体细胞胚芽转移到PHI-F胚芽发芽培养基中,并且在28℃于光中(约80μE,来自冷光灯或同等荧光灯)培养。在7-10天,将约10cm高的再生的植株置于盆中的园艺混合物中,并且使用标准园艺方法进行耐寒锻炼(hardened-off)。
用于植物转化的培养基:
1.PHI-A:4g/L CHU基础盐,1.0mL/L 1000×Eriksson′s维生素混合物,0.5mg/L盐酸硫胺,1.5mg/L 2,4-D,0.69g/L L-脯氨酸,68.5g/L蔗糖,36g/L葡萄糖,pH5.2。加入100μM乙酰丁香酮(过滤灭菌的)。
2.PHI-B:PHI-A,不含有葡萄糖,将2,4-D增加至2mg/L,将蔗糖降低至30g/L,并且补充0.85mg/L硝酸银(过滤灭菌的),3.0g/LGELRITE,100μM乙酰丁香酮(过滤灭菌的),pH5.8。
3.PHI-C:PHI-B,不含GELRITE和乙酰丁香酮,将2,4-D降低至1.5mg/L,并且补充8.0g/L琼脂,0.5g/L 2-[N-吗啉代]乙烷-磺酸(MES)缓冲液,100mg/L羧苄西林(过滤灭菌的)。
4.PHI-D:PHI-C补充3mg/L bialaphos(过滤灭菌的)。
5.PHI-E:4.3g/L的Murashige and Skoog(MS)盐(Gibco,BRL11117-074)、0.5mg/L的烟酸、0.1mg/L的盐酸硫胺素、0.5mg/L的盐酸吡哆醇、2.0mg/L的甘氨酸、0.1g/L的肌醇、0.5mg/L的玉米素(Sigma,商品目录号:No.Z-0164),1mg/L吲哚乙酸(IAA),26.4μg/L脱落酸(ABA),60g/L蔗糖,3mg/L bialaphos(过滤灭菌的),100mg/L羧苄西林(过滤灭菌的),8g/L琼脂,pH5.6。
可以通过以下方法由愈伤组织再生出植物:首先将组织簇转移到N6培养基中,所述培养基补充了0.2mg 2,4-D/升。-两周后,可将组织转移至再生培养基中(Fromm等人,Bio/Technology 8:833-839(1990))。
转基因T0植株可以再生,并且可以确定其表型。可收集T1种子。
可在氮限制条件下(例如1mM硝酸盐)栽培T1植株并分析表型变化。利用图像分析可定量下面的参数:可收集并定量植株面积、体积、生长速率以及颜色分析。超表达构建体与合适的对照植物比较导致绿度(绿色区)、产量、生长速率、生物量、成熟时的鲜重或干重、果实或种子产量、总植物氮含量、果实或种子氮含量、营养组织的氮含量、总植物游离氨基酸含量、营养组织中的游离氨基酸含量、果实或种子中的游离氨基酸含量、果实或种子中的蛋白质含量、营养组织中的蛋白质含量发生变化,可认为它是拟南芥前导基因在玉米中发挥功能提高对氮缺乏耐受性(增加的氮耐受性)的证据。
此外,可通过直接转化或者从单独转化的品系基因渗入而将含有证实的拟南芥基因的重组DNA构建体导入玉米自交系内。
实施例14A
制备表达载体用于用验证过的候选拟南芥基因(At5g50930)、
使用农杆菌转化玉米品系
通过INVITROGENTM GATEWAY技术,使用GATEWAY入门克隆进行LR重组反应以生成前体质粒PHP28699,GATEWAY入门克隆包含拟南芥lnt2-2(如实施例5所述)、入门克隆PHP23112(SEQ IDNO:14)、入门克隆PHP20234(SEQ ID NO:9;图9)和目的载体PHP22655(SEQ ID NO:10)。同样地,使用GATEWAY入门克隆进行LR重组反应以生成前体质粒PHP28700,GATEWAY入门克隆包含拟南芥lnt2-2(如实施例5所述)、入门克隆PHP23112(SEQ ID NO:14)、入门克隆PHP20234(SEQ ID NO:9;图9)和目的载体PHP22655(SEQID NO:10)。PHP28699和PHP28700各包含以下表达盒:
1.表达PAT抗除草剂性基因的泛素启动子::moPAT::PinII终止子盒,该基因用于转化过程期间的选择。
2.表达DS-RED颜色标记的LTP2启动子::DS-RED2::PinII终止子盒,该标记用于分选种子。
此外,PHP28699包含泛素启动子::lnt2-2::PinII终止子盒,该表达盒过表达拟南芥LNT2-2,而PHP28700包含泛素启动子::lnt2-3::PinII终止子盒,该表达盒过表达拟南芥LNT2-3。
实施例14B
使用农杆菌用验证过的候选拟南芥基因(At5g50930)转化玉米品系
使用如实施例12和13所述的农杆菌介导转化,可将载体PHP28699(如实施例14A所述)中存在的LNT2-2表达盒导入玉米自交系或来源于优良玉米自交系的可转化玉米品系。也能使用相同程序将PHP28700中存在的LNT2-3表达盒导入玉米自交系或来源于优良玉米自交系的可转化玉米品系。
能把表达载体PHP28699通过电穿孔导入包含载体PHP10523(SEQID NO:7,图7)的LBA4404农杆菌菌株以制备共整合载体PHP28841,该载体包含lnt2-2表达盒。共整合载体通过每个载体上包含的COS重组位点重组两个质粒PHP28699和PHP10523形成,并且除了农杆菌菌株以及农杆菌介导转化需要的其它基因(TET、TET、TRFA、ORI终止子、CTL、ORI V、VIR C1、VIR C2、VIR G、VIR B)之外,还包含上述相同的三个表达盒(实施例14A)。同样地,能把表达载体PHP28700通过电穿孔导入包含载体PHP10523(SEQ ID NO:7,图7)的LBA4404农杆菌菌株以制备共整合载体PHP28840,该载体包含lnt2-3表达盒。可使用(但不限于)实施例12中的电穿孔规程。
实施例15
制备目的载体PHP23236用于转化到Gaspe Flint来源的玉米品系中
目的载体PHP23236(图6,SEQ ID NO:6)是通过用载体PHP23235(图8;SEQ ID NO:8)转化包含PHP10523(图7;SEQ ID NO:7)的农杆菌菌株LBA4404并分离所得的共整合产物而获得。
目的载体PHP23236可被用于如实施例16所述的与入门克隆的重组反应,以产生用于转化Gaspe Flint衍生的玉米品系的玉米表达载体。
实施例16
制备表达构建体用于转化到Gaspe Flint来源的玉米品系中
使用INVITROGENTM GATEWAYLR重组技术,可使用如实施例5所述的相同入门克隆将表达盒定向克隆到GATEWAY目的载体PHP23236(SEQ ID NO:6;图6)中以制备相应的表达载体。表达载体PHP29694和PHP29689分别包含lnt2-2(SEQ ID NO:29)和lnt2-3(SEQID NO:31)。每个表达载体包含在UBI启动子控制下的受关注cDNA,并且是T-DNA二元载体,用于通过如本文所述实施例所述(但不限于)的农杆菌介导转化到玉米中。
实施例17A
用验证过的候选拟南芥基因(At5g50930)转化
Gaspe Flint来源的玉米品系
为了检查所得表型,可将玉米植株转化以过表达拟南芥属(Arabidopsis)At5g50930基因(和来自其它物种的对应同源物)。可使用如实施例16所述的表达构建体。
受体植株
受体植株细胞可来自具有短的生活周期(“快速循环”)、大小减少以及转化潜能高的单一玉米品系。对玉米典型的这些植株细胞是来自可公开获得的Gaspe Flint(GF)品系变种的植株细胞。一种可能的候选植株品系变种是GFxQTM(Quick Turnaround Maize(快速周转玉米),选择用于在温室条件下生长的Gaspe Flint的可公开获得形式)的F1杂交种,其在Tomes等人(美国专利申请10/367,416,提交于2003年2月13日;美国专利公开公布2003/0221212 A1,公布于2003年11月27日)中有所公开。从该品系获得的转基因植株具有如此小的大小使得它们可在4英寸的盆中生长(是正常大小的玉米植株所需空间的1/4)并且它们在少于2.5个月时间内成熟。(传统上,一旦转基因植株适应温室后需要3.5个月来获得转基因T0种子。)另一合适的品系包括但不限于GS3(高度可转化的品系)X Gaspe Flint的双单倍体品系。还有另一种合适的品系是携带引起较早开花、高度减小或这两者的转基因的可转化的优良玉米自交系。
转化规程
任何合适的方法可用于将转基因引入玉米细胞中,包括但不限于利用基于农杆菌载体的接种类型的步骤(参见例如实施例12和13)。转化可在受体(靶标)植株的未成熟胚上进行。
精确的生长和植株跟踪
将由转化的玉米胚产生的转基因(T0)植株的事件群体在受控的温室环境中栽培,该温室使用改良的随机分块(block)设计以降低或消除环境误差。随机分块设计是这样一种植株布局,在该布局中,实验植株被分成组(如,每组30株植株),称为块,而每株植株随块被随机分配一个位置。
对于一组30株植株,24株转化的实验植株和6株对照植株(具有设定好的表型的植株)(总起来说称为“重复组”)被置于盆中,这些盆在位于温室内的桌子上布置成阵列(也叫做重复组或块)。每株植株(对照植株或实验植株)随块被随机分配一个位置,所述的块映射一个唯一的、温室物理位置以及映射该重复组。在单次实验中多个30株植株的重复组中的每一个可栽培在相同的温室中。应该确定重复组的布局(布置方式)以使对空间的要求最小以及温室内的环境影响最小。这样一种布局可称为压缩的温室布局。
对于加入特定的对照组的一种替代方法是鉴定不表达所关注基因的那些转基因植株。可将诸如RT-PCR之类的多种技术应用于定量评估引入基因的表达水平。可将不表达转基因的T0植株与表达转基因的那些植株进行比较。
在整个评价过程中鉴定和跟踪事件群体中的每株植株,并且从那些植株收集的数据自动与那些植株相关联,使得所搜集的数据可与由该植株携带的转基因关联。例如,每个植株容器具有机器可读的标签(例如通用货单代码(UPC)条形码),该标签包含了关于植物身份的信息,身份信息继而又与温室位置相关,使得从植物获得的数据可自动与该植物相关联。
作为另外一种选择,可使用任何有效的、机器可读的植物识别系统,例如二维矩阵代码或甚至是射频识别标签(RFID),其中数据被接收并由射频接收器/处理器进行翻译。参见提交于2002年12月19日的美国专利申请10/324,288(美国专利公开公布2004/0122592 A1,公布于2004年6月24日),该文献以引用方式并入本文。
利用三维成像进行表型分析
对T0事件群体中的每株温室植株(包括任何对照植株)分析所关注的农学特性,并且以这样一种方式记录或存储每株植株的农学数据,该方式使得数据与该植株的辨识数据(见上面)相关联。可利用与上述类似的实验设计,可在T1代中完成对表型(基因效应)的确认。
在植物的整个温室生活周期中,利用定量的非破坏性成像技术在表型水平上来分析T0植株以评估所关注的性状。在一个实施方案中,将数字成像分析仪用于整株植物的自动多维分析。成像可在温室内进行。将两个摄像系统(位于顶部和侧面)和用于旋转植物的装置用于从所有侧面观察植物和成像。从每株植物的顶部、前面和侧面采集图像。所有的三个图像一起提供了足够的信息用于评价例如每株植物的生物量、大小和形态。
由于植物在第一片叶片从土壤显现出来时到植物处于它们发育的末期时大小的改变,在一个实施方案中是从顶部以较高的放大倍率记录植物发育的早期。这摄像可通过利用完全由成像软件控制的自动变焦镜头系统来完成。
在单次成像分析操纵中,进行如下事件:(1)将植株传送至分析仪区域内,旋转360度以便其机器可读标签可被读取,并且让其保持静止直至其叶片停止移动;(2)获取侧面图像并将其输入数据库;(3)将植株旋转90度并再次让其保持静止直至其叶片停止移动,以及(4)将该植株传送出分析仪。
每24小时的周期让植物至少6个小时处于黑暗以便具有正常的白天/黑夜周期。
成像仪器
可使用任何合适的成像仪器,包括但不限于可从LemnaTec GmbH(Wurselen,Germany)商购获得的光谱数字成像仪。获取图像并用具有1/2″IT Progressive Scan IEE CCD成像设备的LemnaTec ScanalyzerHTS LT-0001-2进行分析。该成像照相机可配备有自动变焦、自动调节光圈和自动聚焦。可利用LemnaTec软件设定所有的照相机设置。在一个实施方案中,对于主要组成成像分析仪的仪器差异小于约5%,对于次要组成成像分析仪的仪器差异小于约10%。
软件
成像分析系统包括用于颜色和构造分析的LemnaTec HTS Bonit软件程序和用于存储约500,000次分析的数据(包括分析数据)的服务器数据库。原始图像和分析过的图像储存在一起以允许用户根据需要进行再次分析。可将数据库连接至成像硬件用于自动的数据收集和存储。多种可商购获得的软件系统(例如Matlab,其它软件)可用于定量解释图像数据,并且可将这些软件体系中的任何一种应用于所述图像数据集。
传送系统
具有植物旋转装置的传送系统可用于将植物传送至成像区域并在成像过程中选择植物。例如,将最多4株植物(每株最高高度为1.5m)装上小车,该小车在循环的传送系统上行进并通过成像测量区域。在这种情况下,该单位(成像分析仪和传送环线)的总占有面积为约5m×5m。
可扩大传送系统以同时容纳更多植物。将植物沿传送环线传送至成像区域并对每株植物分析最多50秒。获取植物的三个视图。传送系统以及成像设备应该能够用于温室环境条件。
照明
任何合适的照明模式可用于图像采集。例如,可在暗背景上使用顶部照明。作为另外一种选择,可采用使用白色背景的顶部照明和背部照明的组合。应该将被照亮的区域围起来以确保恒定的照明条件。遮蔽物应该长于测量区域使得能保持恒定的光条件而不需要打开和关闭门。作为另一种选择,可以变化照明以引起转基因(如,绿色荧光蛋白(GFP)、红色荧光蛋白(RFP))的激发或者引起内源性(如叶绿素)荧光基团的激发。
基于三维成像的生物量估计
为了更好地估计生物量,应该从至少三个轴(在一个实施方案中是顶部视图和两个侧面(侧面1和侧面2)视图)获取植物图像。然后分析这些图像以将植物从背景(盆和花粉控制袋(如果适用的话))分离。可通过如下计算评价植物的体积:
在上面的等式中,体积和面积的单位是“任意单位”。在该体系中,任意单位完全足以检测基因对植物大小和生长影响,因为所需的是检测与实验平均值或对照平均值的差值(正-较大和负-较小两者)。大小(如面积)的任意单位可通过将物理参照加入到成像过程而轻易地转化成物理量度。例如,可在顶部成像过程和侧面成像过程两者中均包括已知面积的物理参照。基于这些物理参照的面积,可测定转换因子以允许从像素转换为面积单位,例如平方厘米(cm2)。物理参照可以是或可以不是独立的样本。例如,具有已知直径和高度的盆足可用作物理参照。
颜色分类
成像技术还可以用于确定植物颜色以及用于将植物颜色归为各种衍生类型。将图像颜色归属于颜色类型是LemnaTec软件的固有特色。使用其他图像分析软件系统,可通过多种计算方法确定颜色分类。
对于植物大小和生长参数的测定,一种有用的分类方案是定义一种单一颜色方案,包括绿色的两种或三种色调(在一个实施方案中色调是50-66,参见图12),此外,还有关于缺绿病、坏死和漂白(在这些条件出现时)的颜色类型。还使用了背景颜色类型,其包括图像中的非植物颜色(例如盆和土壤颜色),并将这些像素特别地从测定大小中排除。在受控的恒定照明下分析植物,使得可以定量一株植物内随时间推移的任何改变,或者植物之间或植物不同分枝之间的任何改变(如季节差异)。
除了其在测定植物的大小、生长中的有效性外,颜色分类还可用于评估其他产量构成性状。对于这些其他产量构成性状,可使用另外的颜色分离方案。例如,称为“保绿度(staygreen)”的性状(已经将其与产量的提高相关联)可通过颜色分类来评估,该颜色分类将绿色色调与黄色和棕色色调(其指示老化的组织)相分离。通过将这种颜色分类应用于在T0或T1植物生活周期末获取的图像,可鉴定绿色的量相对于黄色和棕色(例如,可表示为绿色/黄色比率)增加的植物。这种绿色/黄色比率具有显著差异的植物可被鉴定为携带影响这种重要农学性状的转基因。
熟练的植物学家将认识到可以指示植物健康或应激反应的其他植物颜色(花青素)的出现,以及认识到其他颜色分类方案可以提供对基因在与这些响应相关的性状方面的作用的进一步度量。
植物结构分析
改变植物结构参数的转基因也可以用本发明鉴定,包括诸如最大高度和宽度、节间距离、叶与茎之间的角度、在节处开始的叶片数以及叶片长度。LemnaTec系统软件可如下用于确定植物构造。在第一成像步骤中将植物简化至其主要的几何构造,并且随后基于该图像可进行不同构造参数的参数化鉴定。或者是单独地或者是组合地修改任何这些构造参数的转基因可通过应用此前所述的统计方法来鉴定。
花粉脱落日期
花粉脱落日期是转基因植物中要分析的一个重要参数,并且可以通过活性雄花第一次出现在植物上来确定。为了找到雄花目标,通过颜色对茎的上端进行分类以检测黄色或紫色花药。然后将这种颜色分类分析用于定义活性花,活性花继而可用于计算花粉脱落日期。
作为另外一种选择,花粉脱落日期和其他易于在视觉上检测到的植物属性(如授粉日期、第一穗丝日期)可以由负责进行植物看护的工作任人员来记录。为了使数据完整性和过程效率最大化,通过利用相同的由LemnaTec光谱数字分析设备利用的条形码来跟踪该数据。可将具有条形码阅读器的电脑、掌上设备或笔记本电脑用于使记录观察时间、植物标识符的数据捕捉变得容易,以及使捕捉数据的操纵者变得舒适。
植物的取向
以接近商业栽培的密度种植的成熟玉米植物通常具有平面的结构。也就是说,植物具有一可清晰分辨的宽的侧面和窄的侧面。对来自植物宽侧的图像进行测定。对于每株植物,给其赋予一个明确界定的基本取向以获得宽侧图像与窄侧(edgewise)图像之间的最大差别。将顶部图像用于确定植物的主轴,而将额外的旋转装置用于在开始主图像采集前将植物转至合适的取向。
实施例17B
用玉米同源物转化Gaspe Flint来源的玉米品系
使用INVITROGENTM GATEWAYLR重组技术,可制备入门克隆用于玉米同源物(SEQ ID NO:17)(参见关于入门克隆制备的实施例5),并且能够将入门克隆定向克隆到GATEWAY目的载体PHP23236(SEQID NO:6;图6)中以制备表达载体PHP30115。该表达载体目前包含在UBI启动子控制下的受关注cDNA,并且是T-DNA二元载体,用于通过如本文所述实施例所述(但不限于)的农杆菌介导转化到玉米中。
实施例18
在最佳和减少氮条件下筛选Gaste Flint衍生的玉米品系
转基因植物将含有两个或三个剂量的Gaspe Flint-3与一个剂量的GS3(GS3/(Gaspe-3)2X或GS3/(Gaspe-3)3X),并且对于显性转基因会以1∶1分离。将包含PHP29689(表达盒=lnt2-3)的转基因植物种植在包含100%Turface的200个标准盆中。用1.0mM KNO3生长培养基(参见图13)浇洒植物直到分离确定。在8DAP(种植后天数),将幼苗随机均匀置于相应的处理组中。进行两种处理:最佳氮(6.5mMolKNO3)和减少氮(1.0mMol KNO3)处理,每日两次直至13DAP。在13和24DAP之间的每天灌溉时间是在9:00AM、12:00PM、和3:00PM用营养物质浇灌3分钟(156mL)。在25DAP,在5:00AM增加第四次浇灌,在31DAP,在5:00PM增加第五次浇灌。每个表每周监控pH至少三次,并且记录哪天出苗以及哪天脱落。每周对每个植株拍照三次(周一、周三、和周五)以评估表面积积聚、比生长速率(sgr)、和颜色变化。在8DAP对植物取样进行ELISA MOPAT,并且在35DAP进行表达和代谢表达谱分析。从在37DAP收获的组织中获取鲜重数据,并且然后将收获的组织烘干(70℃,120小时)以获取干重数据。
评估PHP29689的四个事件(图16)。计算更大的Student t检验的概率用于比较每个转基因平均值与合适的无效转基因平均值(分离无效转基因或构建体无效转基因)。使用最小值(P<t)0.1作为临界值。表5示出每个事件与分离无效转基因相比显著增加的变量。
表5
PHP29689事件综述
事件 | 减少氮 | 最佳氮 |
EA2391.314.1.5 | %光照绿色末端指数%光照绿色收获天数总面积收获天数脱落天数最大总面积比生长速率鲜苗比率 | %光照绿色末端指数穗直径穗干重穗鲜重 |
EA2391.314.1.6 | 总面积末端指数总面积收获天数最大总面积苗干重苗鲜重 | %光照绿色末端指数%光照绿色收获天数总面积末端指数总面积收获天数最大总面积 |
苗+穗干重苗+穗鲜重茎+穗直径 | 比生长速率苗干重苗鲜重苗+穗干重苗+穗鲜重 | |
EA2391.314.1.8 | 脱落天数比生长速率苗鲜重苗+穗鲜重 | %光照绿色末端指数%光照绿色收获天数脱落天数比生长速率 |
EA2391.314.1.9 | %光照绿色末端指数%光照绿色收获天数总面积收获天数最大总面积比生长速率 |
当认为所有事件是相对于无效构建体(图17)时,该构建体与无效构建体相比多个变量平均显示出显著的增加(数据概述于表6中)。
表6
PHP29689构建体概述
减少氮 | 最佳氮 |
%光照绿色收获天数总面积收获天数脱落天数最大总面积比生长速率苗鲜重 | %光照绿色末端指数%光照绿色收获天数总面积末端指数总面积收获天数脱落天数最大总面积比生长速率苗干重苗鲜重苗+穗干重苗+穗鲜重 |
实施例19
具有拟南芥前导基因的玉米品系的产量分析
自交或顶交杂交体的转基因植物可通过更严谨的大田试验来研究在氮限制条件下和无氮限制条件下的产量增加和/或稳定性。例如,可进行产量分析以测定包含验证过的拟南芥lnt2-2或lnt2-3基因的植物在与对照植物(或参比植物)进行比较时是否具有产量改善(在氮限制条件下和无氮限制条件下),所述对照植物是构建体转化无效植物或野生型植物。氮限制条件通过以前的能育性实践组合提供,其中施加含量减少的氮一年或多年,玉米或替代作物在该条件下生长并且每季移除种子作物。在此类条件下,基于由Federal and State Extension服务对特定生长区域确定的土壤测试标准,低氮(LN)环境指氮量少于在早春或夏季施加的标准氮肥的量,而标准氮(NN)环境指加入正常产量所需的充足的氮。
包含验证过的拟南芥lnt2-2或lnt2-3基因的玉米杂交体测交以及它们的对照植物在Woodland,CA和Johnston,IA的LN和NN环境下生长,并且评估产量。在LN环境下观察到的产量减少与在NN环境下获得的产量比较。包含验证过的拟南芥lnt2-2或lnt2-3基因的玉米杂交体测交的产量与构建体无效转化植物的产量比较。这些产量试验的结果在图18-21中显示。
包含PHP28840(表达盒=lnt2-3)的植物的个体事件显示在LN条件下显著增加的产量(2007年在Woodland的事件E6919.105.1.11和E6919.105.1.21),而2007年在Johnston测试的E6919.105.1.21事件具有数字上更高的产量。2008年相似的测试揭示事件E6919.105.1.21在Woodland和Johnston以及事件E6919.105.1.2和E6919.105.1.24在Woodland和Johnston分别具有显著改善的产量。包含PHP28840的植物在低氮条件下的结果在图18中显示。
在标准氮(NN)处理条件下,2007年在Woodland和Johnston的事件E6919.105.1.11与无构建体植物的产量相似(无统计学意义上的差异),说明在更高的氮含量条件下,该事件保留了高产量的潜力。2008年在Woodland获得了相似的结果。与之相反,2008年在Johnston的事件E3919.105.1.11和2007年与2008年在Johnston的事件E6919.105.1.21以及E6919.105.1.24具有显著较低的产量。包含PHP28840的植物在标准氮条件下的结果在图20中显示。
包含PHP28841(表达盒=lnt2-2)的植物的个体事件(2007年,Woodland,在LN条件下的事件E6919.106.1.17和E6919.106.1.3)显示具有统计意义上的显著性的产量增加。然而,2007年,Johnston,在LN条件下的事件E6919.106.1.3显示显著较低的产量,并且未收集事件E6919.106.1.17的产量。图19示出包含PHP28841的植物在低氮(LN)条件下的结果。
在标准氮(NN)处理条件下,与构建体无效转化植物相比,2007年在Woodland和Johnston的E6919.106.1.17都具有数字上更高的产量,然而事件E6919.106.1.3在2007年、在Woodland显示显著增加的产量,而在2007年、在Johnston显示数字上增加的产量。事件E6919.106.1.22和E619.106.1.8在Woodland显示显著减少的产量。包含PHP28841的植物在标准氮(NN)条件下的结果在图21中显示。
实施例20
NUE玉米幼苗分析
使用种子颜色标记将转基因事件的种子(具有构建体PHP28841或PHP28840)分成转基因(杂合的)种子和无效转基因种子。进行两组不同的随机分配处理,使用所有处理的9个平行测定,使每个随机分块(block)有排列成6排9列的54个盆。在一个实例中,混合相同构建体的5个事件的4个无效转基因种子,将其用作批对照用于比较该分块的5个阳性事件,在每个分块中制备6个处理的组合。在第二个实例中,将3个转基因阳性处理以及它们对应的无效转基因随机分配到该分块的54个盆中,制备每个分块的6个处理组合(3个阳性处理以及对应的无效转基因),包含所有处理组合的9个平行测定。在第一个实例中,转基因参数与批量无效构建体比较;在第二个实例中,转基因参数与对应的无效转基因事件比较。在其中每个构建体有10、15、或20个事件的实例中,将事件分成5个事件一组,并且计算54个盆的每个分块的变量。然而,在进行转基因方法比较前收集分块的分块无效转基因方法。
就每个处理而言,将两个种子种植在4英寸的方盆中,盆中包含在8英寸交错中心上的Turface。盆每天用包含以下营养物质的溶液浇灌四次:1mM CaCl2,2mM MgSO4,0.5mM KH2PO4,83ppm Sprint330,3mMKCl,1mM KNO3,1μM ZnSO4,1μM MnCl2,3μM H3BO4,0.1μMCuSO4,和0.1μM NaMoO4。
植物出苗后,将其减少到每盆一个种子。通常在周一种植处理种子,并且植物在周五后出苗。然后在种植后18天收获植物。在收获时从盆中移除植物,并且将Turface从根部洗脱。使根与苗分开,把根置于纸袋中并且在70℃干燥70小时。将干燥后的植物部分(根和苗)称重并置于50mL的圆锥管中,管中有大约20 5/32英寸的钢球,在涂料振荡器中进行振荡研磨。将大约30mg研磨组织(记录重量用于后续的调节)在2mL 20%H2O2和6M H2SO4中水解30分钟,水解温度为170℃。在冷却后,加水至20ml,充分混合该溶液。移除50μl的等分试样并加到950μl 1M Na2CO3中。通过将100μL该溶液置于96孔板的每个孔中,然后加入50μL OPA溶液,使用该溶液中的氨评估减少的总植物氮。测定荧光强度,激发(excitation)=360nM/发射(emission)=530nM,并且与溶解在相似溶液并用OPA溶液处理过的NH4Cl标准品进行比较。
以下溶液用于前述实验:
OPA溶液-5μl巯基乙醇+1ml OPA储备液(每天新鲜制备)
OPA储备液-50mg邻苯二醛(OPA-Sigma#P0657)溶解于1.5mL甲醇+4.4mL 1MBorate缓冲液pH9.5(3.09g H3BO4+1g NaOH,溶于50mL水中)+0.55mL 20%SDS(每周新鲜制备)
测量以下参数,并且使用Student t检验比较参数平均值与无效参数平均值:SPAD(绿度)、茎直径、根干重、苗干重、总干重、和植物氮浓度。在每个随机分块中使用最近邻计算以及使用完全随机设计(CRD)模型的方差分析(Analysis of Variance,ANOVA)计算差异。使用F统计,通过将总随机分块处理平均面积除以总随机分块误差平均面积计算每个随机分块的总处理效应。计算更大的Student t检验的概率用于比较每个转基因平均值与合适的无效转基因(或者批构建体或单个事件的无效转基因平均值)平均值。使用最小值(P<t)0.1作为临界值。
图22示出PHP28840(表达盒=lnt2-3)和PHP28841(表达盒=lnt2-2)构建体的NUE幼苗测定结果。包含UBI:lnt2-3表达盒的事件E6919.105.1.21显示以下变量具有统计意义上的显著性的增加:苗干重、氮浓度、和总氮。具有UBI:lnt2-3表达盒的另一个事件和具有UBI:lnt2-2表达盒的六个事件中的四个表现出植物氮浓度具有统计意义上的显著性的增加。此外,包含UBI:lnt2-2表达盒的六个事件中的两个显示具有统计意义上的显著性的总氮增加。
实施例21
转化和评估具有验证过的前导基因的大豆同源物的大豆
基于同源性搜索,能鉴定验证过的拟南芥前导基因的一个或若干个候选大豆同源物,并且还能评估它们增加大豆氮限制条件耐受性的能力。载体构建、植物转化和表型分析将类似于上文实施例所述的规程。
实施例22
转化和评估具有验证过的前导基因的玉米同源物的玉米
基于同源性搜索,能鉴定验证过的拟南芥前导基因的一个或若干个候选玉米同源物(例如SEQ ID NO:18和20),并且还能评估它们增加玉米氮限制条件耐受性的能力。载体构建、植物转化和表型分析可类似于上文实施例所述的规程。
实施例23
用验证过的前导基因的玉米和大豆同源物转化拟南芥
可将验证过的拟南芥前导基因的大豆和玉米同源物在35S启动子的控制下转化到拟南芥中,并且当在低氮培养基中生长时分析其叶片面积和绿色区积聚。可如本文实施例所述进行载体构建和植物转化。检测分析的条件、数据采集和数据分析可类似于上文实施例所述的规程。
序列表
<110>E.I.du Pont de Nemours and Company and
Pioneer Hi-Bred International
<120>在氮限制条件下具有改变的农学特性的植物
以及涉及编码LNT2多肽及其同源物的基因的相关构建体和方法
<130>BB1577
<160>36
<170>PatentIn version 3.4
<210>1
<211>18491
<212>DNA
<213>人工序列
<220>
<223>pHSbarEND2s激活标签载体
<400>1
catgaatcaa acaaacatac acagcgactt attcacacga gctcaaatta caacggtata 60
tatcctgccg tcgacaacca tggtctagac aggatccccg ggtaccgagc tcgaatttgc 120
aggtcgactg cgtcatccct tacgtcagtg gagatatcac atcaatccac ttgctttgaa 180
gacgtggttg gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg 240
ggaccactgt cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat 300
ttgtaggtgc caccttcctt ttctactgtc cttttgatga agtgacagat agctgggcaa 360
tggaatccga ggaggtttcc cgatattacc ctttgttgaa aagtctcaat tgccctttgg 420
tcttctgaga ctgttgcgtc atcccttacg tcagtggaga tatcacatca atccacttgc 480
tttgaagacg tggttggaac gtcttctttt tccacgatgc tcctcgtggg tgggggtcca 540
tctttgggac cactgtcggc agaggcatct tgaacgatag cctttccttt atcgcaatga 600
tggcatttgt aggtgccacc ttccttttct actgtccttt tgatgaagtg acagatagct 660
gggcaatgga atccgaggag gtttcccgat attacccttt gttgaaaagt ctcagttaac 720
ccgcgatcct gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga 780
agacgtggtt ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt 840
gggaccactg tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca 900
tttgtaggtg ccaccttcct tttctactgt ccttttgatg aagtgacaga tagctgggca 960
atggaatccg aggaggtttc ccgatattac cctttgttga aaagtctcaa ttgccctttg 1020
gtcttctgag actgttgcgt catcccttac gtcagtggag atatcacatc aatccacttg 1080
ctttgaagac gtggttggaa cgtcttcttt ttccacgatg ctcctcgtgg gtgggggtcc 1140
atctttggga ccactgtcgg cagaggcatc ttgaacgata gcctttcctt tatcgcaatg 1200
atggcatttg taggtgccac cttccttttc tactgtcctt ttgatgaagt gacagatagc 1260
tgggcaatgg aatccgagga ggtttcccga tattaccctt tgttgaaaag tctcagttaa 1320
cccgcaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc 1380
aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc 1440
gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggatc gatccgtcga 1500
tcgaccaaag cggccatcgt gcctccccac tcctgcagtt cgggggcatg gatgcgcgga 1560
tagccgctgc tggtttcctg gatgccgacg gatttgcact gccggtagaa ctccgcgagg 1620
tcgtccagcc tcaggcagca gctgaaccaa ctcgcgaggg gatcgagccc ctgctgagcc 1680
tcgacatgtt gtcgcaaaat tcgccctgga cccgcccaac gatttgtcgt cactgtcaag 1740
gtttgacctg cacttcattt ggggcccaca tacaccaaaa aaatgctgca taattctcgg 1800
ggcagcaagt cggttacccg gccgccgtgc tggaccgggt tgaatggtgc ccgtaacttt 1860
cggtagagcg gacggccaat actcaacttc aaggaatctc acccatgcgc gccggcgggg 1920
aaccggagtt cccttcagtg aacgttatta gttcgccgct cggtgtgtcg tagatactag 1980
cccctggggc cttttgaaat ttgaataaga tttatgtaat cagtctttta ggtttgaccg 2040
gttctgccgc tttttttaaa attggatttg taataataaa acgcaattgt ttgttattgt 2100
ggcgctctat catagatgtc gctataaacc tattcagcac aatatattgt tttcatttta 2160
atattgtaca tataagtagt agggtacaat cagtaaattg aacggagaat attattcata 2220
aaaatacgat agtaacgggt gatatattcat tagaatgaa ccgaaaccgg cggtaaggat 2280
ctgagctaca catgctcagg ttttttacaa cgtgcacaac agaattgaaa gcaaatatca 2340
tgcgatcata ggcgtctcgc atatctcatt aaagcagggg gtgggcgaag aactccagca 2400
tgagatcccc gcgctggagg atcatccagc cggcgtcccg gaaaacgatt ccgaagccca 2460
acctttcata gaaggcggcg gtggaatcga aatctcgtga tggcaggttg ggcgtcgctt 2520
ggtcggtcat ttcgaacccc agagtcccgc tcagaagaac tcgtcaagaa ggcgatagaa 2580
ggcgatgcgc tgcgaatcgg gagcggcgat accgtaaagc acgaggaagc ggtcagccca 2640
ttcgccgcca agctcttcag caatatcacg ggtagccaac gctatgtcct gatagcggtc 2700
cgccacaccc agccggccac agtcgatgaa tccagaaaag cggccatttt ccaccatgat 2760
attcggcaag caggcatcgc catgggtcac gacgagatcc tcgccgtcgg gcatgccccc 2820
caattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact 2880
taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac 2940
cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt 3000
tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg 3060
ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg 3120
acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg 3180
catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat 3240
acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac 3300
ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat 3360
gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag 3420
tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc 3480
tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc 3540
acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc 3600
cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc 3660
ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt 3720
ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt 3780
atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat 3840
cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct 3900
tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat 3960
gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc 4020
ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg 4080
ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc 4140
tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta 4200
cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc 4260
ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga 4320
tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat 4380
gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 4440
caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 4500
accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 4560
ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt 4620
aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 4680
accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 4740
gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 4800
ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag aaagcgccac 4860
gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 4920
gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 4980
ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 5040
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 5100
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 5160
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 5220
agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg 5280
gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta 5340
gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg 5400
aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct 5460
ttctaggggg ggggtaccga tctgagatcg gtaacgaaaa cgaacgggta gggatgaaaa 5520
cggtcggtaa cggtcggtaa aatacctcta ccgttttcat tttcatattt aacttgcggg 5580
acggaaacga aaacgggata taccggtaac gaaaacgaac gggataaata cggtaatcga 5640
aaaccgatac gatccggtcg ggttaaagtc gaaatcggac gggaaccggt atttttgttc 5700
ggtaaaatca cacatgaaaa catatattca aaacttaaaa acaaatataa aaaattgtaa 5760
acacaagtct taatgatcac tagtggcgcg cctaggagat ctcgagtagg gataacaggg 5820
taatacatag ataaaatcca tataaatctg gagcacacat agtttaatgt agcacataag 5880
tgataagtct tgggctcttg gctaacataa gaagccatat aagtctacta gcacacatga 5940
cacaatataa agtttaaaac acatattcat aatcacttgc tcacatctgg atcacttagc 6000
atgctacagc tagtgcaata ttagacactt tccaatattt ctcaaacttt tcactcattg 6060
caacggccat tctcctaatg acaaattttt catgaacaca ccattggtca atcaaatcct 6120
ttatctcaca gaaacctttg taaaataaat ttgcagtgga atattgagta ccagatagga 6180
gttcagtgag atcaaaaaac ttcttcaaac acttaaaaag agttaatgcc atcttccact 6240
cctcggcttt aggacaaatt gcatcgtacc tacaataatt gacatttgat taattgagaa 6300
tttataatga tgacatgtac aacaattgag acaaacatac ctgcgaggat cacttgtttt 6360
aagccgtgtt agtgcaggct tataatataa ggcatccctc aacatcaaat aggttgaatt 6420
ccatctagtt gagacatcat atgagatccc tttagattta tccaagtcac attcactagc 6480
acacttcatt agttcttccc actgcaaagg agaagatttt acagcaagaa caatcgcttt 6540
gattttctca attgttcctg caattacagc caagccatcc tttgcaacca agttcagtat 6600
gtgacaagca cacctcacat gaaagaaagc accatcacaa actagatttg aatcagtgtc 6660
ctgcaaatcc tcaattatat cgtgcacagc tacttcattt gcactagcat tatccaaaga 6720
caaggcaaac aattttttct caatgttcca cttaaccatg attgcagtga aggtttgtga 6780
taacctttgg ccagtgtggc gcccttcaac atgaaaaaag ccaacaattc ttttttggag 6840
acaccaatca tcatcaatcc aatggatggt gacacacatg tatgacttat tttgacaaga 6900
tgtccacata tccatagttg tactgaagcg agactgaaca tcttttagtt ttccatacaa 6960
cttttctttt tcttccaaat acaaatccat gatatatttt ctagcagtga cacgggactt 7020
tattggaaag tgagggcgca gagacttaac aaactcaaca aagtactcat gttctacaat 7080
attgaaagga tattcatgca tgattattgc caaatgaagc ttctttaggc taaccacttc 7140
atcgtactta taaggctcaa tgagatttat gtctttgcca tgatcctttt cactttttag 7200
acacaactga cctttaacta aactatgtga tgttctcaag tgatttcgaa atccgcttgt 7260
tccatgatga ccctcagccc tatacttagc cttgcaatta ggaaagttgc aatgtcccca 7320
tacctgaacg tatttctttc catcgacctc cacttcaatt tccttcttgg tgaaatgctg 7380
ccatacatcc gatgtgcact tctttgccct cttctgtggt gcttcttctt cgggttcagg 7440
ttgtggctgt ggttgtggtt ctggttgtgg ttgtggttgt ggttgtggtt catgaacaat 7500
agccatatca tcttgactcg gatctgtagc tgtaccattt gcattactac tgcttacact 7560
ctgaataaaa tgcctctcgg cctcagctgt tgatgatgat ggtgatgtgc ggccacatcc 7620
atgcccacgc gcacgtgcac gtacattctg aatccgacta gaagaggctt cagcttttct 7680
tttcaaccct gttataaaca gatttttcgt attattctac agtcaatatg atgcttccca 7740
atctacaacc aattagtaat gctaatgcta ttgctactgt ttttctaata tataccttga 7800
gcatatgcag agaatacgga atttgttttg cgagtagaag gcgctcttgt ggtagacatc 7860
aacttggccaatcttatggc tgagcctgag ggaggattat ttccaaccgg aggcgtcatc 7920
tgaggaatgg agtcgtagcc ggctagccga agtggagagc agagccctgg acagcaggtg 7980
ttcagcaatc agcttggtgc tgtactgctg tgacttgtga gcacctggac ggctggacag 8040
caatcagcag gtgttgcaga gcccctggac agcacacaaa tgacacaaca gcttggtgca 8100
atggtgctga cgtgctgtac tgctaagtgc tgtgagcctg tgagcagccg tggagacagg 8160
gagaccgcgg atggccggat gggcgagcgc cgagcagtgg aggtctggag gaccgctgac 8220
cgcagatggc ggatggcgga tgggcggacc gcggatgggc gagcagtgga gtggaggtct 8280
gggcggatgg gcggaccgcg gcgcggatgg gcgagtcgcg agcagtggag tggagggcgg 8340
accgtggatg gcggcgtctg cgtccggcgt gccgcgtcac ggccgtcacc gcgtgtggtg 8400
cctggtgcag cccagcggcc ggccggctgg gagacaggga gagtcggaga gagcaggcga 8460
gagcgagacg cgtcgccggc gtcggcgtgc ggctggcggc gtccggactc cggcgtgggc 8520
gcgtggcggc gtgtgaatgt gtgatgctgt tactcgtgtg gtgcctggcc gcctgggaga 8580
gaggcagagc agcgttcgct aggtatttct tacatgggct gggcctcagt ggttatggat 8640
gggagttgga gctggccata ttgcagtcat cccgaattag aaaatacggt aacgaaacgg 8700
gatcatcccg attaaaaacg ggatcccggt gaaacggtcg ggaaactagc tctaccgttt 8760
ccgtttccgt ttaccgtttt gtatatcccg tttccgttcc gttttcgttt tttacctcgg 8820
gttcgaaatc gatcgggata aaactaacaa aatcggttat acgataacgg tcggtacggg 8880
attttcccat cctactttca tccctgagat tattgtcgtt tctttcgcag atcggtaccc 8940
cccccctaga gtcgacatcg atctagtaac atagatgacaccgcgcgcga taat ttatcc 9000
tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta 9060
atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta 9120
acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt 9180
aagaaacttt attgccaaat gtttgaacga tctgcttcga cgcactcctt ctttaggtac 9240
ggactagatc tcggtgacgg gcaggaccgg acggggcggt accggcaggc tgaagtccag 9300
ctgccagaaa cccacgtcat gccagttccc gtgcttgaag ccggccgccc gcagcatgcc 9360
gcggggggca tatccgagcg cctcgtgcat gcgcacgctc gggtcgttgg gcagcccgat 9420
gacagcgacc acgctcttga agccctgtgc ctccagggac ttcagcaggt gggtgtagag 9480
cgtggagccc agtcccgtcc gctggtggcg gggggagacg tacacggtcg actcggccgt 9540
ccagtcgtag gcgttgcgtg ccttccaggg gcccgcgtag gcgatgccgg cgacctcgcc 9600
gtccacctcg gcgacgagcc agggatagcg ctcccgcaga cggacgaggt cgtccgtcca 9660
ctcctgcggt tcctgcggct cggtacggaa gttgaccgtg cttgtctcga tgtagtggtt 9720
gacgatggtg cagaccgccg gcatgtccgc ctcggtggca cggcggatgt cggccgggcg 9780
tcgttctggg ctcatggatc tggattgaga gtgaatatga gactctaatt ggataccgag 9840
gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg 9900
accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa 9960
actccagaaa cccgcggctg agtggctcct tcaatcgttg cggttctgtc agttccaaac 10020
gtaaaacggc ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg 10080
ctcatgatcc ccgggtaccg agctcgaatt gcggctgagt ggctccttca atcgttgcgg 10140
ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg tcataacgtg 10200
actcccttaa ttctccgctc atgatcttga tcccctgcgc catcagatcc ttggcggcaa 10260
gaaagccatc cagtttactt tgcagggctt cccaacctta ccagagggcg ccccagctgg 10320
caattccggt tcgcttgctg tatcgatatg gtggatttat cacaaatggg acccgccgcc 10380
gacagaggtg tgatgttagg ccaggacttt gaaaatttgc gcaactatcg tatagtggcc 10440
gacaaattga cgccgagttg acagactgcc tagcatttga gtgaattatg tgaggtaatg 10500
ggctacactg aattggtagc tcaaactgtc agtatttatg tatatgagtg tatattttcg 10560
cataatctca gaccaatctg aagatgaaat gggtatctgg gaatggcgaa atcaaggcat 10620
cgatcgtgaa gtttctcatc taagccccca tttggacgtg aatgtagaca cgtcgaaata 10680
aagatttccg aattagaata atttgtttat tgctttcgcc tataaatacg acggatcgta 10740
atttgtcgtt ttatcaaaat gtactttcat tttataataa cgctgcggac atctacattt 10800
ttgaattgaa aaaaaattgg taattactct ttctttttct ccatattgac catcatactc 10860
attgctgatc catgtagatt tcccggacat gaagccattt acaattgaat atatcctgcc 10920
gccgctgccg ctttgcaccc ggtggagctt gcatgttggt ttctacgcag aactgagccg 10980
gttaggcaga taatttccat tgagaactga gccatgtgca ccttcccccc aacacggtga 11040
gcgacggggc aacggagtga tccacatggg acttttaaac atcatccgtc ggatggcgtt 11100
gcgagagaag cagtcgatcc gtgagatcag ccgacgcacc gggcaggcgc gcaacacgat 11160
cgcaaagtat ttgaacgcag gtacaatcga gccgacgttc accgtcaccc tggatgctgt 11220
aggcataggc ttggttatgc cggtactgcc gggcctcttg cgggatatcg tccattccga 11280
cagcatcgcc agtcactatg gcgtgctgct agcgctatat gcgttgatgc aatttctatg 11340
cgcacccgtt ctcggagcac tgtccgaccg ctttggccgc cgcccagtcc tgctcgcttc 11400
gctacttgga gccactatcg actacgcgat catggcgacc acacccgtcc tgtggtccaa 11460
cccctccgct gctatagtgc agtcggcttc tgacgttcag tgcagccgtc ttctgaaaac 11520
gacatgtcgc acaagtccta agttacgcga caggctgccg ccctgccctt ttcctggcgt 11580
tttcttgtcg cgtgttttag tcgcataaag tagaatactt gcgactagaa ccggagacat 11640
tacgccatga acaagagcgc cgccgctggc ctgctgggct atgcccgcgt cagcaccgac 11700
gaccaggact tgaccaacca acgggccgaa ctgcacgcgg ccggctgcac caagctgttt 11760
tccgagaaga tcaccggcac caggcgcgac cgcccggagc tggccaggat gcttgaccac 11820
ctacgccctg gcgacgttgt gacagtgacc aggctagacc gcctggcccg cagcacccgc 11880
gacctactgg acattgccga gcgcatccag gaggccggcg cgggcctgcg tagcctggca 11940
gagccgtggg ccgacaccac cacgccggcc ggccgcatgg tgttgaccgt gttcgccggc 12000
attgccgagt tcgagcgttc cctaatcatc gaccgcaccc ggagcgggcg cgaggccgcc 12060
aaggcccgag gcgtgaagtt tggcccccgc cctaccctca ccccggcaca gatcgcgcac 12120
gcccgcgagc tgatcgacca ggaaggccgc accgtgaaag aggcggctgc actgcttggc 12180
gtgcatcgct cgaccctgta ccgcgcactt gagcgcagcg aggaagtgac gcccaccgag 12240
gccaggcggc gcggtgcctt ccgtgaggac gcattgaccg aggccgacgc cctggcggcc 12300
gccgagaatg aacgccaaga ggaacaagca tgaaaccgca ccaggacggc caggacgaac 12360
cgtttttcat taccgaagag atcgaggcgg agatgatcgc ggccgggtac gtgttcgagc 12420
cgcccgcgca cgtctcaacc gtgcggctgc atgaaatcct ggccggtttg tctgatgcca 12480
agctggcggc ctggccggcc agcttggccg ctgaagaaac cgagcgccgc cgtctaaaaa 12540
ggtgatgtgt atttgagtaa aacagcttgc gtcatgcggt cgctgcgtat atgatgcgat 12600
gagtaaataa acaaatacgc aagggaacgc atgaagttat cgctgtactt aaccagaaag 12660
gcgggtcagg caagacgacc atcgcaaccc atctagcccg cgccctgcaa ctcgccgggg 12720
ccgatgttct gttagtcgat tccgatcccc agggcagtgc ccgcgattgg gcggccgtgc 12780
gggaagatca accgctaacc gttgtcggca tcgaccgccc gacgattgac cgcgacgtga 12840
aggccatcgg ccggcgcgac ttcgtagtga tcgacggagc gccccaggcg gcggacttgg 12900
ctgtgtccgc gatcaaggca gccgacttcg tgctgattcc ggtgcagcca agcccttacg 12960
acatatgggc caccgccgac ctggtggagc tggttaagca gcgcattgag gtcacggatg 13020
gaaggctaca agcggccttt gtcgtgtcgc gggcgatcaa aggcacgcgc atcggcggtg 13080
aggttgccga ggcgctggcc gggtacgagc tgcccattct tgagtcccgt atcacgcagc 13140
gcgtgagcta cccaggcact gccgccgccg gcacaaccgt tcttgaatca gaacccgagg 13200
gcgacgctgc ccgcgaggtc caggcgctgg ccgctgaaat taaatcaaaa ctcatttgag 13260
ttaatgaggt aaagagaaaa tgagcaaaag cacaaacacg ctaagtgccg gccgtccgag 13320
cgcacgcagc agcaaggctg caacgttggc cagcctggca gacacgccag ccatgaagcg 13380
ggtcaacttt cagttgccgg cggaggatca caccaagctg aagatgtacg cggtacgcca 13440
aggcaagacc attaccgagc tgctatctga atacatcgcg cagctaccag agtaaatgag 13500
caaatgaata aatgagtaga tgaattttag cggctaaagg aggcggcatg gaaaatcaag 13560
aacaaccagg caccgacgcc gtggaatgcc ccatgtgtgg aggaacgggc ggttggccag 13620
gcgtaagcgg ctgggttgtc tgccggccct gcaatggcac tggaaccccc aagcccgagg 13680
aatcggcgtg agcggtcgca aaccatccgg cccggtacaa atcggcgcgg cgctgggtga 13740
tgacctggtg gagaagttga aggccgcgca ggccgcccag cggcaacgca tcgaggcaga 13800
agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga atccgcaaag aatcccggca 13860
accgccggca gccggtgcgc cgtcgat tag gaagccgccc aagggcgacg agcaaccaga 13920
ttttttcgtt ccgatgctct atgacgtggg cacccgcgat agtcgcagca tcatggacgt 13980
ggccgttttc cgtctgtcga agcgtgaccg acgagctggc gaggtgatcc gctacgagct 14040
tccagacggg cacgtagagg tttccgcagg gccggccggc atggccagtg tgtgggatta 14100
cgacctggta ctgatggcgg tttcccatct aaccgaatcc atgaaccgat accgggaagg 14160
gaagggagac aagcccggcc gcgtgttccg tccacacgtt gcggacgtac tcaagttctg 14220
ccggcgagcc gatggcggaa agcagaaaga cgacctggta gaaacctgca ttcggttaaa 14280
caccacgcac gttgccatgc agcgtacgaa gaaggccaag aacggccgcc tggtgacggt 14340
atccgagggt gaagccttga ttagccgcta caagatcgta aagagcgaaa ccgggcggcc 14400
ggagtacatc gagatcgagc tagctgattg gatgtaccgc gagatcacag aaggcaagaa 14460
cccggacgtg ctgacggttc accccgatta ctttttgatc gatcccggca tcggccgttt 14520
tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa gccagatggt tgttcaagac 14580
gatctacgaa cgcagtggca gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa 14640
gctgatcggg tcaaatgacc tgccggagta cgatttgaag gaggaggcgg ggcaggctgg 14700
cccgatccta gtcatgcgct accgcaacct gatcgagggc gaagcatccg ccggttccta 14760
atgtacggag cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct 14820
ctttcctgtg gatagcacgt acattgggaa cccaaagccg tacattggga accggaaccc 14880
gtacattggg aacccaaagc cgtacattgg gaaccggtca cacatgtaag tgactgatat 14940
aaaagagaaa aaaggcgatt tttccgccta aaactcttta aaacttatta aaactcttaa 15000
aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc 15060
gcctaccctt cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc 15120
cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc gcggacaagc 15180
cgcgccgtcg ccactcgacc gccggcgccc acatcaaggc accctgcctc gcgcgtttcg 15240
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 15300
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 15360
ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc 15420
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 15480
cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg 15540
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 15600
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 15660
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 15720
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 15780
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 15840
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 15900
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 15960
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 16020
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 16080
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 16140
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 16200
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 16260
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 16320
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 16380
gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 16440
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 16500
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 16560
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 16620
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 16680
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 16740
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 16800
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 16860
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 16920
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 16980
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 17040
accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt 17100
aaaagtgctc atcattggaa aagacctgca gggggggggg ggaaagccac gttgtgtctc 17160
aaaatctctg atgttacatt gcacaagata aaaatatatc atcatgaaca ataaaactgt 17220
ctgcttacat aaacagtaat acaaggggtg ttatgagcca tattcaacgg gaaacgtctt 17280
gctcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat aaatgggctc 17340
gcgataatgt cgggcaatca ggtgcgacaa tctatcgatt gtatgggaag cccgatgcgc 17400
cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg 17460
tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat tttatccgta 17520
ctcctgatga tgcatggtta ctcaccactg cgatccccgg gaaaacagca ttccaggtat 17580
tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgcc 17640
ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgcgta tttcgtctcg 17700
ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt gatgacgagc 17760
gtaatggctg gcctgttgaa caagtctgga aagaaatgca taagcttttg ccattctcac 17820
cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt gacgagggga 17880
aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac caggatcttg 17940
ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg ctttttcaaa 18000
aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg ctcgatgagt 18060
ttttctaatc agaattggtt aattggttgt aacactggca gagcattacg ctgacttgac 18120
gggacggcgg ctttgttgaa taaatcgaac ttttgctgag ttgaaggatc agatcacgca 18180
tcttcccgac aacgcagacc gttccgtggc aaagcaaaag ttcaaaatca ccaactggtc 18240
cacctacaac aaagctctca tcaaccgtgg ctccctcact ttctggctgg atgatggggc 18300
gattcaggcc tggtatgagt cagcaacacc ttcttcacga ggcagacctc agcgcccccc 18360
cccccctgca ggtcaattcg gtcgatatgg ctattacgaa gaaggctcgt gcgcggagtc 18420
ccgtgaactt tcccacgcaa caagtgaacc gcaccgggtt tgccggaggc catttcgtta 18480
aaatgcgcag c 18491
<210>2
<211>4291
<212>DNA
<213>人工序列
<220>
<223>pDONRZeo构建体
<400>2
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc 240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta 300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc 360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa 420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg 480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa 540
aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac 600
ctgttcgttg caacacattg atgagcaatg cttttttata atgccaactt tgtacaaaaa 660
agctgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa 720
aaaacagact acataatact gtaaaacaca acatatccag tcactatgaa tcaactactt 780
agatggtatt agtgacctgt agtcgaccga cagccttcca aatgttcttc gggtgatgct 840
gccaacttag tcgaccgaca gccttccaaa tgttcttctc aaacggaatc gtcgtatcca 900
gcctactcgc tattgtcctc aatgccgtat taaatcataa aaagaaataa gaaaaagagg 960
tgcgagcctc ttttttgtgt gacaaaataa aaacatctac ctattcatat acgctagtgt 1020
catagtcctg aaaatcatct gcatcaagaa caatttcaca actcttatac ttttctctta 1080
caagtcgttc ggcttcatct ggattttcag cctctatact tactaaacgt gataaagttt 1140
ctgtaatttc tactgtatcg acctgcagac tggctgtgta taagggagcc tgacatttat 1200
attccccaga acatcaggtt aatggcgttt ttgatgtcat tttcgcggtg gctgagatca 1260
gccacttctt ccccgataac ggagaccggc acactggcca tatcggtggt catcatgcgc 1320
cagctttcat ccccgatatg caccaccggg taaagttcac gggagacttt atctgacagc 1380
agacgtgcac tggccagggg gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc 1440
tgtacatcca caaacagacg ataacggctc tctcttttat aggtgtaaac cttaaactgc 1500
atttcaccag cccctgttct cgtcagcaaa agagccgttc atttcaataa accgggcgac 1560
ctcagccatc ccttcctgat tttccgcttt ccagcgttcg gcacgcagac gacgggcttc 1620
attctgcatg gttgtgctta ccagaccgga gatattgaca tcatatatgc cttgagcaac 1680
tgatagctgt cgctgtcaac tgtcactgta atacgctgct tcatagcatacctctttttg 1740
acatacttcg ggtatacata tcagtatata ttcttatacc gcaaaaatca gcgcgcaaat 1800
acgcatactg ttatctggct tttagtaagc cggatccacg cggcgtttac gccccgccct 1860
gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac 1920
agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat 1980
atttgcccat ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa 2040
aactggtgaa actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt 2100
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 2160
actgccggaa atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat 2220
ggaaaacggt gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg 2280
ccatacggaa ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat 2340
aaaacttgtg cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg 2400
tctggttata ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc 2460
attgggatat atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag 2520
ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt 2580
gaaagttgga acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg 2640
gcttcccggt atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca 2700
caggtattta ttcggcgcaa agtgcgtcgg gtgatgctgc caacttagtc gactacaggt 2760
cactaatacc atctaagtag ttgattcata gtgactggat atgttgtgtt ttacagtatt 2820
atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg 2880
tttctcgttc agctttcttg tacaaagttg gcattataag aaagcattgc ttatcaattt 2940
gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttgccat ccagctgata 3000
tcccctatag tgagtcgtat tacatggtca tagctgtttc ctggcagctc tggcccgtgt 3060
ctcaaaatct ctgatgttac attgcacaag ataaaataat atcatcatga tcagtcctgc 3120
tcctcggcca cgaagtgcac gcagttgccg gccgggtcgc gcagggcgaa ctcccgcccc 3180
cacggctgct cgccgatctc ggtcatggcc ggcccggagg cgtcccggaa gttcgtggac 3240
acgacctccg accactcggc gtacagctcg tccaggccgc gcacccacac ccaggccagg 3300
gtgttgtccg gcaccacctg gtcctggacc gcgctgatga acagggtcac gtcgtcccgg 3360
accacaccgg cgaagtcgtc ctccacgaag tcccgggaga acccgagccg gtcggtccag 3420
aactcgaccg ctccggcgac gtcgcgcgcg gtgagcaccg gaacggcact ggtcaacttg 3480
gccatggttt agttcctcac cttgtcgtat tatactatgc cgatatacta tgccgatgat 3540
taattgtcaa cacgtgctga tcatgaccaa aatcccttaa cgtgagttac gcgtcgttcc 3600
actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 3660
gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 3720
atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 3780
atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 3840
ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 3900
gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 3960
cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 4020
tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 4080
cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 4140
ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 4200
gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 4260
tggccttttg ctggcctttt gctcacatgt t 4291
<210>3
<211>4762
<212>DNA
<213>人工序列
<220>
<223>pDONR221
<400>3
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc 240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta 300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc 360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa 420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg 480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa 540
aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac 600
ctgttcgttg caacacattg atgagcaatg cttttttata atgccaactt tgtacaaaaa 660
agctgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa 720
aaaacagact acataatact gtaaaacaca acatatccag tcactatgaa tcaactactt 780
agatggtatt agtgacctgt agtcgaccga cagccttcca aatgttcttc gggtgatgct 840
gccaacttag tcgaccgaca gccttccaaa tgttcttctc aaacggaatc gtcgtatcca 900
gcctactcgc tattgtcctc aatgccgtat taaatcataa aaagaaataa gaaaaagagg 960
tgcgagcctc ttttttgtgt gacaaaataa aaacatctac ctattcatat acgctagtgt 1020
catagtcctg aaaatcatct gcatcaagaa caatttcaca actcttatac ttttctctta 1080
caagtcgttc ggcttcatct ggattttcag cctctatact tactaaacgt gataaagttt 1140
ctgtaatttc tactgtatcg acctgcagac tggctgtgta taagggagcc tgacatttat 1200
attccccaga acatcaggtt aatggcgttt ttgatgtcat tttcgcggtg gctgagatca 1260
gccacttctt ccccgataac ggagaccggc acactggcca tatcggtggt catcatgcgc 1320
cagctttcat ccccgatatg caccaccggg taaagttcac gggagacttt atctgacagc 1380
agacgtgcac tggccagggg gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc 1440
tgtacatcca caaacagacg ataacggctc tctcttttat aggtgtaaac cttaaactgc 1500
atttcaccag cccctgttct cgtcagcaaa agagccgttc atttcaataa accgggcgac 1560
ctcagccatc ccttcctgat tttccgcttt ccagcgttcg gcacgcagac gacgggcttc 1620
attctgcatg gttgtgctta ccagaccgga gatattgaca tcatatatgc cttgagcaac 1680
tgatagctgt cgctgtcaac tgtcactgta atacgctgct tcatagcata cctctttttg 1740
acatacttcg ggtatacata tcagtatata ttcttatacc gcaaaaatca gcgcgcaaat 1800
acgcatactg ttatctggct tttagtaagc cggatccacg cggcgtttac gccccgccct 1860
gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac 1920
agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat 1980
atttgcccat ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa 2040
aactggtgaa actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt 2100
tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa 2160
actgccggaa atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat 2220
ggaaaacggt gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg 2280
ccatacggaa ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat 2340
aaaacttgtg cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg 2400
tctggttata ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc 2460
attgggatat atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag 2520
ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt 2580
gaaagttgga acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg 2640
gcttcccggt atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca 2700
caggtattta ttcggcgcaa agtgcgtcgg gtgatgctgc caacttagtc gactacaggt 2760
cactaatacc atctaagtag ttgattcata gtgactggat atgttgtgtt ttacagtatt 2820
atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg 2880
tttctcgttc agctttcttg tacaaagttg gcattataag aaagcattgc ttatcaattt 2940
gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttgccat ccagctgata 3000
tcccctatag tgagtcgtat tacatggtca tagctgtttc ctggcagctc tggcccgtgt 3060
ctcaaaatct ctgatgttac attgcacaag ataaaataat atcatcatga acaataaaac 3120
tgtctgctta cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt 3180
cgaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa tgggctcgcg 3240
ataatgtcgg gcaatcaggt gcgacaatct atcgcttgta tgggaagccc gatgcgccag 3300
agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtca 3360
gactaaactg gctgacggaa tttatgcctc ttccgaccat caagcatttt atccgtactc 3420
ctgatgatgc atggttactc accactgcga tccccggaaa aacagcattc caggtattag 3480
aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt 3540
tgcattcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc 3600
aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgta 3660
atggctggcc tgttgaacaa gtctggaaag aaatgcataa acttttgcca ttctcaccgg 3720
attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac gaggggaaat 3780
taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcttgcca 3840
tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt tttcaaaaat 3900
atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt 3960
tctaatcaga attggttaat tggttgtaac actggcagag cattacgctg acttgacggg 4020
acggcgcaag ctcatgacca aaatccctta acgtgagtta cgcgtcgttc cactgagcgt 4080
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 4140
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 4200
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc 4260
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 4320
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 4380
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 4440
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 4500
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 4560
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 4620
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 4680
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 4740
gctggccttt tgctcacatg tt 4762
<210>4
<211>16843
<212>DNA
<213>人工序列
<220>
<223>pBC-yellow构建体
<400>4
ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag 60
aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg 120
aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac 180
ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc 240
cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga 300
caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat 360
gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat 420
tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt 480
ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg 540
tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc 600
cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc 660
tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg 720
atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg 780
ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg 840
ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg 900
gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg 960
ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa 1020
acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag 1080
acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata 1140
agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc 1200
ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga 1260
ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta 1320
atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc 1380
agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc 1440
agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt 1500
cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag 1560
ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc 1620
gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta 1680
gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc 1740
tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga 1800
ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa 1860
tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt 1920
tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca 1980
ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc 2040
aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca 2100
aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg 2160
ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat 2220
aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc 2280
taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga 2340
tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata 2400
tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga 2460
catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca 2520
tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta 2580
tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt 2640
tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga 2700
attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga 2760
cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga 2820
ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa 2880
agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc 2940
cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt 3000
tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga 3060
attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact 3120
tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg 3180
ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga 3240
cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag 3300
gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag 3360
gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg 3420
ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg 3480
aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca 3540
gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc 3600
gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta 3660
tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca 3720
agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt 3780
tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg 3840
ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt 3900
tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg 3960
acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga 4020
tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt 4080
acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg 4140
accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg 4200
gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg 4260
gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac 4320
ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc 4380
gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag 4440
cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg 4500
tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg 4560
ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc 4620
gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat 4680
tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat 4740
ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga 4800
gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta 4860
catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc 4920
tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc 4980
cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat 5040
tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt 5100
ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg 5160
cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg 5220
attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac 5280
accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat 5340
ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac 5400
cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc 5460
gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg 5520
agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt 5580
ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc 5640
cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt 5700
tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta 5760
tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag 5820
cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca 5880
caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 5940
gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag 6000
tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat 6060
cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga 6120
tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt 6180
taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc 6240
accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga 6300
aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc 6360
ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg 6420
actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cctgtatggc 6480
cgcattcgca aaacacacct agactagatt tgttttgcta acccaattga tattaattat 6540
atatgattaa tatttatatg tatatggatt tggttaatga aatgcatctg gttcatcaaa 6600
gaattataaa gacacgtgac attcatttag gataagaaat atggatgatc tctttctctt 6660
ttattcagat aactagtaat tacacataac acacaacttt gatgcccaca ttatagtgat 6720
tagcatgtca ctatgtgtgc atccttttat ttcatacatt aattaagttg gccaatccag 6780
aagatggaca agtctaggtt aaccatgtgg tacctacgcg ttcgaatatc catgggccgc 6840
ttcaggccag ggcgctgggg aaggcgatgg cgtgctcggt cagctgccac ttctggttct 6900
tggcgtcgct ccggtcctcc cgcagcagct tgtgctggat gaagtgccac tcgggcatct 6960
tgctgggcac gctcttggcc ttgtacacgg tgtcgaactg gcaccggtac cggccgccgt 7020
ccttcagcag caggtacatg ctcacgtcgc ccttcaggat gccctgctta ggcacgggca 7080
tgatcttctc gcagctggcc tcccagttgg tggtcatctt cttcatcacg gggccgtcgg 7140
cggggaagtt cacgccgttg aagatgctct tgtggtagat gcagttctcc ttcacgctca 7200
cggtgatgtc cacgttacag atgcacacgg cgccgtcctc gaacaggaag ctccggcccc 7260
aggtgtagcc ggcggggcag ctgttcttga agtagtccac gatgtcctgg gggtactcgg 7320
tgaagatccg gtcgccgtac ttgaagccgg cgctcaggat gtcctcgctg aagggcaggg 7380
ggccgccctc gatcacgcac aggttgatgg tctgcttgcc cttgaagggg tagccgatgc 7440
cctcgccggt gatcacgaac ttgtggccgt tcacgcagcc ctccatgtgg tacttcatgg 7500
tcatctcctc cttcaggccg tgcttgctgt gggccatggt ggcgaccggt gaattcgagc 7560
tcggtacccg gggatcctga gtaaaacaga ggagggtctc actaagttta tagagagact 7620
gagagagata aagggacacg tatgaagcgt ctgttttcgt ggtgtgacgt caaagtcatt 7680
ttgctctcta cgcgtgtctg tgtcggcttg atcttttttt ttgctttttg gaactcatgt 7740
cggtagtata tcttttattt attttttctt tttttccctt ttctttcaaa ctgatgtcgg 7800
tatgatattt attccatcct aaaatgtaac ttactattat tagtagtcgg tccatgtcta 7860
ttggcccatc atgtggtcat tttacgttta cgtcgtgtgg ctgtttatta taacaaacgg 7920
cacatccttc tcattcgaat tgtatttctc cttaatcgtt ctaataggta tgatctttta 7980
ttttatacgt aaaattaaaa ttgaatgatg tcaagaacga aaattaattt gtatttacaa 8040
aggagctaaa tattgtttat tcctctactg gtagaagata aaagaagtag atgaaataat 8100
gatcttacta gagaatattc ctcatttaca ctagtcaaat ggaaatcttg taaactttta 8160
caataattta tcctgaaaat atgaaaaaat agaagaaaat gtttacctcc tctctcctct 8220
taattcacct acgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat 8280
gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa 8340
cgacggccag tgaattcgag ctcggtaccc ggggatcctc tagagtcgac ctgcaggcat 8400
gcaagcttgt tgaaacatcc ctgaagtgtc tcattttatt ttatttattc tttgctgata 8460
aaaaaataaa ataaaagaag ctaagcacac ggtcaaccat tgctctactg ctaaaagggt 8520
tatgtgtagt gttttactgc ataaattatg cagcaaacaa gacaactcaa attaaaaaat 8580
ttcctttgct tgtttttttg ttgtctctga cttgactttc ttgtggaagt tggttgtata 8640
aggattggga cacaccattg tccttcttaa tttaatttta tttctttgct gataaaaaaa 8700
aaaaatttca tatagtgtta aataataatt tgttaaataa ccaaaaagtc aaatatgttt 8760
actctcgttt aaataattga gagtcgtcca gcaaggctaa acgattgtat agatttatga 8820
caatatttac ttttttatag ataaatgtta tattataata aatttatata catatattat 8880
atgttattta ttatttatta ttattttaaa tccttcaata ttttatcaaa ccaactcata 8940
attttttttt tatctgtaag aagcaataaa attaaataga cccactttaa ggatgatcca 9000
acctttatac agagtaagag agttcaaata gtaccctttc atatacatat caactaaaat 9060
attagaaata tcatggatca aaccttataa agacattaaa taagtggata agtataatat 9120
ataaatgggt agtatataat atataaatgg atacaaactt ctctctttat aattgttatg 9180
tctccttaac atcctaatat aatacataag tgggtaatat ataatatata aatggagaca 9240
aacttcttcc attataattg ttatgtcttc ttaacactta tgtctcgttc acaatgctaa 9300
agttagaatt gtttagaaag tcttatagta cacatttgtt tttgtactat ttgaagcatt 9360
ccataagccg tcacgattca gatgatttat aataataaga ggaaatttat catagaacaa 9420
taaggtgcat agatagagtg ttaatatatc ataacatcct ttgtttattc atagaagaag 9480
tgagatggag ctcagttatt atactgttac atggtcggat acaatattcc atgctctcca 9540
tgagctctta cacctacatg cattttagtt catacttcat gcacgtggcc atcacagcta 9600
gctgcagcta catatttaca ttttacaaca ccaggagaac tgccctgtta gtgcataaca 9660
atcagaagat ggccgtggct actcgagtta tcgaaccact ttgtacaaga aagctgaacg 9720
agaaacgtaa aatgatataa atatcaatat attaaattag attttgcata aaaaacagac 9780
tacataatac tgtaaaacac aacatatcca gtcactatgg tcgacctgca gactggctgt 9840
gtataaggga gcctgacatt tatattcccc agaacatcag gttaatggcg tttttgatgt 9900
cattttcgcg gtggctgaga tcagccactt cttccccgat aacggagacc ggcacactgg 9960
ccatatcggt ggtcatcatg cgccagcttt catccccgat atgcaccacc gggtaaagtt 10020
cacgggagac tttatctgac agcagacgtg cactggccag ggggatcacc atccgtcgcc 10080
cgggcgtgtc aataatatca ctctgtacat ccacaaacag acgataacgg ctctctcttt 10140
tataggtgta aaccttaaac tgcatttcac cagtccctgt tctcgtcagc aaaagagccg 10200
ttcatttcaa taaaccgggc gacctcagcc atcccttcct gattttccgc tttccagcgt 10260
tcggcacgca gacgacgggc ttcattctgc atggttgtgc ttaccagacc ggagatattg 10320
acatcatata tgccttgagc aactgatagc tgtcgctgtc aactgtcact gtaatacgct 10380
gcttcatagc acacctcttt ttgacatact tcgggtatac atatcagtat atattcttat 10440
accgcaaaaa tcagcgcgca aatacgcata ctgttatctg gcttttagta agccggatcc 10500
tctagattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 10560
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 10620
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 10680
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 10740
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 10800
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 10860
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 10920
cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca ggcgggcaag 10980
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 11040
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 11100
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 11160
ctccatttta gcttccttag ctcctgaaaa tctcgccgga tcctaactca aaatccacac 11220
attatacgag ccggaagcat aaagtgtaaagcctggggtg cctaatgcgg ccgccatagt 11280
gactggatat gttgtgtttt acagtattat gtagtctgtt ttttatgcaa aatctaattt 11340
aatatattga tatttatatc attttacgtt tctcgttcag cttttttgta caaacttgtt 11400
tgataaccgg tactagtgtg cacgtcgagc gtgtcctctc caaatgaaat gaacttcctt 11460
atatagagga agggtcttgc gaaggatagt gggattgtgc gtcatccctt acgtcagtgg 11520
agatgtcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct ttttccacga 11580
tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca tcttgaatga 11640
tagcctttcc tttatcgcaa tgatggcatt tgtaggagcc accttccttt tctactgtcc 11700
tttcgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc gaaattatcc 11760
tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg acatttttgg 11820
agtagaccag agtgtcgtgc tccaccatgt tgacgaagat tttcttcttg tcattgagtc 11880
gtaaaagact ctgtatgaac tgttcgccag tcttcacggc gagttctgtt agatcctcga 11940
tttgaatctt agactccatg catggcctta gattcagtag gaactacctt tttagagact 12000
ccaatctcta ttacttgcct tggtttatga agcaagcctt gaatcgtcca tactggaata 12060
gtacttctga tcttgagaaa tatgtctttc tctgtgttct tgatgcaatt agtcctgaat 12120
cttttgactg catctttaac cttcttggga aggtatttga tctcctggag attgttactc 12180
gggtagatcg tcttgatgag acctgctgcg taggcctctc taaccatctg tgggtcagca 12240
ttctttctga aattgaagag gctaaccttc tcattatcag tggtgaacat agtgtcgtca 12300
ccttcacctt cgaacttcct tcctagatcg taaagataga ggaaatcgtc cattgtaatc 12360
tccggggcaa aggagatctc ttttggggct ggatcactgc tgggcctttt ggttcctagc 12420
gtgagccagt gggctttttg ctttggtggg cttgttaggg ccttagcaaa gctcttgggc 12480
ttgagttgag cttctccttt ggggatgaag ttcaacctgt ctgtttgctg acttgttgtg 12540
tacgcgtcag ctgctgctct tgcctctgta atagtggcaa atttcttgtg tgcaactccg 12600
ggaacgccgt ttgttgccgc ctttgtacaa ccccagtcat cgtatatacc ggcatgtgga 12660
ccgttataca caacgtagta gttgatatga gggtgttgaa tacccgattc tgctctgaga 12720
ggagcaactg tgctgttaag ctcagatttt tgtgggattg gaattggatc ctctagagca 12780
aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat 12840
tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag 12900
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 12960
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggccaaa 13020
gacaaaaggg cgacattcaa ccgattgagg gagggaaggt aaatattgac ggaaattatt 13080
cattaaaggt gaattatcac cgtcaccgac ttgagccatt tgggaattag agccagcaaa 13140
atcaccagta gcaccattac cattagcaag gccggaaacg tcaccaatga aaccatcatc 13200
tagtaacata gatgacaccg cgcgcgataa tttatcctag tttgcgcgct atattttgtt 13260
ttctatcgcg tattaaatgt ataattgcgg gactctaatc ataaaaaccc atctcataaa 13320
taacgtcatg cattacatgt taattattac atgcttaacg taattcaaca gaaattatat 13380
gataatcatc gcaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt 13440
tgaacgatct gcttcgacgc actccttctt taggtacgga ctagatctcg gtgacgggca 13500
ggaccggacg gggcggtacc ggcaggctga agtccagctg ccagaaaccc acgtcatgcc 13560
agttcccgtg cttgaagccg gccgcccgca gcatgccgcg gggggcatat ccgagcgcct 13620
cgtgcatgcg cacgctcggg tcgttgggca gcccgatgac agcgaccacg ctcttgaagc 13680
cctgtgcctc cagggacttc agcaggtggg tgtagagcgt ggagcccagt cccgtccgct 13740
ggtggcgggg ggagacgtac acggtcgact cggccgtcca gtcgtaggcg ttgcgtgcct 13800
tccaggggcc cgcgtaggcg atgccggcga cctcgccgtc cacctcggcg acgagccagg 13860
gatagcgctc ccgcagacgg acgaggtcgt ccgtccactc ctgcggttcc tgcggctcgg 13920
tacggaagtt gaccgtgctt gtctcgatgt agtggttgac gatggtgcag accgccggca 13980
tgtccgcctc ggtggcacgg cggatgtcgg ccgggcgtcg ttctgggctc atggatctgg 14040
attgagagtg aatatgagac tctaattgga taccgagggg aatttatgga acgtcagtgg 14100
agcatttttg acaagaaata tttgctagct gatagtgacc ttaggcgact tttgaacgcg 14160
caataatggt ttctgacgta tgtgcttagc tcattaaact ccagaaaccc gcggctgagt 14220
ggctccttca acgttgcggt tctgtcagtt ccaaacgtaa aacggcttgt cccgcgtcat 14280
cggcgggggt cataacgtga ctcccttaat tctccgctca tgatcagatt gtcgtttccc 14340
gccttcagtt taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa 14400
agagcgttta ttagaataat cggatattta aaagggcgtg aaaaggttta tccgttcgtc 14460
catttgtatg tgcatgccaa ccacagggtt ccccagatct ggcgccggcc agcgagacga 14520
gcaagattgg ccgccgcccg aaacgatccg acagcgcgcc cagcacaggt gcgcaggcaa 14580
attgcaccaa cgcatacagc gccagcagaa tgccatagtg ggcggtgacg tcgttcgagt 14640
gaaccagatc gcgcaggagg cccggcagca ccggcataat caggccgatg ccgacagcgt 14700
cgagcgcgac agtgctcaga attacgatca ggggtatgtt gggtttcacg tctggcctcc 14760
ggaccagcct ccgctggtcc gattgaacgc gcggattctt tatcactgat aagttggtgg 14820
acatattatg tttatcagtg ataaagtgtc aagcatgaca aagttgcagc cgaatacagt 14880
gatccgtgcc gccctggacc tgttgaacga ggtcggcgta gacggtctga cgacacgcaa 14940
actggcggaa cggttggggg ttcagcagcc ggcgctttac tggcacttca ggaacaagcg 15000
ggcgctgctc gacgcactgg ccgaagccat gctggcggag aatcatacgc attcggtgcc 15060
gagagccgac gacgactggc gctcatttct gatcgggaat gcccgcagct tcaggcaggc 15120
gctgctcgcc taccgcgatg gcgcgcgcat ccatgccggc acgcgaccgg gcgcaccgca 15180
gatggaaacg gccgacgcgc agcttcgctt cctctgcgag gcgggttttt cggccgggga 15240
cgccgtcaat gcgctgatga caatcagcta cttcactgtt ggggccgtgc ttgaggagca 15300
ggccggcgac agcgatgccg gcgagcgcgg cggcaccgtt gaacaggctc cgctctcgcc 15360
gctgttgcgg gccgcgatag acgccttcga cgaagccggt ccggacgcag cgttcgagca 15420
gggactcgcg gtgattgtcg atggattggc gaaaaggagg ctcgttgtca ggaacgttga 15480
aggaccgaga aagggtgacg attgatcagg accgctgccg gagcgcaacc cactcactac 15540
agcagagcca tgtagacaac atcccctccc cctttccacc gcgtcagacg cccgtagcag 15600
cccgctacgg gctttttcat gccctgccct agcgtccaag cctcacggcc gcgctcggcc 15660
tctctggcgg ccttctggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 15720
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 15780
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 15840
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 15900
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 15960
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 16020
tccgcctttc tcccttcggg aagcgtggcg cttttccgct gcataaccct gcttcggggt 16080
cattatagcg attttttcgg tatatccatc ctttttcgca cgatatacag gattttgcca 16140
aagggttcgt gtagactttc cttggtgtat ccaacggcgt cagccgggca ggataggtga 16200
agtaggccca cccgcgagcg ggtgttcctt cttcactgtc ccttattcgc acctggcggt 16260
gctcaacggg aatcctgctc tgcgaggctg gccggctacc gccggcgtaa cagatgaggg 16320
caagcggatg gctgatgaaa ccaagccaac caggaagggc agcccaccta tcaaggtgta 16380
ctgccttcca gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg gcatgagcct 16440
gtcggcctac ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg tggactatga 16500
gcacgtccgc gagctggccc gcatcaatgg cgacctgggc cgcctgggcg gcctgctgaa 16560
actctggctc accgacgacc cgcgcacggc gcggttcggt gatgccacga tcctcgccct 16620
gctggcgaag atcgaagaga agcaggacga gcttggcaag gtcatgatgg gcgtggtccg 16680
cccgagggca gagccatgac ttttttagcc gctaaaacgg ccggggggtg cgcgtgattg 16740
ccaagcacgt ccccatgcgc tccatcaaga agagcgactt cgcggagctg gtgaagtaca 16800
tcaccgacga gcaaggcaag accgagcgcc tttgcgacgc tca 16843
<210>5
<211>9142
<212>DNA
<213>人工序列
<220>
<223>PHP27840构建体
<400>5
ctagttatct gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca 60
cgtgtcttta taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata 120
taaatattaa tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt 180
gtgttttgcg aattcgatat caagcttgat gggtaccggc gcgcccgatc atccggatat 240
agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa ggggttatgc 300
tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt tgttagcagc 360
cggatcgatc caagctgtac ctcactattc ctttgccctc ggacgagtgc tggggcgtcg 420
gtttccacta tcggcgagta cttctacaca gccatcggtc cagacggccg cgcttctgcg 480
ggcgatttgt gtacgcccga cagtcccggc tccggatcgg acgattgcgt cgcatcgacc 540
ctgcgcccaa gctgcatcat cgaaattgcc gtcaaccaag ctctgataga gttggtcaag 600
accaatgcgg agcatatacg cccggagccg cggcgatcct gcaagctccg gatgcctccg 660
ctcgaagtag cgcgtctgct gctccataca agccaaccac ggcctccaga agaagatgtt 720
ggcgacctcg tattgggaat ccccgaacat cgcctcgctc cagtcaatga ccgctgttat 780
gcggccattg tccgtcagga cattgttgga gccgaaatcc gcgtgcacga ggtgccggac 840
ttcggggcag tcctcggccc aaagcatcag ctcatcgaga gcctgcgcga cggacgcact 900
gacggtgtcg tccatcacag tttgccagtg atacacatgg ggatcagcaa tcgcgcatat 960
gaaatcacgc catgtagtgt attgaccgat tccttgcggt ccgaatgggc cgaacccgct 1020
cgtctggcta agatcggccg cagcgatcgc atccatagcc tccgcgaccg gctgcagaac 1080
agcgggcagt tcggtttcag gcaggtcttg caacgtgaca ccctgtgcac ggcgggagat 1140
gcaataggtc aggctctcgc tgaattcccc aatgtcaagc acttccggaa tcgggagcgc 1200
ggccgatgca aagtgccgat aaacataacg atctttgtag aaaccatcgg cgcagctatt 1260
tacccgcagg acatatccac gccctcctac atcgaagctg aaagcacgag attcttcgcc 1320
ctccgagagc tgcatcaggt cggagacgct gtcgaacttt tcgatcagaa acttctcgac 1380
agacgtcgcg gtgagttcag gcttttccat gggtatatct ccttcttaaa gttaaacaaa 1440
attatttcta gagggaaacc gttgtggtct ccctatagtg agtcgtatta atttcgcggg 1500
atcgagatct gatcaacctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 1560
gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc 1620
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 1680
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 1740
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 1800
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 1860
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 1920
tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt 1980
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 2040
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 2100
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 2160
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 2220
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 2280
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 2340
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 2400
aagggatttt ggtcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 2460
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 2520
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 2580
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 2640
accatatgga catattgtcg ttagaacgcg gctacaatta atacataacc ttatgtatca 2700
tacacatacg atttaggtga cactatagaa cggcgcgcca agctgggtct agaactagaa 2760
acgtgatgcc acttgttatt gaagtcgatt acagcatcta ttctgtttta ctatttataa 2820
ctttgccatt tctgactttt gaaaactatc tctggatttc ggtatcgctt tgtgaagatc 2880
gagcaaaaga gacgttttgt ggacgcaatg gtccaaatcc gttctacatg aacaaattgg 2940
tcacaatttc cactaaaagt aaataaatgg caagttaaaa aaggaatatg cattttactg 3000
attgcctagg tgagctccaa gagaagttga atctacacgt ctaccaaccg ctaaaaaaag 3060
aaaaacattg aatatgtaac ctgattccat tagcttttga cttcttcaac agattctcta 3120
cttagatttc taacagaaat attattacta gcacatcatt ttcagtctca ctacagcaaa 3180
aaatccaacg gcacaataca gacaacagga gatatcagac tacagagata gatagatgct 3240
actgcatgta gtaagttaaa taaaaggaaa ataaaatgtc ttgctaccaa aactactaca 3300
gactatgatg ctcaccacag gccaaatcct gcaactagga cagcattatc ttatatatat 3360
tgtacaaaac aagcatcaag gaacatttgg tctaggcaat cagtacctcg ttctaccatc 3420
accctcagtt atcacatcct tgaaggatcc attactggga atcatcggca acacatgctc 3480
ctgatggggc acaatgacat caagaaggta ggggccaggg gtgtccaaca ttctctgaat 3540
tgccgctcta agctcttcct tcttcgtcac tcgcgctgcc ggtatcccac aagcatcagc 3600
aaacttgagc atgtttggga atatctcgct ctcgctagac ggatctccaa gataggtgtg 3660
agctctattg gacttgtaga acctatcctc caactgaacc accataccca aatgctgatt 3720
gttcaacaac aatatcttaa ctgggagatt ctccactctt atagtggcca actcctgaac 3780
attcatgatg aaactaccat ccccatcaat gtcaaccaca acagccccag ggttagcaac 3840
agcagcacca atagccgcag gcaatccaaa acccatggct ccaagacccc ctgaggtcaa 3900
ccactgcctc ggtctcttgt acttgtaaaa ctgcgcagcc cacatttgat gctgcccaac 3960
cccagtacta acaatagcat ctccattagt caactcatca agaacctcga tagcatgctg 4020
cggagaaatc gcgtcctgga atgtcttgta acccaatgga aacttgtgtt tctgcacatt 4080
aatctcttct ctccaacctc caagatcaaa cttaccctcc actcctttct cctccaaaat 4140
catattaatt cccttcaagg ccaacttcaa atccgcgcaa accgacacgt gcgcctgctt 4200
gttcttccca atctcggcag aatcaatatc aatgtgaaca atcttagccc tactagcaaa 4260
agcctcaagc ttcccagtaa cacggtcatc aaaccttacc ccaaaggcaa gcaacaaatc 4320
actattgtcaacagcatagt tagcataaac agtaccatgc atacccagca tctgaaggga 4380
atattcatca ccaataggaa aagttccaag acccattaaa gtgctagcaa cgggaatacc 4440
agtgagttca acaaagcgcc tcaattcagc actggaattc aaactgccac cgccgacgta 4500
gagaacgggc ttttgggcct ccatgatgag tctgacaatg tgttccaatt gggcctcggc 4560
ggggggcctg ggcagcctgg cgaggtaacc ggggaggtta acgggctcgt cccaattagg 4620
cacggcgagt tgctgctgaa cgtctttggg aatgtcgatg aggaccggac cggggcggcc 4680
ggaggtggcg acgaagaaag cctcggcgac gacgcggggg atgtcgtcga cgtcgaggat 4740
gaggtagttg tgcttcgtga tggatctgct cacctccacg atcggggttt cttggaaggc 4800
gtcggtgccg atcatccggc gggcgacctg gccggtgatg gcgacgactg ggacgctgtc 4860
cattaaagcg tcggcgaggc cgctcacgag gttggtggcg ccggggccgg aggtggcaat 4920
gcagacgccg gggaggccgg aggaacgcgc gtagccttcg gcggcgaaga cgccgccctg 4980
ctcgtggcgc gggagcacgt tgcggatggc ggcggagcgc gtgagcgcct ggtggatctc 5040
catcgacgca ccgccggggt acgcgaacac cgtcgtcacg ccctgcctct ccagcgcctc 5100
cacaaggatg tccgcgccct tgcgaggttc gccggaggcg aaccgtgaca cgaagggctc 5160
cgtggtcggc gcttccttgg tgaagggcgc cgccgtgggg ggtttggaga tggaacattt 5220
gattttgaga gcgtggttgg gtttggtgag ggtttgatga gagagaggga gggtggatct 5280
agtaatgcgt ttggggaagg tggggtgtga agaggaagaa gagaatcggg tggttctgga 5340
agcggtggcc gccattgtgt tgtgtggcat ggttatactt caaaaactgc acaacaagcc 5400
tagagttagt acctaaacag taaatttaca acagagagca aagacacatg caaaaatttc 5460
agccataaaa aaagttataa tagaatttaa agcaaaagtt tcatttttta aacatatata 5520
caaacaaact ggatttgaag gaagggatta attcccctgc tcaaagtttg aattcctatt 5580
gtgacctata ctcgaataaa attgaagcct aaggaatgta tgagaaacaa gaaaacaaaa 5640
caaaactaca gacaaacaag tacaattaca aaattcgcta aaattctgta atcaccaaac 5700
cccatctcag tcagcacaag gcccaaggtt tattttgaaa taaaaaaaaa gtgattttat 5760
ttctcataag ctaaaagaaa gaaaggcaat tatgaaatga tttcgactag atctgaaagt 5820
caaacgcgta ttccgcagat attaaagaaa gagtagagtt tcacatggat cctagatgga 5880
cccagttgag gaaaaagcaa ggcaaagcaa accagaagtg caagatccga aattgaacca 5940
cggaatctag gatttggtag agggagaaga aaagtacctt gagaggtaga agagaagaga 6000
agagcagaga gatatatgaa cgagtgtgtc ttggtctcaa ctctgaagcg atacgagttt 6060
agaggggagc attgagttcc aatttatagg gaaaccgggt ggcaggggtg agttaatgac 6120
ggaaaagccc ctaagtaacg agattggatt gtgggttaga ttcaaccgtt tgcatccgcg 6180
gcttagattg gggaagtcag agtgaatctc aaccgttgac tgagttgaaa attgaatgta 6240
gcaaccaatt gagccaaccc cagcctttgc cctttgattt tgatttgttt gttgcatact 6300
ttttatttgt cttctggttc tgactctctt tctctcgttt caatgccagg ttgcctactc 6360
ccacaccact cacaagaaga ttctactgtt agtattaaat attttttaat gtattaaatg 6420
atgaatgctt ttgtaaacag aacaagacta tgtctaataa gtgtcttgca acatttttta 6480
agaaattaaa aaaaatatat ttattatcaa aatcaaatgt atgaaaaatc atgaataata 6540
taattttata cattttttta aaaaatcttt taatttctta attaatatct taaaaataat 6600
gattaatatt taacccaaaa taattagtat gattggtaag gaagatatcc atgttatgtt 6660
tggatgtgag tttgatctag agcaaagctt actagagtcg acctgcagcc cctccaccgc 6720
ggtggcggcc gctctagaga tccgtcaaca tggtggagca cgacactctc gtctactcca 6780
agaatatcaa agatacagtc tcagaagacc aaagggctat tgagactttt caacaaaggg 6840
taatatcggg aaacctcctc ggattccatt gcccagctat ctgtcacttc atcaaaagga 6900
cagtagaaaa ggaaggtggc acctacaaat gccatcattg cgataaagga aaggctatcg 6960
ttcaagatgc ctctgccgac agtggtccca aagatggacc cccacccacg aggagcatcg 7020
tggaaaaaga agacgttcca accacgtctt caaagcaagt ggattgatgt gatgatccta 7080
tgcgtatggt atgacgtgtg ttcaagatga tgacttcaaa cctacctatg acgtatggta 7140
tgacgtgtgt cgactgatga cttagatcca ctcgagcggc tataaatacg tacctacgca 7200
ccctgcgcta ccatccctag agctgcagct tatttttaca acaattacca acaacaacaa 7260
acaacaaaca acattacaat tactatttac aattacagtc gacccatcaa caagtttgta 7320
caaaaaagct gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt 7380
gcataaaaaa cagactacat aatactgtaa aacacaacat atccagtcat attggcggcc 7440
gcattaggca ccccaggctt tacactttat gcttccggct cgtataatgt gtggattttg 7500
agttaggatc cgtcgagatt ttcaggagct aaggaagcta aaatggagaa aaaaatcact 7560
ggatatacca ccgttgatat atcccaatgg catcgtaaag aacattttga ggcatttcag 7620
tcagttgctc aatgtaccta taaccagacc gttcagctgg atattacggc ctttttaaag 7680
accgtaaaga aaaataagca caagttttat ccggccttta ttcacattct tgcccgcctg 7740
atgaatgctc atccggaatt ccgtatggca atgaaagacg gtgagctggt gatatgggat 7800
agtgttcacc cttgttacac cgttttccat gagcaaactg aaacgttttc atcgctctgg 7860
agtgaatacc acgacgattt ccggcagttt ctacacatat attcgcaaga tgtggcgtgt 7920
tacggtgaaa acctggccta tttccctaaa gggtttattg agaatatgtt tttcgtctca 7980
gccaatccct gggtgagttt caccagtttt gatttaaacg tggccaatat ggacaacttc 8040
ttcgcccccg ttttcaccat gggcaaatat tatacgcaag gcgacaaggt gctgatgccg 8100
ctggcgattc aggttcatca tgccgtttgt gatggcttcc atgtcggcag aatgcttaat 8160
gaattacaac agtactgcga tgagtggcag ggcggggcgt aaagatctgg atccggctta 8220
ctaaaagcca gataacagta tgcgtatttg cgcgctgatt tttgcggtat aagaatatat 8280
actgatatgt atacccgaag tatgtcaaaa agaggtatgc tatgaagcag cgtattacag 8340
tgacagttga cagcgacagc tatcagttgc tcaaggcata tatgatgtca atatctccgg 8400
tctggtaagc acaaccatgc agaatgaagc ccgtcgtctg cgtgccgaac gctggaaagc 8460
ggaaaatcag gaagggatgg ctgaggtcgc ccggtttatt gaaatgaacg gctcttttgc 8520
tgacgagaac aggggctggt gaaatgcagt ttaaggttta cacctataaa agagagagcc 8580
gttatcgtct gtttgtggat gtacagagtg atattattga cacgcccggg cgacggatgg 8640
tgatccccct ggccagtgca cgtctgctgt cagataaagt ctcccgtgaa ctttacccgg 8700
tggtgcatat cggggatgaa agctggcgca tgatgaccac cgatatggcc agtgtgccgg 8760
tctccgttat cggggaagaa gtggctgatc tcagccaccg cgaaaatgac atcaaaaacg 8820
ccattaacct gatgttctgg ggaatataaa tgtcaggctc ccttatacac agccagtctg 8880
caggtcgacc atagtgactg gatatgttgt gttttacagt attatgtagt ctgtttttta 8940
tgcaaaatct aatttaatat attgatattt atatcatttt acgtttctcg ttcagctttc 9000
ttgtacaaag tggttgataa cctagacttg tccatcttct ggattggcca acttaattaa 9060
tgtatgaaat aaaaggatgc acacatagtg acatgctaat cactataatg tgggcatcaa 9120
agt tgtgtgt tatgtgtaat ta 9142
<210>6
<211>49911
<212>DNA
<213>人工序列
<220>
<223>PHP23236构建体
<400>6
gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta 60
taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt 120
atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca 180
gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt 240
ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg 300
caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta 360
gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct 420
ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa 480
tagaataaaa taaagtgact aaaaattaaa caaataccctt taagaaatt aaaaaaacta 540
aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt 600
ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca 660
cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg 720
ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag 780
gcggcctcct cctcctctca cggcacggca gctacggggg attcctttcc caccgctcct 840
tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc 900
aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc 960
ggcacctccg cttcaaggta cgccgctcgt cctccccccc cccccctctc taccttctct 1020
agatcggcgt tccggtccat ggttagggcc cggtagttct acttctgttc atgtttgtgt 1080
tagatccgtg tttgtgttag atccgtgctg ctagcgttcg tacacggatg cgacctgtac 1140
gtcagacacg ttctgattgc taacttgcca gtgtttctct ttggggaatc ctgggatggc 1200
tctagccgtt ccgcagacgg gatcgatttc atgatttttt ttgtttcgtt gcatagggtt 1260
tggtttgccc ttttccttta tttcaatata tgccgtgcac ttgtttgtcg ggtcatcttt 1320
tcatgctttt ttttgtcttg gttgtgatga tgtggtctgg ttgggcggtc gttctagatc 1380
ggagtagaat tctgtttcaa actacctggt ggatttatta attttggatc tgtatgtgtg 1440
tgccatacat attcatagtt acgaattgaa gatgatggat ggaaatatcg atctaggata 1500
ggtatacatg ttgatgcggg ttttactgat gcatatacag agatgctttt tgttcgcttg 1560
gttgtgatga tgtggtgtgg ttgggcggtc gttcattcgt tctagatcgg agtagaatac 1620
tgtttcaaac tacctggtgt atttattaat tttggaactg tatgtgtgtg tcatacatct 1680
tcatagttac gagtttaaga tggatggaaa tatcgatcta ggataggtat acatgttgat 1740
gtgggtttta ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac 1800
cttgagtacc tatctattat aataaacaag tatgttttat aattattttg atcttgatat 1860
acttggatga tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg 1920
ctatttattt gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact 1980
tctgcaggtc gactctagag gatccacaag tttgtacaaa aaagctgaac gagaaacgta 2040
aaatgatata aatatcaata tattaaatta gattttgcat aaaaaacaga ctacataata 2100
ctgtaaaaca caacatatcc agtcactatg gcggccgcat taggcacccc aggctttaca 2160
ctttatgctt ccggctcgta taatgtgtgg attttgagtt aggatttaaa tacgcgttga 2220
tccggcttac taaaagccag ataacagtat gcgtatttgc gcgctgattt ttgcggtata 2280
agaatatata ctgatatgta tacccgaagt atgtcaaaaa gaggtatgct atgaagcagc 2340
gtattacagt gacagttgac agcgacagct atcagttgct caaggcatat atgatgtcaa 2400
tatctccggt ctggtaagca caaccatgca gaatgaagcc cgtcgtctgc gtgccgaacg 2460
ctggaaagcg gaaaatcagg aagggatggc tgaggtcgcc cggtttattg aaatgaacgg 2520
ctcttttgct gacgagaaca ggggctggtg aaatgcagtt taaggtttac acctataaaa 2580
gagagagccg ttatcgtctg tttgtggatg tacagagtga tatcattgac acgcccggtc 2640
gacggatggt gatccccctg gccagtgcac gtctgctgtc agataaagtc tcccgtgaac 2700
tttacccggt ggtgcatatc ggggatgaaa gctggcgcat gatgaccacc gatatggcca 2760
gtgtgccggt ctccgttatc ggggaagaag tggctgatct cagccaccgc gaaaatgaca 2820
tcaaaaacgc cattaacctg atgttctggg gaatataaat gtcaggctcc cttatacaca 2880
gccagtctgc aggtcgacca tagtgactgg atatgttgtg ttttacagta ttatgtagtc 2940
tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt 3000
tcagctttct tgtacaaagt ggtgttaacc tagacttgtc catcttctgg attggccaac 3060
ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg 3120
ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc 3180
atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga 3240
tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa 3300
ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggcc gccaccgcgg 3360
tggagctcga attccggtcc gggtcacctt tgtccaccaa gatggaactg cggccgctca 3420
ttaattaagt caggcgcgcc tctagttgaa gacacgttca tgtcttcatc gtaagaagac 3480
actcagtagt cttcggccag aatggccatc tggattcagc aggcctagaa ggccatttaa 3540
atcctgagga tctggtcttc ctaaggaccc gggatatcgg accgattaaa ctttaattcg 3600
gtccgaagct tgcatgcctg cagtgcagcg tgacccggtc gtgcccctct ctagagataa 3660
tgagcattgc atgtctaagt tataaaaaat taccacatat tttttttgtc acacttgttt 3720
gaagtgcagt ttatctatct ttatacatat atttaaactt tactctacga ataatataat 3780
ctatagtact acaataatat cagtgtttta gagaatcata taaatgaaca gttagacatg 3840
gtctaaagga caattgagta ttttgacaac aggactctac agttttatct ttttagtgtg 3900
catgtgttct cctttttttt tgcaaatagc ttcacctata taatacttca tccattttat 3960
tagtacatcc atttagggtt tagggttaat ggtttttata gactaatttt tttagtacat 4020
ctattttatt ctattttagc ctctaaatta agaaaactaa aactctattt tagttttttt 4080
atttaataat ttagatataa aatagaataa aataaagtga ctaaaaatta aacaaatacc 4140
ctttaagaaa ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga taatgccagc 4200
ctgttaaacg ccgtcgacga gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc 4260
gggccaagcg aagcagacgg cacggcatct ctgtcgctgc ctctggaccc ctctcgagag 4320
ttccgctcca ccgttggact tgctccgctg tcggcatcca gaaattgcgt ggcggagcgg 4380
cagacgtgag ccggcacggc aggcggcctc ctcctcctct cacggcaccg gcagctacgg 4440
gggattcctt tcccaccgct ccttcgcttt cccttcctcg cccgccgtaa taaatagaca 4500
ccccctccac accctctttc cccaacctcg tgttgttcgg agcgcacaca cacacaacca 4560
gatctccccc aaatccaccc gtcggcacct ccgcttcaag gtacgccgct cgtcctcccc 4620
cccccccctc tctaccttct ctagatcggc gttccggtcc atgcatggtt agggcccggt 4680
agttctactt ctgttcatgt ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag 4740
cgttcgtaca cggatgcgac ctgtacgtca gacacgttct gattgctaac ttgccagtgt 4800
ttctctttgg ggaatcctgg gatggctcta gccgttccgc agacgggatc gatttcatga 4860
ttttttttgt ttcgttgcat agggtttggt ttgccctttt cctttatttc aatatatgcc 4920
gtgcacttgt ttgtcgggtc atcttttcat gctttttttt gtcttggttg tgatgatgtg 4980
gtctggttgg gcggtcgttc tagatcggag tagaattctg tttcaaacta cctggtggat 5040
ttattaattt tggatctgta tgtgtgtgcc atacatattc atagttacga attgaagatg 5100
atggatggaa atatcgatct aggataggta tacatgttga tgcgggtttt actgatgcat 5160
atacagagat gctttttgtt cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc 5220
attcgttcta gatcggagta gaatactgtt tcaaactacc tggtgtattt attaattttg 5280
gaactgtatg tgtgtgtcat acatcttcat agttacgagt ttaagatgga tggaaatatc 5340
gatctaggat aggtatacat gttgatgtgg gttttactga tgcatataca tgatggcata 5400
tgcagcatct attcatatgc tctaaccttg agtacctatc tattataata aacaagtatg 5460
ttttataatt attttgatct tgatatactt ggatgatggc atatgcagca gctatatgtg 5520
gattttttta gccctgcctt catacgctat ttatttgctt ggtactgttt cttttgtcga 5580
tgctcaccct gttgtttggt gttacttctg caggtcgact ttaacttagc ctaggatcca 5640
cacgacacca tgtcccccga gcgccgcccc gtcgagatcc gcccggccac cgccgccgac 5700
atggccgccg tgtgcgacat cgtgaaccac tacatcgaga cctccaccgt gaacttccgc 5760
accgagccgc agaccccgca ggagtggatc gacgacctgg agcgcctcca ggaccgctac 5820
ccgtggctcg tggccgaggt ggagggcgtg gtggccggca tcgcctacgc cggcccgtgg 5880
aaggcccgca acgcctacga ctggaccgtg gagtccaccg tgtacgtgtc ccaccgccac 5940
cagcgcctcg gcctcggctc caccctctac acccacctcc tcaagagcat ggaggcccag 6000
ggcttcaagt ccgtggtggc cgtgatcggc ctcccgaacg acccgtccgt gcgcctccac 6060
gaggccctcg gctacaccgc ccgcggcacc ctccgcgccg ccggctacaa gcacggcggc 6120
tggcacgacg tcggcttctg gcagcgcgac ttcgagctgc cggccccgcc gcgcccggtg 6180
cgcccggtga cgcagatctg agtcgaaacc tagacttgtc catcttctgg attggccaac 6240
ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg 6300
ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc 6360
atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga 6420
tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa 6480
ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggcc gccaccgcgg 6540
tggagctcga attcattccg attaatcgtg gcctcttgct cttcaggatg aagagctatg 6600
tttaaacgtg caagcgctac tagacaattc agtacattaa aaacgtccgc aatgtgttat 6660
taagttgtct aagcgtcaat ttggtttaca ccacaatata tcctgccacc agccagccaa 6720
cagctccccg accggcagct cggcacaaaa tcaccactcg atacaggcag cccatcagtc 6780
cgggacggcg tcagcgggag agccgttgta aggcggcaga ctttgctcat gttaccgatg 6840
ctattcggaa gaacggcaac taagctgccg ggtttgaaac acggatgatc tcgcggaggg 6900
tagcatgttg attgtaacga tgacagagcg ttgctgcctg tgatcaaata tcatctccct 6960
cgcagagatc cgaattatca gccttcttat tcatttctcg cttaaccgtg acaggctgtc 7020
gatcttgaga actatgccga cataatagga aatcgctgga taaagccgct gaggaagctg 7080
agtggcgcta tttctttaga agtgaacgtt gacgatcgtc gaccgtaccc cgatgaatta 7140
attcggacgt acgttctgaa cacagctgga tacttacttg ggcgattgtc atacatgaca 7200
tcaacaatgt acccgtttgt gtaaccgtct cttggaggtt cgtatgacac tagtggttcc 7260
cctcagcttg cgactagatg ttgaggccta acattttatt agagagcagg ctagttgctt 7320
agatacatga tcttcaggcc gttatctgtc agggcaagcg aaaattggcc atttatgacg 7380
accaatgccc cgcagaagct cccatctttg ccgccataga cgccgcgccc cccttttggg 7440
gtgtagaaca tccttttgcc agatgtggaa aagaagttcg ttgtcccatt gttggcaatg 7500
acgtagtagc cggcgaaagt gcgagaccca tttgcgctat atataagcct acgatttccg 7560
ttgcgactat tgtcgtaatt ggatgaacta ttatcgtagt tgctctcaga gttgtcgtaa 7620
tttgatggac tattgtcgta attgcttatg gagttgtcgt agttgcttgg agaaatgtcg 7680
tagttggatg gggagtagtc atagggaaga cgagcttcat ccactaaaac aattggcagg 7740
tcagcaagtg cctgccccga tgccatcgca agtacgaggc ttagaaccac cttcaacaga 7800
tcgcgcatag tcttccccag ctctctaacg cttgagttaa gccgcgccgc gaagcggcgt 7860
cggcttgaac gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg 7920
tagtgaacaa attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttgtccaaga 7980
taagcctgcc tagcttcaag tatgacgggc tgatactggg ccggcaggcg ctccattgcc 8040
cagtcggcag cgacatcctt cggcgcgatt ttgccggtta ctgcgctgta ccaaatgcgg 8100
gacaacgtaa gcactacatt tcgctcatcg ccagcccagt cgggcggcga gttccatagc 8160
gttaaggttt catttagcgc ctcaaataga tcctgttcag gaaccggatc aaagagttcc 8220
tccgccgctg gacctaccaa ggcaacgcta tgttctcttg cttttgtcag caagatagcc 8280
agatcaatgt cgatcgtggc tggctcgaag atacctgcaa gaatgtcatt gcgctgccat 8340
tctccaaatt gcagttcgcg cttagctgga taacgccacg gaatgatgtc gtcgtgcaca 8400
acaatggtga cttctacagc gcggagaatc tcgctctctc caggggaagc cgaagtttcc 8460
aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa gccttacagt caccgtaacc 8520
agcaaatcaa tatcactgtg tggcttcagg ccgccatcca ctgcggagcc gtacaaatgt 8580
acggccagca acgtcggttc gagatggcgc tcgatgacgc caactacctc tgatagttga 8640
gtcgatactt cggcgatcac cgcttccctc atgatgttta actcctgaat taagccgcgc 8700
cgcgaagcgg tgtcggcttg aatgaattgt taggcgtcat cctgtgctcc cgagaaccag 8760
taccagtaca tcgctgtttc gttcgagact tgaggtctag ttttatacgt gaacaggtca 8820
atgccgccga gagtaaagcc acattttgcg tacaaattgc aggcaggtac attgttcgtt 8880
tgtgtctcta atcgtatgcc aaggagctgt ctgcttagtg cccacttttt cgcaaattcg 8940
atgagactgt gcgcgactcc tttgcctcgg tgcgtgtgcg acacaacaat gtgttcgata 9000
gaggctagat cgttccatgt tgagttgagt tcaatcttcc cgacaagctc ttggtcgatg 9060
aatgcgccat agcaagcaga gtcttcatca gagtcatcat ccgagatgta atccttccgg 9120
taggggctca cacttctggt agatagttca aagccttggt cggataggtg cacatcgaac 9180
acttcacgaa caatgaaatg gttctcagca tccaatgttt ccgccacctg ctcagggatc 9240
accgaaatct tcatatgacg cctaacgcct ggcacagcgg atcgcaaacc tggcgcggct 9300
tttggcacaa aaggcgtgac aggtttgcga atccgttgct gccacttgtt aacccttttg 9360
ccagatttgg taactataat ttatgttaga ggcgaagtct tgggtaaaaa ctggcctaaa 9420
attgctgggg atttcaggaa agtaaacatc accttccggc tcgatgtcta ttgtagatat 9480
atgtagtgta tctacttgat cgggggatct gctgcctcgc gcgtttcggt gatgacggtg 9540
aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg 9600
ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca 9660
tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca 9720
gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa 9780
ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 9840
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 9900
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 9960
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 10020
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 10080
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 10140
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 10200
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 10260
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 10320
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 10380
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 10440
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 10500
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 10560
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 10620
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 10680
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 10740
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 10800
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 10860
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 10920
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 10980
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 11040
tgttgccatt gctgcagggg gggggggggg gggggacttc cattgttcat tccacggaca 11100
aaaacagaga aaggaaacga cagaggccaa aaagcctcgc tttcagcacc tgtcgtttcc 11160
tttcttttca gagggtattt taaataaaaa cattaagtta tgacgaagaa gaacggaaac 11220
gccttaaacc ggaaaatttt cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc 11280
tacctgtcgg atcaccggaa aggacccgta aagtgataat gattatcatc tacatatcac 11340
aacgtgcgtg gaggccatca aaccacgtca aataatcaat tatgacgcag gtatcgtatt 11400
aattgatctg catcaactta acgtaaaaac aacttcagac aatacaaatc agcgacactg 11460
aatacggggc aacctcatgt cccccccccc cccccccctg caggcatcgt ggtgtcacgc 11520
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 11580
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 11640
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 11700
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 11760
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca 11820
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 11880
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 11940
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 12000
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 12060
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 12120
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc 12180
taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt 12240
cgtcttcaag aattcggagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 12300
tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 12360
acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 12420
gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 12480
gaataaattg cagtttcatt tgatgctcga tgagtttttc taatcagaat tggttaattg 12540
gttgtaacac tggcagagca ttacgctgac ttgacgggac ggcggctttg ttgaataaat 12600
cgaacttttg ctgagttgaa ggatcagatc acgcatcttc ccgacaacgc agaccgttcc 12660
gtggcaaagc aaaagttcaa aatcaccaac tggtccacct acaacaaagc tctcatcaac 12720
cgtggctccc tcactttctg gctggatgat ggggcgattc aggcctggta tgagtcagca 12780
acaccttctt cacgaggcag acctcagcgc cagaaggccg ccagagaggc cgagcgcggc 12840
cgtgaggctt ggacgctagg gcagggcatg aaaaagcccg tagcgggctg ctacgggcgt 12900
ctgacgcggt ggaaaggggg aggggatgtt gtctacatgg ctctgctgta gtgagtgggt 12960
tgcgctccgg cagcggtcct gatcaatcgt caccctttct cggtccttca acgttcctga 13020
caacgagcct ccttttcgcc aatccatcga caatcaccgc gagtccctgc tcgaacgctg 13080
cgtccggacc ggcttcgtcg aaggcgtcta tcgcggcccg caacagcggc gagagcggag 13140
cctgttcaac ggtgccgccg cgctcgccgg catcgctgtc gccggcctgc tcctcaagca 13200
cggccccaac agtgaagtag ctgattgtca tcagcgcatt gacggcgtcc ccggccgaaa 13260
aacccgcctc gcagaggaag cgaagctgcg cgtcggccgt ttccatctgc ggtgcgcccg 13320
gtcgcgtgcc ggcatggatg cgcgcgccat cgcggtaggc gagcagcgcc tgcctgaagc 13380
tgcgggcatt cccgatcaga aatgagcgcc agtcgtcgtc ggctctcggc accgaatgcg 13440
tatgattctc cgccagcatg gcttcggcca gtgcgtcgag cagcgcccgc ttgttcctga 13500
agtgccagta aagcgccggc tgctgaaccc ccaaccgttc cgccagtttg cgtgtcgtca 13560
gaccgtctac gccgacctcg ttcaacaggt ccagggcggc acggatcact gtattcggct 13620
gcaactttgt catgcttgac actttatcac tgataaacat aatatgtcca ccaacttatc 13680
agtgataaag aatccgcgcg ttcaatcgga ccagcggagg ctggtccgga ggccagacgt 13740
gaaacccaac atacccctga tcgtaattct gagcactgtc gcgctcgacg ctgtcggcat 13800
cggcctgatt atgccggtgc tgccgggcct cctgcgcgat ctggttcact cgaacgacgt 13860
caccgcccac tatggcattc tgctggcgct gtatgcgttg gtgcaatttg cctgcgcacc 13920
tgtgctgggc gcgctgtcgg atcgtttcgg gcggcggcca atcttgctcg tctcgctggc 13980
cggcgccact gtcgactacg ccatcatggc gacagcgcct ttcctttggg ttctctatat 14040
cgggcggatc gtggccggca tcaccggggc gactggggcg gtagccggcg cttatattgc 14100
cgatatcact gatggcgatg agcgcgcgcg gcacttcggc ttcatgagcg cctgtttcgg 14160
gttcgggatg gtcgcgggac ctgtgctcgg tgggctgatg ggcggtttct ccccccacgc 14220
tccgttcttc gccgcggcag ccttgaacgg cctcaatttc ctgacgggct gtttcctttt 14280
gccggagtcg cacaaaggcg aacgccggcc gttacgccgg gaggctctca acccgctcgc 14340
ttcgttccgg tgggcccggg gcatgaccgt cgtcgccgcc ctgatggcgg tcttcttcat 14400
catgcaactt gtcggacagg tgccggccgc gctttgggtc attttcggcg aggatcgctt 14460
tcactgggac gcgaccacga tcggcatttc gcttgccgca tttggcattc tgcattcact 14520
cgcccaggca atgatcaccg gccctgtagc cgcccggctc ggcgaaaggc gggcactcat 14580
gctcggaatg attgccgacg gcacaggcta catcctgctt gccttcgcga cacggggatg 14640
gatggcgttc ccgatcatgg tcctgcttgc ttcgggtggc atcggaatgc cggcgctgca 14700
agcaatgttg tccaggcagg tggatgagga acgtcagggg cagctgcaag gctcactggc 14760
ggcgctcacc agcctgacct cgatcgtcgg acccctcctc ttcacggcga tctatgcggc 14820
ttctataaca acgtggaacg ggtgggcatg gattgcaggc gctgccctct acttgctctg 14880
cctgccggcg ctgcgtcgcg ggctttggag cggcgcaggg caacgagccg atcgctgatc 14940
gtggaaacga taggcctatg ccatgcgggt caaggcgact tccggcaagc tatacgcgcc 15000
ctaggagtgc ggttggaacg ttggcccagc cagatactcc cgatcacgag caggacgccg 15060
atgatttgaa gcgcactcag cgtctgatcc aagaacaacc atcctagcaa cacggcggtc 15120
cccgggctga gaaagcccag taaggaaaca actgtaggtt cgagtcgcga gatcccccgg 15180
aaccaaagga agtaggttaa acccgctccg atcaggccga gccacgccag gccgagaaca 15240
ttggttcctg taggcatcgg gattggcgga tcaaacacta aagctactgg aacgagcaga 15300
agtcctccgg ccgccagttg ccaggcggta aaggtgagca gaggcacggg aggttgccac 15360
ttgcgggtca gcacggttcc gaacgccatg gaaaccgccc ccgccaggcc cgctgcgacg 15420
ccgacaggat ctagcgctgc gtttggtgtc aacaccaaca gcgccacgcc cgcagttccg 15480
caaatagccc ccaggaccgc catcaatcgt atcgggctac ctagcagagc ggcagagatg 15540
aacacgacca tcagcggctg cacagcgcct accgtcgccg cgaccccgcc cggcaggcgg 15600
tagaccgaaataaacaacaa gctccagaat agcgaaatat taagtgcgcc gaggatgaag 15660
atgcgcatcc accagattcc cgttggaatc tgtcggacga tcatcacgag caataaaccc 15720
gccggcaacg cccgcagcag cataccggcg acccctcggc ctcgctgttc gggctccacg 15780
aaaacgccgg acagatgcgc cttgtgagcg tccttggggc cgtcctcctg tttgaagacc 15840
gacagcccaa tgatctcgcc gtcgatgtag gcgccgaatg ccacggcatc tcgcaaccgt 15900
tcagcgaacg cctccatggg ctttttctcc tcgtgctcgt aaacggaccc gaacatctct 15960
ggagctttct tcagggccga caatcggatc tcgcggaaat cctgcacgtc ggccgctcca 16020
agccgtcgaa tctgagcctt aatcacaatt gtcaatttta atcctctgtt tatcggcagt 16080
tcgtagagcg cgccgtgcgt cccgagcgat actgagcgaa gcaagtgcgt cgagcagtgc 16140
ccgcttgttc ctgaaatgcc agtaaagcgc tggctgctga acccccagcc ggaactgacc 16200
ccacaaggcc ctagcgtttg caatgcacca ggtcatcatt gacccaggcg tgttccacca 16260
ggccgctgcc tcgcaactct tcgcaggctt cgccgacctg ctcgcgccac ttcttcacgc 16320
gggtggaatc cgatccgcac atgaggcgga aggtttccag cttgagcggg tacggctccc 16380
ggtgcgagct gaaatagtcg aacatccgtc gggccgtcgg cgacagcttg cggtacttct 16440
cccatatgaa tttcgtgtag tggtcgccag caaacagcac gacgatttcc tcgtcgatca 16500
ggacctggca acgggacgtt ttcttgccac ggtccaggac gcggaagcgg tgcagcagcg 16560
acaccgattc caggtgccca acgcggtcgg acgtgaagcc catcgccgtc gcctgtaggc 16620
gcgacaggca ttcctcggcc ttcgtgtaat accggccatt gatcgaccag cccaggtcct 16680
ggcaaagctc gtagaacgtg aaggtgatcg gctcgccgat aggggtgcgc ttcgcgtact 16740
ccaacacctg ctgccacacc agttcgtcat cgtcggcccg cagctcgacg ccggtgtagg 16800
tgatcttcac gtccttgttg acgtggaaaa tgaccttgtt ttgcagcgcc tcgcgcggga 16860
ttttcttgtt gcgcgtggtg aacagggcag agcgggccgt gtcgtttggc atcgctcgca 16920
tcgtgtccgg ccacggcgca atatcgaaca aggaaagctg catttccttg atctgctgct 16980
tcgtgtgttt cagcaacgcg gcctgcttgg cctcgctgac ctgttttgcc aggtcctcgc 17040
cggcggtttt tcgcttcttg gtcgtcatag ttcctcgcgt gtcgatggtc atcgacttcg 17100
ccaaacctgc cgcctcctgt tcgagacgac gcgaacgctc cacggcggcc gatggcgcgg 17160
gcagggcagg gggagccagt tgcacgctgt cgcgctcgat cttggccgta gcttgctgga 17220
ccatcgagcc gacggactgg aaggtttcgc ggggcgcacg catgacggtg cggcttgcga 17280
tggtttcggc atcctcggcg gaaaaccccg cgtcgatcag ttcttgcctg tatgccttcc 17340
ggtcaaacgt ccgattcatt caccctcctt gcgggattgc cccgactcac gccggggcaa 17400
tgtgccctta ttcctgattt gacccgcctg gtgccttggt gtccagataa tccaccttat 17460
cggcaatgaa gtcggtcccg tagaccgtct ggccgtcctt ctcgtacttg gtattccgaa 17520
tcttgccctg cacgaatacc agcgacccct tgcccaaata cttgccgtgg gcctcggcct 17580
gagagccaaa acacttgatg cggaagaagt cggtgcgctc ctgcttgtcg ccggcatcgt 17640
tgcgccactc ttcattaacc gctatatcga aaattgcttg cggcttgtta gaattgccat 17700
gacgtacctc ggtgtcacgg gtaagattac cgataaactg gaactgatta tggctcatat 17760
cgaaagtctc cttgagaaag gagactctag tttagctaaa cattggttcc gctgtcaaga 17820
actttagcgg ctaaaatttt gcgggccgcg accaaaggtg cgaggggcgg cttccgctgt 17880
gtacaaccag atatttttca ccaacatcct tcgtctgctc gatgagcggg gcatgacgaa 17940
acatgagctg tcggagaggg caggggtttc aatttcgttt ttatcagact taaccaacgg 18000
taaggccaac ccctcgttga aggtgatgga ggccattgcc gacgccctgg aaactcccct 18060
acctcttctc ctggagtcca ccgaccttga ccgcgaggca ctcgcggaga ttgcgggtca 18120
tcctttcaag agcagcgtgc cgcccggata cgaacgcatc agtgtggttt tgccgtcaca 18180
taaggcgttt atcgtaaaga aatggggcga cgacacccga aaaaagctgc gtggaaggct 18240
ctgacgccaa gggttagggc ttgcacttcc ttctttagcc gctaaaacgg ccccttctct 18300
gcgggccgtc ggctcgcgca tcatatcgac atcctcaacg gaagccgtgc cgcgaatggc 18360
atcgggcggg tgcgctttga cagttgtttt ctatcagaac ccctacgtcg tgcggttcga 18420
ttagctgttt gtcttgcagg ctaaacactt tcggtatatc gtttgcctgt gcgataatgt 18480
tgctaatgat ttgttgcgta ggggttactg aaaagtgagc gggaaagaag agtttcagac 18540
catcaaggag cgggccaagc gcaagctgga acgcgacatg ggtgcggacc tgttggccgc 18600
gctcaacgac ccgaaaaccg ttgaagtcat gctcaacgcg gacggcaagg tgtggcacga 18660
acgccttggc gagccgatgc ggtacatctg cgacatgcgg cccagccagt cgcaggcgat 18720
tatagaaacg gtggccggat tccacggcaa agaggtcacg cggcattcgc ccatcctgga 18780
aggcgagttc cccttggatg gcagccgctt tgccggccaa ttgccgccgg tcgtggccgc 18840
gccaaccttt gcgatccgca agcgcgcggt cgccatcttc acgctggaac agtacgtcga 18900
ggcgggcatc atgacccgcg agcaatacga ggtcattaaa agcgccgtcg cggcgcatcg 18960
aaacatcctc gtcattggcg gtactggctc gggcaagacc acgctcgtca acgcgatcat 19020
caatgaaatg gtcgccttca acccgtctga gcgcgtcgtc atcatcgagg acaccggcga 19080
aatccagtgc gccgcagaga acgccgtcca ataccacacc agcatcgacg tctcgatgac 19140
gctgctgctc aagacaacgc tgcgtatgcg ccccgaccgc atcctggtcg gtgaggtacg 19200
tggccccgaa gcccttgatc tgttgatggc ctggaacacc gggcatgaag gaggtgccgc 19260
caccctgcac gcaaacaacc ccaaagcggg cctgagccgg ctcgccatgc ttatcagcat 19320
gcacccggat tcaccgaaac ccattgagcc gctgattggc gaggcggttc atgtggtcgt 19380
ccatatcgcc aggaccccta gcggccgtcg agtgcaagaa attctcgaag ttcttggtta 19440
cgagaacggc cagtacatca ccaaaaccct gtaaggagta tttccaatga caacggctgt 19500
tccgttccgt ctgaccatga atcgcggcat tttgttctac cttgccgtgt tcttcgttct 19560
cgctctcgcg ttatccgcgc atccggcgat ggcctcggaa ggcaccggcg gcagcttgcc 19620
atatgagagc tggctgacga acctgcgcaa ctccgtaacc ggcccggtgg ccttcgcgct 19680
gtccatcatc ggcatcgtcg tcgccggcgg cgtgctgatc ttcggcggcg aactcaacgc 19740
cttcttccga accctgatct tcctggttct ggtgatggcg ctgctggtcg gcgcgcagaa 19800
cgtgatgagc accttcttcg gtcgtggtgc cgaaatcgcg gccctcggca acggggcgct 19860
gcaccaggtg caagtcgcgg cggcggatgc cgtgcgtgcg gtagcggctg gacggctcgc 19920
ctaatcatgg ctctgcgcac gatccccatc cgtcgcgcag gcaaccgaga aaacctgttc 19980
atgggtggtg atcgtgaact ggtgatgttc tcgggcctga tggcgtttgc gctgattttc 20040
agcgcccaag agctgcgggc caccgtggtc ggtctgatcc tgtggttcgg ggcgctctat 20100
gcgttccgaa tcatggcgaa ggccgatccg aagatgcggt tcgtgtacct gcgtcaccgc 20160
cggtacaagc cgtattaccc ggcccgctcg accccgttcc gcgagaacac caatagccaa 20220
gggaagcaat accgatgatc caagcaattg cgattgcaat cgcgggcctc ggcgcgcttc 20280
tgttgttcat cctctttgcc cgcatccgcg cggtcgatgc cgaactgaaa ctgaaaaagc 20340
atcgttccaa ggacgccggc ctggccgatc tgctcaacta cgccgctgtc gtcgatgacg 20400
gcgtaatcgt gggcaagaac ggcagcttta tggctgcctg gctgtacaag ggcgatgaca 20460
acgcaagcag caccgaccag cagcgcgaag tagtgtccgc ccgcatcaac caggccctcg 20520
cgggcc tgggaagtgggtgg atgatccatg tggacgccgt gcggcgtcct gctccgaact 20580
acgcggagcg gggcctgtcg gcgttccctg accgtctgac ggcagcgatt gaagaagagc 20640
gctcggtctt gccttgctcg tcggtgatgt acttcaccag ctccgcgaag tcgctcttct 20700
tgatggagcg catggggacg tgcttggcaa tcacgcgcac cccccggccg ttttagcggc 20760
taaaaaagtc atggctctgc cctcgggcgg accacgccca tcatgacctt gccaagctcg 20820
tcctgcttct cttcgatctt cgccagcagg gcgaggatcg tggcatcacc gaaccgcgcc 20880
gtgcgcgggt cgtcggtgag ccagagtttc agcaggccgc ccaggcggcc caggtcgcca 20940
ttgatgcggg ccagctcgcg gacgtgctca tagtccacga cgcccgtgat tttgtagccc 21000
tggccgacgg ccagcaggta ggccgacagg ctcatgccgg ccgccgccgc cttttcctca 21060
atcgctcttc gttcgtctgg aaggcagtac accttgatag gtgggctgcc cttcctggtt 21120
ggcttggttt catcagccat ccgcttgccc tcatctgtta cgccggcggt agccggccag 21180
cctcgcagag caggattccc gttgagcacc gccaggtgcg aataagggac agtgaagaag 21240
gaacacccgc tcgcgggtgg gcctacttca cctatcctgc ccggctgacg ccgttggata 21300
caccaaggaa agtctacacg aaccctttgg caaaatcctg tatatcgtgc gaaaaaggat 21360
ggatataccg aaaaaatcgc tataatgacc ccgaagcagg gttatgcagc ggaaaagcgc 21420
tgcttccctg ctgttttgtg gaatatctac cgactggaaa caggcaaatg caggaaatta 21480
ctgaactgag gggacaggcg agagacgatg ccaaagagct acaccgacga gctggccgag 21540
tgggttgaat cccgcgcggc caagaagcgc cggcgtgatg aggctgcggt tgcgttcctg 21600
gcggtgaggg cggatgtcga ggcggcgtta gcgtccggct atgcgctcgt caccatttgg 21660
gagcacatgc gggaaacggg gaaggtcaag ttctcctacg agacgttccg ctcgcacgcc 21720
aggcggcaca tcaaggccaa gcccgccgat gtgcccgcac cgcaggccaa ggctgcggaa 21780
cccgcgccgg cacccaagac gccggagcca cggcggccga agcagggggg caaggctgaa 21840
aagccggccc ccgctgcggc cccgaccggc ttcaccttca acccaacacc ggacaaaaag 21900
gatctactgt aatggcgaaa attcacatgg ttttgcaggg caagggcggg gtcggcaagt 21960
cggccatcgc cgcgatcatt gcgcagtaca agatggacaa ggggcagaca cccttgtgca 22020
tcgacaccga cccggtgaac gcgacgttcg agggctacaa ggccctgaac gtccgccggc 22080
tgaacatcat ggccggcgac gaaattaact cgcgcaactt cgacaccctg gtcgagctga 22140
ttgcgccgac caaggatgac gtggtgatcg acaacggtgc cagctcgttc gtgcctctgt 22200
cgcattacct catcagcaac caggtgccgg ctctgctgca agaaatgggg catgagctgg 22260
tcatccatac cgtcgtcacc ggcggccagg ctctcctgga cacggtgagc ggcttcgccc 22320
agctcgccag ccagttcccg gccgaagcgc ttttcgtggt ctggctgaac ccgtattggg 22380
ggcctatcga gcatgagggc aagagctttg agcagatgaa ggcgtacacg gccaacaagg 22440
cccgcgtgtc gtccatcatc cagattccgg ccctcaagga agaaacctac ggccgcgatt 22500
tcagcgacat gctgcaagag cggctgacgt tcgaccaggc gctggccgat gaatcgctca 22560
cgatcatgac gcggcaacgc ctcaagatcg tgcggcgcgg cctgtttgaa cagctcgacg 22620
cggcggccgt gctatgagcg accagattga agagctgatc cgggagattg cggccaagca 22680
cggcatcgcc gtcggccgcg acgacccggt gctgatcctg cataccatca acgcccggct 22740
catggccgac agtgcggcca agcaagagga aatccttgcc gcgttcaagg aagagctgga 22800
agggatcgcc catcgttggg gcgaggacgc caaggccaaa gcggagcgga tgctgaacgc 22860
ggccctggcg gccagcaagg acgcaatggc gaaggtaatg aaggacagcg ccgcgcaggc 22920
ggccgaagcg atccgcaggg aaatcgacga cggccttggc cgccagctcg cggccaaggt 22980
cgcggacgcg cggcgcgtgg cgatgatgaa catgatcgcc ggcggcatgg tgttgttcgc 23040
ggccgccctg gtggtgtggg cctcgttatg aatcgcagag gcgcagatga aaaagcccgg 23100
cgttgccggg ctttgttttt gcgttagctg ggcttgtttg acaggcccaa gctctgactg 23160
cgcccgcgct cgcgctcctg ggcctgtttc ttctcctgct cctgcttgcg catcagggcc 23220
tggtgccgtc gggctgcttc acgcatcgaa tcccagtcgc cggccagctc gggatgctcc 23280
gcgcgcatct tgcgcgtcgc cagttcctcg atcttgggcg cgtgaatgcc catgccttcc 23340
ttgatttcgc gcaccatgtc cagccgcgtg tgcagggtct gcaagcgggc ttgctgttgg 23400
gcctgctgct gctgccaggc ggcctttgta cgcggcaggg acagcaagcc gggggcattg 23460
gactgtagct gctgcaaacg cgcctgctga cggtctacga gctgttctag gcggtcctcg 23520
atgcgctcca cctggtcatg ctttgcctgc acgtagagcg caagggtctg ctggtaggtc 23580
tgctcgatgg gcgcggattc taagagggcc tgctgttccg tctcggcctc ctgggccgcc 23640
tgtagcaaat cctcgccgct gttgccgctg gactgcttta ctgccgggga ctgctgttgc 23700
cctgctcgcg ccgtcgtcgc agttcggctt gcccccactc gattgactgc ttcatttcga 23760
gccgcagcga tgcgatctcg gattgcgtca acggacgggg cagcgcggag gtgtccggct 23820
tctccttggg tgagtcggtc gatgccatag ccaaaggttt ccttccaaaa tgcgtccatt 23880
gctggaccgt gtttctcatt gatgcccgca agcatcttcg gcttgaccgc caggtcaagc 23940
gcgccttcat gggcggtcat gacggacgcc gccatgacct tgccgccgtt gttctcgatg 24000
tagccgcgtaatgaggcaat ggtgccgccc atcgtcagcg tgtcatcgac aacgatgtac 24060
ttctggccgg ggatcacctc cccctcgaaa gtcgggttga acgccaggcg atgatctgaa 24120
ccggctccgg ttcgggcgac cttctcccgc tgcacaatgt ccgtttcgac ctcaaggcca 24180
aggcggtcgg ccagaacgac cgccatcatg gccggaatct tgttgttccc cgccgcctcg 24240
acggcgagga ctggaacgat gcggggcttg tcgtcgccga tcagcgtctt gagctgggca 24300
acagtgtcgt ccgaaatcag gcgctcgacc aaattaagcg ccgcttccgc gtcgccctgc 24360
ttcgcagcct ggtattcagg ctcgttggtc aaagaaccaa ggtcgccgtt gcgaaccacc 24420
ttcgggaagt ctccccacgg tgcgcgctcg gctctgctgt agctgctcaa gacgcctccc 24480
tttttagccg ctaaaactct aacgagtgcg cccgcgactc aacttgacgc tttcggcact 24540
tacctgtgcc ttgccacttg cgtcataggt gatgcttttc gcactcccga tttcaggtac 24600
tttatcgaaa tctgaccggg cgtgcattac aaagttcttc cccacctgtt ggtaaatgct 24660
gccgctatct gcgtggacga tgctgccgtc gtggcgctgc gacttatcgg ccttttgggc 24720
catatagatg ttgtaaatgc caggtttcag ggccccggct ttatctacct tctggttcgt 24780
ccatgcgcct tggttctcgg tctggacaat tctttgccca ttcatgacca ggaggcggtg 24840
tttcattggg tgactcctga cggttgcctc tggtgttaaa cgtgtcctgg tcgcttgccg 24900
gctaaaaaaa agccgacctc ggcagttcga ggccggcttt ccctagagcc gggcgcgtca 24960
aggttgttcc atctatttta gtgaactgcg ttcgatttat cagttacttt cctcccgctt 25020
tgtgtttcct cccactcgtt tccgcgtcta gccgacccct caacatagcg gcctcttctt 25080
gggctgcctt tgcctcttgc cgcgcttcgt cacgctcggc ttgcaccgtc gtaaagcgct 25140
cggcctgcct ggccgcctct tgcgccgcca acttcctttg ctcctggtgg gcctcggcgt 25200
cggcctgcgc cttcgctttc accgctgcca actccgtgcg caaactctcc gcttcgcgcc 25260
tggtggcgtc gcgctcgccg cgaagcgcct gcatttcctg gttggccgcg tccagggtct 25320
tgcggctctc ttctttgaat gcgcgggcgt cctggtgagc gtagtccagc tcggcgcgca 25380
gctcctgcgc tcgacgctcc acctcgtcgg cccgctgcgt cgccagcgcg gcccgctgct 25440
cggctcctgc cagggcggtg cgtgcttcgg ccagggcttg ccgctggcgt gcggccagct 25500
cggccgcctc ggcggcctgc tgctctagca atgtaacgcg cgcctgggct tcttccagct 25560
cgcgggcctg cgcctcgaag gcgtcggcca gctccccgcg cacggcttcc aactcgttgc 25620
gctcacgatc ccagccggct tgcgctgcct gcaacgattc attggcaagg gcctgggcgg 25680
cttgccagag ggcggccacg gcctggttgc cggcctgctg caccgcgtcc ggcacctgga 25740
ctgccagcgg ggcggcctgc gccgtgcgct ggcgtcgcca ttcgcgcatg ccggcgctgg 25800
cgtcgttcat gttgacgcgg gcggccttac gcactgcatc cacggtcggg aagttctccc 25860
ggtcgccttg ctcgaacagc tcgtccgcag ccgcaaaaat gcggtcgcgc gtctctttgt 25920
tcagttccat gttggctccg gtaattggta agaataataa tactcttacc taccttatca 25980
gcgcaagagt ttagctgaac agttctcgac ttaacggcag gttttttagc ggctgaaggg 26040
caggcaaaaa aagccccgca cggtcggcgg gggcaaaggg tcagcgggaa ggggattagc 26100
gggcgtcggg cttcttcatg cgtcggggcc gcgcttcttg ggatggagca cgacgaagcg 26160
cgcacgcgca tcgtcctcgg ccctatcggc ccgcgtcgcg gtcaggaact tgtcgcgcgc 26220
taggtcctcc ctggtgggca ccaggggcat gaactcggcc tgctcgatgt aggtccactc 26280
catgaccgca tcgcagtcga ggccgcgttc cttcaccgtc tcttgcaggt cgcggtacgc 26340
ccgctcgttg agcggctggt aacgggccaa ttggtcgtaa atggctgtcg gccatgagcg 26400
gcctttcctg ttgagccagc agccgacgac gaagccggca atgcaggccc ctggcacaac 26460
caggccgacg ccgggggcag gggatggcag cagctcgcca accaggaacc ccgccgcgat 26520
gatgccgatg ccggtcaacc agcccttgaa actatccggc cccgaaacac ccctgcgcat 26580
tgcctggatg ctgcgccgga tagcttgcaa catcaggagc cgtttctttt gttcgtcagt 26640
catggtccgc cctcaccagt tgttcgtatc ggtgtcggac gaactgaaat cgcaagagct 26700
gccggtatcg gtccagccgc tgtccgtgtc gctgctgccg aagcacggcg aggggtccgc 26760
gaacgccgca gacggcgtat ccggccgcag cgcatcgccc agcatggccc cggtcagcga 26820
gccgccggcc aggtagccca gcatggtgct gttggtcgcc ccggccacca gggccgacgt 26880
gacgaaatcg ccgtcattcc ctctggattg ttcgctgctc ggcggggcag tgcgccgcgc 26940
cggcggcgtc gtggatggct cgggttggct ggcctgcgac ggccggcgaa aggtgcgcag 27000
cagctcgtta tcgaccggct gcggcgtcgg ggccgccgcc ttgcgctgcg gtcggtgttc 27060
cttcttcggc tcgcgcagct tgaacagcat gatcgcggaa accagcagca acgccgcgcc 27120
tacgcctccc gcgatgtaga acagcatcgg attcattctt cggtcctcct tgtagcggaa 27180
ccgttgtctg tgcggcgcgg gtggcccgcg ccgctgtctt tggggatcag ccctcgatga 27240
gcgcgaccag tttcacgtcg gcaaggttcg cctcgaactc ctggccgtcg tcctcgtact 27300
tcaaccaggc atagccttcc gccggcggcc gacggttgag gataaggcgg gcagggcgct 27360
cgtcgtgctc gacctggacg atggcctttt tcagcttgtc cgggtccggc tccttcgcgc 27420
ccttttcctt ggcgtcctta ccgtcctggt cgccgtcctc gccgtcctgg ccgtcgccgg 27480
cctccgcgtc acgctcggca tcagtctggc cgttgaaggc atcgacggtg ttgggatcgc 27540
ggcccttctc gtccaggaac tcgcgcagca gcttgaccgt gccgcgcgtg atttcctggg 27600
tgtcgtcgtc aagccacgcc tcgacttcct ccgggcgctt cttgaaggcc gtcaccagct 27660
cgttcaccac ggtcacgtcg cgcacgcggc cggtgttgaa cgcatcggcg atcttctccg 27720
gcaggtccag cagcgtgacg tgctgggtga tgaacgccgg cgacttgccg atttccttgg 27780
cgatatcgcc tttcttcttg cccttcgcca gctcgcggcc aatgaagtcg gcaatttcgc 27840
gcggggtcag ctcgttgcgt tgcaggttct cgataacctg gtcggcttcg ttgtagtcgt 27900
tgtcgatgaa cgccgggatg gacttcttgc cggcccactt cgagccacgg tagcggcggg 27960
cgccgtgatt gatgatatag cggcccggct gctcctggtt ctcgcgcacc gaaatgggtg 28020
acttcacccc gcgctctttg atcgtggcac cgatttccgc gatgctctcc ggggaaaagc 28080
cggggttgtc ggccgtccgc ggctgatgcg gatcttcgtc gatcaggtcc aggtccagct 28140
cgatagggcc ggaaccgccc tgagacgccg caggagcgtc caggaggctc gacaggtcgc 28200
cgatgctatc caaccccagg ccggacggct gcgccgcgcc tgcggcttcc tgagcggccg 28260
cagcggtgtt tttcttggtg gtcttggctt gagccgcagt cattgggaaa tctccatctt 28320
cgtgaacacg taatcagcca gggcgcgaac ctctttcgat gccttgcgcg cggccgtttt 28380
cttgatcttc cagaccggca caccggatgc gagggcatcg gcgatgctgc tgcgcaggcc 28440
aacggtggcc ggaatcatca tcttggggta cgcggccagc agctcggctt ggtggcgcgc 28500
gtggcgcgga ttccgcgcat cgaccttgct gggcaccatg ccaaggaatt gcagcttggc 28560
gttcttctgg cgcacgttcg caatggtcgt gaccatcttc ttgatgccct ggatgctgta 28620
cgcctcaagc tcgatggggg acagcacata gtcggccgcg aagagggcgg ccgccaggcc 28680
gacgccaagg gtcggggccg tgtcgatcag gcacacgtcg aagccttggt tcgccagggc 28740
cttgatgttc gccccgaaca gctcgcgggc gtcgtccagc gacagccgtt cggcgttcgc 28800
cagtaccggg ttggactcga tgagggcgag gcgcgcggcc tggccgtcgc cggctgcggg 28860
tgcggtttcg gtccagccgc cggcagggac agcgccgaac agcttgcttg catgcaggcc 28920
ggtagcaaag tccttgagcg tgtaggacgc attgccctgg gggtccaggt cgatcacggc 28980
aacccgcaag ccgcgctcga aaaagtcgaa ggcaagatgc acaagggtcg aagtcttgcc 29040
gacgccgcct ttctggttgg ccgtgaccaa agttttcatc gtttggtttc ctgttttttc 29100
ttggcgtccg cttcccactt ccggacgatg tacgcctgat gttccggcag aaccgccgtt 29160
acccgcgcgt acccctcggg caagttcttg tcctcgaacg cggcccacac gcgatgcacc 29220
gcttgcgaca ctgcgcccct ggtcagtccc agcgacgttg cgaacgtcgc ctgtggcttc 29280
ccatcgacta agacgccccg cgctatctcg atggtctgct gccccacttc cagcccctgg 29340
atcgcctcct ggaactggct ttcggtaagc cgtttcttca tggataacac ccataatttg 29400
ctccgcgcct tggttgaaca tagcggtgac agccgccagc acatgagaga agtttagcta 29460
aacatttctc gcacgtcaac acctttagcc gctaaaactc gtccttggcg taacaaaaca 29520
aaagcccgga aaccgggctt tcgtctcttg ccgcttatgg ctctgcaccc ggctccatca 29580
ccaacaggtc gcgcacgcgc ttcactcggt tgcggatcga cactgccagc ccaacaaagc 29640
cggttgccgc cgccgccagg atcgcgccga tgatgccggc cacaccggcc atcgcccacc 29700
aggtcgccgc cttccggttc cattcctgct ggtactgctt cgcaatgctg gacctcggct 29760
caccataggc tgaccgctcg atggcgtatg ccgcttctcc ccttggcgta aaacccagcg 29820
ccgcaggcgg cattgccatg ctgcccgccg ctttcccgac cacgacgcgc gcaccaggct 29880
tgcggtccag accttcggcc acggcgagct gcgcaaggac ataatcagcc gccgacttgg 29940
ctccacgcgc ctcgatcagc tcttgcactc gcgcgaaatc cttggcctcc acggccgcca 30000
tgaatcgcgc acgcggcgaa ggctccgcag ggccggcgtc gtgatcgccg ccgagaatgc 30060
ccttcaccaa gttcgacgac acgaaaatca tgctgacggc tatcaccatc atgcagacgg 30120
atcgcacgaa cccgctgaat tgaacacgag cacggcaccc gcgaccacta tgccaagaat 30180
gcccaaggta aaaattgccg gccccgccat gaagtccgtg aatgccccga cggccgaagt 30240
gaagggcagg ccgccaccca ggccgccgcc ctcactgccc ggcacctggt cgctgaatgt 30300
cgatgccagc acctgcggca cgtcaatgct tccgggcgtc gcgctcgggc tgatcgccca 30360
tcccgttact gccccgatcc cggcaatggc aaggactgcc agcgctgcca tttttggggt 30420
gaggccgttc gcggccgagg ggcgcagccc ctggggggat gggaggcccg cgttagcggg 30480
ccgggagggt tcgagaaggg ggggcacccc ccttcggcgt gcgcggtcac gcgcacaggg 30540
cgcagccctg gttaaaaaca aggtttataa atattggttt aaaagcaggt taaaagacag 30600
gttagcggtg gccgaaaaac gggcggaaac ccttgcaaat gctggatttt ctgcctgtgg 30660
acagcccctc aaatgtcaat aggtgcgccc ctcatctgtc agcactctgc ccctcaagtg 30720
tcaaggatcg cgcccctcat ctgtcagtag tcgcgcccct caagtgtcaa taccgcaggg 30780
cacttatccc caggcttgtc cacatcatct gtgggaaact cgcgtaaaat caggcgtttt 30840
cgccgatttg cgaggctggc cagctccacg tcgccggccg aaatcgagcc tgcccctcat 30900
ctgtcaacgc cgcgccgggt gagtcggccc ctcaagtgtc aacgtccgcc cctcatctgt 30960
cagtgagggc caagttttcc gcgaggtatc cacaacgccg gcggccgcgg tgtctcgcac 31020
acggcttcga cggcgtttct ggcgcgtttg cagggccata gacggccgcc agcccagcgg 31080
cgagggcaac cagcccggtg agcgtcggaa aggcgctgga agccccgtag cgacgcggag 31140
aggggcgaga caagccaagg gcgcaggctc gatgcgcagc acgacatagc cggttctcgc 31200
aaggacgaga atttccctgc ggtgcccctc aagtgtcaat gaaagtttcc aacgcgagcc 31260
attcgcgaga gccttgagtc cacgctagat gagagctttg ttgtaggtgg accagttggt 31320
gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg 31380
atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cacgttgtgt ctcaaaatct 31440
ctgatgttac attgcacaag ataaaaatat atcatcatga acaataaaac tgtctgctta 31500
cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctcgac 31560
tctagagctc gttcctcgag gaacggtacc tgcggggaag cttacaataa tgtgtgttgt 31620
taagtcttgt tgcctgtcat cgtctgactg actttcgtca taaatcccgg cctccgtaac 31680
ccagctttgg gcaagctcac ggatttgatc cggcggaacg ggaatatcga gatgccgggc 31740
tgaacgctgc agttccagct ttccctttcg ggacaggtac tccagctgat tgattatctg 31800
ctgaagggtc ttggttccac ctcctggcac aatgcgaatg attacttgag cgcgatcggg 31860
catccaattt tctcccgtca ggtgcgtggt caagtgctac aaggcacctt tcagtaacga 31920
gcgaccgtcg atccgtcgcc gggatacgga caaaatggag cgcagtagtc catcgagggc 31980
ggcgaaagcc tcgccaaaag caatacgttc atctcgcaca gcctccagat ccgatcgagg 32040
gtcttcggcg taggcagata gaagcatgga tacattgctt gagagtattc cgatggactg 32100
aagtatggct tccatctttt ctcgtgtgtc tgcatctatt tcgagaaagc ccccgatgcg 32160
gcgcaccgca acgcgaattg ccatactatc cgaaagtccc agcaggcgcg cttgatagga 32220
aaaggtttca tactcggccg atcgcagacg ggcactcacg accttgaacc cttcaacttt 32280
cagggatcga tgctggttga tggtagtctc actcgacgtg gctctggtgt gttttgacat 32340
agcttcctcc aaagaaagcg gaaggtctgg atactccagc acgaaatgtg cccgggtaga 32400
cggatggaag tctagccctg ctcaatatga aatcaacagt acatttacag tcaatactga 32460
atatacttgc tacatttgca attgtcttat aacgaatgtg aaataaaaat agtgtaacaa 32520
cgcttttact catcgataat cacaaaaaca tttatacgaa caaaaataca aatgcactcc 32580
ggtttcacag gataggcggg atcagaatat gcaacttttg acgttttgtt ctttcaaagg 32640
gggtgctggc aaaaccaccg cactcatggg cctttgcgct gctttggcaa atgacggtaa 32700
acgagtggcc ctctttgatg ccgacgaaaa ccggcctctg acgcgatgga gagaaaacgc 32760
cttacaaagc agtactggga tcctcgctgt gaagtctatt ccgccgacga aatgcccctt 32820
cttgaagcag cctatgaaaa tgccgagctc gaaggatttg attatgcgtt ggccgatacg 32880
cgtggcggct cgagcgagct caacaacaca atcatcgcta gctcaaacct gcttctgatc 32940
cccaccatgc taacgccgct cgacatcgat gaggcactat ctacctaccg ctacgtcatc 33000
gagctgctgt tgagtgaaaa tttggcaatt cctacagctg ttttgcgcca acgcgtcccg 33060
gtcggccgat tgacaacatc gcaacgcagg atgtcagaga cgctagagag ccttccagtt 33120
gtaccgtctc ccatgcatga aagagatgca tttgccgcga tgaaagaacg cggcatgttg 33180
catcttacat tactaaacac gggaactgat ccgacgatgc gcctcataga gaggaatctt 33240
cggattgcga tggaggaagt cgtggtcatt tcgaaactga tcagcaaaat cttggaggct 33300
tgaagatggc aattcgcaag cccgcattgt cggtcggcga agcacggcgg cttgctggtg 33360
ctcgacccga gatccaccat cccaacccga cacttgttcc ccagaagctg gacctccagc 33420
acttgcctga aaaagccgac gagaaagacc agcaacgtga gcctctcgtc gccgatcaca 33480
tttacagtcc cgatcgacaa cttaagctaa ctgtggatgc ccttagtcca cctccgtccc 33540
cgaaaaagct ccaggttttt ctttcagcgc gaccgcccgc gcctcaagtg tcgaaaacat 33600
atgacaacct cgttcggcaa tacagtccct cgaagtcgct acaaatgatt ttaaggcgcg 33660
cgttggacga tttcgaaagc atgctggcag atggatcatt tcgcgtggcc ccgaaaagtt 33720
atccgatccc ttcaactaca gaaaaatccg ttctcgttca gacctcacgc atgttcccgg 33780
ttgcgttgct cgaggtcgct cgaagtcatt ttgatccgtt ggggttggag accgctcgag 33840
ctttcggcca caagctggct accgccgcgc tcgcgtcatt ctttgctgga gagaagccat 33900
cgagcaattg gtgaagaggg acctatcgga acccctcacc aaatattgag tgtaggtttg 33960
aggccgctgg ccgcgtcctc agtcaccttt tgagccagat aattaagagc caaatgcaat 34020
tggctcaggc tgccatcgtc cccccgtgcg aaacctgcac gtccgcgtca aagaaataac 34080
cggcacctct tgctgttttt atcagttgag ggcttgacgg atccgcctca agtttgcggc 34140
gcagccgcaa aatgagaaca tctatactcc tgtcgtaaac ctcctcgtcg cgtactcgac 34200
tggcaatgag aagttgctcg cgcgatagaa cgtcgcgggg tttctctaaa aacgcgagga 34260
gaagattgaa ctcacctgcc gtaagtttca cctcaccgcc agcttcggac atcaagcgac 34320
gttgcctgag attaagtgtc cagtcagtaa aacaaaaaga ccgtcggtct ttggagcgga 34380
caacgttggg gcgcacgcgc aaggcaaccc gaatgcgtgc aagaaactct ctcgtactaa 34440
acggcttagc gataaaatca cttgctccta gctcgagtgc aacaacttta tccgtctcct 34500
caaggcggtc gccactgata attatgattg gaatatcaga ctttgccgcc agatttcgaa 34560
cgatctcaag cccatcttca cgacctaaat ttagatcaac aaccacgaca tcgaccgtcg 34620
cggaagagag tactctagtg aactgggtgc tgtcggctac cgcggtcact ttgaaggcgt 34680
ggatcgtaag gtattcgata ataagatgcc gcatagcgac atcgtcatcg ataagaagaa 34740
cgtgtttcaa cggctcacct ttcaatctaa aatctgaacc cttgttcaca gcgcttgaga 34800
aattttcacg tgaaggatgt acaatcatct ccagctaaat gggcagttcg tcagaattgc 34860
ggctgaccgc ggatgacgaa aatgcgaacc aagtatttca attttatgac aaaagttctc 34920
aatcgttgtt acaagtgaaa cgcttcgagg ttacagctac tattgattaa ggagatcgcc 34980
tatggtctcg ccccggcgtc gtgcgtccgc cgcgagccag atctcgccta cttcataaac 35040
gtcctcatag gcacggaatg gaatgatgac atcgatcgcc gtagagagca tgtcaatcag 35100
tgtgcgatct tccaagctag caccttgggc gctacttttg acaagggaaa acagtttctt 35160
gaatccttgg attggattcg cgccgtgtat tgttgaaatc gatcccggat gtcccgagac 35220
gacttcactc agataagccc atgctgcatc gtcgcgcatc tcgccaagca atatccggtc 35280
cggccgcata cgcagacttg cttggagcaa gtgctcggcg ctcacagcac ccagcccagc 35340
accgttcttg gagtagagta gtctaacatg attatcgtgt ggaatgacga gttcgagcgt 35400
atcttctatg gtgattagcc tttcctgggg ggggatggcg ctgatcaagg tcttgctcat 35460
tgttgtcttg ccgcttccgg tagggccaca tagcaacatc gtcagtcggc tgacgacgca 35520
tgcgtgcaga aacgcttcca aatccccgtt gtcaaaatgc tgaaggatag cttcatcatc 35580
ctgattttgg cgtttccttc gtgtctgcca ctggttccac ctcgaagcat cataacggga 35640
ggagacttct ttaagaccag aaacacgcga gcttggccgt cgaatggtca agctgacggt 35700
gcccgaggga acggtcggcg gcagacagat ttgtagtcgt tcaccaccag gaagttcagt 35760
ggcgcagagg gggttacgtg gtccgacatc ctgctttctc agcgcgcccg ctaaaatagc 35820
gatatcttca agatcatcat aagagacggg caaaggcatc ttggtaaaaa tgccggcttg 35880
gcgcacaaat gcctctccag gtcgattgat cgcaatttct tcagtcttcg ggtcatcgag 35940
ccattccaaa atcggcttca gaagaaagcg tagttgcgga tccacttcca tttacaatgt 36000
atcctatctc taagcggaaa tttgaattca ttaagagcgg cggttcctcc cccgcgtggc 36060
gccgccagtc aggcggagct ggtaaacacc aaagaaatcg aggtcccgtg ctacgaaaat 36120
ggaaacggtg tcaccctgat tcttcttcag ggttggcggt atgttgatgg ttgccttaag 36180
ggctgtctca gttgtctgct caccgttatt ttgaaagctg ttgaagctca tcccgccacc 36240
cgagctgccg gcgtaggtgc tagctgcctg gaaggcgcct tgaacaacac tcaagagcat 36300
agctccgcta aaacgctgcc agaagtggct gtcgaccgag cccggcaatc ctgagcgacc 36360
gagttcgtcc gcgcttggcg atgttaacga gatcatcgca tggtcaggtg tctcggcgcg 36420
atcccacaac acaaaaacgc gcccatctcc ctgttgcaag ccacgctgta tttcgccaac 36480
aacggtggtg ccacgatcaa gaagcacgat attgttcgtt gttccacgaa tatcctgagg 36540
caagacacac tttacatagc ctgccaaatt tgtgtcgatt gcggtttgca agatgcacgg 36600
aattattgtc ccttgcgtta ccataaaatc ggggtgcggc aagagcgtgg cgctgctggg 36660
ctgcagctcg gtgggtttca tacgtatcga caaatcgttc tcgccggaca cttcgccatt 36720
cggcaaggag ttgtcgtcac gcttgccttc ttgtcttcgg cccgtgtcgc cctgaatggc 36780
gcgtttgctg accccttgat cgccgctgct atatgcaaaa atcggtgttt cttccggccg 36840
tggctcatgc cgctccggtt cgcccctcgg cggtagagga gcagcaggct gaacagcctc 36900
ttgaaccgct ggaggatccg gcggcacctc aatcggagct ggatgaaatg gcttggtgtt 36960
tgttgcgatc aaagttgacg gcgatgcgtt ctcattcacc ttcttttggc gcccacctag 37020
ccaaatgagg cttaatgata acgcgagaac gacacctccg acgatcaatt tctgagaccc 37080
cgaaagacgc cggcgatgtt tgtcggagac cagggatcca gatgcatcaa cctcatgtgc 37140
cgcttgctga ctatcgttat tcatcccttc gcccccttca ggacgcgttt cacatcgggc 37200
ctcaccgtgc ccgtttgcgg cctttggcca acgggatcgt aagcggtgtt ccagatacat 37260
agtactgtgt ggccatccct cagacgccaa cctcgggaaa ccgaagaaat ctcgacatcg 37320
ctccctttaa ctgaatagtt ggcaacagct tccttgccat caggattgat ggtgtagatg 37380
gagggtatgc gtacattgcc cggaaagtgg aataccgtcg taaatccatt gtcgaagact 37440
tcgagtggca acagcgaacg atcgccttgg gcgacgtagt gccaattact gtccgccgca 37500
ccaagggctg tgacaggctg atccaataaa ttctcagctt tccgttgata ttgtgcttcc 37560
gcgtgtagtc tgtccacaac agccttctgt tgtgcctccc ttcgccgagc cgccgcatcg 37620
tcggcggggt aggcgaattg gacgctgtaa tagagatcgg gctgctcttt atcgaggtgg 37680
gacagagtct tggaacttat actgaaaaca taacggcgca tcccggagtc gcttgcggtt 37740
agcacgatta ctggctgagg cgtgaggacc tggcttgcct tgaaaaatag ataatttccc 37800
cgcggtaggg ctgctagatc tttgctattt gaaacggcaa ccgctgtcac cgtttcgttc 37860
gtggcgaatg ttacgaccaa agtagctcca accgccgtcg agaggcgcac cacttgatcg 37920
ggattgtaag ccaaataacg catgcgcgga tctagcttgc ccgccattgg agtgtcttca 37980
gcctccgcac cagtcgcagc ggcaaataaa catgctaaaa tgaaaagtgc ttttctgatc 38040
atggttcgct gtggcctacg tttgaaacgg tatcttccga tgtctgatag gaggtgacaa 38100
ccagacctgc cgggttggtt agtctcaatc tgccgggcaa gctggtcacc ttttcgtagc 38160
gaactgtcgc ggtccacgta ctcaccacag gcattttgcc gtcaacgacg agggtccttt 38220
tatagcgaat ttgctgcgtg cttggagtta catcatttga agcgatgtgc tcgacctcca 38280
ccctgccgcg tttgccaaga atgacttgag gcgaactggg attgggatag ttgaagaatt 38340
gctggtaatc ctggcgcact gttggggcac tgaagttcga taccaggtcg taggcgtact 38400
gagcggtgtc ggcatcataa ctctcgcgca ggcgaacgta ctcccacaat gaggcgttaa 38460
cgacggcctc ctcttgagtt gcaggcaatc gcgagacaga cacctcgctg tcaacggtgc 38520
cgtccggccg tatccataga tatacgggca caagcctgct caacggcacc attgtggcta 38580
tagcgaacgc ttgagcaaca tttcccaaaa tcgcgatagc tgcgacagct gcaatgagtt 38640
tggagagacg tcgcgccgat ttcgctcgcg cggtttgaaa ggcttctact tccttatagt 38700
gctcggcaag gctttcgcgc gccactagca tggcatattc aggccccgtc atagcgtcca 38760
cccgaattgc cgagctgaag atctgacgga gtaggctgcc atcgccccac attcagcggg 38820
aagatcgggc ctttgcagct cgctaatgtg tcgtttgtct ggcagccgct caaagcgaca 38880
actaggcaca gcaggcaata cttcatagaa ttctccattg aggcgaattt ttgcgcgacc 38940
tagcctcgct caacctgagc gaagcgacgg tacaagctgc tggcagattg ggttgcgccg 39000
ctccagtaac tgcctccaat gttgccggcg atcgccggca aagcgacaat gagcgcatcc 39060
cctgtcagaa aaaacatatc gagttcgtaa agaccaatga tcttggccgc ggtcgtaccg 39120
gcgaaggtga ttacaccaag cataagggtg agcgcagtcg cttcggttag gatgacgatc 39180
gttgccacga ggtttaagag gagaagcaag agaccgtagg tgataagttg cccgatccac 39240
ttagctgcga tgtcccgcgt gcgatcaaaa atatatccga cgaggatcag aggcccgatc 39300
gcgagaagca ctttcgtgag aattccaacg gcgtcgtaaa ctccgaaggc agaccagagc 39360
gtgccgtaaa ggacccactg tgccccttgg aaagcaagga tgtcctggtc gttcatcgga 39420
ccgatttcgg atgcgatttt ctgaaaaacg gcctgggtca cggcgaacat tgtatccaac 39480
tgtgccggaa cagtctgcag aggcaagccg gttacactaa actgctgaac aaagtttggg 39540
accgtctttt cgaagatgga aaccacatag tcttggtagt tagcctgccc aacaattaga 39600
gcaacaacga tggtgaccgt gatcacccga gtgataccgc tacgggtatc gacttcgccg 39660
cgtatgacta aaataccctg aacaataatc caaagagtga cacaggcgat caatggcgca 39720
ctcaccgcct cctggatagt ctcaagcatc gagtccaagc ctgtcgtgaa ggctacatcg 39780
aagatcgtat gaatggccgt aaacggcgcc ggaatcgtga aattcatcga ttggacctga 39840
acttgactgg tttgtcgcat aatgttggat aaaatgagct cgcattcggc gaggatgcgg 39900
gcggatgaac aaatcgccca gccttagggg agggcaccaa agatgacagc ggtcttttga 39960
tgctccttgc gttgagcggc cgcctcttcc gcctcgtgaa ggccggcctg cgcggtagtc 40020
atcgttaata ggcttgtcgc ctgtacattt tgaatcattg cgtcatggat ctgcttgaga 40080
agcaaaccat tggtcacggt tgcctgcatg atattgcgag atcgggaaag ctgagcagac 40140
gtatcagcat tcgccgtcaa gcgtttgtcc atcgtttcca gattgtcagc cgcaatgcca 40200
gcgctgtttg cggaaccggt gatctgcgat cgcaacaggt ccgcttcagc atcactaccc 40260
acgactgcac gatctgtatc gctggtgatc gcacgtgccg tggtcgacat tggcattcgc 40320
ggcgaaaaca tttcattgtc taggtccttc gtcgaaggat actgattttt ctggttgagc 40380
gaagtcagta gtccagtaac gccgtaggcc gacgtcaaca tcgtaaccat cgctatagtc 40440
tgagtgagat tctccgcagt cgcgagcgca gtcgcgagcg tctcagcctc cgttgccggg 40500
tcgctaacaa caaactgcgc ccgcgcgggc tgaatatata gaaagctgca ggtcaaaact 40560
gttgcaataa gttgcgtcgt cttcatcgtt tcctacctta tcaatcttct gcctcgtggt 40620
gacgggccat gaattcgctg agccagccag atgagttgcc ttcttgtgcc tcgcgtagtc 40680
gagttgcaaa gcgcaccgtg ttggcacgcc ccgaaagcac ggcgacatat tcacgcatat 40740
cccgcagatc aaattcgcag atgacgcttc cactttctcg tttaagaaga aacttacggc 40800
tgccgaccgt catgtcttca cggatcgcct gaaattcctt ttcggtacat ttcagtccat 40860
cgacataagc cgatcgatct gcggttggtg atggatagaa aatcttcgtc atacattgcg 40920
caaccaagct ggctcctagc ggcgattcca gaacatgctc tggttgctgc gttgccagta 40980
ttagcatccc gttgtttttt cgaacggtca ggaggaattt gtcgacgaca gtcgaaaatt 41040
tagggtttaa caaataggcg cgaaactcat cgcagctcat cacaaaacgg cggccgtcga 41100
tcatggctcc aatccgatgc aggagatatg ctgcagcggg agcgcatact tcctcgtatt 41160
cgagaagatg cgtcatgtcg aagccggtaa tcgacggatc taactttact tcgtcaactt 41220
cgccgtcaaa tgcccagcca agcgcatggc cccggcacca gcgttggagc cgcgctcctg 41280
cgccttcggc gggcccatgc aacaaaaatt cacgtaaccc cgcgattgaa cgcatttgtg 41340
gatcaaacga gagctgacga tggataccac ggaccagacg gcggttctct tccggagaaa 41400
tcccaccccg accatcactc tcgatgagag ccacgatcca ttcgcgcaga aaatcgtgtg 41460
aggctgctgt gttttctagg ccacgcaacg gcgccaaccc gctgggtgtg cctctgtgaa 41520
gtgccaaata tgttcctcct gtggcgcgaa ccagcaattc gccaccccgg tccttgtcaa 41580
agaacacgac cgtacctgca cggtcgacca tgctctgttc gagcatggct agaacaaaca 41640
tcatgagcgt cgtcttaccc ctcccgatag gcccgaatat tgccgtcatg ccaacatcgt 41700
gctcatgcgg gatatagtcg aaaggcgttc cgccattggt acgaaatcgg gcaatcgcgt 41760
tgccccagtg gcctgagctg gcgccctctg gaaagttttc gaaagagaca aaccctgcga 41820
aattgcgtga agtgattgcg ccagggcgtg tgcgccactt aaaattcccc ggcaattggg 41880
accaataggc cgcttccata ccaatacctt cttggacaac cacggcacct gcatccgcca 41940
ttcgtgtccg agcccgcgcg cccctgtccc caagactatt gagatcgtct gcatagacgc 42000
aaaggctcaa atgatgtgag cccataacga attcgttgct cgcaagtgcg tcctcagcct 42060
cggataattt gccgatttga gtcacggctt tatcgccgga actcagcatc tggctcgatt 42120
tgaggctaag tttcgcgtgc gcttgcgggc gagtcaggaa cgaaaaactc tgcgtgagaa 42180
caagtggaaa atcgagggat agcagcgcgt tgagcatgcc cggccgtgtt tttgcagggt 42240
attcgcgaaa cgaatagatg gatccaacgt aactgtcttt tggcgttctg atctcgagtc 42300
ctcgcttgcc gcaaatgact ctgtcggtat aaatcgaagc gccgagtgag ccgctgacga 42360
ccggaaccgg tgtgaaccga ccagtcatga tcaaccgtag cgcttcgcca atttcggtga 42420
agagcacacc ctgcttctcg cggatgccaa gacgatgcag gccatacgct ttaagagagc 42480
cagcgacaac atgccaaaga tcttccatgt tcctgatctg gcccgtgaga tcgttttccc 42540
tttttccgct tagcttggtg aacctcctct ttaccttccc taaagccgcc tgtgggtaga 42600
caatcaacgt aaggaagtgt tcattgcgga ggagttggcc ggagagcacg cgctgttcaa 42660
aagcttcgtt caggctagcg gcgaaaacac tacggaagtg tcgcggcgcc gatgatggca 42720
cgtcggcatg acgtacgagg tgagcatata ttgacacatg atcatcagcg atattgcgca 42780
acagcgtgtt gaacgcacga caacgcgcat tgcgcatttc agtttcctca agctcgaatg 42840
caacgccatc aattctcgca atggtcatga tcgatccgtc ttcaagaagg acgatatggt 42900
cgctgaggtg gccaatataa gggagataga tctcaccgga tctttcggtc gttccactcg 42960
cgccgagcat cacaccattc ctctccctcg tgggggaacc ctaattggat ttgggctaac 43020
agtagcgccc ccccaaactg cactatcaat gcttcttccc gcggtccgca aaaatagcag 43080
gacgacgctc gccgcattgt agtctcgctc cacgatgagc cgggctgcaa accataacgg 43140
cacgagaacg acttcgtaga gcgggttctg aacgataacg atgacaaagc cggcgaacat 43200
catgaataac cctgccaatg tcagtggcac cccaagaaac aatgcgggcc gtgtggctgc 43260
gaggtaaagg gtcgattctt ccaaacgatc agccatcaac taccgccagt gagcgtttgg 43320
ccgaggaagc tcgccccaaa catgataaca atgccgccga cgacgccggc aaccagccca 43380
agcgaagccc gcccgaacat ccaggagatc ccgatagcga caatgccgag aacagcgagt 43440
gactggccga acggaccaag gataaacgtg catatattgt taaccattgt ggcggggtca 43500
gtgccgccac ccgcagattg cgctgcggcg ggtccggatg aggaaatgct ccatgcaatt 43560
gcaccgcaca agcttggggc gcagctcgat atcacgcgca tcatcgcatt cgagagcgag 43620
aggcgattta gatgtaaacg gtatctctca aagcatcgca tcaatgcgca cctccttagt 43680
ataagtcgaa taagacttga ttgtcgtctg cggatttgcc gttgtcctgg tgtggcggtg 43740
gcggagcgat taaaccgcca gcgccatcct cctgcgagcg gcgctgatat gacccccaaa 43800
catcccacgt ctcttcggat tttagcgcct cgtgatcgtc ttttggaggc tcgattaacg 43860
cgggcaccag cgattgagca gctgtttcaa cttttcgcac gtagccgttt gcaaaaccgc 43920
cgatgaaatt accggtgttg taagcggaga tcgcccgacg aagcgcaaat tgcttctcgt 43980
caatcgtttc gccgcctgca taacgacttt tcagcatgtt tgcagcggca gataatgatg 44040
tgcacgcctg gagcgcaccg tcaggtgtca gaccgagcat agaaaaattt cgagagttta 44100
tttgcatgag gccaacatcc agcgaatgcc gtgcatcgag acggtgcctg acgacttggg 44160
ttgcttggct gtgatcttgc cagtgaagcg tttcgccggt cgtgttgtca tgaatcgcta 44220
aaggatcaaa gcgactctcc accttagcta tcgccgcaag cgtagatgtc gcaactgatg 44280
gggcacactt gcgagcaaca tggtcaaact cagcagatga gagtggcgtg gcaaggctcg 44340
acgaacagaa ggagaccatc aaggcaagag aaagcgaccc cgatctctta agcatacctt 44400
atctccttag ctcgcaacta acaccgcctc tcccgttgga agaagtgcgt tgttttatgt 44460
tgaagattat cgggagggtc ggttactcga aaattttcaa ttgcttcttt atgatttcaa 44520
ttgaagcgag aaacctcgcc cggcgtcttg gaacgcaaca tggaccgaga accgcgcatc 44580
catgactaag caaccggatc gacctattca ggccgcagtt ggtcaggtca ggctcagaac 44640
gaaaatgctc ggcgaggtta cgctgtctgt aaacccattc gatgaacggg aagcttcctt 44700
ccgattgctc ttggcaggaa tattggccca tgcctgcttg cgctttgcaa atgctcttat 44760
cgcgttggta tcatatgcct tgtccgccag cagaaacgca ctctaagcga ttatttgtaa 44820
aaatgtttcg gtcatgcggc ggtcatgggc ttgacccgct gtcagcgcaa gacggatcgg 44880
tcaaccgtcg gcatcgacaa cagcgtgaat cttggtggtc aaaccgccac gggaacgtcc 44940
catacagcca tcgtcttgat cccgctgttt cccgtcgccg catgttggtg gacgcggaca 45000
caggaactgt caatcatgac gacattctat cgaaagcctt ggaaatcaca ctcagaatat 45060
gatcccagac gtctgcctca cgccatcgta caaagcgatt gtagcaggtt gtacaggaac 45120
cgtatcgatc aggaacgtct gcccagggcg ggcccgtccg gaagcgccac aagatgacat 45180
tgatcacccg cgtcaacgcg cggcacgcga cgcggcttat ttgggaacaa aggactgaac 45240
aacagtccat tcgaaatcgg tgacatcaaa gcggggacgg gttatcagtg gcctccaagt 45300
caagcctcaa tgaatcaaaa tcagaccgat ttgcaaacct gatttatgag tgtgcggcct 45360
aaatgatgaa atcgtccttc tagatcgcct ccgtggtgta gcaacacctc gcagtatcgc 45420
cgtgctgacc ttggccaggg aattgactgg caagggtgct ttcacatgac cgctcttttg 45480
gccgcgatag atgatttcgt tgctgctttg ggcacgtaga aggagagaag tcatatcgga 45540
gaaattcctc ctggcgcgag agcctgctct atcgcgacgg catcccactg tcgggaacag 45600
accggatcat tcacgaggcg aaagtcgtca acacatgcgt tataggcatc ttcccttgaa 45660
ggatgatctt gttgctgcca atctggaggt gcggcagccg caggcagatg cgatctcagc 45720
gcaacttgcg gcaaaacatc tcactcacct gaaaaccact agcgagtctc gcgatcagac 45780
gaaggccttt tacttaacga cacaatatcc gatgtctgca tcacaggcgt cgctatccca 45840
gtcaatacta aagcggtgca ggaactaaag attactgatg acttaggcgt gccacgaggc 45900
ctgagacgac gcgcgtagac agttttttga aatcattatc aaagtgatgg cctccgctga 45960
agcctatcac ctctgcgccg gtctgtcgga gagatgggca agcattatta cggtcttcgc 46020
gcccgtacat gcattggacg attgcagggt caatggatct gagatcatcc agaggattgc 46080
cgcccttacc ttccgtttcg agttggagcc agcccctaaa tgagacgaca tagtcgactt 46140
gatgtgacaa tgccaagaga gagatttgct taacccgatt tttttgctca agcgtaagcc 46200
tattgaagct tgccggcatg acgtccgcgc cgaaagaata tcctacaagt aaaacattct 46260
gcacaccgaa atgcttggtg tagacatcga ttatgtgacc aagatcctta gcagtttcgc 46320
ttggggaccg ctccgaccag aaataccgaa gtgaactgac gccaatgaca ggaatccctt 46380
ccgtctgcag ataggtacca tcgatagatc tgctgcctcg cgcgtttcgg tgatgacggt 46440
gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc 46500
gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggcgcagcc 46560
atgacccagt cacgtagcga tagcggagtg tatactggct taactatgcg gcatcagagc 46620
agattgtact gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa 46680
aataccgcat caggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 46740
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 46800
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 46860
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 46920
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 46980
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 47040
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 47100
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 47160
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 47220
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 47280
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 47340
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 47400
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 47460
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 47520
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 47580
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 47640
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 47700
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 47760
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 47820
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 47880
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 47940
ttgttgccat tgctgcaggg gggggggggg ggggggactt ccattgttca ttccacggac 48000
aaaaacagag aaaggaaacg acagaggcca aaaagcctcg ctttcagcac ctgtcgtttc 48060
ctttcttttc agagggtatt ttaaataaaa acattaagtt atgacgaaga agaacggaaa 48120
cgccttaaac cggaaaattt tcataaatag cgaaaacccg cgaggtcgcc gccccgtagt 48180
cggatcaccg gaaaggaccc gtaaagtgat aatgattatc atctacatat cacaacgtgc 48240
gtggaggcca tcaaaccacg tcaaataatc aattatgacg caggtatcgt attaattgat 48300
ctgcatcaac ttaacgtaaa aacaacttca gacaatacaa atcagcgaca ctgaatacgg 48360
ggcaacctca tgtccccccc cccccccccc ctgcaggcat cgtggtgtca cgctcgtcgt 48420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 48480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 48540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 48600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 48660
tgcggcgacc gagttgctct tgcccggcgt caacacggga taataccgcg ccacatagca 48720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 48780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 48840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 48900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 48960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 49020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 49080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtcttc 49140
aagaattggt cgacgatctt gctgcgttcg gatattttcg tggagttccc gccacagacc 49200
cggattgaag gcgagatcca gcaactcgcg ccagatcatc ctgtgacgga actttggcgc 49260
gtgatgactg gccaggacgt cggccgaaag agcgacaagc agatcacgct tttcgacagc 49320
gtcggatttg cgatcgagga tttttcggcg ctgcgctacg tccgcgaccg cgttgaggga 49380
tcaagccaca gcagcccact cgaccttcta gccgacccag acgagccaag ggatcttttt 49440
ggaatgctgc tccgtcgtca ggctttccga cgtttgggtg gttgaacaga agtcattatc 49500
gtacggaatg ccaagcactc ccgaggggaa ccctgtggtt ggcatgcaca tacaaatgga 49560
cgaacggata aaccttttca cgccctttta aatatccgtt attctaataa acgctctttt 49620
ctcttaggtt tacccgccaa tatatcctgt caaacactga tagtttaaac tgaaggcggg 49680
aaacgacaat ctgatcatga gcggagaatt aagggagtca cgttatgacc cccgccgatg 49740
acgcgggaca agccgtttta cgtttggaac tgacagaacc gcaacgttga aggagccact 49800
cagcaagctg gtacgattgt aatacgactc actatagggc gaattgagcg ctgtttaaac 49860
gctcttcaac tggaagagcg gttacccgga ccgaagcttg catgcctgca g 49911
<210>7
<211>36909
<212>DNA
<213>人工序列
<220>
<223>PHP10523构建体
<400>7
tctagagctc gttcctcgag gcctcgaggc ctcgaggaac ggtacctgcg gggaagctta 60
caataatgtg tgttgttaag tcttgttgcc tgtcatcgtc tgactgactt tcgtcataaa 120
tcccggcctc cgtaacccag ctttgggcaa gctcacggat ttgatccggc ggaacgggaa 180
tatcgagatg ccgggctgaa cgctgcagtt ccagctttcc ctttcgggac aggtactcca 240
gctgattgat tatctgctga agggtcttgg ttccacctcc tggcacaatg cgaatgatta 300
cttgagcgcg atcgggcatc caattttctc ccgtcaggtg cgtggtcaag tgctacaagg 360
cacctttcag taacgagcga ccgtcgatcc gtcgccggga tacggacaaa atggagcgca 420
gtagtccatc gagggcggcg aaagcctcgc caaaagcaat acgttcatct cgcacagcct 480
ccagatccga tcgagggtct tcggcgtagg cagatagaag catggataca ttgcttgaga 540
gtattccgat ggactgaagt atggcttcca tcttttctcg tgtgtctgca tctatttcga 600
gaaagccccc gatgcggcgc accgcaacgc gaattgccat actatccgaa agtcccagca 660
ggcgcgcttg ataggaaaag gtttcatact cggccgatcg cagacgggca ctcacgacct 720
tgaacccttc aactttcagg gatcgatgct ggttgatggt agtctcactc gacgtggctc 780
tggtgtgttt tgacatagct tcctccaaag aaagcggaag gtctggatac tccagcacga 840
aatgtgcccg ggtagacgga tggaagtcta gccctgctca atatgaaatc aacagtacat 900
ttacagtcaa tactgaatat acttgctaca tttgcaattg tcttataacg aatgtgaaat 960
aaaaatagtg taacaacgct tttactcatc gataatcaca aaaacattta tacgaacaaa 1020
aatacaaatg cactccggtt tcacaggata ggcgggatca gaatatgcaa cttttgacgt 1080
tttgttcttt caaagggggt gctggcaaaa ccaccgcact catgggcctt tgcgctgctt 1140
tggcaaatga cggtaaacga gtggccctct ttgatgccga cgaaaaccgg cctctgacgc 1200
gatggagaga aaacgcctta caaagcagta ctgggatcct cgctgtgaag tctattccgc 1260
cgacgaaatg ccccttcttg aagcagccta tgaaaatgcc gagctcgaag gatttgatta 1320
tgcgttggcc gatacgcgtg gcggctcgag cgagctcaac aacacaatca tcgctagctc 1380
aaacctgctt ctgatcccca ccatgctaac gccgctcgac atcgatgagg cactatctac 1440
ctaccgctac gtcatcgagc tgctgttgag tgaaaatttg gcaattccta cagctgtttt 1500
gcgccaacgc gtcccggtcg gccgattgac aacatcgcaa cgcaggatgt cagagacgct 1560
agagagcctt ccagttgtac cgtctcccat gcatgaaaga gatgcatttg ccgcgatgaa 1620
agaacgcggc atgttgcatc ttacattact aaacacggga actgatccga cgatgcgcct 1680
catagagagg aatcttcgga ttgcgatgga ggaagtcgtg gtcatttcga aactgatcag 1740
caaaatcttg gaggcttgaa gatggcaatt cgcaagcccg cattgtcggt cggcgaagca 1800
cggcggcttg ctggtgctcg acccgagatc caccatccca acccgacact tgttccccag 1860
aagctggacc tccagcactt gcctgaaaaa gccgacgaga aagaccagca acgtgagcct 1920
ctcgtcgccg atcacattta cagtcccgat cgacaactta agctaactgt ggatgccctt 1980
agtccacctc cgtccccgaa aaagctccag gtttttcttt cagcgcgacc gcccgcgcct 2040
caagtgtcga aaacatatga caacctcgtt cggcaataca gtccctcgaa gtcgctacaa 2100
atgattttaa ggcgcgcgtt ggacgatttc gaaagcatgc tggcagatgg atcatttcgc 2160
gtggccccga aaagttatcc gatcccttca actacagaaa aatccgttct cgttcagacc 2220
tcacgcatgt tcccggttgc gttgctcgag gtcgctcgaa gtcattttga tccgttgggg 2280
ttggagaccg ctcgagcttt cggccacaag ctggctaccg ccgcgctcgc gtcattcttt 2340
gctggagaga agccatcgag caattggtga agagggacct atcggaaccc ctcaccaaat 2400
attgagtgta ggtttgaggc cgctggccgc gtcctcagtc accttttgag ccagataatt 2460
aagagccaaa tgcaattggc tcaggctgcc atcgtccccc cgtgcgaaac ctgcacgtcc 2520
gcgtcaaaga aataaccggc acctcttgct gtttttatca gttgagggct tgacggatcc 2580
gcctcaagtt tgcggcgcag ccgcaaaatg agaacatcta tactcctgtc gtaaacctcc 2640
tcgtcgcgta ctcgactggc aatgagaagt tgctcgcgcg atagaacgtc gcggggtttc 2700
tctaaaaacg cgaggagaag attgaactca cctgccgtaa gtttcacctc accgccagct 2760
tcggacatca agcgacgttg cctgagatta agtgtccagt cagtaaaaca aaaagaccgt 2820
cggtctttgg agcggacaac gttggggcgc acgcgcaagg caacccgaat gcgtgcaaga 2880
aactctctcg tactaaacgg cttagcgata aaatcacttg ctcctagctc gagtgcaaca 2940
actttatccg tctcctcaag gcggtcgcca ctgataatta tgattggaat atcagacttt 3000
gccgccagat ttcgaacgat ctcaagccca tcttcacgac ctaaatttag atcaacaacc 3060
acgacatcga ccgtcgcgga agagagtact ctagtgaact gggtgctgtc ggctaccgcg 3120
gtcactttga aggcgtggat cgtaaggtat tcgataataa gatgccgcat agcgacatcg 3180
tcatcgataa gaagaacgtg tttcaacggc tcacctttca atctaaaatc tgaacccttg 3240
ttcacagcgc ttgagaaatt ttcacgtgaa ggatgtacaa tcatctccag ctaaatgggc 3300
agttcgtcag aattgcggct gaccgcggat gacgaaaatg cgaaccaagt atttcaattt 3360
tatgacaaaa gttctcaatc gttgttacaa gtgaaacgct tcgaggttac agctactatt 3420
gattaaggag atcgcctatg gtctcgcccc ggcgtcgtgc gtccgccgcg agccagatct 3480
cgcctacttc ataaacgtcc tcataggcac ggaatggaat gatgacatcg atcgccgtag 3540
agagcatgtc aatcagtgtg cgatcttcca agctagcacc ttgggcgcta cttttgacaa 3600
gggaaaacag tttcttgaat ccttggattg gattcgcgcc gtgtattgtt gaaatcgatc 3660
ccggatgtcc cgagacgact tcactcagat aagcccatgc tgcatcgtcg cgcatctcgc 3720
caagcaatat ccggtccggc cgcatacgca gacttgcttg gagcaagtgc tcggcgctca 3780
cagcacccag cccagcaccg ttcttggagt agagtagtct aacatgatta tcgtgtggaa 3840
tgacgagttc gagcgtatct tctatggtga ttagcctttc ctgggggggg atggcgctga 3900
tcaaggtctt gctcattgtt gtcttgccgc ttccggtagg gccacatagc aacatcgtca 3960
gtcggctgac gacgcatgcg tgcagaaacg cttccaaatc cccgttgtca aaatgctgaa 4020
ggatagcttc atcatcctga ttttggcgtt tccttcgtgt ctgccactgg ttccacctcg 4080
aagcatcata acgggaggag acttctttaa gaccagaaac acgcgagctt ggccgtcgaa 4140
tggtcaagct gacggtgccc gagggaacgg tcggcggcag acagatttgt agtcgttcac 4200
caccaggaag ttcagtggcg cagagggggt tacgtggtcc gacatcctgc tttctcagcg 4260
cgcccgctaa aatagcgata tcttcaagat catcataaga gacgggcaaa ggcatcttgg 4320
taaaaatgcc ggcttggcgc acaaatgcct ctccaggtcg attgatcgca atttcttcag 4380
tcttcgggtc atcgagccat tccaaaatcg gcttcagaag aaagcgtagt tgcggatcca 4440
cttccattta caatgtatcc tatctctaag cggaaatttg aattcattaa gagcggcggt 4500
tcctcccccg cgtggcgccg ccagtcaggc ggagctggta aacaccaaag aaatcgaggt 4560
cccgtgctac gaaaatggaa acggtgtcac cctgattctt cttcagggtt ggcggtatgt 4620
tgatggttgc cttaagggct gtctcagttg tctgctcacc gttattttga aagctgttga 4680
agctcatccc gccacccgag ctgccggcgt aggtgctagc tgcctggaag gcgccttgaa 4740
caacactcaa gagcatagct ccgctaaaac gctgccagaa gtggctgtcg accgagcccg 4800
gcaatcctga gcgaccgagt tcgtccgcgc ttggcgatgt taacgagatc atcgcatggt 4860
caggtgtctc ggcgcgatcc cacaacacaa aaacgcgccc atctccctgt tgcaagccac 4920
gctgtatttc gccaacaacg gtggtgccac gatcaagaag cacgatattg ttcgttgttc 4980
cacgaatatc ctgaggcaag acacacttta catagcctgc caaatttgtg tcgattgcgg 5040
tttgcaagat gcacggaatt attgtccctt gcgttaccat aaaatcgggg tgcggcaaga 5100
gcgtggcgct gctgggctgc agctcggtgg gtttcatacg tatcgacaaa tcgttctcgc 5160
cggacacttc gccattcggc aaggagttgt cgtcacgctt gccttcttgt cttcggcccg 5220
tgtcgccctg aatggcgcgt ttgctgaccc cttgatcgcc gctgctatat gcaaaaatcg 5280
gtgtttcttc cggccgtggc tcatgccgct ccggttcgcc cctcggcggt agaggagcag 5340
caggctgaac agcctcttga accgctggag gatccggcgg cacctcaatc ggagctggat 5400
gaaatggctt ggtgtttgtt gcgatcaaag ttgacggcga tgcgttctca ttcaccttct 5460
tttggcgccc acctagccaa atgaggctta atgataacgc gagaacgaca cctccgacga 5520
tcaatttctg agaccccgaa agacgccggc gatgtttgtc ggagaccagg gatccagatg 5580
catcaacctc atgtgccgct tgctgactat cgttattcat cccttcgccc ccttcaggac 5640
gcgtttcaca tcgggcctca ccgtgcccgt ttgcggcctt tggccaacgg gatcgtaagc 5700
ggtgttccag atacatagta ctgtgtggcc atccctcaga cgccaacctc gggaaaccga 5760
agaaatctcg acatcgctcc ctttaactga atagttggca acagcttcct tgccatcagg 5820
attgatggtg tagatggagg gtatgcgtac attgcccgga aagtggaata ccgtcgtaaa 5880
tccattgtcg aagacttcga gtggcaacag cgaacgatcg ccttgggcga cgtagtgcca 5940
attactgtcc gccgcaccaa gggctgtgac aggctgatcc aataaattct cagctttccg 6000
ttgatattgt gcttccgcgt gtagtctgtc cacaacagcc ttctgttgtg cctcccttcg 6060
ccgagccgcc gcatcgtcgg cggggtaggc gaattggacg ctgtaataga gatcgggctg 6120
ctctttatcg aggtgggaca gagtcttgga acttatactg aaaacataac ggcgcatccc 6180
ggagtcgctt gcggttagca cgattactgg ctgaggcgtg aggacctggc ttgccttgaa 6240
aaatagataa tttccccgcg gtagggctgc tagatctttg ctatttgaaa cggcaaccgc 6300
tgtcaccgtt tcgttcgtgg cgaatgttac gaccaaagta gctccaaccg ccgtcgagag 6360
gcgcaccact tgatcgggat tgtaagccaa ataacgcatg cgcggatcta gcttgcccgc 6420
cattggagtg tcttcagcct ccgcaccagt cgcagcggca aataaacatg ctaaaatgaa 6480
aagtgctttt ctgatcatgg ttcgctgtgg cctacgtttg aaacggtatc ttccgatgtc 6540
tgataggagg tgacaaccag acctgccggg ttggttagtc tcaatctgcc gggcaagctg 6600
gtcacctttt cgtagcgaac tgtcgcggtc cacgtactca ccacaggcat tttgccgtca 6660
acgacgaggg tccttttata gcgaatttgc tgcgtgcttg gagttacatc atttgaagcg 6720
atgtgctcga cctccaccct gccgcgtttg ccaagaatga cttgaggcga actgggattg 6780
ggatagttga agaattgctg gtaatcctgg cgcactgttg gggcactgaa gttcgatacc 6840
aggtcgtagg cgtactgagc ggtgtcggca tcataactct cgcgcaggcg aacgtactcc 6900
cacaatgagg cgttaacgac ggcctcctct tgagttgcag gcaatcgcga gacagacacc 6960
tcgctgtcaa cggtgccgtc cggccgtatc catagatata cgggcacaag cctgctcaac 7020
ggcaccattg tggctatagc gaacgcttga gcaacatttc ccaaaatcgc gatagctgcg 7080
acagctgcaa tgagtttgga gagacgtcgc gccgatttcg ctcgcgcggt ttgaaaggct 7140
tctacttcct tatagtgctc ggcaaggctt tcgcgcgcca ctagcatggc atattcaggc 7200
cccgtcatag cgtccacccg aattgccgag ctgaagatct gacggagtag gctgccatcg 7260
ccccacattc agcgggaaga tcgggccttt gcagctcgct aatgtgtcgt ttgtctggca 7320
gccgctcaaa gcgacaacta ggcacagcag gcaatacttc atagaattct ccattgaggc 7380
gaatttttgc gcgacctagc ctcgctcaac ctgagcgaag cgacggtaca agctgctggc 7440
agattgggtt gcgccgctcc agtaactgcc tccaatgttg ccggcgatcg ccggcaaagc 7500
gacaatgagc gcatcccctg tcagaaaaaa catatcgagt tcgtaaagac caatgatctt 7560
ggccgcggtc gtaccggcga aggtgattac accaagcata agggtgagcg cagtcgcttc 7620
ggttaggatg acgatcgttg ccacgaggtt taagaggaga agcaagagac cgtaggtgat 7680
aagttgcccg atccacttag ctgcgatgtc ccgcgtgcga tcaaaaatat atccgacgag 7740
gatcagaggc ccgatcgcga gaagcacttt cgtgagaatt ccaacggcgt cgtaaactcc 7800
gaaggcagac cagagcgtgc cgtaaaggac ccactgtgcc ccttggaaag caaggatgtc 7860
ctggtcgttc atcggaccga tttcggatgc gattttctga aaaacggcct gggtcacggc 7920
gaacattgta tccaactgtg ccggaacagt ctgcagaggc aagccggtta cactaaactg 7980
ctgaacaaag tttgggaccg tcttttcgaa gatggaaacc acatagtctt ggtagttagc 8040
ctgcccaaca attagagcaa caacgatggt gaccgtgatc acccgagtga taccgctacg 8100
ggtatcgact tcgccgcgta tgactaaaat accctgaaca ataatccaaa gagtgacaca 8160
ggcgatcaat ggcgcactca ccgcctcctg gatagtctca agcatcgagt ccaagcctgt 8220
cgtgaaggct acatcgaaga tcgtatgaat ggccgtaaac ggcgccggaa tcgtgaaatt 8280
catcgattgg acctgaactt gactggtttg tcgcataatg ttggataaaa tgagctcgca 8340
ttcggcgagg atgcgggcgg atgaacaaat cgcccagcct taggggaggg caccaaagat 8400
gacagcggtc ttttgatgct ccttgcgttg agcggccgcc tcttccgcct cgtgaaggcc 8460
ggcctgcgcg gtagtcatcg ttaataggct tgtcgcctgt acattttgaa tcattgcgtc 8520
atggatctgc ttgagaagca aaccattggt cacggttgcc tgcatgatat tgcgagatcg 8580
ggaaagctga gcagacgtat cagcattcgc cgtcaagcgt ttgtccatcg tttccagatt 8640
gtcagccgca atgccagcgc tgtttgcgga accggtgatc tgcgatcgca acaggtccgc 8700
ttcagcatca ctacccacga ctgcacgatc tgtatcgctg gtgatcgcac gtgccgtggt 8760
cgacattggc attcgcggcg aaaacatttc attgtctagg tccttcgtcg aaggatactg 8820
atttttctgg ttgagcgaag tcagtagtcc agtaacgccg taggccgacg tcaacatcgt 8880
aaccatcgct atagtctgag tgagattctc cgcagtcgcg agcgcagtcg cgagcgtctc 8940
agcctccgtt gccgggtcgc taacaacaaa ctgcgcccgc gcgggctgaa tatatagaaa 9000
gctgcaggtc aaaactgttg caataagttg cgtcgtcttc atcgtttcct accttatcaa 9060
tcttctgcct cgtggtgacg ggccatgaat tcgctgagcc agccagatga gttgccttct 9120
tgtgcctcgc gtagtcgagt tgcaaagcgc accgtgttgg cacgccccga aagcacggcg 9180
acatattcac gcatatcccg cagatcaaat tcgcagatga cgcttccact ttctcgttta 9240
agaagaaact tacggctgcc gaccgtcatg tcttcacgga tcgcctgaaa ttccttttcg 9300
gtacatttca gtccatcgac ataagccgat cgatctgcgg ttggtgatgg atagaaaatc 9360
ttcgtcatac attgcgcaac caagctggct cctagcggcg attccagaac atgctctggt 9420
tgctgcgttg ccagtattag catcccgttg ttttttcgaa cggtcaggag gaatttgtcg 9480
acgacagtcg aaaatttagg gtttaacaaa taggcgcgaa actcatcgca gctcatcaca 9540
aaacggcggc cgtcgatcat ggctccaatc cgatgcagga gatatgctgc agcgggagcg 9600
catacttcct cgtattcgag aagatgcgtc atgtcgaagc cggtaatcga cggatctaac 9660
tttacttcgt caacttcgcc gtcaaatgcc cagccaagcg catggccccg gcaccagcgt 9720
tggagccgcg ctcctgcgcc ttcggcgggc ccatgcaaca aaaattcacg taaccccgcg 9780
attgaacgca tttgtggatc aaacgagagc tgacgatgga taccacggac cagacggcgg 9840
ttctcttccg gagaaatccc accccgacca tcactctcga tgagagccac gatccattcg 9900
cgcagaaaat cgtgtgaggc tgctgtgttt tctaggccac gcaacggcgc caacccgctg 9960
ggtgtgcctc tgtgaagtgc caaatatgtt cctcctgtgg cgcgaaccag caattcgcca 10020
ccccggtcct tgtcaaagaa cacgaccgta cctgcacggt cgaccatgct ctgttcgagc 10080
atggctagaa caaacatcat gagcgtcgtc ttacccctcc cgataggccc gaatattgcc 10140
gtcatgccaa catcgtgctc atgcgggata tagtcgaaag gcgttccgcc attggtacga 10200
aatcgggcaa tcgcgttgcc ccagtggcct gagctggcgc cctctggaaa gttttcgaaa 10260
gagacaaacc ctgcgaaatt gcgtgaagtg attgcgccag ggcgtgtgcg ccacttaaaa 10320
ttccccggca attgggacca ataggccgct tccataccaa taccttcttg gacaaccacg 10380
gcacctgcat ccgccattcg tgtccgagcc cgcgcgcccc tgtccccaag actattgaga 10440
tcgtctgcat agacgcaaag gctcaaatga tgtgagccca taacgaattc gttgctcgca 10500
agtgcgtcct cagcctcgga taatttgccg atttgagtca cggctttatc gccggaactc 10560
agcatctggc tcgatttgag gctaagtttc gcgtgcgctt gcgggcgagt caggaacgaa 10620
aaactctgcg tgagaacaag tggaaaatcg agggatagca gcgcgttgag catgcccggc 10680
cgtgtttttg cagggtattc gcgaaacgaa tagatggatc caacgtaact gtcttttggc 10740
gttctgatct cgagtcctcg cttgccgcaa atgactctgt cggtataaat cgaagcgccg 10800
agtgagccgc tgacgaccgg aaccggtgtg aaccgaccag tcatgatcaa ccgtagcgct 10860
tcgccaattt cggtgaagag cacaccctgc ttctcgcgga tgccaagacg atgcaggcca 10920
tacgctttaa gagagccagc gacaacatgc caaagatctt ccatgttcct gatctggccc 10980
gtgagatcgt tttccctttt tccgcttagc ttggtgaacc tcctctttac cttccctaaa 11040
gccgcctgtg ggtagacaat caacgtaagg aagtgttcat tgcggaggag ttggccggag 11100
agcacgcgct gttcaaaagc ttcgttcagg ctagcggcga aaacactacg gaagtgtcgc 11160
ggcgccgatg atggcacgtc ggcatgacgt acgaggtgag catatattga cacatgatca 11220
tcagcgatat tgcgcaacag cgtgttgaac gcacgacaac gcgcattgcg catttcagtt 11280
tcctcaagct cgaatgcaac gccatcaatt ctcgcaatgg tcatgatcga tccgtcttca 11340
agaaggacga tatggtcgct gaggtggcca atataaggga gatagatctc accggatctt 11400
tcggtcgttc cactcgcgcc gagcatcaca ccattcctct ccctcgtggg ggaaccctaa 11460
ttggatttgg gctaacagta gcgccccccc aaactgcact atcaatgctt cttcccgcgg 11520
tccgcaaaaa tagcaggacg acgctcgccg cattgtagtc tcgctccacg atgagccggg 11580
ctgcaaacca taacggcacg agaacgactt cgtagagcgg gttctgaacg ataacgatga 11640
caaagccggc gaacatcatg aataaccctg ccaatgtcag tggcacccca agaaacaatg 11700
cgggccgtgt ggctgcgagg taaagggtcg attcttccaa acgatcagcc atcaactacc 11760
gccagtgagc gtttggccga ggaagctcgc cccaaacatg ataacaatgc cgccgacgac 11820
gccggcaacc agcccaagcg aagcccgccc gaacatccag gagatcccga tagcgacaat 11880
gccgagaaca gcgagtgact ggccgaacgg accaaggata aacgtgcata tattgttaac 11940
cattgtggcg gggtcagtgc cgccacccgc agattgcgct gcggcgggtc cggatgagga 12000
aatgctccat gcaattgcac cgcacaagct tggggcgcag ctcgatatca cgcgcatcat 12060
cgcattcgag agcgagaggc gatttagatg taaacggtat ctctcaaagc atcgcatcaa 12120
tgcgcacctc cttagtataa gtcgaataag acttgattgt cgtctgcgga tttgccgttg 12180
tcctggtgtg gcggtggcgg agcgattaaa ccgccagcgc catcctcctg cgagcggcgc 12240
tgatatgacc cccaaacatc ccacgtctct tcggatttta gcgcctcgtg atcgtctttt 12300
ggaggctcga ttaacgcggg caccagcgat tgagcagctg tttcaacttt tcgcacgtag 12360
ccgtttgcaa aaccgccgat gaaattaccg gtgttgtaag cggagatcgc ccgacgaagc 12420
gcaaattgct tctcgtcaat cgtttcgccg cctgcataac gacttttcag catgtttgca 12480
gcggcagata atgatgtgca cgcctggagc gcaccgtcag gtgtcagacc gagcatagaa 12540
aaatttcgag agtttatttg catgaggcca acatccagcg aatgccgtgc atcgagacgg 12600
tgcctgacga cttgggttgc ttggctgtga tcttgccagt gaagcgtttc gccggtcgtg 12660
ttgtcatgaa tcgctaaagg atcaaagcga ctctccacct tagctatcgc cgcaagcgta 12720
gatgtcgcaa ctgatggggc acacttgcga gcaacatggt caaactcagc agatgagagt 12780
ggcgtggcaa ggctcgacga acagaaggag accatcaagg caagagaaag cgaccccgat 12840
ctcttaagca taccttatct ccttagctcg caactaacac cgcctctccc gttggaagaa 12900
gtgcgttgtt ttatgttgaa gattatcggg agggtcggtt actcgaaaat tttcaattgc 12960
ttctttatga tttcaattga agcgagaaac ctcgcccggc gtcttggaac gcaacatgga 13020
ccgagaaccg cgcatccatg actaagcaac cggatcgacc tattcaggcc gcagttggtc 13080
aggtcaggct cagaacgaaa atgctcggcg aggttacgct gtctgtaaac ccattcgatg 13140
aacgggaagc ttccttccga ttgctcttgg caggaatatt ggcccatgcc tgcttgcgct 13200
ttgcaaatgc tcttatcgcg ttggtatcat atgccttgtc cgccagcaga aacgcactct 13260
aagcgattat ttgtaaaaat gtttcggtca tgcggcggtc atgggcttga cccgctgtca 13320
gcgcaagacg gatcggtcaa ccgtcggcat cgacaacagc gtgaatcttg gtggtcaaac 13380
cgccacggga acgtcccata cagccatcgt cttgatcccg ctgtttcccg tcgccgcatg 13440
ttggtggacg cggacacagg aactgtcaat catgacgaca ttctatcgaa agccttggaa 13500
atcacactca gaatatgatc ccagacgtct gcctcacgcc atcgtacaaa gcgattgtag 13560
caggttgtac aggaaccgta tcgatcagga acgtctgccc agggcgggcc cgtccggaag 13620
cgccacaaga tgacattgat cacccgcgtc aacgcgcggc acgcgacgcg gcttatttgg 13680
gaacaaagga ctgaacaaca gtccattcga aatcggtgac atcaaagcgg ggacgggtta 13740
tcagtggcct ccaagtcaag cctcaatgaa tcaaaatcag accgatttgc aaacctgatt 13800
tatgagtgtg cggcctaaat gatgaaatcg tccttctaga tcgcctccgt ggtgtagcaa 13860
cacctcgcag tatcgccgtg ctgaccttgg ccagggaatt gactggcaag ggtgctttca 13920
catgaccgct cttttggccg cgatagatga tttcgttgct gctttgggca cgtagaagga 13980
gagaagtcat atcggagaaa ttcctcctgg cgcgagagcc tgctctatcg cgacggcatc 14040
ccactgtcgg gaacagaccg gatcattcac gaggcgaaag tcgtcaacac atgcgttata 14100
ggcatcttcc cttgaaggat gatcttgttg ctgccaatct ggaggtgcgg cagccgcagg 14160
cagatgcgat ctcagcgcaa cttgcggcaa aacatctcac tcacctgaaa accactagcg 14220
agtctcgcga tcagacgaag gccttttact taacgacaca atatccgatg tctgcatcac 14280
aggcgtcgct atcccagtca atactaaagc ggtgcaggaa ctaaagatta ctgatgactt 14340
aggcgtgcca cgaggcctga gacgacgcgc gtagacagtt ttttgaaatc attatcaaag 14400
tgatggcctc cgctgaagcc tatcacctct gcgccggtct gtcggagaga tgggcaagca 14460
ttattacggt cttcgcgccc gtacatgcat tggacgattg cagggtcaat ggatctgaga 14520
tcatccagag gattgccgcc cttaccttcc gtttcgagtt ggagccagcc cctaaatgag 14580
acgacatagt cgacttgatg tgacaatgcc aagagagaga tttgcttaac ccgatttttt 14640
tgctcaagcg taagcctatt gaagcttgcc ggcatgacgt ccgcgccgaa agaatatcct 14700
acaagtaaaa cattctgcac accgaaatgc ttggtgtaga catcgattat gtgaccaaga 14760
tccttagcag tttcgcttgg ggaccgctcc gaccagaaat accgaagtga actgacgcca 14820
atgacaggaa tcccttccgt ctgcagatag gtaccatcga tagatctgct gcctcgcgcg 14880
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg 14940
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg 15000
gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata ctggcttaac 15060
tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac 15120
agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg 15180
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 15240
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 15300
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 15360
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 15420
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 15480
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 15540
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 15600
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 15660
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 15720
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 15780
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 15840
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 15900
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 15960
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 16020
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 16080
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 16140
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 16200
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 16260
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 16320
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 16380
aatagtttgc gcaacgttgt tgccattgct gcaggggggg gggggggggg gttccattgt 16440
tcattccacg gacaaaaaca gagaaaggaa acgacagagg ccaaaaagct cgctttcagc 16500
acctgtcgtt tcctttcttt tcagagggta ttttaaataa aaacattaag ttatgacgaa 16560
gaagaacgga aacgccttaa accggaaaat tttcataaat agcgaaaacc cgcgaggtcg 16620
ccgccccgta acctgtcgga tcaccggaaa ggacccgtaa agtgataatg attatcatct 16680
acatatcaca acgtgcgtgg aggccatcaa accacgtcaa ataatcaatt atgacgcagg 16740
tatcgtatta attgatctgc atcaacttaa cgtaaaaaca acttcagaca atacaaatca 16800
gcgacactga atacggggca acctcatgtc cccccccccc ccccccctgc aggcatcgtg 16860
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 16920
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 16980
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 17040
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 17100
ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac acgggataat 17160
accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 17220
aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 17280
aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 17340
caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 17400
ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 17460
gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 17520
cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg 17580
aggccctttc gtcttcaaga attcggagct tttgccattc tcaccggatt cagtcgtcac 17640
tcatggtgat ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat 17700
tgatgttgga cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg 17760
cctcggtgag ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa 17820
tcctgatatg aataaattgc agtttcattt gatgctcgat gagtttttct aatcagaatt 17880
ggttaattgg ttgtaacact ggcagagcat tacgctgact tgacgggacg gcggctttgt 17940
tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcttcc cgacaacgca 18000
gaccgttccg tggcaaagca aaagttcaaa atcaccaact ggtccaccta caacaaagct 18060
ctcatcaacc gtggctccct cactttctgg ctggatgatg gggcgattca ggcctggtat 18120
gagtcagcaa caccttcttc acgaggcaga cctcagcgcc agaaggccgc cagagaggcc 18180
gagcgcggcc gtgaggcttg gacgctaggg cagggcatga aaaagcccgt agcgggctgc 18240
tacgggcgtc tgacgcggtg gaaaggggga ggggatgttg tctacatggc tctgctgtag 18300
tgagtgggtt gcgctccggc agcggtcctg atcaatcgtc accctttctc ggtccttcaa 18360
cgttcctgac aacgagcctc cttttcgcca atccatcgac aatcaccgcg agtccctgct 18420
cgaacgctgc gtccggaccg gcttcgtcga aggcgtctat cgcggcccgc aacagcggcg 18480
agagcggagc ctgttcaacg gtgccgccgc gctcgccggc atcgctgtcg ccggcctgct 18540
cctcaagcac ggccccaaca gtgaagtagc tgattgtcat cagcgcattg acggcgtccc 18600
cggccgaaaa acccgcctcg cagaggaagc gaagctgcgc gtcggccgtt tccatctgcg 18660
gtgcgcccgg tcgcgtgccg gcatggatgc gcgcgccatc gcggtaggcg agcagcgcct 18720
gcctgaagct gcgggcattc ccgatcagaa atgagcgcca gtcgtcgtcg gctctcggca 18780
ccgaatgcgt atgattctcc gccagcatgg cttcggccag tgcgtcgagc agcgcccgct 18840
tgttcctgaa gtgccagtaa agcgccggct gctgaacccc caaccgttcc gccagtttgc 18900
gtgtcgtcag accgtctacg ccgacctcgt tcaacaggtc cagggcggca cggatcactg 18960
tattcggctg caactttgtc atgcttgaca ctttatcact gataaacata atatgtccac 19020
caacttatca gtgataaaga atccgcgcgt tcaatcggac cagcggaggc tggtccggag 19080
gccagacgtg aaacccaaca tacccctgat cgtaattctg agcactgtcg cgctcgacgc 19140
tgtcggcatc ggcctgatta tgccggtgct gccgggcctc ctgcgcgatc tggttcactc 19200
gaacgacgtc accgcccact atggcattct gctggcgctg tatgcgttgg tgcaatttgc 19260
ctgcgcacct gtgctgggcg cgctgtcgga tcgtttcggg cggcggccaa tcttgctcgt 19320
ctcgctggcc ggcgccactg tcgactacgc catcatggcg acagcgcctt tcctttgggt 19380
tctctatatc gggcggatcg tggccggcat caccggggcg actggggcgg tagccggcgc 19440
ttatattgcc gatatcactg atggcgatga gcgcgcgcgg cacttcggct tcatgagcgc 19500
ctgtttcggg ttcgggatgg tcgcgggacc tgtgctcggt gggctgatgg gcggtttctc 19560
cccccacgct ccgttcttcg ccgcggcagc cttgaacggc ctcaatttcc tgacgggctg 19620
tttccttttg ccggagtcgc acaaaggcga acgccggccg ttacgccggg aggctctcaa 19680
cccgctcgct tcgttccggt gggcccgggg catgaccgtc gtcgccgccc tgatggcggt 19740
cttcttcatc atgcaacttg tcggacaggt gccggccgcg ctttgggtca ttttcggcga 19800
ggatcgcttt cactgggacg cgaccacgat cggcatttcg cttgccgcat ttggcattct 19860
gcattcactc gcccaggcaa tgatcaccgg ccctgtagcc gcccggctcg gcgaaaggcg 19920
ggcactcatg ctcggaatga ttgccgacgg cacaggctac atcctgcttg ccttcgcgac 19980
acggggatgg atggcgttcc cgatcatggt cctgcttgct tcgggtggca tcggaatgcc 20040
ggcgctgcaa gcaatgttgt ccaggcaggt ggatgaggaa cgtcaggggc agctgcaagg 20100
ctcactggcg gcgctcacca gcctgacctc gatcgtcgga cccctcctct tcacggcgat 20160
ctatgcggct tctataacaa cgtggaacgg gtgggcatgg attgcaggcg ctgccctcta 20220
cttgctctgc ctgccggcgc tgcgtcgcgg gctttggagc ggcgcagggc aacgagccga 20280
tcgctgatcg tggaaacgat aggcctatgc catgcgggtc aaggcgactt ccggcaagct 20340
atacgcgccc taggagtgcg gttggaacgt tggcccagcc agatactccc gatcacgagc 20400
aggacgccga tgatttgaag cgcactcagc gtctgatcca agaacaacca tcctagcaac 20460
acggcggtcc ccgggctgag aaagcccagt aaggaaacaa ctgtaggttc gagtcgcgag 20520
atcccccgga accaaaggaa gtaggttaaa cccgctccga tcaggccgag ccacgccagg 20580
ccgagaacat tggttcctgt aggcatcggg attggcggat caaacactaa agctactgga 20640
acgagcagaa gtcctccggc cgccagttgc caggcggtaa aggtgagcag aggcacggga 20700
ggttgccact tgcgggtcag cacggttccg aacgccatgg aaaccgcccc cgccaggccc 20760
gctgcgacgc cgacaggatc tagcgctgcg tttggtgtca acaccaacag cgccacgccc 20820
gcagttccgc aaatagcccc caggaccgcc atcaatcgta tcgggctacc tagcagagcg 20880
gcagagatga acacgaccat cagcggctgc acagcgccta ccgtcgccgc gaccccgccc 20940
ggcaggcggt agaccgaaat aaacaacaag ctccagaata gcgaaatatt aagtgcgccg 21000
aggatgaaga tgcgcatcca ccagattccc gttggaatct gtcggacgat catcacgagc 21060
aataaacccg ccggcaacgc ccgcagcagc ataccggcga cccctcggcc tcgctgttcg 21120
ggctccacga aaacgccgga cagatgcgcc ttgtgagcgt ccttggggcc gtcctcctgt 21180
ttgaagaccg acagcccaat gatctcgccg tcgatgtagg cgccgaatgc cacggcatct 21240
cgcaaccgtt cagcgaacgc ctccatgggc tttttctcct cgtgctcgta aacggacccg 21300
aacatctctg gagctttctt cagggccgac aatcggatct cgcggaaatc ctgcacgtcg 21360
gccgctccaa gccgtcgaat ctgagcctta atcacaattg tcaattttaa tcctctgttt 21420
atcggcagtt cgtagagcgc gccgtgcgtc ccgagcgata ctgagcgaag caagtgcgtc 21480
gagcagtgcc cgcttgttcc tgaaatgcca gtaaagcgct ggctgctgaa cccccagccg 21540
gaactgaccc cacaaggccc tagcgtttgc aatgcaccag gtcatcattg acccaggcgt 21600
gttccaccag gccgctgcct cgcaactctt cgcaggcttc gccgacctgc tcgcgccact 21660
tcttcacgcg ggtggaatcc gatccgcaca tgaggcggaa ggtttccagc ttgagcgggt 21720
acggctcccg gtgcgagctg aaatagtcga acatccgtcg ggccgtcggc gacagcttgc 21780
ggtacttctc ccatatgaat ttcgtgtagt ggtcgccagc aaacagcacg acgatttcct 21840
cgtcgatcag gacctggcaa cgggacgttt tcttgccacg gtccaggacg cggaagcggt 21900
gcagcagcga caccgattcc aggtgcccaa cgcggtcgga cgtgaagccc atcgccgtcg 21960
cctgtaggcg cgacaggcat tcctcggcct tcgtgtaata ccggccattg atcgaccagc 22020
ccaggtcctg gcaaagctcg tagaacgtga aggtgatcgg ctcgccgata ggggtgcgct 22080
tcgcgtactc caacacctgc tgccacacca gttcgtcatc gtcggcccgc agctcgacgc 22140
cggtgtaggt gatcttcacg tccttgttga cgtggaaaat gaccttgttt tgcagcgcct 22200
cgcgcgggat tttcttgttg cgcgtggtga acagggcaga gcgggccgtg tcgtttggca 22260
tcgctcgcat cgtgtccggc cacggcgcaa tatcgaacaa ggaaagctgc atttccttga 22320
tctgctgctt cgtgtgtttc agcaacgcgg cctgcttggc ctcgctgacc tgttttgcca 22380
ggtcctcgcc ggcggttttt cgcttcttgg tcgtcatagt tcctcgcgtg tcgatggtca 22440
tcgacttcgc caaacctgcc gcctcctgtt cgagacgacg cgaacgctcc acggcggccg 22500
atggcgcggg cagggcaggg ggagccagtt gcacgctgtc gcgctcgatc ttggccgtag 22560
cttgctggac catcgagccg acggactgga aggtttcgcg gggcgcacgc atgacggtgc 22620
ggcttgcgat ggtttcggca tcctcggcgg aaaaccccgc gtcgatcagt tcttgcctgt 22680
atgccttccg gtcaaacgtc cgattcattc accctccttg cgggattgcc ccgactcacg 22740
ccggggcaat gtgcccttat tcctgatttg acccgcctgg tgccttggtg tccagataat 22800
ccaccttatc ggcaatgaag tcggtcccgt agaccgtctg gccgtccttc tcgtacttgg 22860
tattccgaat cttgccctgc acgaatacca gcgacccctt gcccaaatac ttgccgtggg 22920
cctcggcctg agagccaaaa cacttgatgc ggaagaagtc ggtgcgctcc tgcttgtcgc 22980
cggcatcgtt gcgccactct tcattaaccg ctatatcgaa aattgcttgc ggcttgttag 23040
aattgccatg acgtacctcg gtgtcacggg taagattacc gataaactgg aactgattat 23100
ggctcatatc gaaagtctcc ttgagaaagg agactctagt ttagctaaac attggttccg 23160
ctgtcaagaa ctttagcggc taaaattttg cgggccgcga ccaaaggtgc gaggggcggc 23220
ttccgctgtg tacaaccaga tatttttcac caacatcctt cgtctgctcg atgagcgggg 23280
catgacgaaa catgagctgt cggagagggc aggggtttca atttcgtttt tatcagactt 23340
aaccaacggt aaggccaacc cctcgttgaa ggtgatggag gccattgccg acgccctgga 23400
aactccccta cctcttctcc tggagtccac cgaccttgac cgcgaggcac tcgcggagat 23460
tgcgggtcat cctttcaaga gcagcgtgcc gcccggatac gaacgcatca gtgtggtttt 23520
gccgtcacat aaggcgttta tcgtaaagaa atggggcgac gacacccgaa aaaagctgcg 23580
tggaaggctc tgacgccaag ggttagggct tgcacttcct tctttagccg ctaaaacggc 23640
cccttctctg cgggccgtcg gctcgcgcat catatcgaca tcctcaacgg aagccgtgcc 23700
gcgaatggca tcgggcgggt gcgctttgac agttgttttc tatcagaacc cctacgtcgt 23760
gcggttcgat tagctgtttg tcttgcaggc taaacacttt cggtatatcg tttgcctgtg 23820
cgataatgtt gctaatgatt tgttgcgtag gggttactga aaagtgagcg ggaaagaaga 23880
gtttcagacc atcaaggagc gggccaagcg caagctggaa cgcgacatgg gtgcggacct 23940
gttggccgcg ctcaacgacc cgaaaaccgt tgaagtcatg ctcaacgcgg acggcaaggt 24000
gtggcacgaa cgccttggcg agccgatgcg gtacatctgc gacatgcggc ccagccagtc 24060
gcaggcgatt atagaaacgg tggccggatt ccacggcaaa gaggtcacgc ggcattcgcc 24120
catcctggaa ggcgagttcc ccttggatgg cagccgcttt gccggccaat tgccgccggt 24180
cgtggccgcg ccaacctttg cgatccgcaa gcgcgcggtc gccatcttca cgctggaaca 24240
gtacgtcgag gcgggcatca tgacccgcga gcaatacgag gtcattaaaa gcgccgtcgc 24300
ggcgcatcga aacatcctcg tcattggcgg tactggctcg ggcaagacca cgctcgtcaa 24360
cgcgatcatc aatgaaatgg tcgccttcaa cccgtctgag cgcgtcgtca tcatcgagga 24420
caccggcgaa atccagtgcg ccgcagagaa cgccgtccaa taccacacca gcatcgacgt 24480
ctcgatgacg ctgctgctca agacaacgct gcgtatgcgc cccgaccgca tcctggtcgg 24540
tgaggtacgt ggccccgaag cccttgatct gttgatggcc tggaacaccg ggcatgaagg 24600
aggtgccgcc accctgcacg caaacaaccc caaagcgggc ctgagccggc tcgccatgct 24660
tatcagcatg cacccggatt caccgaaacc cattgagccg ctgattggcg aggcggttca 24720
tgtggtcgtc catatcgcca ggacccctag cggccgtcga gtgcaagaaa ttctcgaagt 24780
tcttggttac gagaacggcc agtacatcac caaaaccctg taaggagtat ttccaatgac 24840
aacggctgtt ccgttccgtc tgaccatgaa tcgcggcatt ttgttctacc ttgccgtgtt 24900
cttcgttctc gctctcgcgt tatccgcgca tccggcgatg gcctcggaag gcaccggcgg 24960
cagcttgcca tatgagagct ggctgacgaa cctgcgcaac tccgtaaccg gcccggtggc 25020
cttcgcgctg tccatcatcg gcatcgtcgt cgccggcggc gtgctgatct tcggcggcga 25080
actcaacgcc ttcttccgaa ccctgatctt cctggttctg gtgatggcgc tgctggtcgg 25140
cgcgcagaac gtgatgagca ccttcttcgg tcgtggtgcc gaaatcgcgg ccctcggcaa 25200
cggggcgctg caccaggtgc aagtcgcggc ggcggatgcc gtgcgtgcgg tagcggctgg 25260
acggctcgcc taatcatggc tctgcgcacg atccccatcc gtcgcgcagg caaccgagaa 25320
aacctgttca tgggtggtga tcgtgaactg gtgatgttct cgggcctgat ggcgtttgcg 25380
ctgattttca gcgcccaaga gctgcgggcc accgtggtcg gtctgatcct gtggttcggg 25440
gcgctctatg cgttccgaat catggcgaag gccgatccga agatgcggtt cgtgtacctg 25500
cgtcaccgcc ggtacaagcc gtattacccg gcccgctcga ccccgttccg cgagaacacc 25560
aatagccaag ggaagcaata ccgatgatcc aagcaattgc gattgcaatc gcgggcctcg 25620
gcgcgcttct gttgttcatc ctctttgccc gcatccgcgc ggtcgatgcc gaactgaaac 25680
tgaaaaagca tcgttccaag gacgccggcc tggccgatct gctcaactac gccgctgtcg 25740
tcgatgacgg cgtaatcgtg ggcaagaacg gcagctttat ggctgcctgg ctgtacaagg 25800
gcgatgacaa cgcaagcagc accgaccagc agcgcgaagt agtgtccgcc cgcatcaacc 25860
aggccctcgc gggcctggga agtgggtgga tgatccatgt ggacgccgtg cggcgtcctg 25920
ctccgaacta cgcggagcgg ggcctgtcgg cgttccctga ccgtctgacg gcagcgattg 25980
aagaagagcg ctcggtcttg ccttgctcgt cggtgatgta cttcaccagc tccgcgaagt 26040
cgctcttctt gatggagcgc atggggacgt gcttggcaat cacgcgcacc ccccggccgt 26100
tttagcggct aaaaaagtca tggctctgcc ctcgggcgga ccacgcccat catgaccttg 26160
ccaagctcgt cctgcttctc ttcgatcttc gccagcaggg cgaggatcgt ggcatcaccg 26220
aaccgcgccg tgcgcgggtc gtcggtgagc cagagtttca gcaggccgcc caggcggccc 26280
aggtcgccat tgatgcgggc cagctcgcgg acgtgctcat agtccacgac gcccgtgatt 26340
ttgtagccct ggccgacggc cagcaggtag gccgacaggc tcatgccggc cgccgccgcc 26400
ttttcctcaa tcgctcttcg ttcgtctgga aggcagtaca ccttgatagg tgggctgccc 26460
ttcctggttg gcttggtttc atcagccatc cgcttgccct catctgttac gccggcggta 26520
gccggccagc ctcgcagagc aggattcccg ttgagcaccg ccaggtgcga ataagggaca 26580
gtgaagaagg aacacccgct cgcgggtggg cctacttcac ctatcctgcc cggctgacgc 26640
cgttggatac accaaggaaa gtctacacga accctttggc aaaatcctgt atatcgtgcg 26700
aaaaaggatg gatataccga aaaaatcgct ataatgaccc cgaagcaggg ttatgcagcg 26760
gaaaagcgct gcttccctgc tgttttgtgg aatatctacc gactggaaac aggcaaatgc 26820
aggaaattac tgaactgagg ggacaggcga gagacgatgc caaagagcta caccgacgag 26880
ctggccgagt gggttgaatc ccgcgcggcc aagaagcgcc ggcgtgatga ggctgcggtt 26940
gcgttcctgg cggtgagggc ggatgtcgag gcggcgttag cgtccggcta tgcgctcgtc 27000
accatttggg agcacatgcg ggaaacgggg aaggtcaagt tctcctacga gacgttccgc 27060
tcgcacgcca ggcggcacat caaggccaag cccgccgatg tgcccgcacc gcaggccaag 27120
gctgcggaac ccgcgccggc acccaagacg ccggagccac ggcggccgaa gcaggggggc 27180
aaggctgaaa agccggcccc cgctgcggcc ccgaccggct tcaccttcaa cccaacaccg 27240
gacaaaaagg atctactgta atggcgaaaa ttcacatggt tttgcagggc aagggcgggg 27300
tcggcaagtc ggccatcgcc gcgatcattg cgcagtacaa gatggacaag gggcagacac 27360
ccttgtgcat cgacaccgac ccggtgaacg cgacgttcga gggctacaag gccctgaacg 27420
tccgccggct gaacatcatg gccggcgacg aaattaactc gcgcaacttc gacaccctgg 27480
tcgagctgat tgcgccgacc aaggatgacg tggtgatcga caacggtgcc agctcgttcg 27540
tgcctctgtc gcattacctc atcagcaacc aggtgccggc tctgctgcaa gaaatggggc 27600
atgagctggt catccatacc gtcgtcaccg gcggccaggc tctcctggac acggtgagcg 27660
gcttcgccca gctcgccagc cagttcccgg ccgaagcgct tttcgtggtc tggctgaacc 27720
cgtattgggg gcctatcgag catgagggca agagctttga gcagatgaag gcgtacacgg 27780
ccaacaaggc ccgcgtgtcg tccatcatcc agattccggc cctcaaggaa gaaacctacg 27840
gccgcgattt cagcgacatg ctgcaagagc ggctgacgtt cgaccaggcg ctggccgatg 27900
aatcgctcac gatcatgacg cggcaacgcc tcaagatcgt gcggcgcggc ctgtttgaac 27960
agctcgacgc ggcggccgtg ctatgagcga ccagattgaa gagctgatcc gggagattgc 28020
ggccaagcac ggcatcgccg tcggccgcga cgacccggtg ctgatcctgc ataccatcaa 28080
cgcccggctc atggccgaca gtgcggccaa gcaagaggaa atccttgccg cgttcaagga 28140
agagctggaa gggatcgccc atcgttgggg cgaggacgcc aaggccaaag cggagcggat 28200
gctgaacgcg gccctggcgg ccagcaagga cgcaatggcg aaggtaatga aggacagcgc 28260
cgcgcaggcg gccgaagcga tccgcaggga aatcgacgac ggccttggcc gccagctcgc 28320
ggccaaggtc gcggacgcgc ggcgcgtggc gatgatgaac atgatcgccg gcggcatggt 28380
gttgttcgcg gccgccctgg tggtgtgggc ctcgttatga atcgcagagg cgcagatgaa 28440
aaagcccggc gttgccgggc tttgtttttg cgttagctgg gcttgtttga caggcccaag 28500
ctctgactgc gcccgcgctc gcgctcctgg gcctgtttct tctcctgctc ctgcttgcgc 28560
atcagggcct ggtgccgtcg ggctgcttca cgcatcgaat cccagtcgcc ggccagctcg 28620
ggatgctccg cgcgcatctt gcgcgtcgcc agttcctcga tcttgggcgc gtgaatgccc 28680
atgccttcct tgatttcgcg caccatgtcc agccgcgtgt gcagggtctg caagcgggct 28740
tgctgttggg cctgctgctg ctgccaggcg gcctttgtac gcggcaggga cagcaagccg 28800
ggggcattgg actgtagctg ctgcaaacgc gcctgctgac ggtctacgag ctgttctagg 28860
cggtcctcga tgcgctccac ctggtcatgc tttgcctgca cgtagagcgc aagggtctgc 28920
tggtaggtct gctcgatggg cgcggattct aagagggcct gctgttccgt ctcggcctcc 28980
tgggccgcct gtagcaaatc ctcgccgctg ttgccgctgg actgctttac tgccggggac 29040
tgctgttgcc ctgctcgcgc cgtcgtcgca gttcggcttg cccccactcg attgactgct 29100
tcatttcgag ccgcagcgat gcgatctcgg attgcgtcaa cggacggggc agcgcggagg 29160
tgtccggctt ctccttgggt gagtcggtcg atgccatagc caaaggtttc cttccaaaat 29220
gcgtccattg ctggaccgtg tttctcattg atgcccgcaa gcatcttcgg cttgaccgcc 29280
aggtcaagcg cgccttcatg ggcggtcatg acggacgccg ccatgacctt gccgccgttg 29340
ttctcgatgt agccgcgtaa tgaggcaatg gtgccgccca tcgtcagcgt gtcatcgaca 29400
acgatgtact tctggccggg gatcacctcc ccctcgaaag tcgggttgaa cgccaggcga 29460
tgatctgaac cggctccggt tcgggcgacc ttctcccgct gcacaatgtc cgtttcgacc 29520
tcaaggccaa ggcggtcggc cagaacgacc gccatcatgg ccggaatctt gttgttcccc 29580
gccgcctcga cggcgaggac tggaacgatg cggggcttgt cgtcgccgat cagcgtcttg 29640
agctgggcaa cagtgtcgtc cgaaatcagg cgctcgacca aattaagcgc cgcttccgcg 29700
tcgccctgct tcgcagcctg gtattcaggc tcgttggtca aagaaccaag gtcgccgttg 29760
cgaaccacct tcgggaagtc tccccacggt gcgcgctcgg ctctgctgta gctgctcaag 29820
acgcctccct ttttagccgc taaaactcta acgagtgcgc ccgcgactca acttgacgct 29880
ttcggcactt acctgtgcct tgccacttgc gtcataggtg atgcttttcg cactcccgat 29940
ttcaggtact ttatcgaaat ctgaccgggc gtgcattaca aagttcttcc ccacctgttg 30000
gtaaatgctg ccgctatctg cgtggacgat gctgccgtcg tggcgctgcg acttatcggc 30060
cttttgggcc atatagatgt tgtaaatgcc aggtttcagg gccccggctt tatctacctt 30120
ctggttcgtc catgcgcctt ggttctcggt ctggacaatt ctttgcccat tcatgaccag 30180
gaggcggtgt ttcattgggt gactcctgac ggttgcctct ggtgttaaac gtgtcctggt 30240
cgcttgccgg ctaaaaaaaa gccgacctcg gcagttcgag gccggctttc cctagagccg 30300
ggcgcgtcaa ggttgttcca tctattttag tgaactgcgt tcgatttatc agttactttc 30360
ctcccgcttt gtgtttcctc ccactcgttt ccgcgtctag ccgacccctc aacatagcgg 30420
cctcttcttg ggctgccttt gcctcttgcc gcgcttcgtc acgctcggct tgcaccgtcg 30480
taaagcgctc ggcctgcctg gccgcctctt gcgccgccaa cttcctttgc tcctggtggg 30540
cctcggcgtc ggcctgcgcc ttcgctttca ccgctgccaa ctccgtgcgc aaactctccg 30600
cttcgcgcct ggtggcgtcg cgctcgccgc gaagcgcctg catttcctgg ttggccgcgt 30660
ccagggtctt gcggctctct tctttgaatg cgcgggcgtc ctggtgagcg tagtccagct 30720
cggcgcgcag ctcctgcgct cgacgctcca cctcgtcggc ccgctgcgtc gccagcgcgg 30780
cccgctgctc ggctcctgcc agggcggtgc gtgcttcggc cagggcttgc cgctggcgtg 30840
cggccagctc ggccgcctcg gcggcctgct gctctagcaa tgtaacgcgc gcctgggctt 30900
cttccagctc gcgggcctgc gcctcgaagg cgtcggccag ctccccgcgc acggcttcca 30960
actcgttgcg ctcacgatcc cagccggctt gcgctgcctg caacgattca ttggcaaggg 31020
cctgggcggc ttgccagagg gcggccacgg cctggttgcc ggcctgctgc accgcgtccg 31080
gcacctggac tgccagcggg gcggcctgcg ccgtgcgctg gcgtcgccat tcgcgcatgc 31140
cggcgctggc gtcgttcatg ttgacgcggg cggccttacg cactgcatcc acggtcggga 31200
agttctcccg gtcgccttgc tcgaacagct cgtccgcagc cgcaaaaatg cggtcgcgcg 31260
tctctttgtt cagttccatg ttggctccgg taattggtaa gaataataat actcttacct 31320
accttatcag cgcaagagtt tagctgaaca gttctcgact taacggcagg ttttttagcg 31380
gctgaagggc aggcaaaaaa agccccgcac ggtcggcggg ggcaaagggt cagcgggaag 31440
gggattagcg ggcgtcgggc ttcttcatgc gtcggggccg cgcttcttgg gatggagcac 31500
gacgaagcgc gcacgcgcat cgtcctcggc cctatcggcc cgcgtcgcgg tcaggaactt 31560
gtcgcgcgct aggtcctccc tggtgggcac caggggcatg aactcggcct gctcgatgta 31620
ggtccactcc atgaccgcat cgcagtcgag gccgcgttcc ttcaccgtct cttgcaggtc 31680
gcggtacgcc cgctcgttga gcggctggta acgggccaat tggtcgtaaa tggctgtcgg 31740
ccatgagcgg cctttcctgt tgagccagca gccgacgacg aagccggcaa tgcaggcccc 31800
tggcacaacc aggccgacgc cgggggcagg ggatggcagc agctcgccaa ccaggaaccc 31860
cgccgcgatg atgccgatgc cggtcaacca gcccttgaaa ctatccggcc ccgaaacacc 31920
cctgcgcatt gcctggatgc tgcgccggat agcttgcaac atcaggagcc gtttcttttg 31980
ttcgtcagtc atggtccgcc ctcaccagtt gttcgtatcg gtgtcggacg aactgaaatc 32040
gcaagagctg ccggtatcgg tccagccgct gtccgtgtcg ctgctgccga agcacggcga 32100
ggggtccgcg aacgccgcag acggcgtatc cggccgcagc gcatcgccca gcatggcccc 32160
ggtcagcgag ccgccggcca ggtagcccag catggtgctg ttggtcgccc cggccaccag 32220
ggccgacgtg acgaaatcgc cgtcattccc tctggattgt tcgctgctcg gcggggcagt 32280
gcgccgcgcc ggcggcgtcg tggatggctc gggttggctg gcctgcgacg gccggcgaaa 32340
ggtgcgcagc agctcgttat cgaccggctg cggcgtcggg gccgccgcct tgcgctgcgg 32400
tcggtgttcc ttcttcggct cgcgcagctt gaacagcatg atcgcggaaa ccagcagcaa 32460
cgccgcgcct acgcctcccg cgatgtagaa cagcatcgga ttcattcttc ggtcctcctt 32520
gtagcggaac cgttgtctgt gcggcgcggg tggcccgcgc cgctgtcttt ggggatcagc 32580
cctcgatgag cgcgaccagt ttcacgtcgg caaggttcgc ctcgaactcc tggccgtcgt 32640
cctcgtactt caaccaggca tagccttccg ccggcggccg acggttgagg ataaggcggg 32700
cagggcgctc gtcgtgctcg acctggacga tggccttttt cagcttgtcc gggtccggct 32760
ccttcgcgcc cttttccttg gcgtccttac cgtcctggtc gccgtcctcg ccgtcctggc 32820
cgtcgccggc ctccgcgtca cgctcggcat cagtctggcc gttgaaggca tcgacggtgt 32880
tgggatcgcg gcccttctcg tccaggaact cgcgcagcag cttgaccgtg ccgcgcgtga 32940
tttcctgggt gtcgtcgtca agccacgcct cgacttcctc cgggcgcttc ttgaaggccg 33000
tcaccagctc gttcaccacg gtcacgtcgc gcacgcggcc ggtgttgaac gcatcggcga 33060
tcttctccgg caggtccagc agcgtgacgt gctgggtgat gaacgccggc gacttgccga 33120
tttccttggc gatatcgcct ttcttcttgc ccttcgccag ctcgcggcca atgaagtcgg 33180
caatttcgcg cggggtcagc tcgttgcgtt gcaggttctc gataacctgg tcggcttcgt 33240
tgtagtcgtt gtcgatgaac gccgggatgg acttcttgcc ggcccacttc gagccacggt 33300
agcggcgggc gccgtgattg atgatatagc ggcccggctg ctcctggttc tcgcgcaccg 33360
aaatgggtga cttcaccccg cgctctttga tcgtggcacc gatttccgcg atgctctccg 33420
gggaaaagcc ggggttgtcg gccgtccgcg gctgatgcgg atcttcgtcg atcaggtcca 33480
ggtccagctc gatagggccg gaaccgccct gagacgccgc aggagcgtcc aggaggctcg 33540
acaggtcgcc gatgctatcc aaccccaggc cggacggctg cgccgcgcct gcggcttcct 33600
gagcggccgc agcggtgttt ttcttggtgg tcttggcttg agccgcagtc attgggaaat 33660
ctccatcttc gtgaacacgt aatcagccag ggcgcgaacc tctttcgatg ccttgcgcgc 33720
ggccgttttc ttgatcttcc agaccggcac accggatgcg agggcatcgg cgatgctgct 33780
gcgcaggcca acggtggccg gaatcatcat cttggggtac gcggccagca gctcggcttg 33840
gtggcgcgcg tggcgcggat tccgcgcatc gaccttgctg ggcaccatgc caaggaattg 33900
cagcttggcg ttcttctggc gcacgttcgc aatggtcgtg accatcttct tgatgccctg 33960
gatgctgtac gcctcaagct cgatggggga cagcacatag tcggccgcga agagggcggc 34020
cgccaggccg acgccaaggg tcggggccgt gtcgatcagg cacacgtcga agccttggtt 34080
cgccagggcc ttgatgttcg ccccgaacag ctcgcgggcg tcgtccagcg acagccgttc 34140
ggcgttcgcc agtaccgggt tggactcgat gagggcgagg cgcgcggcct ggccgtcgcc 34200
ggctgcgggt gcggtttcgg tccagccgcc ggcagggaca gcgccgaaca gcttgcttgc 34260
atgcaggccg gtagcaaagt ccttgagcgt gtaggacgca ttgccctggg ggtccaggtc 34320
gatcacggca acccgcaagc cgcgctcgaa aaagtcgaag gcaagatgca caagggtcga 34380
agtcttgccg acgccgcctt tctggttggc cgtgaccaaa gttttcatcg tttggtttcc 34440
tgttttttct tggcgtccgc ttcccacttc cggacgatgt acgcctgatg ttccggcaga 34500
accgccgtta cccgcgcgta cccctcgggc aagttcttgt cctcgaacgc ggcccacacg 34560
cgatgcaccg cttgcgacac tgcgcccctg gtcagtccca gcgacgttgc gaacgtcgcc 34620
tgtggcttcc catcgactaa gacgccccgc gctatctcga tggtctgctg ccccacttcc 34680
agcccctgga tcgcctcctg gaactggctt tcggtaagcc gtttcttcat ggataacacc 34740
cataatttgc tccgcgcctt ggttgaacat agcggtgaca gccgccagca catgagagaa 34800
gtttagctaa acatttctcg cacgtcaaca cctttagccg ctaaaactcg tccttggcgt 34860
aacaaaacaa aagcccggaa accgggcttt cgtctcttgc cgcttatggc tctgcacccg 34920
gctccatcac caacaggtcg cgcacgcgct tcactcggtt gcggatcgac actgccagcc 34980
caacaaagcc ggttgccgcc gccgccagga tcgcgccgat gatgccggcc acaccggcca 35040
tcgcccacca ggtcgccgcc ttccggttcc attcctgctg gtactgcttc gcaatgctgg 35100
acctcggctc accataggct gaccgctcga tggcgtatgc cgcttctccc cttggcgtaa 35160
aacccagcgc cgcaggcggc attgccatgc tgcccgccgc tttcccgacc acgacgcgcg 35220
caccaggctt gcggtccaga ccttcggcca cggcgagctg cgcaaggaca taatcagccg 35280
ccgacttggc tccacgcgcc tcgatcagct cttgcactcg cgcgaaatcc ttggcctcca 35340
cggccgccat gaatcgcgca cgcggcgaag gctccgcagg gccggcgtcg tgatcgccgc 35400
cgagaatgcc cttcaccaag ttcgacgaca cgaaaatcat gctgacggct atcaccatca 35460
tgcagacgga tcgcacgaac ccgctgaatt gaacacgagc acggcacccg cgaccactat 35520
gccaagaatg cccaaggtaa aaattgccgg ccccgccatg aagtccgtga atgccccgac 35580
ggccgaagtg aagggcaggc cgccacccag gccgccgccc tcactgcccg gcacctggtc 35640
gctgaatgtc gatgccagca cctgcggcac gtcaatgctt ccgggcgtcg cgctcgggct 35700
gatcgcccat cccgttactg ccccgatccc ggcaatggca aggactgcca gcgctgccat 35760
ttttggggtg aggccgttcg cggccgaggg gcgcagcccc tggggggatg ggaggcccgc 35820
gttagcgggc cgggagggtt cgagaagggg gggcaccccc cttcggcgtg cgcggtcacg 35880
cgcacagggc gcagccctgg ttaaaaacaa ggtttataaa tattggttta aaagcaggtt 35940
aaaagacagg ttagcggtgg ccgaaaaacg ggcggaaacc cttgcaaatg ctggattttc 36000
tgcctgtgga cagcccctca aatgtcaata ggtgcgcccc tcatctgtca gcactctgcc 36060
cctcaagtgt caaggatcgc gcccctcatc tgtcagtagt cgcgcccctc aagtgtcaat 36120
accgcagggc acttatcccc aggcttgtcc acatcatctg tgggaaactc gcgtaaaatc 36180
aggcgttttc gccgatttgc gaggctggcc agctccacgt cgccggccga aatcgagcct 36240
gcccctcatc tgtcaacgcc gcgccgggtg agtcggcccc tcaagtgtca acgtccgccc 36300
ctcatctgtc agtgagggcc aagttttccg cgaggtatcc acaacgccgg cggccgcggt 36360
gtctcgcaca cggcttcgac ggcgtttctg gcgcgtttgc agggccatag acggccgcca 36420
gcccagcggc gagggcaacc agcccggtga gcgtcggaaa ggcgctggaa gccccgtagc 36480
gacgcggaga ggggcgagac aagccaaggg cgcaggctcg atgcgcagca cgacatagcc 36540
ggttctcgca aggacgagaa tttccctgcg gtgcccctca agtgtcaatg aaagtttcca 36600
acgcgagcca ttcgcgagag ccttgagtcc acgctagatg agagctttgt tgtaggtgga 36660
ccagttggtg attttgaact tttgctttgc cacggaacgg tctgcgttgt cgggaagatg 36720
cgtgatctga tccttcaact cagcaaaagt tcgatttatt caacaaagcc acgttgtgtc 36780
tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact 36840
gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac gggaaacgtc 36900
ttgctcgac 36909
<210>8
<211>13019
<212>DNA
<213>人工序列
<220>
<223>PHP23235构建体
<400>8
gttacccgga ccgaagctta gcccgggcat gcctgcagtg cagcgtgacc cggtcgtgcc 60
cctctctaga gataatgagc attgcatgtc taagttataa aaaattacca catatttttt 120
ttgtcacact tgtttgaagt gcagtttatc tatctttata catatattta aactttactc 180
tacgaataat ataatctata gtactacaat aatatcagtg ttttagagaa tcatataaat 240
gaacagttag acatggtcta aaggacaatt gagtattttg acaacaggac tctacagttt 300
tatcttttta gtgtgcatgt gttctccttt ttttttgcaa atagcttcac ctatataata 360
cttcatccat tttattagta catccattta gggtttaggg ttaatggttt ttatagacta 420
atttttttag tacatctatt ttattctatt ttagcctcta aattaagaaa actaaaactc 480
tattttagtt tttttattta ataatttaga tataaaatag aataaaataa agtgactaaa 540
aattaaacaa atacccttta agaaattaaa aaaactaagg aaacattttt cttgtttcga 600
gtagataatg ccagcctgtt aaacgccgtc gacgagtcta acggacacca accagcgaac 660
cagcagcgtc gcgtcgggcc aagcgaagca gacggcacgg catctctgtc gctgcctctg 720
gacccctctc gagagttccg ctccaccgtt ggacttgctc cgctgtcggc atccagaaat 780
tgcgtggcgg agcggcagac gtgagccggc acggcaggcg gcctcctcct cctctcacgg 840
cacggcagct acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc 900
gtaataaata gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca 960
cacacacaca accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc 1020
cgctcgtcct cccccccccc ccctctctac cttctctaga tcggcgttcc ggtccatggt 1080
tagggcccgg tagttctact tctgttcatg tttgtgttag atccgtgttt gtgttagatc 1140
cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc agacacgttc tgattgctaa 1200
cttgccagtg tttctctttg gggaatcctg ggatggctct agccgttccg cagacgggat 1260
cgatttcatg attttttttg tttcgttgca tagggtttgg tttgcccttt tcctttattt 1320
caatatatgc cgtgcacttg tttgtcgggt catcttttca tgcttttttt tgtcttggtt 1380
gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga gtagaattct gtttcaaact 1440
acctggtgga tttattaatt ttggatctgt atgtgtgtgc catacatatt catagttacg 1500
aattgaagat gatggatgga aatatcgatc taggataggt atacatgttg atgcgggttt 1560
tactgatgca tatacagaga tgctttttgt tcgcttggtt gtgatgatgt ggtgtggttg 1620
ggcggtcgtt cattcgttct agatcggagt agaatactgt ttcaaactac ctggtgtatt 1680
tattaatttt ggaactgtat gtgtgtgtca tacatcttca tagttacgag tttaagatgg 1740
atggaaatat cgatctagga taggtataca tgttgatgtg ggttttactg atgcatatac 1800
atgatggcat atgcagcatc tattcatatg ctctaacctt gagtacctat ctattataat 1860
aaacaagtat gttttataat tattttgatc ttgatatact tggatgatgg catatgcagc 1920
agctatatgt ggattttttt agccctgcct tcatacgcta tttatttgct tggtactgtt 1980
tcttttgtcg atgctcaccc tgttgtttgg tgttacttct gcaggtcgac tctagaggat 2040
ccacaagttt gtacaaaaaa gctgaacgag aaacgtaaaa tgatataaat atcaatatat 2100
taaattagat tttgcataaa aaacagacta cataatactg taaaacacaa catatccagt 2160
cactatggcg gccgcattag gcaccccagg ctttacactt tatgcttccg gctcgtataa 2220
tgtgtggatt ttgagttagg atttaaatac gcgttgatcc ggcttactaa aagccagata 2280
acagtatgcg tatttgcgcg ctgatttttg cggtataaga atatatactg atatgtatac 2340
ccgaagtatg tcaaaaagag gtatgctatg aagcagcgta ttacagtgac agttgacagc 2400
gacagctatc agttgctcaa ggcatatatg atgtcaatat ctccggtctg gtaagcacaa 2460
ccatgcagaa tgaagcccgt cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag 2520
ggatggctga ggtcgcccgg tttattgaaa tgaacggctc ttttgctgac gagaacaggg 2580
gctggtgaaa tgcagtttaa ggtttacacc tataaaagag agagccgtta tcgtctgttt 2640
gtggatgtac agagtgatat cattgacacg cccggtcgac ggatggtgat ccccctggcc 2700
agtgcacgtc tgctgtcaga taaagtctcc cgtgaacttt acccggtggt gcatatcggg 2760
gatgaaagct ggcgcatgat gaccaccgat atggccagtg tgccggtctc cgttatcggg 2820
gaagaagtgg ctgatctcag ccaccgcgaa aatgacatcaaaaacgccat taacctgatg 2880
ttctggggaa tataaatgtc aggctccctt atacacagcc agtctgcagg tcgaccatag 2940
tgactggata tgttgtgttt tacagtatta tgtagtctgt tttttatgca aaatctaatt 3000
taatatattg atatttatat cattttacgt ttctcgttca gctttcttgt acaaagtggt 3060
gttaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag 3120
gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt 3180
gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg 3240
aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat 3300
atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag 3360
tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg agctcgaatt ccggtccggg 3420
tcacctttgt ccaccaagat ggaactgcgg ccgctcatta attaagtcag gcgcgcctct 3480
agttgaagac acgttcatgt cttcatcgta agaagacact cagtagtctt cggccagaat 3540
ggccatctgg attcagcagg cctagaaggc catttaaatc ctgaggatct ggtcttccta 3600
aggacccggg atatcggacc gattaaactt taattcggtc cgaagcttgc atgcctgcag 3660
tgcagcgtga cccggtcgtg cccctctcta gagataatga gcattgcatg tctaagttat 3720
aaaaaattac cacatatttt ttttgtcaca cttgtttgaa gtgcagttta tctatcttta 3780
tacatatatt taaactttac tctacgaata atataatcta tagtactaca ataatatcag 3840
tgttttagag aatcatataa atgaacagtt agacatggtc taaaggacaa ttgagtattt 3900
tgacaacagg actctacagt tttatctttt tagtgtgcat gtgttctcct ttttttttgc 3960
aaatagcttc acctatataa tacttcatcc attttattag tacatccatt tagggtttag 4020
ggttaatggt ttttatagac taattttttt agtacatcta ttttattcta ttttagcctc 4080
taaattaaga aaactaaaac tctattttag tttttttatt taataattta gatataaaat 4140
agaataaaat aaagtgacta aaaattaaac aaataccctt taagaaatta aaaaaactaa 4200
ggaaacattt ttcttgtttc gagtagataa tgccagcctg ttaaacgccg tcgacgagtc 4260
taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag cagacggcac 4320
ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg ttggacttgc 4380
tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg gcacggcagg 4440
cggcctcctc ctcctctcac ggcaccggca gctacggggg attcctttcc caccgctcct 4500
tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc 4560
aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc 4620
ggcacctccg cttcaaggta cgccgctcgt cctccccccc ccccctctct accttctcta 4680
gatcggcgtt ccggtccatg catggttagg gcccggtagt tctacttctg ttcatgtttg 4740
tgttagatcc gtgtttgtgt tagatccgtg ctgctagcgt tcgtacacgg atgcgacctg 4800
tacgtcagac acgttctgat tgctaacttg ccagtgtttc tctttgggga atcctgggat 4860
ggctctagcc gttccgcaga cgggatcgat ttcatgattt tttttgtttc gttgcatagg 4920
gtttggtttg cccttttcct ttatttcaat atatgccgtg cacttgtttg tcgggtcatc 4980
ttttcatgct tttttttgtc ttggttgtga tgatgtggtc tggttgggcg gtcgttctag 5040
atcggagtag aattctgttt caaactacct ggtggattta ttaattttgg atctgtatgt 5100
gtgtgccata catattcata gttacgaatt gaagatgatg gatggaaata tcgatctagg 5160
ataggtatac atgttgatgc gggttttact gatgcatata cagagatgct ttttgttcgc 5220
ttggttgtga tgatgtggtg tggttgggcg gtcgttcatt cgttctagat cggagtagaa 5280
tactgtttca aactacctgg tgtatttatt aattttggaa ctgtatgtgt gtgtcataca 5340
tcttcatagt tacgagttta agatggatgg aaatatcgat ctaggatagg tatacatgtt 5400
gatgtgggtt ttactgatgc atatacatga tggcatatgc agcatctatt catatgctct 5460
aaccttgagt acctatctat tataataaac aagtatgttt tataattatt ttgatcttga 5520
tatacttgga tgatggcata tgcagcagct atatgtggat ttttttagcc ctgccttcat 5580
acgctattta tttgcttggt actgtttctt ttgtcgatgc tcaccctgtt gtttggtgtt 5640
acttctgcag gtcgacttta acttagccta ggatccacac gacaccatgt cccccgagcg 5700
ccgccccgtc gagatccgcc cggccaccgc cgccgacatg gccgccgtgt gcgacatcgt 5760
gaaccactac atcgagacct ccaccgtgaa cttccgcacc gagccgcaga ccccgcagga 5820
gtggatcgac gacctggagc gcctccagga ccgctacccg tggctcgtgg ccgaggtgga 5880
gggcgtggtg gccggcatcg cctacgccgg cccgtggaag gcccgcaacg cctacgactg 5940
gaccgtggag tccaccgtgt acgtgtccca ccgccaccag cgcctcggcc tcggctccac 6000
cctctacacc cacctcctca agagcatgga ggcccagggc ttcaagtccg tggtggccgt 6060
gatcggcctc ccgaacgacc cgtccgtgcg cctccacgag gccctcggct acaccgcccg 6120
cggcaccctc cgcgccgccg gctacaagca cggcggctgg cacgacgtcg gcttctggca 6180
gcgcgacttc gagctgccgg ccccgccgcg cccggtgcgc ccggtgacgc agatctgagt 6240
cgaaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag 6300
gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt 6360
gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg 6420
aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat 6480
atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag 6540
tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg agctcgaatt cattccgatt 6600
aatcgtggcc tcttgctctt caggatgaag agctatgttt aaacgtgcaa gcgctactag 6660
acaattcagt acattaaaaa cgtccgcaat gtgttattaa gttgtctaag cgtcaatttg 6720
tttacaccac aatatatcct gccaccagcc agccaacagc tccccgaccg gcagctcggc 6780
acaaaatcac cactcgatac aggcagccca tcagtccggg acggcgtcag cgggagagcc 6840
gttgtaaggc ggcagacttt gctcatgtta ccgatgctat tcggaagaac ggcaactaag 6900
ctgccgggtt tgaaacacgg atgatctcgc ggagggtagc atgttgattg taacgatgac 6960
agagcgttgc tgcctgtgat caaatatcat ctccctcgca gagatccgaa ttatcagcct 7020
tcttattcat ttctcgctta accgtgacag gctgtcgatc ttgagaacta tgccgacata 7080
ataggaaatc gctggataaa gccgctgagg aagctgagtg gcgctatttc tttagaagtg 7140
aacgttgacg atcgtcgacc gtaccccgat gaattaattc ggacgtacgt tctgaacaca 7200
gctggatact tacttgggcg attgtcatac atgacatcaa caatgtaccc gtttgtgtaa 7260
ccgtctcttg gaggttcgta tgacactagt ggttcccctc agcttgcgac tagatgttga 7320
ggcctaacat tttattagag agcaggctag ttgcttagat acatgatctt caggccgtta 7380
tctgtcaggg caagcgaaaa ttggccattt atgacgacca atgccccgca gaagctccca 7440
tctttgccgc catagacgcc gcgcccccct tttggggtgt agaacatcct tttgccagat 7500
gtggaaaaga agttcgttgt cccattgttg gcaatgacgt agtagccggc gaaagtgcga 7560
gacccatttg cgctatatat aagcctacga tttccgttgc gactattgtc gtaattggat 7620
gaactattat cgtagttgct ctcagagttg tcgtaatttg atggactatt gtcgtaattg 7680
cttatggagt tgtcgtagtt gcttggagaa atgtcgtagt tggatgggga gtagtcatag 7740
ggaagacgag cttcatccac taaaacaatt ggcaggtcag caagtgcctg ccccgatgcc 7800
atcgcaagta cgaggcttag aaccaccttc aacagatcgc gcatagtctt ccccagctct 7860
ctaacgcttg agttaagccg cgccgcgaag cggcgtcggc ttgaacgaat tgttagacat 7920
tatttgccga ctaccttggt gatctcgcct ttcacgtagt gaacaaattc ttccaactga 7980
tctgcgcgcg aggccaagcg atcttcttgt ccaagataag cctgcctagc ttcaagtatg 8040
acgggctgat actgggccgg caggcgctcc attgcccagt cggcagcgac atccttcggc 8100
gcgattttgc cggttactgc gctgtaccaa atgcgggaca acgtaagcac tacatttcgc 8160
tcatcgccag cccagtcggg cggcgagttc catagcgtta aggtttcatt tagcgcctca 8220
aatagatcct gttcaggaac cggatcaaag agttcctccg ccgctggacc taccaaggca 8280
acgctatgtt ctcttgcttt tgtcagcaag atagccagat caatgtcgat cgtggctggc 8340
tcgaagatac ctgcaagaat gtcattgcgc tgccattctc caaattgcag ttcgcgctta 8400
gctggataac gccacggaat gatgtcgtcg tgcacaacaa tggtgacttc tacagcgcgg 8460
agaatctcgc tctctccagg ggaagccgaa gtttccaaaa ggtcgttgat caaagctcgc 8520
cgcgttgttt catcaagcct tacagtcacc gtaaccagca aatcaatatc actgtgtggc 8580
ttcaggccgc catccactgc ggagccgtac aaatgtacgg ccagcaacgt cggttcgaga 8640
tggcgctcga tgacgccaac tacctctgat agttgagtcg atacttcggc gatcaccgct 8700
tccctcatga tgtttaactc ctgaattaag ccgcgccgcg aagcggtgtc ggcttgaatg 8760
aattgttagg cgtcatcctg tgctcccgag aaccagtacc agtacatcgc tgtttcgttc 8820
gagacttgag gtctagtttt atacgtgaac aggtcaatgc cgccgagagt aaagccacat 8880
tttgcgtaca aattgcaggc aggtacattg ttcgtttgtg tctctaatcg tatgccaagg 8940
agctgtctgc ttagtgccca ctttttcgca aattcgatga gactgtgcgc gactcctttg 9000
cctcggtgcg tgtgcgacac aacaatgtgt tcgatagagg ctagatcgtt ccatgttgag 9060
ttgagttcaa tcttcccgac aagctcttgg tcgatgaatg cgccatagca agcagagtct 9120
tcatcagagt catcatccga gatgtaatcc ttccggtagg ggctcacact tctggtagat 9180
agttcaaagc cttggtcgga taggtgcaca tcgaacactt cacgaacaat gaaatggttc 9240
tcagcatcca atgtttccgc cacctgctca gggatcaccg aaatcttcat atgacgccta 9300
acgcctggca cagcggatcg caaacctggc gcggcttttg gcacaaaagg cgtgacaggt 9360
ttgcgaatcc gttgctgcca cttgttaacc cttttgccag atttggtaac tataatttat 9420
gttagaggcg aagtcttggg taaaaactgg cctaaaattg ctggggattt caggaaagta 9480
aacatcacct tccggctcga tgtctattgt agatatatgt agtgtatcta cttgatcggg 9540
ggatctgctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc 9600
cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg 9660
cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt agcgatagcg 9720
gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat 9780
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc 9840
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 9900
ctcaaaggcg gtaatacggt tatccacagaatcaggggat aacgcaggaa agaacatgtg 9960
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 10020
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 10080
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 10140
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 10200
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 10260
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 10320
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 10380
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 10440
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 10500
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 10560
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 10620
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 10680
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 10740
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 10800
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 10860
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 10920
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 10980
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 11040
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg cagggggggg 11100
gggggggggg gacttccatt gttcattcca cggacaaaaa cagagaaagg aaacgacaga 11160
ggccaaaaag cctcgctttc agcacctgtc gtttcctttc ttttcagagg gtattttaaa 11220
taaaaacatt aagttatgac gaagaagaac ggaaacgcct taaaccggaa aattttcata 11280
aatagcgaaa acccgcgagg tcgccgcccc gtaacctgtc ggatcaccgg aaaggacccg 11340
taaagtgata atgattatca tctacatatc acaacgtgcg tggaggccat caaaccacgt 11400
caaataatca attatgacgc aggtatcgta ttaattgatc tgcatcaact taacgtaaaa 11460
acaacttcag acaatacaaa tcagcgacac tgaatacggg gcaacctcat gtcccccccc 11520
cccccccccc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct 11580
ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta 11640
gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg 11700
ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga 11760
ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt 11820
gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca 11880
ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt 11940
cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt 12000
ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga 12060
aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt 12120
gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc 12180
gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc atgacattaa 12240
cctataaaaa taggcgtatc acgaggccct ttcgtcttca agaattggtc gacgatcttg 12300
ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggattgaagg cgagatccag 12360
caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg tgatgactgg ccaggacgtc 12420
ggccgaaaga gcgacaagca gatcacgctt ttcgacagcg tcggatttgc gatcgaggat 12480
ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat caagccacag cagcccactc 12540
gaccttctag ccgacccaga cgagccaagg gatctttttg gaatgctgct ccgtcgtcag 12600
gctttccgac gtttgggtgg ttgaacagaa gtcattatcg tacggaatgc caagcactcc 12660
cgaggggaac cctgtggttg gcatgcacat acaaatggac gaacggataa accttttcac 12720
gcccttttaa atatccgtta ttctaataaa cgctcttttc tcttaggttt acccgccaat 12780
atatcctgtc aaacactgat agtttaaact gaaggcggga aacgacaatc tgatcatgag 12840
cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa gccgttttac 12900
gtttggaact gacagaaccg caacgttgaa ggagccactc agcaagctgg tacgattgta 12960
atacgactca ctatagggcg aattgagcgc tgtttaaacg ctcttcaact ggaagagcg 13019
<210>9
<211>2991
<212>DNA
<213>人工序列
<220>
<223>PHP20234构建体
<400>9
ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga 60
taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga 120
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 180
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc 240
tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta 300
gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc 360
acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa 420
caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg 480
gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa 540
aacgacggcc agtcttaagc tcgggccctg cagctctaga gctcgaattc tacaggtcac 600
taataccatc taagtagttg gttcatagtg actgcatatg ttgtgtttta cagtattatg 660
tagtctgttt tttatgcaaa atctaattta atatattgat atttatatca ttttacgttt 720
ctcgttcaac tttcttgtac aaagtggccg ttaacggatc cagacttgtc catcttctgg 780
attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca 840
ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga 900
gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg 960
atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa 1020
ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggca 1080
agcttgcggc cgccccgggc aactttatta tacaaagttg gcattataaa aaagcattgc 1140
ttatcaattt gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttggagc 1200
tccatggtag cgttaacgcg gccgcgatat cccctatagt gagtcgtatt acatggtcat 1260
agctgtttcc tggcagctct ggcccgtgtc tcaaaatctc tgatgttaca ttgcacaaga 1320
taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg 1380
tgttatgagc catattcaac gggaaacgtc gaggccgcga ttaaattcca acatggatgc 1440
tgatttatat gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta 1500
tcgcttgtat gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt 1560
tgccaatgat gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct 1620
tccgaccatc aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat 1680
ccccggaaaa acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt 1740
tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt 1800
taacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt 1860
tgatgcgagt gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga 1920
aatgcataaa cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact 1980
tgataacctt atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg 2040
aatcgcagac cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc 2100
ttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt 2160
gcagtttcat ttgatgctcg atgagttttt ctaatcagaa ttggttaatt ggttgtaaca 2220
ctggcagagc attacgctga cttgacggga cggcgcaagc tcatgaccaa aatcccttaa 2280
cgtgagttac gcgtcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 2340
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 2400
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 2460
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 2520
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 2580
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 2640
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 2700
ctacaccgaa ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg 2760
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 2820
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 2880
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 2940
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt t 2991
<210>10
<211>13278
<212>DNA
<213>人工序列
<220>
<223>PHP22655构建体(目的载体)
<400>10
aagctggtac gattgtaata cgactcacta tagggcgaat tgagcgctgt ttaaacgctc 60
ttcaactgga agagcggtta ccagagctgg tcacctttgt ccaccaagat ggaactgcgg 120
ccgctcatta attaagtcag gcgcgcctct agttgaagac acgttcatgt cttcatcgta 180
agaagacact cagtagtctt cggccagaat ggcccggacc gaagctggcc gctctagaac 240
tagtggatct cgatgtgtag tctacgagaa gggttaaccg tctcttcgtg agaataaccg 300
tggcctaaaa ataagccgat gaggataaat aaaatgtggt ggtacagtac ttcaagaggt 360
ttactcatca agaggatgct tttccgatga gctctagtag tacatcggac ctcacatacc 420
tccattgtgg tgaaatattt tgtgctcatt tagtgatggg taaattttgt ttatgtcact 480
ctaggttttg acatttcagt tttgccactc ttaggttttg acaaataatt tccattccgc 540
ggcaaaagca aaacaatttt attttacttt taccactctt agctttcaca atgtatcaca 600
aatgccactc tagaaattct gtttatgcca cagaatgtga aaaaaaacac tcacttattt 660
gaagccaagg tgttcatggc atggaaatgt gacataaagt aacgttcgtg tataagaaaa 720
aattgtactc ctcgtaacaa gagacggaaa catcatgaga caatcgcgtt tggaaggctt 780
tgcatcacct ttggatgatg cgcatgaatg gagtcgtctg cttgctagcc ttcgcctacc 840
gcccactgag tccgggcggc aactaccatc ggcgaacgac ccagctgacc tctaccgacc 900
ggacttgaat gcgctacctt cgtcagcgac gatggccgcg tacgctggcg acgtgccccc 960
gcatgcatgg cggcacatgg cgagctcaga ccgtgcgtgg ctggctacaa atacgtaccc 1020
cgtgagtgcc ctagctagaa acttacacct gcaactgcga gagcgagcgt gtgagtgtag 1080
ccgagtagat cccccggtcg ccaccatggc ctcctccgag aacgtcatca ccgagttcat 1140
gcgcttcaag gtgcgcatgg agggcaccgt gaacggccac gagttcgaga tcgagggcga 1200
gggcgagggc cgcccctacg agggccacaa caccgtgaag ctgaaggtga ccaagggcgg 1260
ccccctgccc ttcgcctggg acatcctgtc cccccagttc cagtacggct ccaaggtgta 1320
cgtgaagcac cccgccgaca tccccgacta caagaagctg tccttccccg agggcttcaa 1380
gtgggagcgc gtgatgaact tcgaggacgg cggcgtggcg accgtgaccc aggactcctc 1440
cctgcaggac ggctgcttca tctacaaggt gaagttcatc ggcgtgaact tcccctccga 1500
cggccccgtg atgcagaaga agaccatggg ctgggaggcc tccaccgagc gcctgtaccc 1560
ccgcgacggc gtgctgaagg gcgagaccca caaggccctg aagctgaagg acggcggcca 1620
ctacctggtg gagttcaagt ccatctacat ggccaagaag cccgtgcagc tgcccggcta 1680
ctactacgtg gacgccaagc tggacatcac ctcccacaac gaggactaca ccatcgtgga 1740
gcagtacgag cgcaccgagg gccgccacca cctgttcctg tagcggccca tggatattcg 1800
aacgcgtagg taccacatgg ttaacctaga cttgtccatc ttctggattg gccaacttaa 1860
ttaatgtatg aaataaaagg atgcacacat agtgacatgc taatcactat aatgtgggca 1920
tcaaagttgt gtgttatgtg taattactag ttatctgaat aaaagagaaa gagatcatcc 1980
atatttctta tcctaaatga atgtcacgtg tctttataat tctttgatga accagatgca 2040
tttcattaac caaatccata tacatataaa tattaatcat atataattaa tatcaattgg 2100
gttagcaaaa caaatctagt ctaggtgtgt tttgcgaatg cggccgccac cgcggtggag 2160
ctcgaattcc ggtccgggcc tagaaggcca tttaaatcct gaggatctgg tcttcctaag 2220
gacccgggat atcgctatca actttgtata gaaaagttga acgagaaacg taaaatgata 2280
taaatatcaa tatattaaat tagattttgc ataaaaaaca gactacataa tactgtaaaa 2340
cacaacatat ccagtcacta tggtcgacct gcagactggc tgtgtataag ggagcctgac 2400
atttatattc cccagaacat caggttaatg gcgtttttga tgtcattttc gcggtggctg 2460
agatcagcca cttcttcccc gataacggag accggcacac tggccatatc ggtggtcatc 2520
atgcgccagc tttcatcccc gatatgcacc accgggtaaa gttcacgggg gactttatct 2580
gacagcagac gtgcactggc cagggggatc accatccgtc gcccgggcgt gtcaataata 2640
tcactctgta catccacaaa cagacgataa cggctctctc ttttataggt gtaaacctta 2700
aactgcattt caccagcccc tgttctcgtc ggcaaaagag ccgttcattt caataaaccg 2760
ggcgacctca gccatccctt cctgattttc cgctttccag cgttcggcac gcagacgacg 2820
ggcttcattc tgcatggttg tgcttaccga accggagata ttgacatcat atatgccttg 2880
agcaactgat agctgtcgct gtcaactgtc actgtaatac gctgcttcat agcatacctc 2940
tttttgacat acttcgggta tacatatcag tatatattct tataccgcaa aaatcagcgc 3000
gcaaatacgc atactgttat ctggctttta gtaagccgga tcctctagat tacgccccgc 3060
ctgccactca tcgcagtact gttgtaattc attaagcatt ctgccgacat ggaagccatc 3120
acaaacggca tgatgaacct gaatcgccag cggcatcagc accttgtcgc cttgcgtata 3180
atatttgccc atggtgaaaa cgggggcgaa gaagttgtcc atattggcca cgtttaaatc 3240
aaaactggtg aaactcaccc agggattggc tgagacgaaa aacatattct caataaaccc 3300
tttagggaaa taggccaggt tttcaccgta acacgccaca tcttgcgaat atatgtgtag 3360
aaactgccgg aaatcgtcgt ggtattcact ccagagcgat gaaaacgttt cagtttgctc 3420
atggaaaacg gtgtaacaag ggtgaacact atcccatatc accagctcac cgtctttcat 3480
tgccatacgg aattccggat gagcattcat caggcgggca agaatgtgaa taaaggccgg 3540
ataaaacttg tgcttatttt tctttacggt ctttaaaaag gccgtaatat ccagctgaac 3600
ggtctggtta taggtacatt gagcaactga ctgaaatgcc tcaaaatgtt ctttacgatg 3660
ccattgggat atatcaacgg tggtatatcc agtgattttt ttctccattt tagcttcctt 3720
agctcctgaa aatctcgacg gatcctaact caaaatccac acattatacg agccggaagc 3780
ataaagtgta aagcctgggg tgccctaatg cggccgccat agtgactgga tatgttgtgt 3840
tttacagtat tatgtagtct gttttttatg caaaatctaa tttaatatat tgatatttat 3900
atcattttac gtttctcgtt caactttatt atacaaagtt gatagatatc ggaccgatta 3960
aactttaatt cggtccgaag cttgcatgcc tgcagtgcag cgtgacccgg tcgtgcccct 4020
ctctagagat aatgagcatt gcatgtctaa gttataaaaa attaccacat attttttttg 4080
tcacacttgt ttgaagtgca gtttatctat ctttatacat atatttaaac tttactctac 4140
gaataatata atctatagta ctacaataat atcagtgttt tagagaatca tataaatgaa 4200
cagttagaca tggtctaaag gacaattgag tattttgaca acaggactct acagttttat 4260
ctttttagtg tgcatgtgtt ctcctttttt tttgcaaata gcttcaccta tataatactt 4320
catccatttt attagtacat ccatttaggg tttagggtta atggttttta tagactaatt 4380
tttttagtac atctatttta ttctatttta gcctctaaat taagaaaact aaaactctat 4440
tttagttttt ttatttaata atttagatat aaaatagaat aaaataaagt gactaaaaat 4500
taaacaaata ccctttaaga aattaaaaaa actaaggaaa catttttctt gtttcgagta 4560
gataatgcca gcctgttaaa cgccgtcgac gagtctaacg gacaccaacc agcgaaccag 4620
cagcgtcgcg tcgggccaag cgaagcagac ggcacggcat ctctgtcgct gcctctggac 4680
ccctctcgag agttccgctc caccgttgga cttgctccgc tgtcggcatc cagaaattgc 4740
gtggcggagc ggcagacgtg agccggcacg gcaggcggcc tcctcctcct ctcacggcac 4800
cggcagctac gggggattcc tttcccaccg ctccttcgct ttcccttcct cgcccgccgt 4860
aataaataga caccccctcc acaccctctt tccccaacct cgtgttgttc ggagcgcaca 4920
cacacacaac cagatctccc ccaaatccac ccgtcggcac ctccgcttca aggtacgccg 4980
ctcgtcctcc cccccccccc tctctacctt ctctagatcg gcgttccggt ccatgcatgg 5040
ttagggcccg gtagttctac ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat 5100
ccgtgctgct agcgttcgta cacggatgcg acctgtacgt cagacacgtt ctgattgcta 5160
acttgccagt gtttctcttt ggggaatcct gggatggctc tagccgttcc gcagacggga 5220
tcgatttcat gatttttttt gtttcgttgc atagggtttg gtttgccctt ttcctttatt 5280
tcaatatatg ccgtgcactt gtttgtcggg tcatcttttc atgctttttt ttgtcttggt 5340
tgtgatgatg tggtctggtt gggcggtcgt tctagatcgg agtagaattc tgtttcaaac 5400
tacctggtgg atttattaat tttggatctg tatgtgtgtg ccatacatat tcatagttac 5460
gaattgaaga tgatggatgg aaatatcgat ctaggatagg tatacatgtt gatgcgggtt 5520
ttactgatgc atatacagag atgctttttg ttcgcttggt tgtgatgatg tggtgtggtt 5580
gggcggtcgt tcattcgttc tagatcggag tagaatactg tttcaaacta cctggtgtat 5640
ttattaattt tggaactgta tgtgtgtgtc atacatcttc atagttacga gtttaagatg 5700
gatggaaatatcgatctagg ataggta tac atgttgatgt gggttttact gatgcatata 5760
catgatggca tatgcagcat ctattcatat gctctaacct tgagtaccta tctattataa 5820
taaacaagta tgttttataa ttattttgat cttgatatac ttggatgatg gcatatgcag 5880
cagctatatg tggatttttt tagccctgcc ttcatacgct atttatttgc ttggtactgt 5940
ttcttttgtc gatgctcacc ctgttgtttg gtgttacttc tgcaggtcga ctttaactta 6000
gcctaggatc cacacgacac catgtccccc gagcgccgcc ccgtcgagat ccgcccggcc 6060
accgccgccg acatggccgc cgtgtgcgac atcgtgaacc actacatcga gacctccacc 6120
gtgaacttcc gcaccgagcc gcagaccccg caggagtgga tcgacgacct ggagcgcctc 6180
caggaccgct acccgtggct cgtggccgag gtggagggcg tggtggccgg catcgcctac 6240
gccggcccgt ggaaggcccg caacgcctac gactggaccg tggagtccac cgtgtacgtg 6300
tcccaccgcc accagcgcct cggcctcggc tccaccctct acacccacct cctcaagagc 6360
atggaggccc agggcttcaa gtccgtggtg gccgtgatcg gcctcccgaa cgacccgtcc 6420
gtgcgcctcc acgaggccct cggctacacc gcccgcggca ccctccgcgc cgccggctac 6480
aagcacggcg gctggcacga cgtcggcttc tggcagcgcg acttcgagct gccggccccg 6540
ccgcgcccgg tgcgcccggt gacgcagatc tgagtcgaaa cctagacttg tccatcttct 6600
ggattggcca acttaattaa tgtatgaaat aaaaggatgc acacatagtg acatgctaat 6660
cactataatg tgggcatcaa agttgtgtgt tatgtgtaat tactagttat ctgaataaaa 6720
gagaaagaga tcatccatat ttcttatcct aaatgaatgt cacgtgtctt tataattctt 6780
tgatgaacca gatgcatttc attaaccaaa tccatataca tataaatatt aatcatatat 6840
aattaatatc aattgggtta gcaaaacaaa tctagtctag gtgtgttttg cgaattgcgg 6900
ccgccaccgc ggtggagctc gaattcattc cgattaatcg tggcctcttg ctcttcagga 6960
tgaagagcta tgtttaaacg tgcaagcgct actagacaat tcagtacatt aaaaacgtcc 7020
gcaatgtgtt attaagttgt ctaagcgtca atttgtttac accacaatat atcctgccac 7080
cagccagcca acagctcccc gaccggcagc tcggcacaaaatcaccactc gatacaggca 7140
gcccatcagt ccgggacggc gtcagcggga gagccgttgt aaggcggcag actttgctca 7200
tgttaccgat gctattcgga agaacggcaa ctaagctgcc gggtttgaaa cacggatgat 7260
ctcgcggagg gtagcatgtt gattgtaacg atgacagagc gttgctgcct gtgatcaaat 7320
atcatctccc tcgcagagat ccgaattatc agccttctta ttcatttctc gcttaaccgt 7380
gacaggctgt cgatcttgag aactatgccg acataatagg aaatcgctgg ataaagccgc 7440
tgaggaagct gagtggcgct atttctttag aagtgaacgt tgacgatcgt cgaccgtacc 7500
ccgatgaatt aattcggacg tacgttctga acacagctgg atacttactt gggcgattgt 7560
catacatgac atcaacaatg tacccgtttg tgtaaccgtc tcttggaggt tcgtatgaca 7620
ctagtggttc ccctcagctt gcgactagat gttgaggcct aacattttat tagagagcag 7680
gctagttgct tagatacatg atcttcaggc cgttatctgt cagggcaagc gaaaattggc 7740
catttatgac gaccaatgcc ccgcagaagc tcccatcttt gccgccatag acgccgcgcc 7800
ccccttttgg ggtgtagaac atccttttgc cagatgtgga aaagaagttc gttgtcccat 7860
tgttggcaat gacgtagtag ccggcgaaag tgcgagaccc atttgcgcta tatataagcc 7920
tacgatttcc gttgcgacta ttgtcgtaat tggatgaact attatcgtag ttgctctcag 7980
agttgtcgta atttgatgga ctattgtcgt aattgcttat ggagttgtcg tagttgcttg 8040
gagaaatgtc gtagttggat ggggagtagt catagggaag acgagcttca tccactaaaa 8100
caattggcag gtcagcaagt gcctgccccg atgccatcgc aagtacgagg cttagaacca 8160
ccttcaacag atcgcgcata gtcttcccca gctctctaac gcttgagtta agccgcgccg 8220
cgaagcggcg tcggcttgaa cgaattgtta gacattattt gccgactacc ttggtgatct 8280
cgcctttcac gtagtgaaca aattcttcca actgatctgc gcgcgaggcc aagcgatctt 8340
cttgtccaag ataagcctgc ctagcttcaa gtatgacggg ctgatactgg gccggcaggc 8400
gctccattgc ccagtcggca gcgacatcct tcggcgcgat tttgccggtt actgcgctgt 8460
accaaatgcg ggacaacgta agcactacat ttcgctcatc gccagcccag tcgggcggcg 8520
agttccatag cgttaaggtt tcatttagcg cctcaaatag atcctgttca ggaaccggat 8580
caaagagttc ctccgccgct ggacctacca aggcaacgct atgttctctt gcttttgtca 8640
gcaagatagc cagatcaatg tcgatcgtgg ctggctcgaa gatacctgca agaatgtcat 8700
tgcgctgcca ttctccaaat tgcagttcgc gcttagctgg ataacgccac ggaatgatgt 8760
cgtcgtgcac aacaatggtg acttctacag cgcggagaat ctcgctctct ccaggggaag 8820
ccgaagtttc caaaaggtcg ttgatcaaag ctcgccgcgt tgtttcatca agccttacag 8880
tcaccgtaac cagcaaatcaa tatcactgt gtggcttcag gccgccatcc actgcggagc 8940
cgtacaaatg tacggccagc aacgtcggtt cgagatggcg ctcgatgacg ccaactacct 9000
ctgatagttg agtcgatact tcggcgatca ccgcttccct catgatgttt aactcctgaa 9060
ttaagccgcg ccgcgaagcg gtgtcggctt gaatgaattg ttaggcgtca tcctgtgctc 9120
ccgagaacca gtaccagtac atcgctgttt cgttcgagac ttgaggtcta gttttatacg 9180
tgaacaggtc aatgccgccg agagtaaagc cacattttgc gtacaaattg caggcaggta 9240
cattgttcgt ttgtgtctct aatcgtatgc caaggagctg tctgcttagt gcccactttt 9300
tcgcaaattc gatgagactg tgcgcgactc ctttgcctcg gtgcgtgtgc gacacaacaa 9360
tgtgttcgat agaggctaga tcgttccatg ttgagttgag ttcaatcttc ccgacaagct 9420
cttggtcgat gaatgcgcca tagcaagcag agtcttcatc agagtcatca tccgagatgt 9480
aatccttccg gtaggggctc acacttctgg tagatagttc aaagccttgg tcggataggt 9540
gcacatcgaa cacttcacga acaatgaaat ggttctcagc atccaatgtt tccgccacct 9600
gctcagggat caccgaaatc ttcatatgac gcctaacgcc tggcacagcg gatcgcaaac 9660
ctggcgcggc ttttggcaca aaaggcgtga caggtttgcg aatccgttgc tgccacttgt 9720
taaccctttt gccagatttg gtaactataa tttatgttag aggcgaagtc ttgggtaaaa 9780
actggcctaa aattgctggg gatttcagga aagtaaacat caccttccgg ctcgatgtct 9840
attgtagata tatgtagtgt atctacttga tcgggggatc tgctgcctcg cgcgtttcgg 9900
tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta 9960
agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg 10020
gggcgcagcc atgacccagt cacgtagcga tagcggagtg tatactggct taactatgcg 10080
gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc gcacagatgc 10140
gtaaggagaa aataccgcat caggcgctct tccgcttcct cgctcactga ctcgctgcgc 10200
tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 10260
acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 10320
aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 10380
cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 10440
gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 10500
tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 10560
tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 10620
cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 10680
gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 10740
ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 10800
ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 10860
ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 10920
agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 10980
aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 11040
atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 11100
tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 11160
tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 11220
tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 11280
gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 11340
tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 11400
ttgcgcaacg ttgttgccat tgctgcaggg gggggggggg ggggggactt ccattgttca 11460
ttccacggac aaaaacagag aaaggaaacg acagaggcca aaaagcctcg ctttcagcac 11520
ctgtcgtttc ctttcttttc agagggtatt ttaaataaaa acattaagtt atgacgaaga 11580
agaacggaaa cgccttaaac cggaaaattt tcataaatag cgaaaacccg cgaggtcgcc 11640
gccccgtaac ctgtcggatc accggaaagg acccgtaaag tgataatgat tatcatctac 11700
atatcacaac gtgcgtggag gccatcaaac cacgtcaaat aatcaattat gacgcaggta 11760
tcgtattaat tgatctgcat caacttaacg taaaaacaac ttcagacaat acaaatcagc 11820
gacactgaat acggggcaac ctcatgtccc cccccccccc ccccctgcag gcatcgtggt 11880
gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 11940
tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 12000
cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 12060
tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 12120
ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac 12180
cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 12240
actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 12300
ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 12360
aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 12420
ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 12480
atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc 12540
tgacgtctaa gaaaccatta ttatcatgac attaacctat aaaaataggc gtatcacgag 12600
gccctttcgt cttcaagaat tggtcgacga tcttgctgcg ttcggatatt ttcgtggagt 12660
tcccgccaca gacccggatt gaaggcgaga tccagcaact cgcgccagat catcctgtga 12720
cggaactttg gcgcgtgatg actggccagg acgtcggccg aaagagcgac aagcagatca 12780
cgcttttcga cagcgtcgga tttgcgatcg aggatttttc ggcgctgcgc tacgtccgcg 12840
accgcgttga gggatcaagc cacagcagcc cactcgacct tctagccgac ccagacgagc 12900
caagggatct ttttggaatg ctgctccgtc gtcaggcttt ccgacgtttg ggtggttgaa 12960
cagaagtcat tatcgtacgg aatgccaagc actcccgagg ggaaccctgt ggttggcatg 13020
cacatacaaa tggacgaacg gataaacctt ttcacgccct tttaaatatc cgttattcta 13080
ataaacgctc ttttctctta ggtttacccg ccaatatatc ctgtcaaaca ctgatagttt 13140
aaactgaagg cgggaaacga caatctgatc atgagcggag aattaaggga gtcacgttat 13200
gacccccgcc gatgacgcgg gacaagccgt tttacgtttg gaactgacag aaccgcaacg 13260
ttgaaggagc cactcagc 13278
<210>11
<211>50
<212>DNA
<213>人工序列
<220>
<223>多接头
<400>11
gatcactagt ggcgcgccta ggagatctcg agtagggata acagggtaat 50
<210>12
<211>25
<212>DNA
<213>人工序列
<220>
<223>attB1序列
<400>12
acaagtttgt acaaaaaagc aggct 25
<210>13
<211>25
<212>DNA
<213>人工序列
<220>
<223>attB2 sequence
<400>13
accactttgt acaagaaagc tgggt 25
<210>14
<211>4778
<212>DNA
<213>人工序列
<220>
<223>PHP23112构建体
<400>14
gaaaggccca gtcttccgac tgagcctttc gttttatttg atgcctggca gttccctact 60
ctcgcgttaa cgctagcatg gatgttttcc cagtcacgac gttgtaaaac gacggccagt 120
cttaagctcg ggcccgcgtt aacgctacca tggagctcca aataatgatt ttattttgac 180
tgatagtgac ctgttcgttg caacaaattg ataagcaatg cttttttata atgccaactt 240
tgtatagaaa agttgggccg aattcgagct cggtacggcc agaatggccc ggaccgggtt 300
accgaattcg agctcggtac cctgggatca gcttgcatgc ctgcagtgca gcgtgacccg 360
gtcgtgcccc tctctagaga taatgagcat tgcatgtcta agttataaaa aattaccaca 420
tatttttttt gtcacacttg tttgaagtgc agtttatcta tctttataca tatatttaaa 480
ctttactcta cgaataatat aatctatagt actacaataa tatcagtgtt ttagagaatc 540
atataaatga acagttagac atggtctaaa ggacaattga gtattttgac aacaggactc 600
tacagtttta tctttttagt gtgcatgtgt tctccttttt ttttgcaaat agcttcacct 660
atataatact tcatccattt tattagtaca tccatttagg gtttagggtt aatggttttt 720
atagactaat ttttttagta catctatttt attctatttt agcctctaaa ttaagaaaac 780
taaaactcta ttttagtttt tttatttaat aatttagata taaaatagaa taaaataaag 840
tgactaaaaa ttaaacaaat accctttaag aaattaaaaa aactaaggaa acatttttct 900
tgtttcgagt agataatgcc agcctgttaa acgccgtcga cgagtctaac ggacaccaac 960
cagcgaacca gcagcgtcgc gtcgggccaa gcgaagcaga cggcacggca tctctgtcgc 1020
tgcctctgga cccctctcga gagttccgct ccaccgttgg acttgctccg ctgtcggcat 1080
ccagaaattg cgtggcggag cggcagacgt gagccggcac ggcaggcggc ctcctcctcc 1140
tctcacggca ccggcagcta cgggggattc ctttcccacc gctccttcgc tttcccttcc 1200
tcgcccgccg taataaatag acaccccctc cacaccctct ttccccaacc tcgtgttgtt 1260
cggagcgcac acacacacaa ccagatctcc cccaaatcca cccgtcggca cctccgcttc 1320
aaggtacgcc gctcgtcctc cccccccccc ctctctacct tctctagatc ggcgttccgg 1380
tccatgcatg gttagggccc ggtagttcta cttctgttca tgtttgtgtt agatccgtgt 1440
ttgtgttaga tccgtgctgc tagcgttcgt acacggatgc gacctgtacg tcagacacgt 1500
tctgattgct aacttgccag tgtttctctt tggggaatcc tgggatggct ctagccgttc 1560
cgcagacggg atcgatttca tgattttttt tgtttcgttg catagggttt ggtttgccct 1620
tttcctttat ttcaatatat gccgtgcact tgtttgtcgg gtcatctttt catgcttttt 1680
tttgtcttgg ttgtgatgat gtggtctggt tgggcggtcg ttctagatcg gagtagaatt 1740
ctgtttcaaa ctacctggtg gatttattaa ttttggatct gtatgtgtgt gccatacata 1800
ttcatagtta cgaattgaag atgatggatg gaaatatcga tctaggatag gtatacatgt 1860
tgatgcgggt tttactgatg catatacaga gatgcttttt gttcgcttgg ttgtgatgat 1920
gtggtgtggt tgggcggtcg ttcattcgtt ctagatcgga gtagaatact gtttcaaact 1980
acctggtgta tttattaatt ttggaactgt atgtgtgtgt catacatctt catagttacg 2040
agtttaagat ggatggaaat atcgatctag gataggtata catgttgatg tgggttttac 2100
tgatgcatat acatgatggc atatgcagca tctattcata tgctctaacc ttgagtacct 2160
atctattata ataaacaagt atgttttata attattttga tcttgatata cttggatgat 2220
ggcatatgca gcagctatat gtggattttt ttagccctgc cttcatacgc tatttatttg 2280
cttggtactg tttcttttgt cgatgctcac cctgttgttt ggtgttactt ctgcaggtcg 2340
actctagagg atcagcttgg tcacccggtc cgggcctaga aggccagctt caagtttgta 2400
caaaaaagtt gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt 2460
gcataaaaaa cagactacat aatactgtaa aacacaacat atgcagtcac tatgaatcaa 2520
ctacttagat ggtattagtg acctgtagaa ttcgagctct agagctgcag ggcggccgcg 2580
atatccccta tagtgagtcg tattacatgg tcatagctgt ttcctggcag ctctggcccg 2640
tgtctcaaaa tctctgatgt tacattgcac aagataaaaa tatatcatca tgaacaataa 2700
aactgtctgc ttacataaac agtaatacaa ggggtgttat gagccatatt caacgggaaa 2760
cgtcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat aaatgggctc 2820
gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt gtatgggaag cccgatgcgc 2880
cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg 2940
tcagactaaactggctgacg gaatttatgc ctcttccgac catcaagcat tttatccgta 3000
ctcctgatga tgcatggtta ctcaccactg cgatccccgg aaaaacagca ttccaggtat 3060
tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgcc 3120
ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgcgta tttcgtctcg 3180
ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt gatgacgagc 3240
gtaatggctg gcctgttgaa caagtctgga aagaaatgca taaacttttg ccattctcac 3300
cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt gacgagggga 3360
aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac caggatcttg 3420
ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg ctttttcaaa 3480
aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg ctcgatgagt 3540
ttttctaatc agaattggtt aattggttgt aacactggca gagcattacg ctgacttgac 3600
gggacggcgc aagctcatga ccaaaatccc ttaacgtgag ttacgcgtcg ttccactgag 3660
cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa 3720
tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag 3780
agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg 3840
tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat 3900
acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta 3960
ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg 4020
gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc 4080
gtgagcattg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa 4140
gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc 4200
tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt 4260
caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct 4320
tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc 4380
gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg 4440
agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt 4500
ggccgattca ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc 4560
gcaacgcaat taatacgcgt accgctagcc aggaagagtt tgtagaaacg caaaaaggcc 4620
atccgtcagg atggccttct gcttagtttg atgcctggca gtttatggcg ggcgtcctgc 4680
ccgccaccct ccgggccgtt gcttcacaac gttcaaatcc gctcccggcg gatttgtcct 4740
actcaggaga gcgttcaccg acaaacaaca gataaaac 4778
<210>15
<211>54
<212>DNA
<213>人工序列
<220>
<223>forward primer VC062
<400>15
ttaaacaagt ttgtacaaaa aagcaggctg caattaaccc tcactaaagg gaac 54
<210>16
<211>53
<212>DNA
<213>人工序列
<220>
<223>反向引物VC063
<400>16
ttaaaccact ttgtacaaga aagctgggtg cgtaatacga ctcactatag ggc 53
<210>17
<211>788
<212>DNA
<213>玉米
<400>17
gcaaacaccg ctccagccgc cttcgctgct gctcgtgtgt ctcgtggaag ctccgcggct 60
ggaccatgga cccggacctg gacctcgacc tagacatgga tatggagacg ctcgccggcg 120
acagcggcgg cgaggccgag cgcaacgaag ccgccgaggc cgaggctgag gtggagcggt 180
acgaggccgc cgaagccgag gccgacatcc tccgcgaccg attccgcctc gccgtcatca 240
gcatcgccac cgccgaagga aagaaggccg gaatgacggt cgccgacccc gttgtttcct 300
gcatcgccga cttggcgttc aagagcgcag agcagctagc aaaggatgca gagttgtttg 360
cacagcatgc cggtcgcaaa tccgtcagga tggatgatgt catactcaca gctcacagga 420
acgagcatct tatgggcctg ctgcggacct tctctcagga gctgaaggga aaggagcctg 480
ccagtgagag gaagagaaag aaatcgtcca agaaggatga gacggtgatc gaggtctgat 540
ttcagatctg tcctcttttt ttttagagag gaaggcatgc atttttatct cgcgaggtcc 600
tcccggcttg tacagcttcc ttgtgtcgat actatcttcc atgtcatttc gcagaacttt 660
tcttctacga accctttcat cctagtcagt ttttctagtc agttattgat ggtacttgag 720
ttgagcttgc tttctcaact gcacatagca ttagtactga gtccaaaaaa aaaaaaaaaa 780
aaaaaaaa 788
<210>18
<211>157
<212>PRT
<213>玉米
<400>18
Met Asp Pro Asp Leu Asp Leu Asp Leu Asp Met Asp Met Glu Thr Leu
1 5 10 15
Ala Gly Asp Ser Gly Gly Glu Ala Glu Arg Asn Glu Ala Ala Glu Ala
20 25 30
Glu Ala Glu Val Glu Arg Tyr Glu Ala Ala Glu Ala Glu Ala Asp Ile
35 40 45
Leu Arg Asp Arg Phe Arg Leu Ala Val Ile Ser Ile Ala Thr Ala Glu
50 55 60
Gly Lys Lys Ala Gly Met Thr Val Ala Asp Pro Val Val Ser Cys Ile
65 70 75 80
Ala Asp Leu Ala Phe Lys Ser Ala Glu Gln Leu Ala Lys Asp Ala Glu
85 90 95
Leu Phe Ala Gln His Ala Gly Arg Lys Ser Val Arg Met Asp Asp Val
100 105 110
Ile Leu Thr Ala His Arg Asn Glu His Leu Met Gly Leu Leu Arg Thr
115 120 125
Phe Ser Gln Glu Leu Lys Gly Lys Glu Pro Ala Ser Glu Arg Lys Arg
130 135 140
Lys Lys Ser Ser Lys Lys Asp Glu Thr Val Ile Glu Val
145 150 155
<210>19
<211>676
<212>DNA
<213>水稻
<400>19
aaatcccatc tcagtccgcc atggacgcgg agatggacct cctcgccgac gacgacggcg 60
gcgaggccga gaggctggag gccgcggagg cgcaggccga cctcctccgc gatcgcctcc 120
gcctcgccgt catcagcatc gccacctccg aaggaaagaa ggcggggatg gaggtctccg 180
accccgtcgt cgcctgcatc gccgatctgg cctacaagac cgtagagcag ctggctaagg 240
atgttgagtt gtttgcacag catgctggtc gtaaatccat caagatggaa gatgttatac 300
tcacagcaca tagaaatgag catctgatgg gcctcctgcg gacattttct caagaactga 360
agggtaagga gccttccagc gagaggaaga gaaagaaatc ttcgaagaag gacgacaacg 420
tgatgcaaat ctgatttaag tcatgagata aatcttcttc ccatagaaca aagtggtagg 480
ttcaagcagg aaactctgca agtaactcag gctacccact gatcctgtat ttcacacatt 540
tagatgtggt atgacacaat gttgtctgtg gaaagtggag atccttcaca cctgtaaatt 600
cactgaggct gttgtgtcaa gtagtaaatg gcaaaattca gagtttggtt cttaaaaaaa 660
aaaaaaaaaa aaaaaa 676
<210>20
<211>137
<212>PRT
<213>水稻
<400>20
Met Asp Ala Glu Met Asp Leu Leu Ala Asp Asp Asp Gly Gly Glu Ala
1 5 10 15
Glu Arg Leu Glu Ala Ala Glu Ala Gln Ala Asp Leu Leu Arg Asp Arg
20 25 30
Leu Arg Leu Ala Val Ile Ser Ile Ala Thr Ser Glu Gly Lys Lys Ala
35 40 45
Gly Met Glu Val Ser Asp Pro Val Val Ala Cys Ile Ala Asp Leu Ala
50 55 60
Tyr Lys Thr Val Glu Gln Leu Ala Lys Asp Val Glu Leu Phe Ala Gln
65 70 75 80
His Ala Gly Arg Lys Ser Ile Lys Met Glu Asp Val Ile Leu Thr Ala
85 90 95
His Arg Asn Glu His Leu Met Gly Leu Leu Arg Thr Phe Ser Gln Glu
100 105 110
Leu Lys Gly Lys Glu Pro Ser Ser Glu Arg Lys Arg Lys Lys Ser Ser
115 120 125
Lys Lys Asp Asp Asn Val Met Gln Ile
130 135
<210>21
<211>513
<212>DNA
<213>大豆
<220>
<221>misc_feature
<222>(356)..(356)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(364)..(364)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(367)..(367)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(413)..(413)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(437)..(437)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(474)..(474)
<223>n是a、c、g、t、或u
<220>
<221>misc_feature
<222>(493)..(494)
<223>n是a、c、g、t、或u
<400>21
cgcgaacagc gaagtcgaaa acgacgcgga aatgaagctc ttgagagata aattcaggct 60
ctccgcaatc tccatcatcg aatctcaagc aaaacaaaac ggcatggaag tatcaaaagt 120
cgtagtcact tgcgttgcgg atttggcctt caagtatacg gagcgcctgg ctagggatct 180
tcatctattt gcgcagcatg cgaatcgtaa atctgtaaat atggaagatg tgatactttg 240
tggacatagg aatgaacatg tatctggcat gttgaggagc ttctccaatg atttaaaagc 300
caaggatcct caatctgaaa ggaagcgaaa gaaagaaccc aaaaagaacg acaaangaac 360
cgcntancgc atatgcctga tgcatatata tgggcctaag aacatatttt ggnacgggta 420
ggtaatttta tgtatanttt tccccccctt aaaatgtttt tgggtttggg aagntagtgc 480
tgggatccat tannccaact taatcaattt atg 513
<210>22
<211>428
<212>DNA
<213>大豆
<220>
<221>misc_feature
<222>(415)..(415)
<223>n是a、c、g、t、或u
<400>22
aaaatcgtag tcacttgcat tgcggatttg gccttcaaat atacagagtg cgtggctagg 60
gatcttcatc tatttgcgca gcatgcgaat cgtaaatctg taaatatgga agatgtgata 120
ctttgtggac ataggaatga acatgtatct ggcatgttga ggagcttctc caatgtttta 180
aaagccaacg atcctcaatc tgaaaggaag cgaaagaaag aaaccaaaaa gaacgacaaa 240
ggaaccgctt agaacatatt ttggtatgat taagtaaaat cttatatata tattatttcc 300
ttacttttat tggacttgtt agctattgct ggaatctatt agtccatctt aatcatttat 360
gggtgccttt aaacttaata cctatgatgt gtgtaattga atcaatttaa tttangagca 420
ttttctat 428
<210>23
<211>612
<212>DNA
<213>大豆
<400>23
aaactcgacg atggaaagcg tggacgcgaa cagcgaagtc gaaaacgacg cggaaatgaa 60
gctcttgaga gataaattca ggctctccgc aatctccatc atcgaatctc aagcaaaaca 120
aaacggcatg gaagtatcaa aagtcgtagt cacttgcgtt gcggatttgg ccttcaagta 180
tacggagcgc ctggctaggg atcttcatct atttgcgcag catgcgaatc gtaaatctgt 240
aaatatggaa gatgtgatac tttgtggaca taggaatgaa catgtatctg gcatgttgag 300
gagcttctcc aatgatttaa aagccaagga tcctcaatct gaaaggaagc gaaagaaaga 360
acccaaaaag aacgacaaag gaaccgctta gcgcatatgc ctgatgcata tatatggtcc 420
taggaacata ttttggtacg gttagttaat tttatgtata tttttctctc ctttatatgt 480
ttttggattt ggtagctagt gctggaatct attagtccat cttaatcatttatgcatgcc 540
tttaaactta attccagtaa ggcagtaact atgagtgcgt gattgaagta attaatttag 600
aagcattttt tt 612
<210>24
<211>126
<212>PRT
<213>大豆
<400>24
Met Glu Ser Val Asp Ala Asn Ser Glu Val Glu Asn Asp Ala Glu Met
1 5 10 15
Lys Leu Leu Arg Asp Lys Phe Arg Leu Ser Ala Ile Ser Ile Ile Glu
20 25 30
Ser Gln Ala Lys Gln Asn Gly Met Glu Val Ser Lys Val Val Val Thr
35 40 45
Cys Val Ala Asp Leu Ala Phe Lys Tyr Thr Glu Arg Leu Ala Arg Asp
50 55 60
Leu His Leu Phe Ala Gln His Ala Asn Arg Lys Ser Val Asn Met Glu
65 70 75 80
Asp Val Ile Leu Cys Gly His Arg Asn Glu His Val Ser Gly Met Leu
85 90 95
Arg Ser Phe Ser Asn Asp Leu Lys Ala Lys Asp Pro Gln Ser Glu Arg
100 105 110
Lys Arg Lys Lys Glu Pro Lys Lys Asn Asp Lys Gly Thr Ala
115 120 125
<210>25
<211>578
<212>DNA
<213>大豆
<400>25
gttgctgtcg aaaaatctcg acgatggaaa acgcggacgc gaacagcgaa gtcgaaaacg 60
acgcggaaat gaagctcttg agagataaat tcaggctctc cgcaatctcc ataatcgaat 120
ctcaagcaaa acaaaatggc atggaagtag caaaaatcgt agtcacttgc attgcggatt 180
tggccttcaa atatacagag tgcgtggcta gggatcttca tctatttgcg cagcatgcga 240
atcgtaaatc tgtaaatatg gaagatgtga tactttgtgg acataggaat gaacatgtat 300
ctggcatgtt gaggagcttc tccaatgttt taaaagccaa cgatcctcaa tctgaaagga 360
agcgaaagaa agaaaccaaa aagaacgaca aaggaaccgc ttagaacata ttttggtatg 420
attagtaaaa tcttatatat atattatttc cttactttta ttggacttgt tagctattgc 480
tggaatctat tagtccatct taatcattta tgggtgcctt taaacttaat accactcact 540
gtatgatgtg tgtaattgaa tcattttaat ttaggagc 578
<210>26
<211>126
<212>PRT
<213>大豆
<400>26
Met Glu Asn Ala Asp Ala Asn Ser Glu Val Glu Asn Asp Ala Glu Met
1 5 10 15
Lys Leu Leu Arg Asp Lys Phe Arg Leu Ser Ala Ile Ser Ile Ile Glu
20 25 30
Ser Gln Ala Lys Gln Asn Gly Met Glu Val Ala Lys Ile Val Val Thr
35 40 45
Cys Ile Ala Asp Leu Ala Phe Lys Tyr Thr Glu Cys Val Ala Arg Asp
50 55 60
Leu His Leu Phe Ala Gln His Ala Asn Arg Lys Ser Val Asn Met Glu
65 70 75 80
Asp Val Ile Leu Cys Gly His Arg Asn Glu His Val Ser Gly Met Leu
85 90 95
Arg Ser Phe Ser Asn Val Leu Lys Ala Asn Asp Pro Gln Ser Glu Arg
100 105 110
Lys Arg Lys Lys Glu Thr Lys Lys Asn Asp Lys Gly Thr Ala
115 120 125
<210>27
<211>847
<212>DNA
<213>拟南芥
<400>27
atgtttaaca tttcttacgc caaacgaaac gctaaatatt tatttaaatt gctagcctgg 60
tgtatgatga tcgaggaagc tggacctaac atcggtaaca agcaaaaagt agttctccaa 120
cttagcaaaa tgctaataat gtatatcatt ctccatataa acgctgcgtt ttggacatgg 180
aggggatact taaaacgctg cgttttacac tttgttttcc cgcgtatatt tctcccttta 240
ttatcggata gcccaacaat cacacaggcg aagaaaccta gctattgctt cgccatggac 300
gtcggaggag aagacataag cgatctccag gtagaccaaa tcgttgaaga atattctatg 360
gacgatctca ttagagaccg attcagactc tccgcgatct ctatcgccga agccgaggcg 420
aagaaaaatg gaatggaaat aggtggacct gttgtggcat gtgtggcaga tttagccttc 480
aaatatgcag aaaacgttgc aaaggatctt gaactattcg ctcatcatgc tggacgcaaa 540
gttgtgaaca tggacgatgt tgttctctcc gcgcatagaa acgataactt agcagcatct 600
ttgaggtcac tatgcaatga gctaaaggca aaggagccac aatctgagag gaaacgcaag 660
aaaggatcag ccaagaaaga agacaaagcc agtagtagca atgccgttcg catcacgacc 720
gatctgtaac tcttcaagca gagtgtaaat acacgcactc ctctatatat atatataaac 780
attaactttg atggagaagc tgttattaaa tttttgtgga aaattttata tagaagactt 840
ttgcatt 847
<210>28
<211>242
<212>PRT
<213>拟南芥
<400>28
Met Phe Asn Ile Ser Tyr Ala Lys Arg Asn Ala Lys Tyr Leu Phe Lys
1 5 10 15
Leu Leu Ala Trp Cys Met Met Ile Glu Glu Ala Gly Pro Asn Ile Gly
20 25 30
Asn Lys Gln Lys Val Val Leu Gln Leu Ser Lys Met Leu Ile Met Tyr
35 40 45
Ile Ile Leu His Ile Asn Ala Ala Phe Trp Thr Trp Arg Gly Tyr Leu
50 55 60
Lys Arg Cys Val Leu His Phe Val Phe Pro Arg Ile Phe Leu Pro Leu
65 70 75 80
Leu Ser Asp Ser Pro Thr Ile Thr Gln Ala Lys Lys Pro Ser Tyr Cys
85 90 95
Phe Ala Met Asp Val Gly Gly Glu Asp Ile Ser Asp Leu Gln Val Asp
100 105 110
Gln Ile Val Glu Glu Tyr Ser Met Asp Asp Leu Ile Arg Asp Arg Phe
115 120 125
Arg Leu Ser Ala Ile Ser Ile Ala Glu Ala Glu Ala Lys Lys Asn Gly
130 135 140
Met Glu Ile Gly Gly Pro Val Val Ala Cys Val Ala Asp Leu Ala Phe
145 150 155 160
Lys Tyr Ala Glu Asn Val Ala Lys Asp Leu Glu Leu Phe Ala His His
165 170 175
Ala Gly Arg Lys Val Val Asn Met Asp Asp Val Val Leu Ser Ala His
180 185 190
Arg Asn Asp Asn Leu Ala Ala Ser Leu Arg Ser Leu Cys Asn Glu Leu
195 200 205
Lys Ala Lys Glu Pro Gln Ser Glu Arg Lys Arg Lys Lys Gly Ser Ala
210 215 220
Lys Lys Glu Asp Lys Ala Ser Ser Ser Asn Ala Val Arg Ile Thr Thr
225 230 235 240
Asp Leu
<210>29
<211>665
<212>DNA
<213>拟南芥
<400>29
atgtttaaca tttcttacgc caaacgaaac gctaaatatt tatttaaatt gctagcctgg 60
taggcgcgta atagagagtg ctatgtttcc ttaaatcaaa gcaaaacata gatgttgttg 120
ccggcaacga ggatggtaat cgataaagcc acaggtgtat gatgatcgag gaagctggac 180
ctaacatcgg taacaagcaa aaagcgaaga aacctagcta ttgcttcgcc atggacgtcg 240
gaggagaaga cataagcgat ctccaggtag accaaatcgt tgaagaatat tctatggacg 300
atctcattag agaccgattc agactctccg cgatctctat cgccgaagcc gaggcgaaga 360
aaaatggaat ggaaataggt ggacctgttg tggcatgtgt ggcagattta gccttcaaat 420
atgcagaaaa cgttgcaaag gatcttgaac tattcgctca tcatgctgga cgcaaagttg 480
tgaacatgga cgatgttgtt ctctccgcgc atagaaacga taacttagca gcatctttga 540
ggtcactatg caatgagcta aaggcaaagg agccacaatc tgagaggaaa cgcaagaaag 600
gatcagccaa gaaagaagac aaagccagta gtagcaatgc cgttcgcatc acgaccgatc 660
tgtaa 665
<210>30
<211>168
<212>PRT
<213>拟南芥
<400>30
Met Met Ile Glu Glu Ala Gly Pro Asn Ile Gly Asn Lys Gln Lys Ala
1 5 10 15
Lys Lys Pro Ser Tyr Cys Phe Ala Met Asp Val Gly Gly Glu Asp Ile
20 25 30
Ser Asp Leu Gln Val Asp Gln Ile Val Glu Glu Tyr Ser Met Asp Asp
35 40 45
Leu Ile Arg Asp Arg Phe Arg Leu Ser Ala Ile Ser Ile Ala Glu Ala
50 55 60
Glu Ala Lys Lys Asn Gly Met Glu Ile Gly Gly Pro Val Val Ala Cys
65 70 75 80
Val Ala Asp Leu Ala Phe Lys Tyr Ala Glu Asn Val Ala Lys Asp Leu
85 90 95
Glu Leu Phe Ala His His Ala Gly Arg Lys Val Val Asn Met Asp Asp
100 105 110
Val Val Leu Ser Ala His Arg Asn Asp Asn Leu Ala Ala Ser Leu Arg
115 120 125
Ser Leu Cys Asn Glu Leu Lys Ala Lys Glu Pro Gln Ser Glu Arg Lys
130 135 140
Arg Lys Lys Gly Ser Ala Lys Lys Glu Asp Lys Ala Ser Ser Ser Asn
145 150 155 160
Ala Val Arg Ile Thr Thr Asp Leu
165
<210>31
<211>669
<212>DNA
<213>拟南芥
<400>31
atgtttaaca tttcttacgc caaacgaaac gctaaatatt tatttaaatt gctagcctgg 60
taggcgcgta atagagagtg ctatgtttcc ttaaatcaaa gcaaaacata gatgttgttg 120
ccggcaacga ggatggtaat cgataaagcc acaggtgtat gatgatcgag gaagctggac 180
ctaacatcgg taacaagcaa aaagtaggcg aagaaaccta gctattgctt cgccatggac 240
gtcggaggag aagacataag cgatctccag gtagaccaaa tcgttgaaga atattctatg 300
gacgatctca ttagagaccg attcagactc tccgcgatct ctatcgccga agccgaggcg 360
aagaaaaatg gaatggaaat aggtggacct gttgtggcat gtgtggcaga tttagccttc 420
aaatatgcag aaaacgttgc aaaggatctt gaactattcg ctcatcatgc tggacgcaaa 480
gttgtgaaca tggacgatgt tgttctctcc gcgcatagaa acgataactt agcagcatct 540
ttgaggtcac tatgcaatga gctaaaggca aaggagccac aatctgagag gaaacgcaag 600
aaaggatcag ccaagaaaga agacaaagcc agtagtagca atgccgttcg catcacgacc 660
gatctgtaa 669
<210>32
<211>144
<212>PRT
<213>拟南芥
<400>32
Met Asp Val Gly Gly Glu Asp Ile Ser Asp Leu Gln Val Asp Gln Ile
1 5 10 15
Val Glu Glu Tyr Ser Met Asp Asp Leu Ile Arg Asp Arg Phe Arg Leu
20 25 30
Ser Ala Ile Ser Ile Ala Glu Ala Glu Ala Lys Lys Asn Gly Met Glu
35 40 45
Ile Gly Gly Pro Val Val Ala Cys Val Ala Asp Leu Ala Phe Lys Tyr
50 55 60
Ala Glu Asn Val Ala Lys Asp Leu Glu Leu Phe Ala His His Ala Gly
65 70 75 80
Arg Lys Val Val Asn Met Asp Asp Val Val Leu Ser Ala His Arg Asn
85 90 95
Asp Asn Leu Ala Ala Ser Leu Arg Ser Leu Cys Asn Glu Leu Lys Ala
100 105 110
Lys Glu Pro Gln Ser Glu Arg Lys Arg Lys Lys Gly Ser Ala Lys Lys
115 120 125
Glu Asp Lys Ala Ser Ser Ser Asn Ala Val Arg Ile Thr Thr Asp Leu
130 135 140
<210>33
<211>137
<212>PRT
<213>水稻
<400>33
Met Asp Ala Glu Met Asp Leu Leu Ala Asp Asp Asp Gly Gly Glu Ala
1 5 10 15
Glu Arg Leu Glu Ala Ala Glu Ala Gln Ala Asp Leu Leu Arg Asp Arg
20 25 30
Leu Arg Leu Ala Val Ile Ser Ile Ala Thr Ser Glu Gly Lys Lys Ala
35 40 45
Gly Met Glu Val Ser Asp Pro Val Val Ala Cys Ile Ala Asp Leu Ala
50 55 60
Tyr Lys Thr Val Glu Gln Leu Ala Lys Asp Val Glu Leu Phe Ala Gln
65 70 75 80
His Ala Gly Arg Lys Ser Ile Lys Met Glu Asp Val Ile Leu Thr Ala
85 90 95
His Arg Asn Glu His Leu Met Gly Leu Leu Arg Thr Phe Ser Gln Glu
100 105 110
Leu Lys Gly Lys Glu Pro Ser Ser Glu Arg Lys Arg Lys Lys Ser Ser
115 120 125
Lys Lys Asp Asp Asn Val Met Gln Ile
130 135
<210>34
<211>135
<212>PRT
<213>Vitis vinifera
<400>34
Met Glu Glu Ala Arg Ser Glu Leu Glu Arg Glu Glu Asp Glu Glu Ala
1 5 10 15
Thr Glu Leu Leu Arg Asp Arg Phe Arg Leu Ser Thr Ile Ser Ile Val
20 25 30
Glu Ala Gln Ala Lys Lys Ser Asp Met Glu Ile Ser Glu Pro Ile Val
35 40 45
Ala Cys Ile Ser Asp Leu Ala Phe Lys Tyr Thr Glu Gln Leu Ala Lys
50 55 60
Asp Leu Glu Leu Phe Ser Gln His Ala Gly Arg Lys Thr Val Asn Met
65 70 75 80
Glu Asp Val Ile Leu Ser Ala His Arg Asn Lys His Leu Ala Ser Ser
85 90 95
Leu Arg Ser Phe Cys Asn Asp Leu Lys Ala Lys Glu Ile Pro Ser Glu
100 105 110
Arg Lys Arg Lys Lys Ala Ser Arg Lys Glu Asp Lys Ala Ser Thr Ser
115 120 125
Val Val His Ile Pro Asp Leu
130 135
<210>35
<211>55
<212>DNA
<213>Artificial
<220>
<223>At5g50930-5’attB正向引物的核苷酸序列。
<400>35
ttaaacaagt ttgtacaaaa aagcaggctc aacaatgttt aacatttctt acgcc 55
<210>36
<211>50
<212>DNA
<213>Artificial
<220>
<223>At5g50930-3′attB反向引物的核苷酸序列。
<400>36
ttaaaccact ttgtacaaga aagctgggtt tacagatcgg tcgtgatgcg 50
Claims (11)
1.增加植物氮胁迫耐受性的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽由SEQ ID NO:32所示的氨基酸序列组成;和
(b)在步骤(a)之后从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体并且在与未包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。
2.权利要求1的方法,所述方法还包括:
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体并且在与不包含所述重组DNA构建体的对照植物进行比较时表现出增加的氮胁迫耐受性。
3.评估植物氮胁迫耐受性的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽由SEQ ID NO:32所示的氨基酸序列组成;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在基因组中包含所述重组DNA构建体;以及
(c)评价所述转基因植物在与不包含所述重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
4.权利要求3的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(e)评价所述子代植物在与不包含所述重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
5.评估植物氮胁迫耐受性的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽由SEQ ID NO:32所示的氨基酸序列组成;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(d)评价所述转子代植物在与不包含所述重组DNA构建体的对照植物进行比较时的氮胁迫耐受性。
6.测定植物产量、绿度或生物量增加的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽由SEQ ID NO:32所示的氨基酸序列组成;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;以及
(c)测定所述转基因植物在与不包含所述重组DNA构建体的对照植物进行比较时是否表现出产量、绿度或生物量增加。
7.权利要求6的方法,所述方法还包括:
(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(e)测定所述子代植物在与不包含所述重组DNA构建体的对照植物进行比较时是否表现出产量、绿度或生物量增加。
8.权利要求6的方法,其中所述测定步骤(c)包括:测定所述转基因植物在氮限制条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出产量、绿度或生物量增加。
9.权利要求7的方法,其中所述测定步骤(e)包括:测定所述子代植物在氮限制条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出产量、绿度或生物量增加。
10.测定植物产量、绿度或生物量增加的方法,所述方法包括:
(a)将重组DNA构建体引入到可再生的植物细胞中,所述重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽由SEQ ID NO:32所示的氨基酸序列组成;
(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;
(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述重组DNA构建体;以及
(d)测定所述子代植物在与不包含所述重组DNA构建体的对照植物比较时是否表现出产量、绿度或生物量增加。
11.权利要求10的方法,其中所述测定步骤(d)包括:测定所述转基因植物在氮限制条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出产量、绿度或生物量增加。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US98608807P | 2007-11-07 | 2007-11-07 | |
US60/986,088 | 2007-11-07 | ||
US60/986088 | 2007-11-07 | ||
PCT/US2008/082421 WO2009061776A1 (en) | 2007-11-07 | 2008-11-05 | Plants having altered agronomic characteristics under nitrogen limiting conditions and related constructs and methods involving genes encoding lnt2 polypeptides and homologs thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101918560A CN101918560A (zh) | 2010-12-15 |
CN101918560B true CN101918560B (zh) | 2014-02-26 |
Family
ID=40233305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880124194.9A Expired - Fee Related CN101918560B (zh) | 2007-11-07 | 2008-11-05 | 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 |
Country Status (9)
Country | Link |
---|---|
US (4) | US20090119804A1 (zh) |
EP (1) | EP2220236A1 (zh) |
CN (1) | CN101918560B (zh) |
AR (1) | AR069240A1 (zh) |
BR (1) | BRPI0817356A2 (zh) |
CA (1) | CA2703243A1 (zh) |
MX (1) | MX2010005106A (zh) |
RU (1) | RU2010122899A (zh) |
WO (1) | WO2009061776A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2786741A1 (en) | 2010-01-06 | 2011-07-14 | Pioneer Hi-Bred International, Inc. | Identification of diurnal rhythms in photosynthetic and non-photosynthetic tissues from zea mays and use in improving crop plants |
EP2525658B1 (de) | 2010-01-22 | 2017-03-01 | Bayer Intellectual Property GmbH | Akarizide und/oder insektizide wirkstoffkombinationen |
US9265252B2 (en) | 2011-08-10 | 2016-02-23 | Bayer Intellectual Property Gmbh | Active compound combinations comprising specific tetramic acid derivatives |
WO2016000243A1 (en) | 2014-07-03 | 2016-01-07 | Pioneer Overseas Corporation | Plants having altered agronomic characteristics under nitrogen limiting conditions and related constructs and methods involving low nitrogen tolerancegenes |
WO2017030864A1 (en) * | 2015-08-17 | 2017-02-23 | Dow Agrosciences Llc | Plant promotor and 3' utr for transgene expression |
CN110402760A (zh) * | 2019-09-10 | 2019-11-05 | 广西民族师范学院 | 一种香蕉林下间作种植食用菌的生态种植方法 |
CN112946239B (zh) * | 2021-02-01 | 2023-04-07 | 中国农业科学院农业资源与农业区划研究所 | 一种基于土壤磷环境阈值测算土壤允许施用的最大粪肥量的方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1586645A2 (en) * | 1999-02-25 | 2005-10-19 | Ceres Incorporated | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
CN1737148A (zh) * | 2005-07-15 | 2006-02-22 | 南开大学 | 高亲和铵转运因子融合基因及其在转基因植物中的应用 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5569597A (en) | 1985-05-13 | 1996-10-29 | Ciba Geigy Corp. | Methods of inserting viral DNA into plant material |
US5268463A (en) | 1986-11-11 | 1993-12-07 | Jefferson Richard A | Plant promoter α-glucuronidase gene construct |
US5608142A (en) | 1986-12-03 | 1997-03-04 | Agracetus, Inc. | Insecticidal cotton plants |
ES2187497T3 (es) | 1990-04-12 | 2003-06-16 | Syngenta Participations Ag | Promotores preferentemente en tejidos. |
US5498830A (en) | 1990-06-18 | 1996-03-12 | Monsanto Company | Decreased oil content in plant seeds |
US5399680A (en) | 1991-05-22 | 1995-03-21 | The Salk Institute For Biological Studies | Rice chitinase promoter |
EP0600993B1 (en) | 1991-08-27 | 1999-11-10 | Novartis AG | Proteins with insecticidal properties against homopteran insects and their use in plant protection |
US5608144A (en) | 1994-08-12 | 1997-03-04 | Dna Plant Technology Corp. | Plant group 2 promoters and uses thereof |
US5659026A (en) | 1995-03-24 | 1997-08-19 | Pioneer Hi-Bred International | ALS3 promoter |
US6072050A (en) | 1996-06-11 | 2000-06-06 | Pioneer Hi-Bred International, Inc. | Synthetic promoters |
ATE336580T1 (de) | 1998-02-26 | 2006-09-15 | Pioneer Hi Bred Int | Mais met-1 promoter |
EP1033405A3 (en) | 1999-02-25 | 2001-08-01 | Ceres Incorporated | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
US20040031072A1 (en) | 1999-05-06 | 2004-02-12 | La Rosa Thomas J. | Soy nucleic acid molecules and other molecules associated with transcription plants and uses thereof for plant improvement |
US20090087878A9 (en) | 1999-05-06 | 2009-04-02 | La Rosa Thomas J | Nucleic acid molecules associated with plants |
US20110131679A2 (en) | 2000-04-19 | 2011-06-02 | Thomas La Rosa | Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement |
US7834146B2 (en) * | 2000-05-08 | 2010-11-16 | Monsanto Technology Llc | Recombinant polypeptides associated with plants |
EP1586654A1 (en) | 2004-04-15 | 2005-10-19 | Vereniging voor christelijk hoger onderwijs, wetenschappelijk onderzoek en patiëntenzorg | Replication competent viruses capable of silencing virus inhibitory factor expression |
CA2617876A1 (en) * | 2005-08-15 | 2007-02-22 | E.I. Du Pont De Nemours And Company | Nitrate transport components |
-
2008
- 2008-11-05 CN CN200880124194.9A patent/CN101918560B/zh not_active Expired - Fee Related
- 2008-11-05 MX MX2010005106A patent/MX2010005106A/es active IP Right Grant
- 2008-11-05 WO PCT/US2008/082421 patent/WO2009061776A1/en active Application Filing
- 2008-11-05 BR BRPI0817356-7A2A patent/BRPI0817356A2/pt not_active IP Right Cessation
- 2008-11-05 CA CA2703243A patent/CA2703243A1/en not_active Abandoned
- 2008-11-05 EP EP08847131A patent/EP2220236A1/en not_active Withdrawn
- 2008-11-05 US US12/264,990 patent/US20090119804A1/en not_active Abandoned
- 2008-11-05 RU RU2010122899/10A patent/RU2010122899A/ru not_active Application Discontinuation
- 2008-11-05 US US12/741,384 patent/US8394634B2/en not_active Expired - Fee Related
- 2008-11-07 AR ARP080104895A patent/AR069240A1/es unknown
-
2010
- 2010-08-02 US US12/848,277 patent/US8338181B2/en not_active Expired - Fee Related
-
2013
- 2013-02-21 US US13/772,666 patent/US20140059716A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1586645A2 (en) * | 1999-02-25 | 2005-10-19 | Ceres Incorporated | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
CN1737148A (zh) * | 2005-07-15 | 2006-02-22 | 南开大学 | 高亲和铵转运因子融合基因及其在转基因植物中的应用 |
Also Published As
Publication number | Publication date |
---|---|
US20110039263A1 (en) | 2011-02-17 |
BRPI0817356A2 (pt) | 2014-10-07 |
US20140059716A1 (en) | 2014-02-27 |
US8394634B2 (en) | 2013-03-12 |
MX2010005106A (es) | 2010-06-25 |
US8338181B2 (en) | 2012-12-25 |
CA2703243A1 (en) | 2009-05-14 |
WO2009061776A1 (en) | 2009-05-14 |
US20100269218A1 (en) | 2010-10-21 |
AR069240A1 (es) | 2010-01-06 |
US20090119804A1 (en) | 2009-05-07 |
CN101918560A (zh) | 2010-12-15 |
EP2220236A1 (en) | 2010-08-25 |
RU2010122899A (ru) | 2011-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101815432A (zh) | 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法 | |
CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
KR102147005B1 (ko) | Fad2 성능 유전자좌 및 표적화 파단을 유도할 수 있는 상응하는 표적 부위 특이적 결합 단백질 | |
CN101827938A (zh) | 涉及rt1基因、相关的构建体和方法的具有改变的根构造的植物 | |
CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
DK2087105T3 (da) | Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer | |
CN108368517B (zh) | 用于快速植物转化的方法和组合物 | |
KR101447300B1 (ko) | 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산 | |
CA2683497C (en) | .delta.8 desaturases and their use in making polyunsaturated fatty acids | |
DK2623594T3 (da) | Antistof mod human prostaglandin-E2-receptor EP4 | |
CN101646766B (zh) | △17去饱和酶及其用于制备多不饱和脂肪酸的用途 | |
DK2324120T3 (en) | Manipulating SNF1 protein kinase OF REVISION OF OIL CONTENT IN OLEAGINOUS ORGANISMS | |
CN112204147A (zh) | 基于Cpf1的植物转录调控系统 | |
KR20130132405A (ko) | 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주 | |
CN101918560B (zh) | 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 | |
BRPI0806354A2 (pt) | plantas oleaginosas transgências, sementes, óleos, produtos alimentìcios ou análogos a alimento, produtos alimentìcios medicinais ou análogos alimentìcios medicinais, produtos farmacêuticos, bebidas fórmulas para bebês, suplementos nutricionais, rações para animais domésticos, alimentos para aquacultura, rações animais, produtos de sementes inteiras, produtos de óleos misturados, produtos, subprodutos e subprodutos parcialmente processados | |
KR20070085665A (ko) | 도코사헥사엔산을 생성하는 야로위아 리폴리티카 균주 | |
CN111836825A (zh) | 优化的植物crispr/cpf1系统 | |
CN101868545B (zh) | 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法 | |
KR20150093721A (ko) | 원핵생물 경로를 모방함에 의한 식물 자기 질소 고정 | |
CN101208433A (zh) | 用于植物中表皮特异性病原体可诱导的转基因表达的启动子 | |
KR20180137558A (ko) | 유전자내 식물 형질전환을 위한 구조체 및 벡터 | |
BRPI0616533A2 (pt) | polinucleotìdeo isolado, fragmento de ácido nucléico isolado, construções de dna recombinante, plantas, sementes, células vegetais, tecidos vegetais, método de isolamento de fragmentos de ácidos nucléico, método de mapeamento de variações genéticas, método de cultivo molecular, plantas de milho, métodos de alteração do transporte de nitrogênio das plantas e variantes de hat de plantas alteradas | |
CN101848931B (zh) | 具有改变的根构造的植物、涉及编码exostosin家族多肽及其同源物的基因的相关的构建体和方法 | |
US20240150795A1 (en) | Targeted insertion via transportation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140226 Termination date: 20151105 |
|
EXPY | Termination of patent right or utility model |