CN114540262A

CN114540262A - 构建产l-缬氨酸的重组微生物的方法及其所用核酸分子和生物材料

Info

Publication number: CN114540262A
Application number: CN202210137750.8A
Authority: CN
Inventors: 孟刚; 魏爱英; 齐晓琴; 贾慧萍; 赵春光; 蔡卫卫
Original assignee: Ningxia Eppen Biotech Co Ltd
Current assignee: Ningxia Eppen Biotech Co Ltd
Priority date: 2022-02-15
Filing date: 2022-02-15
Publication date: 2022-05-27
Anticipated expiration: 2042-02-15
Also published as: CN114540262B

Abstract

本发明公开了构建产L‑缬氨酸的重组微生物的方法及其所用核酸分子和生物材料。具体地公开了突变蛋白质CEY17_RS14810^G397Y及其编码基因。本发明构建了包含突变(GG‑TA)的基因工程菌，以及过表达CEY17_RS14810基因或其突变基因的工程菌。实验表明，CEY17_RS14810基因及其变体参与了L‑缬氨酸的生物合成，对CEY17_RS14810基因编码区进行突变或在生产菌中过表达CEY17_RS14810基因和/或其突变体，有助于L‑缬氨酸产量及转化率的提高，可以培育符合工业化生产的高产高质量菌种，对L‑缬氨酸的工业化生产具有重要的意义。

Description

构建产L-缬氨酸的重组微生物的方法及其所用核酸分子和生物材料

技术领域

本发明属于微生物变异或遗传工程技术领域，具体涉及构建产L-缬氨酸的重组微生物的方法及其所用核酸分子和生物材料。

背景技术

L-缬氨酸(L-valine)，化学名称为α-氨基异戊酸，是支链氨基酸之一，人和动物自身不能合成。L-缬氨酸是人体八种必需氨基酸之一，具有促进蛋白合成、抑制蛋白分解的作用，增强机体的免疫防护作用，有助于纠正因手术、创伤、感染等引起的负氮平衡。另外，L-缬氨酸还具有抗中枢疲劳的作用，抗外周疲劳作用，延缓运动性疲劳，加快运动后机体的修复，因此在食品和医药行业具有广泛的应用及商业价值。由L-缬氨酸配制的复合支链氨基酸输液在血脑屏障、肝昏迷、慢性肝硬化以及肾功能衰竭的治疗，先天性代谢缺陷病的膳食治疗，败血症及术后糖尿病患者的治疗，加快外科创伤愈合的治疗和肿瘤患者的营养支持治疗中应用广泛。L-缬氨酸在食品工业上主要用作食品添加剂、营养增补液及风味剂等。L-缬氨酸凝胶具有带正电的端基，是新型低分子量凝胶，可以制备形成水凝胶，其在生物医药、组织工程、光化学、电化学、食品工业、化妆品等领域已被广泛应用。

目前，L-缬氨酸的生产方法主要有提取法、化学合成法、发酵法。提取法和化学合成法由于原料来源受限制、生产成本高、收率低，污染严重，难以实现工业化生产。微生物直接发酵法生产L-缬氨酸具有原料来源广泛，成本低、反应条件温和、容易实现大规模生产等优点，是一种非常经济、高效的生产方法。而工业发酵中获得高产的菌种，对于L-缬氨酸的发酵生产来说是至关重要的，是整个L-缬氨酸发酵工业的核心，是决定发酵产品工业价值的重要因素。随着基因工程育种技术的不断发展，从分子水平上改造生产菌，研究和挖掘相关基因的功能，为L-缬氨酸的工业化发酵生产提供了广阔的前景。选育高产、稳定的生产菌种，促进L-缬氨酸在微生物体内的积累，进一步提高L-缬氨酸的产量将一直伴随L-缬氨酸发酵工业的发展，对于促进L-缬氨酸产业化的进程具有重要的意义。

发明内容

本发明所要解决的技术问题是如何提高微生物L-缬氨酸的产量，所要解决的技术问题不限于所描述的技术主题，本领域技术人员通过以下描述可以清楚地理解本文未提及的其它技术主题。

为解决上述技术问题，本发明首先提供了一种构建重组微生物的方法，所述方法包括至少下述任一种：

F1)将编码蛋白质的核酸分子导入目的微生物，得到所述重组微生物，所述蛋白质名称为CEY17_RS14810^G397Y，可为下述任一种：

A1)氨基酸序列是SEQ ID No.4的蛋白质，

A2)将SEQ ID No.4所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的与A1)所示的蛋白质具有80％以上的同一性且具有相同功能的蛋白质，

A3)在A1)或A2)的N端和/或C端连接标签得到的具有相同功能的融合蛋白质；

F2)将SEQ ID No.1所示的DNA分子导入目的微生物，得到所述重组微生物；

F3)利用基因编辑手段(如单碱基基因编辑)对SEQ ID No.1所示的DNA分子进行编辑，使目的微生物中含有SEQ ID No.3所示的DNA分子。

所述导入可为通过化学转化法或电击转化法等任何已知的转化方法将携带本发明DNA分子的载体转化宿主菌。导入的DNA分子可以是单拷贝也可以是多拷贝。所述导入可以是将外源基因整合到宿主染色体中，也可以是由质粒在染色体外表达。

所述蛋白质CEY17_RS14810^G397Y也在本发明的保护范围内。

本发明还提供了核酸分子，名称为CEY17_RS14810^{GG1189-1190TA}所述核酸分子可为下述任一种：

B1)编码所述蛋白质CEY17_RS14810^G397Y的核酸分子；

B2)编码序列是SEQ ID No.3所示的DNA分子；

B3)核苷酸序列是SEQ ID No.3所示的DNA分子。

SEQ ID No.3所示的DNA分子也为本发明所述CEY17_RS14810^{GG1189-1190TA}基因。

SEQ ID No.3所示的DNA分子(CEY17_RS14810^{GG1189-1190TA})编码SEQ ID No.4所示的蛋白质CEY17_RS14810^G397Y。

所述蛋白质CEY17_RS14810^G397Y氨基酸序列(SEQ ID No.4)中的第397位的酪氨酸(Y)是由甘氨酸(G)突变而来。

本发明还提供了生物材料，所述生物材料可为下述任一种：

C1)含有所述核酸分子CEY17_RS14810^{GG1189-1190TA}的表达盒；

C2)含有所述核酸分子CEY17_RS14810^{GG1189-1190TA}的重组载体、或含有C1)所述表达盒的重组载体；

C3)含有所述核酸分子CEY17_RS14810^{GG1189-1190TA}的重组微生物、或含有C1)所述表达盒的重组微生物、或含有C2)所述重组载体的重组微生物。

本发明还提供了D1)-D8)中任一项的下述任一种应用：

G1)D1)-D8)中任一项在调控微生物的L-缬氨酸的产量中的应用；

G2)D1)-D8)中任一项在构建产L-缬氨酸的基因工程菌中的应用；

G3)D1)-D8)中任一项在制备L-缬氨酸中的应用；

其中，所述D1)-D8)为：

D1)所述蛋白质CEY17_RS14810^G397Y；

D2)所述核酸分子CEY17_RS14810^{GG1189-1190TA}；

D3)所述生物材料；

D4)核苷酸序列为SEQ ID No.1的DNA分子；

D5)SEQ ID No.1所示的核苷酸序列经过修饰和/或一个或几个核苷酸的取代和/或缺失和/或添加得到的与SEQ ID No.1所示的DNA分子具有90％以上的同一性，且具有相同功能的DNA分子；

D6)含有D4)或D5)中所述DNA分子的表达盒；

D7)含有D4)或D5)中所述DNA分子的重组载体、或含有D6)所述表达盒的重组载体；

D8)含有D4)或D5)中所述DNA分子的重组微生物、或含有D6)所述表达盒的重组微生物、或含有D7)所述重组载体的重组微生物。

SEQ ID No.1所示的DNA分子也为本发明所述CEY17_RS14810基因。

SEQ ID No.1所示的DNA分子(CEY17_RS14810基因)编码SEQ ID No.2所示的蛋白质。

本文中，同一性是指氨基酸序列或核苷酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性，如NCBI主页网站的BLAST网页。例如，可在高级BLAST2.1中，通过使用blastp作为程序，将Expect值设置为10，将所有Filter设置为OFF，使用BLOSUM62作为Matrix，将Gap existence cost，Per residue gap cost和Lambda ratio分别设置为11，1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算，然后即可获得同一性的值(％)。

本文中，所述80％以上的同一性可为至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。

本文中，所述90％以上的同一性可为至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的同一性。

本文所述调控微生物的L-缬氨酸的产量可为提高或降低微生物中L-缬氨酸的积累量(即促进或抑制L-缬氨酸的生物合成)。

本发明还提供了一种提高微生物中L-缬氨酸的产量的方法，所述方法包括下述任一种：

E1)提高目的微生物中的所述核酸分子CEY17_RS14810^{GG1189-1190TA}的表达量或含量，得到L-缬氨酸的产量高于所述目的微生物的微生物；

E2)提高目的微生物中的D4)或D5)所述DNA分子的表达量或含量，得到L-缬氨酸的产量高于所述目的微生物的微生物；

E3)对所述目的微生物中的核苷酸序列为SEQ ID No.1的DNA分子进行突变(如碱基置换、碱基插入或碱基缺失)，得到L-缬氨酸的产量高于所述目的微生物的微生物。

上述方法中，所述突变可为将SEQ ID No.1所示DNA分子编码的氨基酸序列的第397位的甘氨酸残基突变为另一种氨基酸残基。

上述方法中，所述突变可为将SEQ ID No.1所示DNA分子编码的氨基酸序列的第397位的甘氨酸残基突变为酪氨酸残基。

上述方法中，所述突变可为通过定点突变方法将SEQ ID No.1所示DNA分子中第1189-1190位的核苷酸GG突变为TA。

所述突变是指通过定点突变改变基因中的某个或某几个碱基，导致对应的蛋白质氨基酸组成发生改变，产生新的蛋白质或使原蛋白质产生新的功能，即基因定点突变。基因的定点突变技术如寡核苷酸引物介导的定点突变、PCR介导的定点突变或盒式突变等是本领域技术人员所熟知的。

本文所述载体是本领域技术人员公知的，包括但不限于：质粒、噬菌体(如λ噬菌体或M13丝状噬菌体等)、黏粒(即柯斯质粒)或病毒载体。具体可为pK18mobsacB或pXMJ19。

本文中，所述微生物可为酵母、细菌、藻或真菌。其中，细菌可来自短杆菌属(Brevibacterium)、棒杆菌属(Corynebacterium)、埃希氏菌属(Escherichia)、气杆菌属(Aerobacter)、微球菌属(Micrococcus)、黄杆菌属(Flavobacterium)或芽孢杆菌属(Bacillus)等。

具体地，所述微生物可为谷氨酸棒杆菌(Corynebacterium glutamicum)、黄色短杆菌(Brevibacterium flavum)、乳酸发酵短杆菌(Brevibacterium lactofermentum)、产谷氨酸微球菌(Micrococcus glutamicus)、产氨短杆菌(Brevibacterum ammoniagenes)、大肠杆菌(Escherichia coli)或产气气杆菌(Aerobacter aerogenes)但不限于此。

具体地，所述微生物可为谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCCNo.21260，或谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC14067。

本文中，所述重组载体具体可为重组载体pK18-CEY17_RS14810^{GG1189-1190TA}、pK18-CEY17_RS14810OE、pK18-CEY17_RS14810^{GG1189-1190TA}OE、pXMJ19-CEY17_RS14810和/或pXMJ19-CEY17_RS14810^{GG1189-1190TA}。

所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}是将pK18mobsacB质粒的Xbal I和BamH I识别位点间的片段(小片段)替换为序列表中SEQ ID No.5的第37-1266位所示的DNA片段，保持pK18mobsacB载体的其他序列不变，得到的重组载体。所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}含有SEQ ID No.3所示的突变基因CEY17_RS14810^{GG1189-1190TA}的第597-1269位所示的DNA分子。

所述重组载体pK18-CEY17_RS14810OE用于将外源基因CEY17_RS14810整合到宿主染色体中，在生产菌中过表达野生型CEY17_RS14810基因。

所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}OE用于将外源基因CEY17_RS14810^{GG1189-1190TA}整合到宿主染色体中，在生产菌中过表达突变型基因CEY17_RS14810^{GG1189-1190TA}。

所述重组载体pXMJ19-CEY17_RS14810是将pXMJ19载体的EcoR I和KpnI识别位点间的片段(小片段)替换为核苷酸序列是序列表中SEQ ID No.13的DNA片段，保持pXMJ19载体的其他序列不变，得到的重组表达载体。重组载体pXMJ19-CEY17_RS14810用于将外源基因CEY17_RS14810通过质粒在染色体外表达，进而在生产菌中过表达野生型CEY17_RS14810基因。

所述重组载体pXMJ19-CEY17_RS14810^{GG1189-1190TA}是将pXMJ19载体的EcoR I和KpnI识别位点间的片段(小片段)替换为核苷酸序列是序列表中SEQ ID No.14的DNA片段，保持pXMJ19载体的其他序列不变，得到的重组表达载体。所述重组载体pXMJ19-CEY17_RS14810^{GG1189-1190TA}用于将外源基因CEY17_RS14810^{GG1189-1190TA}通过质粒在染色体外表达，进而在生产菌中过表达突变型CEY17_RS14810^{GG1189-1190TA}基因。

所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}、pK18-CEY17_RS14810OE、pK18-CEY17_RS14810^{GG1189-1190TA}OE、pXMJ19-CEY17_RS14810和pXMJ19-CEY17_RS14810^{GG1189-1190TA}均在本发明的保护范围内。

本文中，所述重组微生物具体可为重组菌YPV-091、YPV-092、YPV-093、YPV-094和/或YPV-095。

所述重组菌YPV-091是将所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}转化入谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCC No.21260中得到的重组菌，重组菌YPV-091含有SEQ ID No.3所示的突变的基因CEY17_RS14810^{GG1189-1190TA}。

所述重组菌YPV-092含有双拷贝的SEQ ID No.1所示的CEY17_RS14810基因；具体地，重组菌YPV-092是将谷氨酸棒杆菌CGMCC No.21260的基因组中上同源臂CEY17_02570和下同源臂CEY17_02575的间隔区替换为CEY17_RS14810基因，保持谷氨酸棒杆菌CGMCCNo.21260的基因组中的其它核苷酸不变得到的重组菌。含有双拷贝CEY17_RS14810基因的重组菌可以显著和稳定地提高CEY17_RS14810基因的表达量。重组菌YPV-092为在基因组上过表达野生型CEY17_RS14810基因的工程菌，是将所述重组载体pK18-CEY17_RS14810OE导入大肠杆菌DH5α得到的重组菌。

所述重组菌YPV-093含有SEQ ID No.3所示的突变的CEY17_RS14810^{GG1189-1190TA}基因；具体地，重组菌YPV-093是将谷氨酸棒杆菌CGMCC No.21260的基因组中上同源臂CEY17_02570和下同源臂CEY17_02575的间隔区替换为CEY17_RS14810^{GG1189-1190TA}基因，保持谷氨酸棒杆菌CGMCC No.21260的基因组中的其它核苷酸不变得到的重组菌。重组菌YPV-093为在基因组上过表达突变型CEY17_RS14810^{GG1189-1190TA}基因的工程菌，是将所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}OE导入大肠杆菌DH5α得到的重组菌。

所述重组菌YPV-094含有SEQ ID No.1所示的CEY17_RS14810基因，重组菌YPV-094为在质粒上过表达野生型CEY17_RS14810基因的工程菌，即由质粒pXMJ19-CEY17_RS14810在染色体外进行过表达。

所述重组菌YPV-095含有SEQ ID No.3所示的突变的CEY17_RS14810^{GG1189-1190TA}基因，重组菌YPV-095为在质粒上过表达突变型CEY17_RS14810^{GG1189-1190TA}基因的工程菌，即由质粒pXMJ19-CEY17_RS14810^{GG1189-1190TA}在染色体外进行过表达。

所述重组菌YPV-091、YPV-092、YPV-093、YPV-094和YPV-095均在本发明的保护范围内。

本发明还提供了一种制备L-缬氨酸的方法，所述方法包括利用本文中所述的重组微生物生产L-缬氨酸。

上述方法中，所述方法可为发酵法制备L-缬氨酸，所述重组微生物可为棒杆菌属(Corynebacterium)，具体可为谷氨酸棒杆菌(Corynebacterium glutamicum)及其变体。

在本发明的一个实施方案中，所述重组微生物为重组菌YPV-091、YPV-092、YPV-093、YPV-094或YPV-095。

本发明首先以等位基因置换的方式在谷氨酸棒杆菌(Corynebacteriumglutamicum)CGMCC No.21260(经测序确认该菌株染色体上保留有野生型的CEY17_RS14810基因)的CEY17_RS14810基因编码区(SEQ ID No.1)中引入突变，构建了包含突变(GG-TA)的基因工程菌YPV-091。为进一步研究验证在生产菌中过表达野生型CEY17_RS14810基因或其突变基因CEY17_RS14810^{GG1189-1190TA}可以增加L-缬氨酸的产量，分别将外源基因整合到宿主染色体中或由质粒在染色体外表达，构建了基因组上和质粒上过表达CEY17_RS14810基因或CEY17_RS14810^{GG1189-1190TA}基因的工程菌YPV-092、YPV-093、YPV-094和YPV-095。实验表明，CEY17_RS14810基因及其变体参与了L-缬氨酸的生物合成，通过对CEY17_RS14810基因进行过表达或敲除、或定点突变可以调控L-缬氨酸在微生物内的积累量。对CEY17_RS14810基因编码区进行突变或在生产菌中过表达CEY17_RS14810基因或其突变基因CEY17_RS14810^{GG1189-1190TA}，有助于L-缬氨酸产量及转化率的提高，而对CEY17_RS14810基因进行敲除或弱化，不利于L-缬氨酸的积累。可利用CEY17_RS14810基因及其变体(如CEY17_RS14810^{GG1189-1190TA}基因)来构建生产L-缬氨酸的基因工程菌种，以促进L-缬氨酸产量提高，培育符合工业化生产的高产、高质量菌种，对L-缬氨酸的工业化生产具有广泛的应用价值和重要的经济意义。

保藏说明

菌种名称：谷氨酸棒杆菌

拉丁名：Corynebacterium glutamicum

分类命名：谷氨酸棒杆菌(Corynebacterium glutamicum)

菌株编号：YPFV1

保藏机构：中国微生物菌种保藏管理委员会普通微生物中心

保藏机构简称：CGMCC

地址：北京市朝阳区北辰西路1号院3号

保藏日期：2020年11月30日

保藏中心登记入册编号：CGMCC No.21260

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述，给出的实施例仅为了阐明本发明，而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南，并不以任何方式构成对本发明的限制。

下述实施例中的实验方法，如无特殊说明，均为常规方法，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等，如无特殊说明，均可从商业途径得到。

下述实施例中的谷氨酸棒杆菌(Corynebacterium glutamicum)YPFV1 CGMCCNo.21260是将谷氨酸棒杆菌ATCC15168进行诱变获得，并已于2020年11月30日保藏于中国微生物菌种保藏管理委员会普通微生物中心(简称CGMCC，地址为：北京市朝阳区北辰西路1号院3号，中国科学院微生物研究所)，保藏登记号为CGMCC No.21260。谷氨酸棒杆菌(Corynebacterium glutamicum)YPFV1，又称为谷氨酸棒杆菌CGMCC No.21260。

实施例1构建包含突变的CEY17_RS14810基因编码区片段的重组载体

依据NCBI公布的谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC14067基因组序列，设计并合成两对扩增CEY17_RS14810基因编码区的引物，以等位基因置换的方式在谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCC No.21260(经测序确认该菌株染色体上保留有野生型的CEY17_RS14810基因)的CEY17_RS14810基因编码区(SEQ ID No.1)中引入突变，所述突变为将CEY17_RS14810基因的核苷酸序列(SEQ ID No.1)中的第1189-1190位鸟嘌呤鸟嘌呤(GG)突变为胸腺嘧啶腺嘌呤(TA)，得到SEQ ID No.3所示的DNA分子(突变的CEY17_RS14810基因，名称为CEY17_RS14810^{GG1189-1190TA})。

其中，SEQ ID No.1所示的DNA分子编码氨基酸序列为SEQ ID No.2的蛋白质(所述蛋白质名称为蛋白质CEY17_RS14810)。

SEQ ID No.3所示的DNA分子编码氨基酸序列为SEQ ID No.4的突变蛋白质(所述突变蛋白质名称为CEY17_RS14810^G397Y)。所述突变蛋白质CEY17_RS14810^G397Y氨基酸序列(SEQ ID No.4)中的第397位酪氨酸(Y)由甘氨酸(G)突变而来。

采用NEBuilder重组技术进行载体构建，对CEY17_RS14810基因进行定点突变，引物设计如下(上海invitrogen公司合成)，加粗字体的碱基为突变位置：

P1:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGCGGTGCCATCACCTTCGCCC-3'，

P2:

P3:

P4:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCGCGAGCTGAATCTCGGCGAG-3'。

构建方法如下：以谷氨酸棒杆菌ATCC14067为模板，分别以引物P1和P2，P3和P4，进行PCR扩增，获得两条分别带有突变碱基，大小分别为646bp和692bp的CEY17_RS14810基因编码区的DNA片段(CEY17_RS14810 Up和CEY17_RS14810 Down)。

PCR扩增体系为：10×Ex Taq Buffer 5μL，dNTP Mixture(各2.5mM)4μL，Mg²⁺(25mM)4μL，引物(10pM)各2μL，Ex Taq(5U/μL)0.25μL，总体积50μL；

PCR扩增反应程序为：94℃预变性5min，(94℃变性30s；52℃退火30s；72℃延伸40s；30个循环)，72℃过度延伸10min。

将上述两条DNA片段(CEY17_RS14810 Up和CEY17_RS14810 Down)经琼脂糖凝胶电泳分离纯化后，与经过酶切(Xbal I/BamH I)后纯化的pK18mobsacB质粒(购自Add gene公司，质粒上含有卡那霉素抗性标记)用NEBuilder酶(NEBuilder HiFi DNA A ssemblyMaster Mix，购自NEB公司)进行DNA组装反应，反应条件为：50℃连接30min，连接产物转化DH5α(购自TAKARA公司)后长出的单克隆经引物M13(M13F:5’-TGTAAAACGACGGCCAGT-3’，M13R:5’-CAGGAAACAGCTATGACC-3’)进行鉴定获得阳性重组载体pK18-CEY17_RS14810^GG1189 ^-1190TA。将酶切正确的重组载体pK18-CEY17_RS14810^{GG1189-1190TA}送测序公司测序鉴定，并将含有正确突变(GG-TA)的重组载体pK18-CEY17_RS14810^{GG1189-1190TA}保存备用。

经测序鉴定，重组载体pK18-CEY17_RS14810^{GG1189-1190TA}中含有整合DNA片段CEY17_RS14810 Up和CEY17_RS14810 Down的DNA片段，命名为CEY17_RS14810 Up-Down，CEY17_RS14810 Up-Down DNA片段大小为1304bp，序列如SEQ ID No.5所示，其含有突变位点(GG-TA)，用于在菌株谷氨酸棒杆菌CGMCC No.21260中的CEY17_RS14810基因编码区(SEQ IDNo.1)引入核酸改造，所述核酸改造具体为将SEQ ID No.1的第1189位鸟嘌呤(G)突变为胸腺嘧啶(T)、第1190位鸟嘌呤(G)突变为腺嘌呤(A)，即将SEQ ID No.1的第1189-1190位的核苷酸GG突变为TA，最终导致编码蛋白的第397位甘氨酸(G)突变为酪氨酸(Y)。

所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}是将pK18mobsacB质粒的Xbal I和BamH I识别位点间的片段(小片段)替换为序列表中SEQ ID No.5的第37-1266位所示的DNA片段，保持pK18mobsacB载体的其他序列不变，得到的重组载体。

所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}含有SEQ ID No.3所示的突变基因CEY17_RS14810^{GG1189-1190TA}的第597-1269位所示的DNA分子。

实施例2构建包含基因CEY17_RS14810^{GG1189-1190TA}的工程菌株

构建方法如下：将实施例1中的等位替换质粒(pK18-CEY17_RS14810^{GG1189-1190TA})通过电击转化入谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCC No.21260中后，在培养基中进行培养，培养基成分和培养条件参见表1，对培养产生的单菌落分别通过实施例1中的引物P1和通用引物M13R(5’-CAGGAAACAGCTATGACC-3’)进行鉴定，能扩增出1311bp(序列如SEQ ID No.6所示)大小条带的菌株为阳性菌株。将阳性菌株在含15％蔗糖的培养基上培养，对培养产生的单菌落分别在含有卡那霉素和不含卡那霉素的培养基上培养，选择在不含卡那霉素的培养基上生长，而在含卡那霉素的培养基上不生长的菌株进一步采用如下引物(上海invitrogen公司合成)进行PCR鉴定：

P5:5'-CGACGGTGTCATCACCGCTG-3'，

P6:5'-CAGAATCGCCTCTGAGGGAT-3'。

将得到的PCR扩增产物(270bp)通过95℃高温变性10min、冰浴5min后进行SSCP(Single-Strand Conformation Polymorphis)电泳(以质粒pK18-CEY17_RS14810^GG1189 ^-1190TA扩增片段为阳性对照，谷氨酸棒杆菌ATCC14067扩增片段为阴性对照，水作为空白对照)，SSCP电泳的PAGE的制备及电泳条件参见表2，由于片段结构不同，电泳位置不同，因此片段电泳位置与阴性对照片段位置不一致且与阳性对照片段位置一致的菌株为等位替换成功的菌株。再次通过引物P5/P6 PCR扩增阳性菌株CEY17_RS14810基因片段，并连接到PMD19-T载体进行测序，通过序列比对，碱基序列发生突变(GG-TA)的菌株为等位替换成功的阳性菌株，并被命名为YPV-091。

重组菌YPV-091是将所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}转化入谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCC No.21260中得到的重组菌，重组菌YPV-091含有SEQ ID No.3所示的突变的基因CEY17_RS14810^{GG1189-1190TA}。

表1培养基的组成和培养条件

表2 SSCP电泳的PAGE的制备及电泳条件

实施例3构建基因组上过表达CEY17_RS14810基因和CEY17_RS14810^{GG1189-1190TA}基因的工程菌株

采用NEBuilder重组技术进行载体构建，依据NCBI公布的谷氨酸棒杆菌ATCC14067基因组序列，设计并合成三对扩增上下游同源臂片段及CEY17_RS14810或CEY17_RS14810^{GG1189-1190TA}基因编码区及启动子区的引物，以同源重组的方式在谷氨酸棒杆菌CGMCC No.21260中引入CEY17_RS14810或CEY17_RS14810^{GG1189-1190TA}基因。

引物设计如下(上海invitrogen公司合成)：

P7:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGGTAGTGCCGTGCGTACCCCA-3'，

P8:5'-AAAAATGTGCAGAATCGCTTCCCAACCCCAATCGCAATGT-3'，

P9:5'-ACATTGCGATTGGGGTTGGGAAGCGATTCTGCACATTTTT-3'，

P10:5'-GTGCGGGTTGGGGTTTTTGATTAGTTTGATGGAGCGCCAG-3'，

P11:5'-CTGGCGCTCCATCAAACTAATCAAAAACCCCAACCCGCAC-3'，

P12:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCGTTGGTTTAGCGGAGCTGCA-3'。

构建方法如下：分别以谷氨酸棒杆菌ATCC14067或YPV-091为模板，分别以引物P7/P8，P9/P10，P11/P12进行PCR扩增，获得上游同源臂片段795bp(对应于谷氨酸棒杆菌CGMCCNo.21260 CEY17_RS02570基因及其CEY17_RS02575的间隔区，序列如SEQ ID No.7所示)，CEY17_RS14810基因及其启动子片段1489bp(序列如SEQ ID No.8所示)或CEY17_RS14810^{GG1189-1190TA}基因及其启动子片段1489bp(序列如SEQ ID No.9所示)及下游同源臂片段769bp(对应于谷氨酸棒杆菌CGMCC No.21260 CEY17_RS02575基因及其与CEY17_RS02570的间隔区，序列如SEQ ID No.10所示)。

PCR反应结束后，对每个模板扩增得到的3个片段采用柱式DNA凝胶回收试剂盒分别进行电泳回收。回收后的3个片段与经过Xbal I/BamH I酶切后纯化的pK18mobsacB质粒(购自Addgene公司，该质粒上含有卡那霉素抗性作为筛选标记)用NEBuilder酶(NEBuilderHiFi DNA Assembly Master Mix，购自NEB公司)进行DNA组装反应，反应条件为：50℃连接30min，连接产物转化DH5α后长出的单克隆用M13引物(M13F:5’TGTAAAACGACGGCCAGT 3’，M13R:5’CAGGAAACAGCTATGACC 3’)经PCR鉴定获得阳性整合质粒(重组载体)，分别为pK18-CEY17_RS14810OE、pK18-CEY17_RS14810^{GG1189-1190TA}OE，该阳性整合质粒上含有卡那霉素抗性标记，可以通过卡那霉素筛选获得质粒整合到基因组上的重组子。

重组载体pK18-CEY17_RS14810OE用于将外源基因CEY17_RS14810整合到宿主染色体中，在生产菌中过表达野生型CEY17_RS14810基因。

重组载体pK18-CEY17_RS14810^{GG1189-1190TA}OE用于将外源基因CEY17_RS14810^GG1189 ^-1190TA整合到宿主染色体中，在生产菌中过表达突变型基因CEY17_RS14810^{GG1189-1190TA}。

PCR反应体系为：10×Ex Taq Buffer 5μL，dNTP Mixture(各2.5mM)4μL，Mg²⁺(25mM)4μL，引物(10pM)各2μL，Ex Taq(5U/μL)0.25μL，总体积50μL。

PCR反应程序为：94℃预变性5min，94℃变性30s；52℃退火30s；72℃延伸60s(30个循环)，72℃过度延伸10min。

将测序正确的整合质粒(pK18-CEY17_RS14810 OE、pK18-CEY17_RS14810^GG1189 ^-1190TAOE)分别电转化入谷氨酸棒杆菌CGMCC No.21260，在培养基中进行培养，培养基成分和培养条件参见表1，对培养产生的单菌落通过P13/P14引物进行PCR鉴定，PCR扩增出含有大小2214bp(不含突变的序列如SEQ ID No.11所示，含突变的序列第2157-2158位为TA，其余如SEQ ID No.11)的片段的为阳性菌株，扩增不到片段的为原菌。将阳性菌株在含15％蔗糖的培养基上培养，对培养产生的单菌落进一步采用P15/P16引物进行PCR鉴定，扩增出大小为1571bp(不含突变的序列如SEQ ID No.12所示，含突变的序列第693-694位为TA，其余如SEQ ID No.12)的菌为CEY17_RS14810或CEY17_RS14810^{GG1189-1190TA}基因整合到谷氨酸棒杆菌CGMCC No.21260基因组上同源臂CEY17_02570和下同源臂CEY17_02575的间隔区上的阳性菌株，分别命名为YPV-092(不含突变点)和YPV-093(含突变点)。

重组菌YPV-092含有双拷贝的SEQ ID No.1所示的CEY17_RS14810基因；具体地，重组菌YPV-092是将谷氨酸棒杆菌CGMCC No.21260的基因组中上同源臂CEY17_02570和下同源臂CEY17_02575的间隔区替换为CEY17_RS14810基因，保持谷氨酸棒杆菌CGMCC No.21260的基因组中的其它核苷酸不变得到的重组菌。含有双拷贝CEY17_RS14810基因的重组菌可以显著和稳定地提高CEY17_RS14810基因的表达量。重组菌YPV-092为在基因组上过表达野生型CEY17_RS14810基因的工程菌，是将所述重组载体pK18-CEY17_RS14810OE导入大肠杆菌DH5α得到的重组菌。

重组菌YPV-093含有SEQ ID No.3所示的突变的CEY17_RS14810^{GG1189-1190TA}基因；具体地，重组菌YPV-093是将谷氨酸棒杆菌CGMCC No.21260的基因组中上同源臂CEY17_02570和下同源臂CEY17_02575的间隔区替换为CEY17_RS14810^{GG1189-1190TA}基因，保持谷氨酸棒杆菌CGMCC No.21260的基因组中的其它核苷酸不变得到的重组菌。重组菌YPV-093为在基因组上过表达突变型CEY17_RS14810^{GG1189-1190TA}基因的工程菌，是将所述重组载体pK18-CEY17_RS14810^{GG1189-1190TA}OE导入大肠杆菌DH5α得到的重组菌。

PCR鉴定引物如下所示：

P13:5'-CGGTTAGATTTTTTGGCCCC-3'(对应上同源臂CEY17_RS02570的外侧)，

P14:5'-GCATTTCACCAGTAGGCATG-3'(对应CEY17_RS14810编码区区)，

P15:5'-GCCAGTACTACATCGCATTC-3'(对应CEY17_RS14810编码区)，

P16:5'-TCTGGACTGGGTGTTGCGCT-3'(对应下同源臂CEY17_RS02575的外侧)。

实施例4构建质粒上过表达CEY17_RS14810基因或CEY17_RS14810^{GG1189-1190TA}基因的工程菌株

采用NEBuilder重组技术进行载体构建，依据NCBI公布的谷氨酸棒杆菌ATCC14067基因组序列，设计并合成一对扩增CEY17_RS14810和CEY17_RS14810^{GG1189-1190TA}基因编码区及启动子区的引物，引物设计如下(上海invitrogen公司合成)：

P17:5'-GCTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCAAGCGATTCTGCACATTTTT-3'(带下划线的核苷酸序列为pXMJ19上的序列)，

P18:5'-ATCAGGCTGAAAATCTTCTCTCATCCGCCAAAACTTAGTTTGATGGAGCGCCAG-3'(带下划线的核苷酸序列为pXMJ19上的序列)。

构建方法如下：分别以谷氨酸棒杆菌ATCC14067和YPV-091为模板，以引物P17/P18进行PCR扩增，获得CEY17_RS14810基因及其启动子片段(序列如SEQ ID No.13所示)和CEY17_RS14810^{GG1189-1190TA}基因及其启动子片段1519bp(序列如SEQ ID No.14所示)，对扩增产物进行电泳并采用柱式DNA凝胶回收试剂盒进行纯化回收，回收的DNA片段与经EcoR I/KpnI酶切回收的穿梭质粒pXMJ19(购自Addgene公司，该质粒上含有氯霉素抗性作为筛选标记)用NEBuilder酶(NEBuilder HiFi DNA Assembly Master Mix，购自NEB公司)进行DNA组装反应，反应条件为：50℃连接30min，连接产物转化DH5α后长出的单克隆用M13R(-48)(5'AGCGGATAAC AATTTCACAC AGGA3')/P18引物经PCR鉴定获得阳性过表达载体pXMJ19-CEY17_RS14810(含有CEY17_RS14810基因)和pXMJ19-CEY17_RS14810^{GG1189-1190TA}(含有CEY17_RS14810^{GG1189-1190TA}基因)，将该质粒送测序。因质粒上含有氯霉素抗性标记，可以通过氯霉素来筛选质粒是否转化到菌株中。

重组载体pXMJ19-CEY17_RS14810是将pXMJ19载体的EcoR I和KpnI识别位点间的片段(小片段)替换为核苷酸序列是序列表中SEQ ID No.13的DNA片段，保持pXM J19载体的其他序列不变，得到的重组表达载体。重组载体pXMJ19-CEY17_RS14810用于将外源基因CEY17_RS14810通过质粒在染色体外表达，进而在生产菌中过表达野生型CEY17_RS14810基因。

重组载体pXMJ19-CEY17_RS14810^{GG1189-1190TA}是将pXMJ19载体的EcoR I和KpnI识别位点间的片段(小片段)替换为核苷酸序列是序列表中SEQ ID No.14的DNA片段，保持pXMJ19载体的其他序列不变，得到的重组表达载体。所述重组载体pXMJ19-CEY17_RS14810^{GG1189-1190TA}用于将外源基因CEY17_RS14810^{GG1189-1190TA}通过质粒在染色体外表达，进而在生产菌中过表达突变型CEY17_RS14810^{GG1189-1190TA}基因。

将测序正确的pXMJ19-CEY17_RS14810和pXMJ19-CEY17_RS14810^{GG1189-1190TA}质粒分别电转化入谷氨酸棒杆菌CGMCC No.21260中，在培养基中进行培养，培养基成分和培养条件参见表1，对培养产生的单菌落通过引物M13R(-48)/P18进行PCR鉴定，PCR扩增出含有大小1558bp(不含突变的序列如SEQ ID No.15所示，含突变的序列第1444-1445位为TA，其余如SEQ ID No.15所示)片段的为阳性菌株，其被命名为YPV-094(不含突变点)和YPV-095(含突变点)。

重组菌YPV-094含有SEQ ID No.1所示的CEY17_RS14810基因，重组菌YPV-094为在质粒上过表达野生型CEY17_RS14810基因的工程菌，即由质粒pXMJ19-CEY17_RS14810在染色体外进行过表达。

重组菌YPV-095含有SEQ ID No.3所示的突变的CEY17_RS14810^{GG1189-1190TA}基因，重组菌YPV-095为在质粒上过表达突变型CEY17_RS14810^{GG1189-1190TA}基因的工程菌，即由质粒pXMJ19-CEY17_RS14810^{GG1189-1190TA}在染色体外进行过表达。

实施例5构建基因组上缺失CEY17_RS14810基因的工程菌株

采用NEBuilder重组技术进行载体构建，根据NCBI公布的谷氨酸棒杆菌ATCC14067的基因组序列，合成两对扩增CEY17_RS14810基因编码区两端片段的引物，作为上下游同源臂片段。引物设计如下(上海invitrogen公司合成)：

P19:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGTGCCGAGAAATTTTCATTGG-3'，

P20:5'-GTTCGGCCTCTTAAATGGCGGAGAACTAATATAAAAGTAA-3'，

P21:5'-TTACTTTTATATTAGTTCTCCGCCATTTAAGAGGCCGAAC-3'，

P22:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCCGGCAAGGCTCACATCCGTT-3'。

构建方法如下：以谷氨酸棒杆菌ATCC14067为模板，分别以引物P19/P20和P21/P22进行PCR扩增，获得CEY17_RS14810的上游同源臂片段720bp及CEY17_RS14810的下游同源臂片段695bp。

对扩增的产物进行电泳并采用柱式DNA凝胶回收试剂盒进行纯化，回收的DNA片段与经过Xbal I/BamH I酶切后纯化的pK18mobsacB质粒(购自Addgene公司，该质粒上含有卡那霉素抗性作为筛选标记)用NEBuilder酶(NEBuilder HiFi DNA Assembly Master Mix，购自NEB公司)进行DNA组装反应，反应条件为：50℃连接30min，连接产物转化DH5α后长出的单克隆用M13引物(M13F:5’-TGTAAAACGACGGCCAGT-3’，M13R:5’-CAGGAAACAGCTATGACC-3’)经PCR鉴定获得阳性敲除载体pK18-ΔCEY17_RS14810，此重组质粒pK18-ΔCEY17_RS14810中包含名称为ΔCEY17_RS14810的Up-Down DNA 1375bp(序列如SEQ ID No.16所示)。

将该质粒送测序，将测序正确的敲除质粒pK18-ΔCEY17_RS14810电转化入谷氨酸棒杆菌CGMCC No.21260，在培养基中进行培养，培养基成分和培养条件参见表1，对培养产生的单菌落通过如下引物(上海invitrogen公司合成)进行PCR鉴定：

P23:5'-TGCCGAGAAATTTTCATTGG-3'(对应于谷氨酸棒杆菌CGMCC No.21260CEY17_RS11895基因内部)，

P24:5'-CGGCAAGGCTCACATCCGTT-3'(对应于谷氨酸棒杆菌CGMCC No.21260CEY17_RS11905基因内部)。

上述PCR同时扩增出大小1301bp及2570bp的条带的菌株为阳性菌株，只扩增出2570bp条带的菌株为原菌。阳性菌株在15％蔗糖培养基上筛选后分别在含有卡那霉素和不含卡那霉素的培养基上培养，选择在不含卡那霉素的培养基上生长，而在含卡那霉素的培养基上不生长的菌株进一步采用P23/P24引物进行PCR鉴定，扩增出大小为1301bp条带的菌株为CEY17_RS14810基因编码区被敲除的阳性菌株CEY17_RS14810。再次通过P23/P24引物PCR扩增阳性菌株CEY17_RS14810片段，并连接到pMD19-T载体进行测序，将测序正确的菌株命名为YPV-096(谷氨酸棒杆菌CGMCC No.21260上的基因组上的CEY17_RS14810基因被敲除)。

实施例6L-缬氨酸发酵实验

将上述实施例构建的菌株和原始菌株谷氨酸棒杆菌CGMCC No.21260在BLBIO-5GC-4-H型号的发酵罐(购自上海百仑生物科技有限公司)中以表3所示的培养基和表4所示的控制工艺进行发酵实验。每个菌株重复三次，结果如表5所示。

结果如表5所示，在谷氨酸棒杆菌中对CEY17_RS14810基因编码区进行定点突变(如突变为CEY17_RS14810^{GG1189-1190TA})及过表达，有助于L-缬氨酸产量及转化率的提高，而对CEY17_RS14810基因进行敲除或弱化，不利于L-缬氨酸的积累。

表3发酵培养基配方(其余为水)

成分	配方
		硫酸铵	14g/L
磷酸二氢钾	1g/L
		磷酸氢二钾	1g/L
硫酸镁	0.5g/L
		酵母粉	2g/L
硫酸亚铁	18mg/L
		硫酸锰	4.2mg/L
生物素	0.02mg/L
		维生素B1	2mg/L
antifoam(CB-442)消泡剂)	0.5mL/L
		70％葡萄糖(底糖)	40g/L

表4发酵控制工艺

表5 L-缬氨酸发酵实验结果

菌株	OD<sub>610</sub>	L-缬氨酸产量(g/L)
			谷氨酸棒杆菌CGMCC No.21260	98.2	84.1
YPV-091	100.2	85.2
			YPV-092	100.1	84.5
YPV-093	99.4	85.7
			YPV-094	100.6	85.3
YPV-095	101.3	86.1
			YPV-096	97.7	83.1

以上对本发明进行了详述。对于本领域技术人员来说，在不脱离本发明的宗旨和范围，以及无需进行不必要的实验情况下，可在等同参数、浓度和条件下，在较宽范围内实施本发明。虽然本发明给出了特殊的实施例，应该理解为，可以对本发明作进一步的改进。总之，按本发明的原理，本申请欲包括任何变更、用途或对本发明的改进，包括脱离了本申请中已公开范围，而用本领域已知的常规技术进行的改变。

SEQUENCE LISTING

<110> 宁夏伊品生物科技股份有限公司

<120> 构建产L-缬氨酸的重组微生物的方法及其所用核酸分子和生物材料

<160> 16

<170> PatentIn version 3.5

<210> 1

<211> 1269

<212> DNA

<213> 谷氨酸棒杆菌（Corynebacterium glutamicum）

<400> 1

atgcgcctca acaaacgact cccagcggca ctctccggac tgctgctctc tgctgccctt 60

cttgccggat gctccacttc tggaaccgcc gagaccacga caacaaccgt ttcatctgct 120

gcggcatcaa caaccacttc cacctcctcc gattcctctt cctcctcttc ctccgactca 180

agcaccaccg ccgaaaccat ctccaacacc gcggaagctg cccaagcttt cttgtccacc 240

ctgtccaccg aagaacaaga cgccgtactc tacgactacg acgctgaaga aaagtccacc 300

ggctggtcta acttcccagt caccttcgtg cagcgttccg gcgtgaacct caccgacctc 360

actgaggaac agcaagcagc tgccctcaac gtgctgaaga acctgctcaa cgacgacgcc 420

taccaaatga tcgaagacat catggctagc gatcagtacc tcaacgacga aagcaacacc 480

accgaggatt ccctcggcca gtactacatc gcattcttcg gcgatccaag cagcgactcc 540

gactggtcca tccaattcgg cggacaccac atcggcatca acgccacctt ctccgacggt 600

gccatcacct tcgccccaac ccaccttggc acccagcctt ccgagtggac caaccaggac 660

ggcgaaaccg ttgcagcact aagcaacatg tacgaaaccg ccttcgcctt ctacgacagc 720

ctcaccgaag agcagcaagc acagctctac cagggtgaag agttggattc catggtctgc 780

gcaccgggca gcacctgcga ctacccaacc ggcaccggct tgaaaggctc cgacctcacc 840

gacgagcaaa aggaattgct tctcgacgtg atcgccaact gggttggtct agccgatgag 900

gaaaccaccg aaactgaact cgatgccatc cgcgaaaccc tggatgacac ctacatcaac 960

tggtccggag ccaccgagta cgacacctcc accggcgacg gcatctactt ccagatcagt 1020

ggcccaaagg tctacattga gttcgctaac cagcaaggtt ctgcaggtgc cgacatcgac 1080

ggtgtcatca ccgctggatg gggccacatt cacaccatct accgcgaccc aaccaatgat 1140

tacgctaact ccgtaactca ggaagcagcc agcggaatga tgggcggcgg ccctggtggt 1200

aatggtggcg agatgcctag cggtgacatg cctactggtg aaatgccttc tggcgctcca 1260

tcaaactaa 1269

<210> 2

<211> 422

<212> PRT

<213> 谷氨酸棒杆菌（Corynebacterium glutamicum）

<400> 2

Met Arg Leu Asn Lys Arg Leu Pro Ala Ala Leu Ser Gly Leu Leu Leu

1 5 10 15

Ser Ala Ala Leu Leu Ala Gly Cys Ser Thr Ser Gly Thr Ala Glu Thr

20 25 30

Thr Thr Thr Thr Val Ser Ser Ala Ala Ala Ser Thr Thr Thr Ser Thr

35 40 45

Ser Ser Asp Ser Ser Ser Ser Ser Ser Ser Asp Ser Ser Thr Thr Ala

50 55 60

Glu Thr Ile Ser Asn Thr Ala Glu Ala Ala Gln Ala Phe Leu Ser Thr

65 70 75 80

Leu Ser Thr Glu Glu Gln Asp Ala Val Leu Tyr Asp Tyr Asp Ala Glu

85 90 95

Glu Lys Ser Thr Gly Trp Ser Asn Phe Pro Val Thr Phe Val Gln Arg

100 105 110

Ser Gly Val Asn Leu Thr Asp Leu Thr Glu Glu Gln Gln Ala Ala Ala

115 120 125

Leu Asn Val Leu Lys Asn Leu Leu Asn Asp Asp Ala Tyr Gln Met Ile

130 135 140

Glu Asp Ile Met Ala Ser Asp Gln Tyr Leu Asn Asp Glu Ser Asn Thr

145 150 155 160

Thr Glu Asp Ser Leu Gly Gln Tyr Tyr Ile Ala Phe Phe Gly Asp Pro

165 170 175

Ser Ser Asp Ser Asp Trp Ser Ile Gln Phe Gly Gly His His Ile Gly

180 185 190

Ile Asn Ala Thr Phe Ser Asp Gly Ala Ile Thr Phe Ala Pro Thr His

195 200 205

Leu Gly Thr Gln Pro Ser Glu Trp Thr Asn Gln Asp Gly Glu Thr Val

210 215 220

Ala Ala Leu Ser Asn Met Tyr Glu Thr Ala Phe Ala Phe Tyr Asp Ser

225 230 235 240

Leu Thr Glu Glu Gln Gln Ala Gln Leu Tyr Gln Gly Glu Glu Leu Asp

245 250 255

Ser Met Val Cys Ala Pro Gly Ser Thr Cys Asp Tyr Pro Thr Gly Thr

260 265 270

Gly Leu Lys Gly Ser Asp Leu Thr Asp Glu Gln Lys Glu Leu Leu Leu

275 280 285

Asp Val Ile Ala Asn Trp Val Gly Leu Ala Asp Glu Glu Thr Thr Glu

290 295 300

Thr Glu Leu Asp Ala Ile Arg Glu Thr Leu Asp Asp Thr Tyr Ile Asn

305 310 315 320

Trp Ser Gly Ala Thr Glu Tyr Asp Thr Ser Thr Gly Asp Gly Ile Tyr

325 330 335

Phe Gln Ile Ser Gly Pro Lys Val Tyr Ile Glu Phe Ala Asn Gln Gln

340 345 350

Gly Ser Ala Gly Ala Asp Ile Asp Gly Val Ile Thr Ala Gly Trp Gly

355 360 365

His Ile His Thr Ile Tyr Arg Asp Pro Thr Asn Asp Tyr Ala Asn Ser

370 375 380

Val Thr Gln Glu Ala Ala Ser Gly Met Met Gly Gly Gly Pro Gly Gly

385 390 395 400

Asn Gly Gly Glu Met Pro Ser Gly Asp Met Pro Thr Gly Glu Met Pro

405 410 415

Ser Gly Ala Pro Ser Asn

420

<210> 3

<211> 1269

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 3

atgcgcctca acaaacgact cccagcggca ctctccggac tgctgctctc tgctgccctt 60

cttgccggat gctccacttc tggaaccgcc gagaccacga caacaaccgt ttcatctgct 120

gcggcatcaa caaccacttc cacctcctcc gattcctctt cctcctcttc ctccgactca 180

agcaccaccg ccgaaaccat ctccaacacc gcggaagctg cccaagcttt cttgtccacc 240

ctgtccaccg aagaacaaga cgccgtactc tacgactacg acgctgaaga aaagtccacc 300

ggctggtcta acttcccagt caccttcgtg cagcgttccg gcgtgaacct caccgacctc 360

actgaggaac agcaagcagc tgccctcaac gtgctgaaga acctgctcaa cgacgacgcc 420

taccaaatga tcgaagacat catggctagc gatcagtacc tcaacgacga aagcaacacc 480

accgaggatt ccctcggcca gtactacatc gcattcttcg gcgatccaag cagcgactcc 540

gactggtcca tccaattcgg cggacaccac atcggcatca acgccacctt ctccgacggt 600

gccatcacct tcgccccaac ccaccttggc acccagcctt ccgagtggac caaccaggac 660

ggcgaaaccg ttgcagcact aagcaacatg tacgaaaccg ccttcgcctt ctacgacagc 720

ctcaccgaag agcagcaagc acagctctac cagggtgaag agttggattc catggtctgc 780

gcaccgggca gcacctgcga ctacccaacc ggcaccggct tgaaaggctc cgacctcacc 840

gacgagcaaa aggaattgct tctcgacgtg atcgccaact gggttggtct agccgatgag 900

gaaaccaccg aaactgaact cgatgccatc cgcgaaaccc tggatgacac ctacatcaac 960

tggtccggag ccaccgagta cgacacctcc accggcgacg gcatctactt ccagatcagt 1020

ggcccaaagg tctacattga gttcgctaac cagcaaggtt ctgcaggtgc cgacatcgac 1080

ggtgtcatca ccgctggatg gggccacatt cacaccatct accgcgaccc aaccaatgat 1140

tacgctaact ccgtaactca ggaagcagcc agcggaatga tgggcggcta ccctggtggt 1200

aatggtggcg agatgcctag cggtgacatg cctactggtg aaatgccttc tggcgctcca 1260

tcaaactaa 1269

<210> 4

<211> 422

<212> PRT

<213> 人工序列（Artificial sequence）

<400> 4

Met Arg Leu Asn Lys Arg Leu Pro Ala Ala Leu Ser Gly Leu Leu Leu

1 5 10 15

Ser Ala Ala Leu Leu Ala Gly Cys Ser Thr Ser Gly Thr Ala Glu Thr

20 25 30

Thr Thr Thr Thr Val Ser Ser Ala Ala Ala Ser Thr Thr Thr Ser Thr

35 40 45

Ser Ser Asp Ser Ser Ser Ser Ser Ser Ser Asp Ser Ser Thr Thr Ala

50 55 60

Glu Thr Ile Ser Asn Thr Ala Glu Ala Ala Gln Ala Phe Leu Ser Thr

65 70 75 80

Leu Ser Thr Glu Glu Gln Asp Ala Val Leu Tyr Asp Tyr Asp Ala Glu

85 90 95

Glu Lys Ser Thr Gly Trp Ser Asn Phe Pro Val Thr Phe Val Gln Arg

100 105 110

Ser Gly Val Asn Leu Thr Asp Leu Thr Glu Glu Gln Gln Ala Ala Ala

115 120 125

Leu Asn Val Leu Lys Asn Leu Leu Asn Asp Asp Ala Tyr Gln Met Ile

130 135 140

Glu Asp Ile Met Ala Ser Asp Gln Tyr Leu Asn Asp Glu Ser Asn Thr

145 150 155 160

Thr Glu Asp Ser Leu Gly Gln Tyr Tyr Ile Ala Phe Phe Gly Asp Pro

165 170 175

Ser Ser Asp Ser Asp Trp Ser Ile Gln Phe Gly Gly His His Ile Gly

180 185 190

Ile Asn Ala Thr Phe Ser Asp Gly Ala Ile Thr Phe Ala Pro Thr His

195 200 205

Leu Gly Thr Gln Pro Ser Glu Trp Thr Asn Gln Asp Gly Glu Thr Val

210 215 220

Ala Ala Leu Ser Asn Met Tyr Glu Thr Ala Phe Ala Phe Tyr Asp Ser

225 230 235 240

Leu Thr Glu Glu Gln Gln Ala Gln Leu Tyr Gln Gly Glu Glu Leu Asp

245 250 255

Ser Met Val Cys Ala Pro Gly Ser Thr Cys Asp Tyr Pro Thr Gly Thr

260 265 270

Gly Leu Lys Gly Ser Asp Leu Thr Asp Glu Gln Lys Glu Leu Leu Leu

275 280 285

Asp Val Ile Ala Asn Trp Val Gly Leu Ala Asp Glu Glu Thr Thr Glu

290 295 300

Thr Glu Leu Asp Ala Ile Arg Glu Thr Leu Asp Asp Thr Tyr Ile Asn

305 310 315 320

Trp Ser Gly Ala Thr Glu Tyr Asp Thr Ser Thr Gly Asp Gly Ile Tyr

325 330 335

Phe Gln Ile Ser Gly Pro Lys Val Tyr Ile Glu Phe Ala Asn Gln Gln

340 345 350

Gly Ser Ala Gly Ala Asp Ile Asp Gly Val Ile Thr Ala Gly Trp Gly

355 360 365

His Ile His Thr Ile Tyr Arg Asp Pro Thr Asn Asp Tyr Ala Asn Ser

370 375 380

Val Thr Gln Glu Ala Ala Ser Gly Met Met Gly Gly Tyr Pro Gly Gly

385 390 395 400

Asn Gly Gly Glu Met Pro Ser Gly Asp Met Pro Thr Gly Glu Met Pro

405 410 415

Ser Gly Ala Pro Ser Asn

420

<210> 5

<211> 1304

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 5

cagtgccaag cttgcatgcc tgcaggtcga ctctagcggt gccatcacct tcgccccaac 60

ccaccttggc acccagcctt ccgagtggac caaccaggac ggcgaaaccg ttgcagcact 120

aagcaacatg tacgaaaccg ccttcgcctt ctacgacagc ctcaccgaag agcagcaagc 180

acagctctac cagggtgaag agttggattc catggtctgc gcaccgggca gcacctgcga 240

ctacccaacc ggcaccggct tgaaaggctc cgacctcacc gacgagcaaa aggaattgct 300

tctcgacgtg atcgccaact gggttggtct agccgatgag gaaaccaccg aaactgaact 360

cgatgccatc cgcgaaaccc tggatgacac ctacatcaac tggtccggag ccaccgagta 420

cgacacctcc accggcgacg gcatctactt ccagatcagt ggcccaaagg tctacattga 480

gttcgctaac cagcaaggtt ctgcaggtgc cgacatcgac ggtgtcatca ccgctggatg 540

gggccacatt cacaccatct accgcgaccc aaccaatgat tacgctaact ccgtaactca 600

ggaagcagcc agcggaatga tgggcggcta ccctggtggt aatggtggcg agatgcctag 660

cggtgacatg cctactggtg aaatgccttc tggcgctcca tcaaactaac gccatttaag 720

aggccgaacc cgtgagacga gcatttacat cacctcacgg gtttggatcc ctcagaggcg 780

attctgtgaa gtcggtttct gctgggccca ggtcagtttc tccaggcggt tagcattgga 840

gaggcgtttc agaccaaaag cgctcggatt cttccgatcc ttggcctcga atgacagttt 900

cctcgcctac aaagtgctgt ttcagaccaa gaaccccact tttcgactgg ccctttggtc 960

tctttttcaa gtccacccac aaagcgcgtg tccctcgtca aagaagggca cgcgcttgaa 1020

gtgtttttaa gagattttag cggatggtca cctggcggga cttgatgttc tccagctgac 1080

ggcgctcgtc ggcgttgagc tgtgcatcgt tatccagttc agcgacgatc ttctcgttga 1140

gtgcaaccaa aacatcggcg taatcggtgg atggacgctc aggatcgaga tcccacactg 1200

ggacgacgat gccgtgggtg cggaaagcgc cagcgaactt ggtttcctcg ccgagattca 1260

gctcgcgggt accgagctcg aattcgtaat catggtcata gctg 1304

<210> 6

<211> 1311

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 6

cagtgccaag cttgcatgcc tgcaggtcga ctctagcggt gccatcacct tcgccccaac 60

ccaccttggc acccagcctt ccgagtggac caaccaggac ggcgaaaccg ttgcagcact 120

aagcaacatg tacgaaaccg ccttcgcctt ctacgacagc ctcaccgaag agcagcaagc 180

acagctctac cagggtgaag agttggattc catggtctgc gcaccgggca gcacctgcga 240

ctacccaacc ggcaccggct tgaaaggctc cgacctcacc gacgagcaaa aggaattgct 300

tctcgacgtg atcgccaact gggttggtct agccgatgag gaaaccaccg aaactgaact 360

cgatgccatc cgcgaaaccc tggatgacac ctacatcaac tggtccggag ccaccgagta 420

cgacacctcc accggcgacg gcatctactt ccagatcagt ggcccaaagg tctacattga 480

gttcgctaac cagcaaggtt ctgcaggtgc cgacatcgac ggtgtcatca ccgctggatg 540

gggccacatt cacaccatct accgcgaccc aaccaatgat tacgctaact ccgtaactca 600

ggaagcagcc agcggaatga tgggcggcta ccctggtggt aatggtggcg agatgcctag 660

cggtgacatg cctactggtg aaatgccttc tggcgctcca tcaaactaac gccatttaag 720

aggccgaacc cgtgagacga gcatttacat cacctcacgg gtttggatcc ctcagaggcg 780

attctgtgaa gtcggtttct gctgggccca ggtcagtttc tccaggcggt tagcattgga 840

gaggcgtttc agaccaaaag cgctcggatt cttccgatcc ttggcctcga atgacagttt 900

cctcgcctac aaagtgctgt ttcagaccaa gaaccccact tttcgactgg ccctttggtc 960

tctttttcaa gtccacccac aaagcgcgtg tccctcgtca aagaagggca cgcgcttgaa 1020

gtgtttttaa gagattttag cggatggtca cctggcggga cttgatgttc tccagctgac 1080

ggcgctcgtc ggcgttgagc tgtgcatcgt tatccagttc agcgacgatc ttctcgttga 1140

gtgcaaccaa aacatcggcg taatcggtgg atggacgctc aggatcgaga tcccacactg 1200

ggacgacgat gccgtgggtg cggaaagcgc cagcgaactt ggtttcctcg ccgagattca 1260

gctcgcgggt accgagctcg aattcgtaat catggtcata gctgtttcct g 1311

<210> 7

<211> 795

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 7

cagtgccaag cttgcatgcc tgcaggtcga ctctaggtag tgccgtgcgt accccattag 60

aaagtgaaaa ttcactgatt ctagccagtc acgctgggaa tcattacatg ggccttcttc 120

gatcattcca tgatcgacaa gaaaagcctc acgttcatca ggttgtaaat aggggacagt 180

agacattaat tacacctaaa aagaaaaggg cccccatgag gcgcatcgtt gagaggcgtt 240

gggggtgctg ttggcttcta cgatatatct aattttgcct gatgtgtcag tagctcgaac 300

gtcactttca cttgtcgtct gaagtttcga tgtttctgca ccataaacgg tgtttatgaa 360

ttatcccccc ctctaccccc cgggggtgag gttttcgctg agaaggctgg cttcaaacgg 420

gggctggaca cgtacgcgga gatggcgacg cgttctgtca cgaatcgtgc gttgcgtgct 480

ggccattccg ccacccaagc cagatccagg tcatgagggc taccaggcca cacagaagca 540

gcgctaccta gaacgccaga tcagggcgtc gaaacggatg gaagctgcag ccatcgaccc 600

tagagacatt gacaccgcaa aacagcgcat acgggcatac caggcaaaac tacgcgacca 660

catcaaacag cacgacctgc caaggcgcag acaccgagaa cagattaaaa tgcgctaaag 720

aagttaacat catgctgcca ccgcccaagc gggaaacatt gcgattgggg ttgggaagcg 780

attctgcaca ttttt 795

<210> 8

<211> 1489

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 8

acattgcgat tggggttggg aagcgattct gcacattttt taacatcccc aaggcgtgat 60

ttcgattttc ggaatcacgc ctttcccatt ttcgcgttaa aataccaggt caacacacac 120

aggaaccgtt cagaaacctt ccagattgct cactttttga tttcactttt ttgagaagtt 180

ttacttttat attagttctc atgcgcctca acaaacgact cccagcggca ctctccggac 240

tgctgctctc tgctgccctt cttgccggat gctccacttc tggaaccgcc gagaccacga 300

caacaaccgt ttcatctgct gcggcatcaa caaccacttc cacctcctcc gattcctctt 360

cctcctcttc ctccgactca agcaccaccg ccgaaaccat ctccaacacc gcggaagctg 420

cccaagcttt cttgtccacc ctgtccaccg aagaacaaga cgccgtactc tacgactacg 480

acgctgaaga aaagtccacc ggctggtcta acttcccagt caccttcgtg cagcgttccg 540

gcgtgaacct caccgacctc actgaggaac agcaagcagc tgccctcaac gtgctgaaga 600

acctgctcaa cgacgacgcc taccaaatga tcgaagacat catggctagc gatcagtacc 660

tcaacgacga aagcaacacc accgaggatt ccctcggcca gtactacatc gcattcttcg 720

gcgatccaag cagcgactcc gactggtcca tccaattcgg cggacaccac atcggcatca 780

acgccacctt ctccgacggt gccatcacct tcgccccaac ccaccttggc acccagcctt 840

ccgagtggac caaccaggac ggcgaaaccg ttgcagcact aagcaacatg tacgaaaccg 900

ccttcgcctt ctacgacagc ctcaccgaag agcagcaagc acagctctac cagggtgaag 960

agttggattc catggtctgc gcaccgggca gcacctgcga ctacccaacc ggcaccggct 1020

tgaaaggctc cgacctcacc gacgagcaaa aggaattgct tctcgacgtg atcgccaact 1080

gggttggtct agccgatgag gaaaccaccg aaactgaact cgatgccatc cgcgaaaccc 1140

tggatgacac ctacatcaac tggtccggag ccaccgagta cgacacctcc accggcgacg 1200

gcatctactt ccagatcagt ggcccaaagg tctacattga gttcgctaac cagcaaggtt 1260

ctgcaggtgc cgacatcgac ggtgtcatca ccgctggatg gggccacatt cacaccatct 1320

accgcgaccc aaccaatgat tacgctaact ccgtaactca ggaagcagcc agcggaatga 1380

tgggcggcgg ccctggtggt aatggtggcg agatgcctag cggtgacatg cctactggtg 1440

aaatgccttc tggcgctcca tcaaactaat caaaaacccc aacccgcac 1489

<210> 9

<211> 1489

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 9

acattgcgat tggggttggg aagcgattct gcacattttt taacatcccc aaggcgtgat 60

ttcgattttc ggaatcacgc ctttcccatt ttcgcgttaa aataccaggt caacacacac 120

aggaaccgtt cagaaacctt ccagattgct cactttttga tttcactttt ttgagaagtt 180

ttacttttat attagttctc atgcgcctca acaaacgact cccagcggca ctctccggac 240

tgctgctctc tgctgccctt cttgccggat gctccacttc tggaaccgcc gagaccacga 300

caacaaccgt ttcatctgct gcggcatcaa caaccacttc cacctcctcc gattcctctt 360

cctcctcttc ctccgactca agcaccaccg ccgaaaccat ctccaacacc gcggaagctg 420

cccaagcttt cttgtccacc ctgtccaccg aagaacaaga cgccgtactc tacgactacg 480

acgctgaaga aaagtccacc ggctggtcta acttcccagt caccttcgtg cagcgttccg 540

gcgtgaacct caccgacctc actgaggaac agcaagcagc tgccctcaac gtgctgaaga 600

acctgctcaa cgacgacgcc taccaaatga tcgaagacat catggctagc gatcagtacc 660

tcaacgacga aagcaacacc accgaggatt ccctcggcca gtactacatc gcattcttcg 720

gcgatccaag cagcgactcc gactggtcca tccaattcgg cggacaccac atcggcatca 780

acgccacctt ctccgacggt gccatcacct tcgccccaac ccaccttggc acccagcctt 840

ccgagtggac caaccaggac ggcgaaaccg ttgcagcact aagcaacatg tacgaaaccg 900

ccttcgcctt ctacgacagc ctcaccgaag agcagcaagc acagctctac cagggtgaag 960

agttggattc catggtctgc gcaccgggca gcacctgcga ctacccaacc ggcaccggct 1020

tgaaaggctc cgacctcacc gacgagcaaa aggaattgct tctcgacgtg atcgccaact 1080

gggttggtct agccgatgag gaaaccaccg aaactgaact cgatgccatc cgcgaaaccc 1140

tggatgacac ctacatcaac tggtccggag ccaccgagta cgacacctcc accggcgacg 1200

gcatctactt ccagatcagt ggcccaaagg tctacattga gttcgctaac cagcaaggtt 1260

ctgcaggtgc cgacatcgac ggtgtcatca ccgctggatg gggccacatt cacaccatct 1320

accgcgaccc aaccaatgat tacgctaact ccgtaactca ggaagcagcc agcggaatga 1380

tgggcggcta ccctggtggt aatggtggcg agatgcctag cggtgacatg cctactggtg 1440

aaatgccttc tggcgctcca tcaaactaat caaaaacccc aacccgcac 1489

<210> 10

<211> 769

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 10

ctggcgctcc atcaaactaa tcaaaaaccc caacccgcac atttttagat ttctattttg 60

tgtacatagg gttcggaaca aagcttaaac catccccaat tgaaatgtcg ttacacaccc 120

acatgtttga agtggagcaa accgaaaacc agttttcccc aacggcagcc gccccccacg 180

ttgaaccttc gaaatagtag gcaacaccat caagcggatc ttcatcaagc gaaatagtga 240

ttgactcttc accgttccgc ttacaaactg cgttagtgtc gctattttcc acccacttgt 300

cacactcgta cccgttttca tttagccatt tttcggcatg tcctattttc tcgaaccggg 360

caggagcgtc agggcttccg cagcccgcta gtagtagtcc ggctgcaatg atgcttaatg 420

tttttttcat gaattaaaca tagtactttg ctggtaaaaa tattggagaa ccccactggc 480

ctacatggtc agtgggggca tttttgcgtt tcacccctca aaaatcatca ccacacttgc 540

gggatttccc cctgatttcc cccactccca caccattccc agtggacagt gtggacgtat 600

tggacacatt aaacacattg cgaccaggta aaacgtcatg accaggtatc gtcaatgttc 660

ttgatgaatt tccgcaccgc aggattatca ttcgaggtgg aataaatagc ctgcagctcc 720

gctaaaccaa cgggtaccga gctcgaattc gtaatcatgg tcatagctg 769

<210> 11

<211> 2214

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 11

cggttagatt ttttggcccc tcccaatggg actcattaat gagatttcgg tagtgccgtg 60

cgtaccccat tagaaagtga aaattcactg attctagcca gtcacgctgg gaatcattac 120

atgggccttc ttcgatcatt ccatgatcga caagaaaagc ctcacgttca tcaggttgta 180

aataggggac agtagacatt aattacacct aaaaagaaaa gggcccccat gaggcgcatc 240

gttgagaggc gttgggggtg ctgttggctt ctacgatata tctaattttg cctgatgtgt 300

cagtagctcg aacgtcactt tcacttgtcg tctgaagttt cgatgtttct gcaccataaa 360

cggtgtttat gaattatccc cccctctacc ccccgggggt gaggttttcg ctgagaaggc 420

tggcttcaaa cgggggctgg acacgtacgc ggagatggcg acgcgttctg tcacgaatcg 480

tgcgttgcgt gctggccatt ccgccaccca agccagatcc aggtcatgag ggctaccagg 540

ccacacagaa gcagcgctac ctagaacgcc agatcagggc gtcgaaacgg atggaagctg 600

cagccatcga ccctagagac attgacaccg caaaacagcg catacgggca taccaggcaa 660

aactacgcga ccacatcaaa cagcacgacc tgccaaggcg cagacaccga gaacagatta 720

aaatgcgcta aagaagttaa catcatgctg ccaccgccca agcgggaaac attgcgattg 780

gggttgggaa gcgattctgc acatttttta acatccccaa ggcgtgattt cgattttcgg 840

aatcacgcct ttcccatttt cgcgttaaaa taccaggtca acacacacag gaaccgttca 900

gaaaccttcc agattgctca ctttttgatt tcactttttt gagaagtttt acttttatat 960

tagttctcat gcgcctcaac aaacgactcc cagcggcact ctccggactg ctgctctctg 1020

ctgcccttct tgccggatgc tccacttctg gaaccgccga gaccacgaca acaaccgttt 1080

catctgctgc ggcatcaaca accacttcca cctcctccga ttcctcttcc tcctcttcct 1140

ccgactcaag caccaccgcc gaaaccatct ccaacaccgc ggaagctgcc caagctttct 1200

tgtccaccct gtccaccgaa gaacaagacg ccgtactcta cgactacgac gctgaagaaa 1260

agtccaccgg ctggtctaac ttcccagtca ccttcgtgca gcgttccggc gtgaacctca 1320

ccgacctcac tgaggaacag caagcagctg ccctcaacgt gctgaagaac ctgctcaacg 1380

acgacgccta ccaaatgatc gaagacatca tggctagcga tcagtacctc aacgacgaaa 1440

gcaacaccac cgaggattcc ctcggccagt actacatcgc attcttcggc gatccaagca 1500

gcgactccga ctggtccatc caattcggcg gacaccacat cggcatcaac gccaccttct 1560

ccgacggtgc catcaccttc gccccaaccc accttggcac ccagccttcc gagtggacca 1620

accaggacgg cgaaaccgtt gcagcactaa gcaacatgta cgaaaccgcc ttcgccttct 1680

acgacagcct caccgaagag cagcaagcac agctctacca gggtgaagag ttggattcca 1740

tggtctgcgc accgggcagc acctgcgact acccaaccgg caccggcttg aaaggctccg 1800

acctcaccga cgagcaaaag gaattgcttc tcgacgtgat cgccaactgg gttggtctag 1860

ccgatgagga aaccaccgaa actgaactcg atgccatccg cgaaaccctg gatgacacct 1920

acatcaactg gtccggagcc accgagtacg acacctccac cggcgacggc atctacttcc 1980

agatcagtgg cccaaaggtc tacattgagt tcgctaacca gcaaggttct gcaggtgccg 2040

acatcgacgg tgtcatcacc gctggatggg gccacattca caccatctac cgcgacccaa 2100

ccaatgatta cgctaactcc gtaactcagg aagcagccag cggaatgatg ggcggcggcc 2160

ctggtggtaa tggtggcgag atgcctagcg gtgacatgcc tactggtgaa atgc 2214

<210> 12

<211> 1571

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 12

gccagtacta catcgcattc ttcggcgatc caagcagcga ctccgactgg tccatccaat 60

tcggcggaca ccacatcggc atcaacgcca ccttctccga cggtgccatc accttcgccc 120

caacccacct tggcacccag ccttccgagt ggaccaacca ggacggcgaa accgttgcag 180

cactaagcaa catgtacgaa accgccttcg ccttctacga cagcctcacc gaagagcagc 240

aagcacagct ctaccagggt gaagagttgg attccatggt ctgcgcaccg ggcagcacct 300

gcgactaccc aaccggcacc ggcttgaaag gctccgacct caccgacgag caaaaggaat 360

tgcttctcga cgtgatcgcc aactgggttg gtctagccga tgaggaaacc accgaaactg 420

aactcgatgc catccgcgaa accctggatg acacctacat caactggtcc ggagccaccg 480

agtacgacac ctccaccggc gacggcatct acttccagat cagtggccca aaggtctaca 540

ttgagttcgc taaccagcaa ggttctgcag gtgccgacat cgacggtgtc atcaccgctg 600

gatggggcca cattcacacc atctaccgcg acccaaccaa tgattacgct aactccgtaa 660

ctcaggaagc agccagcgga atgatgggcg gcggccctgg tggtaatggt ggcgagatgc 720

ctagcggtga catgcctact ggtgaaatgc cttctggcgc tccatcaaac taatcaaaaa 780

ccccaacccg cacattttta gatttctatt ttgtgtacat agggttcgga acaaagctta 840

aaccatcccc aattgaaatg tcgttacaca cccacatgtt tgaagtggag caaaccgaaa 900

accagttttc cccaacggca gccgcccccc acgttgaacc ttcgaaatag taggcaacac 960

catcaagcgg atcttcatca agcgaaatag tgattgactc ttcaccgttc cgcttacaaa 1020

ctgcgttagt gtcgctattt tccacccact tgtcacactc gtacccgttt tcatttagcc 1080

atttttcggc atgtcctatt ttctcgaacc gggcaggagc gtcagggctt ccgcagcccg 1140

ctagtagtag tccggctgca atgatgctta atgttttttt catgaattaa acatagtact 1200

ttgctggtaa aaatattgga gaaccccact ggcctacatg gtcagtgggg gcatttttgc 1260

gtttcacccc tcaaaaatca tcaccacact tgcgggattt ccccctgatt tcccccactc 1320

ccacaccatt cccagtggac agtgtggacg tattggacac attaaacaca ttgcgaccag 1380

gtaaaacgtc atgaccaggt atcgtcaatg ttcttgatga atttccgcac cgcaggatta 1440

tcattcgagg tggaataaat agcctgcagc tccgctaaac caacaggtag atcataaaaa 1500

tggcgatact caacaccgct gtaattgagt tttttcgcgg actccggaac cagcgcaaca 1560

cccagtccag a 1571

<210> 13

<211> 1519

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 13

gcttgcatgc ctgcaggtcg actctagagg atccccaagc gattctgcac attttttaac 60

atccccaagg cgtgatttcg attttcggaa tcacgccttt cccattttcg cgttaaaata 120

ccaggtcaac acacacagga accgttcaga aaccttccag attgctcact ttttgatttc 180

acttttttga gaagttttac ttttatatta gttctcatgc gcctcaacaa acgactccca 240

gcggcactct ccggactgct gctctctgct gcccttcttg ccggatgctc cacttctgga 300

accgccgaga ccacgacaac aaccgtttca tctgctgcgg catcaacaac cacttccacc 360

tcctccgatt cctcttcctc ctcttcctcc gactcaagca ccaccgccga aaccatctcc 420

aacaccgcgg aagctgccca agctttcttg tccaccctgt ccaccgaaga acaagacgcc 480

gtactctacg actacgacgc tgaagaaaag tccaccggct ggtctaactt cccagtcacc 540

ttcgtgcagc gttccggcgt gaacctcacc gacctcactg aggaacagca agcagctgcc 600

ctcaacgtgc tgaagaacct gctcaacgac gacgcctacc aaatgatcga agacatcatg 660

gctagcgatc agtacctcaa cgacgaaagc aacaccaccg aggattccct cggccagtac 720

tacatcgcat tcttcggcga tccaagcagc gactccgact ggtccatcca attcggcgga 780

caccacatcg gcatcaacgc caccttctcc gacggtgcca tcaccttcgc cccaacccac 840

cttggcaccc agccttccga gtggaccaac caggacggcg aaaccgttgc agcactaagc 900

aacatgtacg aaaccgcctt cgccttctac gacagcctca ccgaagagca gcaagcacag 960

ctctaccagg gtgaagagtt ggattccatg gtctgcgcac cgggcagcac ctgcgactac 1020

ccaaccggca ccggcttgaa aggctccgac ctcaccgacg agcaaaagga attgcttctc 1080

gacgtgatcg ccaactgggt tggtctagcc gatgaggaaa ccaccgaaac tgaactcgat 1140

gccatccgcg aaaccctgga tgacacctac atcaactggt ccggagccac cgagtacgac 1200

acctccaccg gcgacggcat ctacttccag atcagtggcc caaaggtcta cattgagttc 1260

gctaaccagc aaggttctgc aggtgccgac atcgacggtg tcatcaccgc tggatggggc 1320

cacattcaca ccatctaccg cgacccaacc aatgattacg ctaactccgt aactcaggaa 1380

gcagccagcg gaatgatggg cggcggccct ggtggtaatg gtggcgagat gcctagcggt 1440

gacatgccta ctggtgaaat gccttctggc gctccatcaa actaagtttt ggcggatgag 1500

agaagatttt cagcctgat 1519

<210> 14

<211> 1519

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 14

gcttgcatgc ctgcaggtcg actctagagg atccccaagc gattctgcac attttttaac 60

atccccaagg cgtgatttcg attttcggaa tcacgccttt cccattttcg cgttaaaata 120

ccaggtcaac acacacagga accgttcaga aaccttccag attgctcact ttttgatttc 180

acttttttga gaagttttac ttttatatta gttctcatgc gcctcaacaa acgactccca 240

gcggcactct ccggactgct gctctctgct gcccttcttg ccggatgctc cacttctgga 300

accgccgaga ccacgacaac aaccgtttca tctgctgcgg catcaacaac cacttccacc 360

tcctccgatt cctcttcctc ctcttcctcc gactcaagca ccaccgccga aaccatctcc 420

aacaccgcgg aagctgccca agctttcttg tccaccctgt ccaccgaaga acaagacgcc 480

gtactctacg actacgacgc tgaagaaaag tccaccggct ggtctaactt cccagtcacc 540

ttcgtgcagc gttccggcgt gaacctcacc gacctcactg aggaacagca agcagctgcc 600

ctcaacgtgc tgaagaacct gctcaacgac gacgcctacc aaatgatcga agacatcatg 660

gctagcgatc agtacctcaa cgacgaaagc aacaccaccg aggattccct cggccagtac 720

tacatcgcat tcttcggcga tccaagcagc gactccgact ggtccatcca attcggcgga 780

caccacatcg gcatcaacgc caccttctcc gacggtgcca tcaccttcgc cccaacccac 840

cttggcaccc agccttccga gtggaccaac caggacggcg aaaccgttgc agcactaagc 900

aacatgtacg aaaccgcctt cgccttctac gacagcctca ccgaagagca gcaagcacag 960

ctctaccagg gtgaagagtt ggattccatg gtctgcgcac cgggcagcac ctgcgactac 1020

ccaaccggca ccggcttgaa aggctccgac ctcaccgacg agcaaaagga attgcttctc 1080

gacgtgatcg ccaactgggt tggtctagcc gatgaggaaa ccaccgaaac tgaactcgat 1140

gccatccgcg aaaccctgga tgacacctac atcaactggt ccggagccac cgagtacgac 1200

acctccaccg gcgacggcat ctacttccag atcagtggcc caaaggtcta cattgagttc 1260

gctaaccagc aaggttctgc aggtgccgac atcgacggtg tcatcaccgc tggatggggc 1320

cacattcaca ccatctaccg cgacccaacc aatgattacg ctaactccgt aactcaggaa 1380

gcagccagcg gaatgatggg cggctaccct ggtggtaatg gtggcgagat gcctagcggt 1440

gacatgccta ctggtgaaat gccttctggc gctccatcaa actaagtttt ggcggatgag 1500

agaagatttt cagcctgat 1519

<210> 15

<211> 1558

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 15

agcggataac aatttcacac aggaaacaga attaattaag cttgcatgcc tgcaggtcga 60

ctctagagga tccccaagcg attctgcaca ttttttaaca tccccaaggc gtgatttcga 120

ttttcggaat cacgcctttc ccattttcgc gttaaaatac caggtcaaca cacacaggaa 180

ccgttcagaa accttccaga ttgctcactt tttgatttca cttttttgag aagttttact 240

tttatattag ttctcatgcg cctcaacaaa cgactcccag cggcactctc cggactgctg 300

ctctctgctg cccttcttgc cggatgctcc acttctggaa ccgccgagac cacgacaaca 360

accgtttcat ctgctgcggc atcaacaacc acttccacct cctccgattc ctcttcctcc 420

tcttcctccg actcaagcac caccgccgaa accatctcca acaccgcgga agctgcccaa 480

gctttcttgt ccaccctgtc caccgaagaa caagacgccg tactctacga ctacgacgct 540

gaagaaaagt ccaccggctg gtctaacttc ccagtcacct tcgtgcagcg ttccggcgtg 600

aacctcaccg acctcactga ggaacagcaa gcagctgccc tcaacgtgct gaagaacctg 660

ctcaacgacg acgcctacca aatgatcgaa gacatcatgg ctagcgatca gtacctcaac 720

gacgaaagca acaccaccga ggattccctc ggccagtact acatcgcatt cttcggcgat 780

ccaagcagcg actccgactg gtccatccaa ttcggcggac accacatcgg catcaacgcc 840

accttctccg acggtgccat caccttcgcc ccaacccacc ttggcaccca gccttccgag 900

tggaccaacc aggacggcga aaccgttgca gcactaagca acatgtacga aaccgccttc 960

gccttctacg acagcctcac cgaagagcag caagcacagc tctaccaggg tgaagagttg 1020

gattccatgg tctgcgcacc gggcagcacc tgcgactacc caaccggcac cggcttgaaa 1080

ggctccgacc tcaccgacga gcaaaaggaa ttgcttctcg acgtgatcgc caactgggtt 1140

ggtctagccg atgaggaaac caccgaaact gaactcgatg ccatccgcga aaccctggat 1200

gacacctaca tcaactggtc cggagccacc gagtacgaca cctccaccgg cgacggcatc 1260

tacttccaga tcagtggccc aaaggtctac attgagttcg ctaaccagca aggttctgca 1320

ggtgccgaca tcgacggtgt catcaccgct ggatggggcc acattcacac catctaccgc 1380

gacccaacca atgattacgc taactccgta actcaggaag cagccagcgg aatgatgggc 1440

ggcggccctg gtggtaatgg tggcgagatg cctagcggtg acatgcctac tggtgaaatg 1500

ccttctggcg ctccatcaaa ctaagttttg gcggatgaga gaagattttc agcctgat 1558

<210> 16

<211> 1375

<212> DNA

<213> 人工序列（Artificial sequence）

<400> 16

cagtgccaag cttgcatgcc tgcaggtcga ctctagtgcc gagaaatttt cattgggcct 60

ggatttcatt gaaattcagg cccttgccat tcccgatgct gctaggttcg tgttaagcaa 120

ccacaagttg caccaccatt cttccatcca gagaatacga attcgtttac ctctagaaag 180

gcactttccc atgtcttacc acgatcacag cgacatcgaa tacctcgaga agatcggcgc 240

caactcccct gacgccttca aagcttttgc ccattttgat gaggcagctc tccgcggccc 300

gaacaagaaa atcccacgca actacaccga aatgatcgca cttgcggtcg cattcacaac 360

ccaatgcgcc tactgcatcg acatccacac tgccgctgcg aagaaggaag gtgtcaccac 420

cgaggagctc gctgaggttg cgctcatcgc cgcagcactt cgggcaggcg gcgccatgac 480

gcacggcgca cttgccatga agctttacga cgaaaactag aagcgattct gcacattttt 540

taacatcccc aaggcgtgat ttcgattttc ggaatcacgc ctttcccatt ttcgcgttaa 600

aataccaggt caacacacac aggaaccgtt cagaaacctt ccagattgct cactttttga 660

tttcactttt ttgagaagtt ttacttttat attagttctc cgccatttaa gaggccgaac 720

ccgtgagacg agcatttaca tcacctcacg ggtttggatc cctcagaggc gattctgtga 780

agtcggtttc tgctgggccc aggtcagttt ctccaggcgg ttagcattgg agaggcgttt 840

cagaccaaaa gcgctcggat tcttccgatc cttggcctcg aatgacagtt tcctcgccta 900

caaagtgctg tttcagacca agaaccccac ttttcgactg gccctttggt ctctttttca 960

agtccaccca caaagcgcgt gtccctcgtc aaagaagggc acgcgcttga agtgttttta 1020

agagatttta gcggatggtc acctggcggg acttgatgtt ctccagctga cggcgctcgt 1080

cggcgttgag ctgtgcatcg ttatccagtt cagcgacgat cttctcgttg agtgcaacca 1140

aaacatcggc gtaatcggtg gatggacgct caggatcgag atcccacact gggacgacga 1200

tgccgtgggt gcggaaagcg ccagcgaact tggtttcctc gccgagattc agctcgccac 1260

gtgctgcgat gcgtgccaaa gcgttgaaca gtgcggtttc gttttcggtg cggacccaac 1320

ggatgtgagc cttgccgggg taccgagctc gaattcgtaa tcatggtcat agctg 1375

Claims

1.一种构建重组微生物的方法，其特征在于，所述方法包括至少下述任一种：

F1)将编码蛋白质的核酸分子导入目的微生物，得到所述重组微生物，所述蛋白质为下述任一种：

A1)氨基酸序列是SEQ ID No.4的蛋白质，

F3)利用基因编辑手段对SEQ ID No.1所示的DNA分子进行编辑，使目的微生物中含有SEQ ID No.3所示的DNA分子。

2.权利要求1中所述的任一蛋白质。

3.核酸分子，其特征在于，所述核酸分子为下述任一种：

B1)编码权利要求1或2中所述任一蛋白质的核酸分子；

B2)编码序列是SEQ ID No.3所示的DNA分子；

B3)核苷酸序列是SEQ ID No.3所示的DNA分子。

4.生物材料，其特征在于，所述生物材料为下述任一种：

C1)含有权利要求3所述任一核酸分子的表达盒；

C2)含有权利要求3所述任一核酸分子的重组载体、或含有C1)所述任一表达盒的重组载体；

C3)含有权利要求3所述任一核酸分子的重组微生物、或含有C1)所述任一表达盒的重组微生物、或含有C2)所述任一重组载体的重组微生物。

5.D1)-D8)中任一项的下述任一种应用：

G1)D1)-D8)中任一项在调控微生物的L-缬氨酸的产量中的应用；

G2)D1)-D8)中任一项在构建产L-缬氨酸的基因工程菌中的应用；

G3)D1)-D8)中任一项在制备L-缬氨酸中的应用；

其中，所述D1)-D8)为：

D1)权利要求1或2中所述的任一蛋白质；

D2)权利要求3所述的任一核酸分子；

D3)权利要求4所述的任一生物材料；

D4)核苷酸序列为SEQ ID No.1的DNA分子；

D6)含有D4)或D5)中所述DNA分子的表达盒；

6.一种提高微生物中L-缬氨酸的产量的方法，其特征在于，所述方法包括下述任一种：

E1)提高目的微生物中的权利要求3所述任一核酸分子的表达量或含量，得到L-缬氨酸的产量高于所述目的微生物的微生物；

E2)提高目的微生物中的权利要求5中D4)或D5)所述DNA分子的表达量或含量，得到L-缬氨酸的产量高于所述目的微生物的微生物；

E3)对所述目的微生物中的核苷酸序列为SEQ ID No.1的DNA分子进行突变，得到L-缬氨酸的产量高于所述目的微生物的微生物。

7.根据权利要求6所述的方法，其特征在于，所述突变为将SEQ ID No.1所示DNA分子编码的氨基酸序列的第397位的甘氨酸残基突变为另一种氨基酸残基。

8.根据权利要求6或7所述的方法，其特征在于，所述突变为将SEQ ID No.1所示DNA分子编码的氨基酸序列的第397位的甘氨酸残基突变为酪氨酸残基。

9.根据权利要求8所述的方法，其特征在于，所述突变是通过定点突变方法将SEQ IDNo.1所示DNA分子中第1189-1190位的核苷酸GG突变为TA。

10.一种制备L-缬氨酸的方法，其特征在于，所述方法包括利用权利要求1和/或权利要求4和/或权利要求5中所述的任一重组微生物生产L-缬氨酸。