CN101715484B - 二肽的制造方法 - Google Patents
二肽的制造方法 Download PDFInfo
- Publication number
- CN101715484B CN101715484B CN200880019211.2A CN200880019211A CN101715484B CN 101715484 B CN101715484 B CN 101715484B CN 200880019211 A CN200880019211 A CN 200880019211A CN 101715484 B CN101715484 B CN 101715484B
- Authority
- CN
- China
- Prior art keywords
- ala
- leu
- ile
- val
- gly
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K5/00—Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
- C07K5/04—Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
- C07K5/06—Dipeptides
- C07K5/06008—Dipeptides with the first amino acid being neutral
- C07K5/06017—Dipeptides with the first amino acid being neutral and aliphatic
- C07K5/06026—Dipeptides with the first amino acid being neutral and aliphatic the side chain containing 0 or 1 carbon atom, i.e. Gly or Ala
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
根据本发明,提供一种微生物及使用该微生物的二肽的制造方法,所述微生物具有生产具有二肽合成活性的蛋白质的能力,并且以下[1]~[3]中任一项所述的具有将菌体内的二肽转运到菌体外的活性(以下称为二肽转运活性)的蛋白质的活性高于亲本株。[1]具有序列号6~10中任何一者所示的氨基酸序列的蛋白质;[2]具有序列号6~10中任何一者所示的氨基酸序列缺失、取代或添加1个以上氨基酸后的氨基酸序列,并且具有二肽转运活性的蛋白质;[3]具有与序列号6~10中任何一者所示的氨基酸序列有80%以上同源性的氨基酸序列,并且具有二肽转运活性的蛋白质。
Description
技术领域
本发明涉及一种微生物及使用该微生物的二肽的制造方法,所述微生物具有生产具有二肽合成活性的蛋白质的能力,并且具有将菌体内的二肽转运到菌体外的活性的蛋白质的活性高于亲本株。
背景技术
作为生产两个L-氨基酸通过α键连接而成的二肽的方法,已知有利用作为杆菌溶素的合成酶之一的ywfE基因产物的方法(专利文献1~8),所述杆菌溶素是来自于属于芽孢杆菌属的微生物的二肽抗生素。
作为在L-氨基酸发酵中提高菌株的生产能力的方法,已知有改变将菌体内的L-氨基酸向细胞外转运的系统的方法(专利文献9~14)。另外,还已知存在将肽抗生素抗菌肽J25(Microcin J25)向细胞外转运的系统(非专利文献1)。
在二肽的生产中,也认为如果能增强二肽的转运系统、即具有将菌体内的二肽转运到菌体外的活性(以下称为二肽转运活性)的蛋白质的活性,则能够改善二肽的生产率,但目前为止尚未报道具有二肽转运活性的蛋白质。
已知大肠杆菌的bcr基因是与双环霉素(bicyclomycin)抗性相关的膜蛋白的基因(非专利文献2),norE基因是与喹诺酮(quinolone)抗性相关的排出泵的基因(非专利文献3)。emrD基因据报道是SDS转运基因(非专利文献4)。ydeE基因被预测为药物转运基因,但活性并未得到确认(非专利文献4)。yeeO基因的功能完全不清楚。
专利文献1:国际公开第2004/058960号小册子
专利文献2:国际公开第2005/045006号小册子
专利文献3:国际公开第2005/052153号小册子
专利文献4:国际公开第2005/052177号小册子
专利文献5:国际公开第2005/103260号小册子
专利文献6:国际公开第2006/001379号小册子
专利文献7:国际公开第2006/001381号小册子
专利文献8:国际公开第2006/001382号小册子
专利文献9:国际公开第97/23597A2号小册子
专利文献10:美国专利申请公开第US2003/0113899A1号说明书
专利文献11:日本特开2000-116390号公报
专利文献12:日本特开2000-189177号公报
专利文献13:日本特开2005-287333号公报
专利文献14:日本特开2005-237379号公报
非专利文献1:J.Bacteriol.,187,3465-3470(2005)
非专利文献2:Gene,127,117-120(1993)
非专利文献3:J.Antimicrob,Chemother.,51,545-56(2003)
非专利文献4:J.Bacteriol.,183,5803-5812(2001)
发明内容
本发明的目的在于,提供高效地生产二肽的微生物及使用该微生物的二肽的制造方法。
本发明涉及以下(1)~(6)。
(1)一种微生物,具有生产具有二肽合成活性的蛋白质的能力,并且以下[1]~[3]中任一项所述的具有菌体内二肽转运活性的蛋白质的活性高于亲本株,
具有序列号6~10中任何一者所示的氨基酸序列的蛋白质;
具有序列号6~10中任何一者所示的氨基酸序列缺失、取代或添加1个以上的氨基酸后的氨基酸序列,并且具有二肽转运活性的蛋白质;
具有与序列号6~10中任何一者所示的氨基酸序列有80%以上同源性的氨基酸序列,并且具有二肽转运活性的蛋白质。
(2)上述(1)的微生物,其为使用以下[1]~[3]中任一项所述的DNA转化亲本株而得到的微生物,
编码上述(1)的[1]~[3]中任一项所述的蛋白质的DNA;
具有序列号1~5中任何一者所示的碱基序列中的编码区的碱基序列的DNA;
在严格条件下与具有同序列号1~5中任何一者所示的碱基序列中的编码区的碱基序列互补的碱基序列的DNA杂交,并且编码具有二肽转运活性的蛋白质的DNA。
(3)上述(1)或(2)的微生物,其为属于埃希氏菌属、棒状杆菌属、芽孢杆菌属、沙雷氏菌属、假单胞菌属或链霉菌属的微生物。
(4)一种二肽的制造方法,其中,使水性介质中存在上述(1)~(3)中任一项所述的微生物的培养物或该培养物的处理物及氨基酸、氨基酸酯或氨基酸酰胺,使二肽在该水性介质中生成、累积,并从该介质中收集该二肽。
(5)一种二肽的制造方法,其中,在培养基中培养具有生产构成二肽的氨基酸中至少1种氨基酸的能力的上述(1)或(2)所述的微生物,使该二肽在培养基中生成、累积,并从培养物中收集该二肽。
(6)上述(4)或(5)所述的二肽的制造方法,其中,微生物为属于埃希氏菌属、棒状杆菌属、芽孢杆菌属、沙雷氏菌属、假单胞菌属或链霉菌属的微生物。
发明效果
根据本发明,通过增强微生物的具有将菌体内的二肽转运到菌体外的活性的蛋白质的活性,能够使用该微生物高效地制造二肽。
具体实施方式
1.本发明的微生物
(1)二肽转运活性高于亲本株的微生物
作为具有二肽转运活性的蛋白质的活性高于亲本株的微生物,可以列举:(a)通过改变亲本株的染色体DNA上存在的编码具有二肽转运活性的蛋白质的基因而得到的、i)该蛋白质的比活性高于亲本株的微生物、及ii)具有二肽输送活性的蛋白质的产量高于亲本株的微生物;以及(b)用编码具有二肽转运活性的蛋白质的DNA转化亲本株而得到的微生物。另外,本说明书中的亲本株是作为变异或转化对象的原株,可以是野生株,也可以是突变株。作为该亲本株,例如当微生物为大肠杆菌(Escherichia coli)时,可以列举:大肠杆菌K-12株、B株、B/r株的野生株、或其突变株;作为该突变株,可以列举:大肠杆菌XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌MC1000、大肠杆菌ATCC 12435、大肠杆菌W1485、大肠杆菌JM109、大肠杆菌HB101、大肠杆菌No.49、大肠杆菌W3110、大肠杆菌NY49、大肠杆菌MP347、大肠杆菌NM522、大肠杆菌BL21、大肠杆菌ME8415等。
作为具有二肽转运活性的蛋白质,可以列举以下[1]~[3]中任一项所述的蛋白质:
具有序列号6~10中任何一者所示的氨基酸序列的蛋白质;
具有序列号6~10中任何一者所示的氨基酸序列缺失、取代或添加1个以上氨基酸后的氨基酸序列,并且具有二肽转运活性的蛋白质;和
具有与序列号6~10中任何一者所示的氨基酸序列有80%以上同源性的氨基酸序列,并且具有二肽转运活性的蛋白质。
上述中,具有缺失、取代或添加1个以上氨基酸残基后的氨基酸序列,并且具有二肽转运活性的蛋白质可以如下获得:使用分子克隆实验指南(MolecularCloning,A Laboratory Manual),第3版,冷泉港实验室出版社(1989)(以下,简称为分子克隆第3版)、最新分子生物学实验方法汇编(CurrentProtocols in Molecular Biology),约翰威立父子出版公司(1987-1997)(以下,简称为最新分子生物学实验方法汇编(カレント·プロトコ一ルズ·ィン·モレキュラ一·バィォロジ一))、Nucleic Acids Research,10,6487(1982)、Proc.Natl.Acad.Sci.USA,79,6409(1982)、Gene,34,315(1985)、Nucleic Acids Research,13,4431(1985)、Proc.Natl.Acad.Sci.USA,82,488(1985)等中所述的定点突变导入法,在例如编码具有序列号6~10中任何一者所示的氨基酸序列的蛋白质的DNA中导入定点突变。
缺失、取代或添加的氨基酸残基的数量没有特别限制,是通过上述定点突变法等公知的方法能够缺失、取代或添加的程度的数量,为1~几十个,优选1~20个,更优选1~10个,进一步优选1~5个。
序列号6~10所示的氨基酸序列缺失、取代或添加1个以上的氨基酸是指,可以在同一序列中的任意位置缺失、取代或添加1个或多个氨基酸残基。
作为能够缺失或添加氨基酸残基的位置,可以列举例如:序列号6~10中任何一者所示的氨基酸序列的N末端侧及C末端侧的10个氨基酸残基。
缺失、取代或添加可以同时发生,取代或添加的氨基酸为天然型或非天然型均可。作为天然型氨基酸,可以列举例如:L-丙氨酸、L-天冬酰胺、L-天冬氨酸、L-精氨酸、L-谷氨酰胺、L-谷氨酸、甘氨酸、L-组氨酸、L-异亮氨酸、L-亮氨酸、L-赖氨酸、L-蛋氨酸、L-苯丙氨酸、L-脯氨酸、L-丝氨酸、L-苏氨酸、L-色氨酸、L-酪氨酸、L-缬氨酸、L-半胱氨酸等。
以下表示可以相互取代的氨基酸的例子。同一组中所含的氨基酸可以相互取代。
A组:亮氨酸、异亮氨酸、正亮氨酸、缬氨酸、正缬氨酸、丙氨酸、2-氨基丁酸、蛋氨酸、O-甲基丝氨酸、叔丁基甘氨酸、叔丁基丙氨酸、环己基丙氨酸
B组:天冬氨酸、谷氨酸、异天冬氨酸、异谷氨酸、2-氨基己二酸、2-氨基辛二酸
C组:天冬酰胺、谷氨酰胺
D组:赖氨酸、精氨酸、鸟氨酸、2,4-二氨基丁酸、2,3-二氨基丙酸
E组:脯氨酸、3-羟基脯氨酸、4-羟基脯氨酸
F组:丝氨酸、苏氨酸、高丝氨酸
G组:苯丙氨酸、酪氨酸
另外,作为具有二肽转运活性的蛋白质,可以列举:具有与序列号6~10中任何一者所示的氨基酸序列的同源性为80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选98%以上、最优选99%以上的氨基酸序列,并且具有二肽转运活性的蛋白质。
氨基酸序列、碱基序列的同源性可以使用Karlin和Altschul的BLAST算法[Pro.Natl.Acad.Sci.USA,90,5873(1973)]或FASTA[MethodsEnzymol.,183,63(1990)]来确定。基于该BLAST算法,开发出了称为BLASTN、BLASTX的程序[J.Mol.Biol.,215,403(1990)]。基于BLAST通过BLASTN分析碱基序列时,将参数设为例如:分数(Score)=100、字长(wordlength)=12。另外,基于BLAST通过BASTX分析氨基酸序列时,将参数设为例如:分数(score)=50、字长(wordlenght)=3。使用BLAST和GappedBLAST程序时,使用各程序的默认参数。这些分析方法的具体方法已经众所周知。
具有序列号6~10所示的氨基酸序列缺失、取代或添加1个以上氨基酸残基后的氨基酸序列的蛋白质是具有二肽转运活性的蛋白质,这可以通过例如下述方法确认:使用编码想要确认活性的蛋白质的DNA转化亲本株,由此制备该蛋白质的活性高于该亲本株的转化子,使缓冲液中存在该亲本株或该转化株的培养物及构成目标二肽的氨基酸,比较该水性介质中生成、累积的二肽的量。
作为上述(a)的i)的具有二肽转运活性的蛋白质的比活性高于亲本株的微生物,可以列举如下微生物:含有突变型蛋白质,所述蛋白质具有在亲本株含有的该蛋白质的氨基酸序列中取代1个以上氨基酸、优选1~10个氨基酸、更优选1~5个氨基酸、进一步优选1~3个氨基酸后的氨基酸序列,因此与亲本株的具有二肽转运活性活性的蛋白质相比活性提高。
作为上述(a)的ii)的具有二肽转运活性的蛋白质的产量高于亲本株的微生物,可以列举如下微生物:含有在亲本株的染色体DNA上存在的编码该蛋白质的基因的转录调控区或启动子区的碱基序列中取代1个以上碱基、优选1~10个碱基、更优选1~5个碱基、进一步优选1~3个碱基后的启动子区,因此与亲本株的具有二肽转运活性的蛋白质的产量相比,该蛋白质的产量提高。
作为上述(b)的用编码具有二肽转运活性的蛋白质的DNA转化亲本株而得到的微生物,可以列举使用如下DNA转化亲本株而得到的微生物:
编码上述[1]~[3]中任一项所述的蛋白质的DNA;
具有序列号1~5中任何一者所示的碱基序列中的编码区的碱基序列的DNA;或者
在严格条件下与具有同序列号1~5中任何一者所示的碱基序列中的编码区的碱基序列互补的碱基序列的DNA杂交,并且编码具有二肽转运活性的蛋白质的DNA。
作为该微生物,可以列举:i)在染色体DNA上、及ii)在染色体外具有外源性的编码具有二肽转运活性的蛋白质的DNA的微生物。即,i)的微生物,在亲本株不具有编码具有二肽转运活性的蛋白质的DNA时,是在染色体DNA上具有1个或2个以上新导入的该DNA的微生物,在亲本株本来具有编码具有二肽转运活性的蛋白质的DNA时,是在染色体DNA上具有包括新导入的该DNA在内的2个以上编码具有二肽转运活性的蛋白质的DNA的微生物。ii)的微生物是在质粒DNA上具有编码具有二肽转运活性的蛋白质的DNA的微生物。
上述中所说的“杂交”是指,DNA与具有特定碱基序列的DNA或该DNA的一部分杂交。因此,该具有特定碱基序列的DNA或其一部分是能够用作Northern或Southern印记分析的探针,或者能够用作PCR分析的寡核苷酸引物的DNA。作为用作探针的DNA,可以列举至少100个碱基以上、优选200个碱基以上、更优选500个碱基以上的DNA;作为用作引物的DNA,可以列举至少10个碱基以上、优选15个碱基以上的DNA。
DNA杂交实验的方法已经熟知,例如如果是本领域技术人员,则可以根据本说明书决定杂交的条件。该杂交条件除根据分子克隆第2版、第3版(2001年)、Methods for General and Molecular Bacteriology,ASM出版社(1994)、Immunology methods manual,美国学术出版社(分子)的记载之外,还可以根据多种其它标准教科书的记载来进行。
上述严格条件优选为如下条件:将固定有DNA的过滤器和探针DNA在含有50%甲酰胺、5×SSC(750mmol/l氯化钠、75mmol/l柠檬酸钠)、50mmol/l磷酸钠(pH7.6)、5×邓哈特(Denhardt′s)溶液、10%硫酸葡聚糖及20μg/l变性鲑鱼精DNA的溶液中,在42℃下孵育一夜后,在例如约65℃的0.2×SSC溶液中洗涤该过滤器,但也可以使用严格度更低的条件。严格条件的改变可以通过调节甲酰胺的浓度(甲酰胺的浓度越低则严格度越低)、改变盐浓度及温度条件来实现。作为低严格条件,可以列举例如:在含有6×SSCE(20×SSCE为3mol/l氯化钠、0.2mol/l磷酸二氢钠、0.02mol/l EDTA、pH7.4)、0.5%SDS、30%甲酰胺、100μg/l变性鲑鱼精DNA的溶液中,在37℃下孵育一夜后,使用50℃的1×SSC、0.1%SDS溶液进行洗涤的条件。另外,作为严格度更低的条件,可以列举在上述低严格条件中,使用高盐浓度(例如5×SSC)的溶液进行杂交后进行洗涤的条件。
上述各种条件也可以通过添加或改变用于抑制杂交试验的背景的封闭试剂来进行设定。为了使条件合适,上述封闭试剂的添加也可以伴有杂交条件的改变。
作为能够在上述严格条件下进行杂交的DNA,可以例举例如:使用上述BLAST、FASTA等基于上述参数等进行计算时,与具有序列号1~5中任何一者所示的碱基序列中的编码区的碱基序列的DNA有至少90%以上、优选95%以上、更优选97%以上、进一步优选98%以上、特别优选99%以上同源性的DNA。
(2)具有生产具有二肽合成活性的蛋白质的能力的微生物
具有生产具有二肽合成活性的蛋白质的能力的微生物,只要具有该能力则没有特别限制,可以列举例如:生产具有将1种以上的氨基酸缩合、连接而合成二肽的活性的蛋白质[以下,称为L-氨基酸连接酶(EC 6.3.2.28)]的微生物、生产具有由L-氨基酸酯和L-氨基酸合成二肽的活性的蛋白质的微生物及生产具有由L-氨基酸酰胺和L-氨基酸合成二肽的活性的蛋白质的微生物等。
作为生产具有将1种以上的氨基酸缩合、连接而合成二肽的活性的蛋白质的微生物,可以列举生产选自由NRPS、D-Ala-D-Ala连接酶、L-氨基酸连接酶组成的组中的蛋白质的微生物。
作为生产NRPS的微生物,可以列举:包括芽孢杆菌属在内的原核生物、包括青霉属在内的真核生物、生产BacA、BacB及BacC(GenBank AF007865)的微生物、生产TycA、TycB及TycC(GenBankAF004835)的微生物、生产PcbAB(GenBank M57425)的微生物及生产与选自BacA、BacB、BacC、TycA、TycB、TycC、PcbAB中的任何一种蛋白质的氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性并且具有NRPS活性的蛋白质的微生物等。
作为生产D-Ala-D-Ala连接酶的微生物,可以列举:形成肽聚糖的原核生物、生产DdlA(GenBank登录号:M58467)的微生物、生产DdlB(GenBank登录号:AE000118)的微生物、生产DdlC(GenBank登录号:D88151)的微生物及生产具有选自DdlA、DdlB、DdlC中的任何一者的氨基酸序列缺失、取代或添加1个以上氨基酸后的氨基酸序列并且具有D-Ala-D-Ala连接酶活性的蛋白质的微生物等。
氨基酸序列的同源性可以使用上述BLAST、FASTA等程序来确定。
作为生产L-氨基酸连接酶的微生物,可以列举属于芽孢杆菌属的微生物,优选列举:枯草芽孢杆菌(Bacillus subtilis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、凝结芽孢杆菌(Bacillus coagulans)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)及生产WO2004/058960号中记载的蛋白质的微生物。
可以列举具有生产例如选自以下[7]~[10]的蛋白质作为L-氨基酸连接酶的能力的微生物:
具有序列号11~18中任何一者所示的氨基酸序列的蛋白质;
具有序列号11~18中任何一者所示的氨基酸序列缺失、取代或添加1个以上氨基酸后的氨基酸序列,并且具有L-氨基酸连接酶活性的蛋白质;
具有与序列号11~18中任何一者所示的氨基酸序列有80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选98%以上、最优选99%以上同源性的氨基酸序列,并且具有L-氨基酸连接酶活性的蛋白质;和
具有与序列号19所示的氨基酸序列有80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选98%以上、最优选99%以上同源性的氨基酸序列,并且具有L-氨基酸连接酶活性的蛋白质。
作为生产具有由L-氨基酸酯和L-氨基酸合成二肽的活性的蛋白质的微生物,可以列举生产脯氨酸亚氨基肽酶的微生物,具体可以列举属于芽孢杆菌属、棒状杆菌属或假单胞菌属的微生物等。具体可以列举:枯草芽孢杆菌ATCC6633、凝结芽孢杆菌EK01[J.Bacteriol.,174,7919(1992)]、谷氨酸棒杆菌ATCC13286,恶臭假单胞杆菌AJ-2402(FERM BP-8101)、恶臭假单胞杆菌ATCC12633、恶臭假单胞杆菌AJ2048(FERM BP-8123)(以上为WO 03/010307号中记载的微生物)等。另外,作为生产脯氨酸亚氨基肽酶的微生物,可以列举:烟草节杆菌[FEMS Microbiol.Lett.,78,191(1999)]、大肠杆菌(日本特开平2-113887)、脑膜炎败血黄杆菌[Arch.Biochem.Biophys.,336,35(1996)]、蜂房哈夫尼亚菌[J.Biochem.,119,468(1996)]、德氏乳杆菌[Microbiology,140,527(1994)]、凝结芽孢杆菌[J.Bacteriol.,174,7919(1994)]、温和气单胞菌[J.Biochem.,116,818(1994)]、野油菜黄单胞菌(日本特开平9-121860)、淋球菌[Mol.Microbiol.,9,1203(1993)]、费氏丙酸杆菌[Appl.Environ.Microbiol.,64,4736(1998)]、粘质沙雷氏菌[J.Biochem.,122,601(1997)]、变异棒状杆菌[J.Appl.Microbiol.,90,449(2001)]、嗜酸热原体[FEBS Lett.,398,101(1996)]、绿脓杆菌[Nature,406,959(2000)]等。
另外,作为生产脯氨酸亚氨基肽酶的微生物,可以列举具有生产选自以下[11]~[13]的蛋白质的能力的微生物:
WO 03/010307号、FEMS Microbiol.Lett.,78,191(1999)、日本特开平2-113887、Arch.Biolchem.Biophys.,336,35(1996)、J.Biochem.,119,468(1996)、Microbiology,140,527(1994)、J.Bacteriol.,174,7919(1994)、J.Biochem.,116,818(1994)、日本特开平9-121860、Mol.Microbiol.,9,1203(1993)、Appl.Environ.Microbiol.,64,4736(1998)、J.Biochem.,122,601(1997)、FEBS Lett.,398,101(1996)、Nature,406,959(2000)中任何一者所记载的脯氨酸亚氨基肽酶;
具有上述[11]中任何一种脯氨酸亚氨基肽酶的氨基酸序列缺失、取代或添加1个以上氨基酸后的氨基酸序列,并且具有脯氨酸亚氨基肽酶活性的蛋白质;和
具有与上述[11]中任何一种脯氨酸亚氨基肽酶的氨基酸序列有80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选98%以上、最优选99%以上同源性的氨基酸序列,并且具有脯氨酸亚氨基肽酶活性的蛋白质。
作为生产具有由L-氨基酸酰胺和L-氨基酸合成二肽的活性的蛋白质的微生物,可以列举生产L-氨基酸酰胺水解酶的微生物,具体可以列举:属于芽孢杆菌属、棒状杆菌属、欧文氏菌属、红球菌属、金黄杆菌属、微球菌属、假单胞菌属、隐球菌属、毛孢子菌属、红冬孢酵母属、掷孢酵母属、银耳属、有孢圆酵母属、梗孢酵母属及红酵母属的微生物,优选属于芽孢杆菌属、棒状杆菌属或假单胞菌属的微生物,更优选巨大芽孢杆菌AJ3284(FERM BP-8090)、谷氨酸棒杆菌ATCC13286、藤黄微球菌ATCC9341、嗜糖假单胞菌ATCC15946(以上为WO03/010187号中记载的微生物)等。
另外,作为生产具有L-氨基酸酰胺水解酶活性的蛋白质的微生物,可以列举具有生产选自以下[14]~[16]的蛋白质的能力的微生物:
WO03/010187号记载的L-氨基酸酰胺水解酶;
具有WO03/010187号记载的L-氨基酸酰胺水解酶的氨基酸序列缺失、取代或添加1个以上氨基酸后的氨基酸序列,并且具有L-氨基酸酰胺水解酶活性的蛋白质;和
具有与WO03/010187号记载的L-氨基酸酰胺水解酶的氨基酸序列有80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选98%以上、最优选99%以上同源性的氨基酸序列,并且具有L-氨基酸酰胺水解酶活性的蛋白质。
上述中具有缺失、取代或添加1个以上氨基酸后的氨基酸序列,并且具有二肽合成活性的蛋白质可以通过与上述(1)相同的方法获得。缺失、取代或添加的氨基酸的数量、种类等也与上述(1)相同。
氨基酸序列的同源性可以使用上述BLAST、FASTA等程序来确定。
另外,将编码具有使1种以上的氨基酸缩合、连接而合成二肽的活性的蛋白质的DNA、编码具有由L-氨基酸酯和L-氨基酸合成二肽的活性的蛋白质的DNA或编码具有由L-氨基酸酰胺和L-氨基酸合成二肽的活性的蛋白质的DNA与载体DNA连接而得到重组DNA,具有上述重组DNA的微生物也是具有生产具有二肽合成活性的蛋白质的能力的微生物。
作为该微生物,可以列举属于埃希氏菌属、芽孢杆菌属、棒状杆菌属或酵母菌属的微生物。
作为编码具有将1种以上的氨基酸缩合、连接而合成二肽的活性的蛋白质的DNA,可以列举编码NRPS、D-Ala-D-Ala连接酶或L-氨基酸连接酶的DNA等。
作为编码NRPS的DNA,可以列举编码选自由BacA、BacB、BacC、TycA、TycB、TycC及PcbAB组成的组中的蛋白质的DNA。
作为编码D-Ala-D-Ala连接酶的DNA,可以列举编码选自由DdlA、DdlB及DdlC组成的组中的蛋白质的DNA。
作为编码L-氨基酸连接酶的DNA,可以列举选自以下[17]~[20]的DNA:
编码上述[7]~[10]中任一项所述的L-氨基酸连接酶的DNA;
具有序列号20~28中任何一者所示的碱基序列的DNA;
在严格条件下与具有同序列号20~28中任何一者所示的碱基序列互补的碱基序列的DNA杂交,并且编码具有L-氨基酸连接酶活性的蛋白质的DNA;和
具有与序列号29所示的碱基序列有80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选98%以上、最优选99%以上同源性的碱基序列,并且编码具有L-氨基酸连接酶活性的蛋白质的DNA。
作为编码具有由L-氨基酸酯和L-氨基酸合成二肽的活性的蛋白质的DNA,可以列举选自以下[21]~[23]的DNA:
编码上述[11]~[13]中任一项所述的脯氨酸亚氨基肽酶的DNA;
编码具有WO 03/010307号、FEMS Microbiol.Lett.,78,191(1999)、日本特开平2-113887、Arch.Biolchem.Biophys.,336,35(1996)、J.Biochem.,119,468(1996)、Microbiology,140,527(1994)、J.Bacteriol.,174,7919(1994)、J.Biochem.,116,818(1994)、日本特开平9-121860、Mol.Microbiol.,9,1203(1993)、Appl.Environ.Microbiol.,64,4736(1998)、J.Biochem.,122,601(1997)、FEBS Lett.,398,101(1996)、Nature,406,959(2000)中任何一者所记载的碱基序列的脯氨酸亚氨基肽酶的DNA;和
在严格条件下与编码上述[21]中任何一种脯氨酸亚氨基肽酶的DNA的互补链DNA杂交,并且编码具有脯氨酸亚氨基肽酶活性的蛋白质的DNA。
作为编码具有由L-氨基酸酰胺和L-氨基酸合成二肽的活性的蛋白质的DNA,可以列举选自以下[24]~[26]的DNA:
编码上述[14]~[16]中任一项所述的L-氨基酸酰胺水解酶的DNA;
编码具有WO03/010187号记载的碱基序列的L-氨基酸酰胺水解酶的DNA;和
在严格条件下与编码具有WO03/010187号记载的碱基序列的L-氨基酸酰胺水解酶的DNA的互补链杂交,并且编码具有L-氨基酸酰胺水解酶活性的蛋白质的DNA。
能够在严格条件下进行杂交的DNA与上述1(1)的定义相同。对于在严格条件下与上述DNA杂交的DNA是编码具有二肽合成活性的蛋白质的DNA,可以通过如下方法进行确认:制作表达该DNA的重组DNA,使用将该重组DNA导入宿主细胞而得到的微生物作为酶源,1)使水性介质中存在该酶源及1种以上的氨基酸,通过HPLC等分析该水性介质中是否生成、累积了二肽的方法、2)使水性介质中存在该酶源、L-氨基酸酯及L-氨基酸,通过HPLC等分析该水性介质中是否生成、累积了二肽的方法、3)使水性介质中存在该酶源、L-氨基酸酰胺及L-氨基酸,通过HPLC等分析该水性介质中是否生成、累积了二肽的方法。
碱基序列的同源性可以通过使用上述BLAST或FASTA等程序来确定。
2.本发明中使用的微生物的制备
(1)具有二肽转运活性的蛋白质的活性高于亲本株的微生物的制备
具有二肽转运活性的蛋白质的活性高于亲本株的微生物中,比活性高于亲本株的具有二肽转运活性的蛋白质的微生物可以如下得到:通过将编码具有二肽转运活性的蛋白质的DNA供给在体外使用诱变剂的诱变处理或易错PCR(Error-prone PCR)等,在该DNA中导入突变,然后使用公知的方法[Proc.Natl.Acad.Sci.USA.,97,6640(2000)],使该突变DNA取代亲本株的染色体DNA上存在的导入突变前的编码具有二肽转运活性的蛋白质的DNA,由此制作表达该突变DNA的变异体,使用上述方法比较亲本株和变异体的二肽转运活性。
另外,具有二肽转运活性的蛋白质的活性高于亲本株的微生物中,该蛋白质的产量高于亲本株的产量的微生物可以通过如下方法确认:通过将具有编码亲本株含有的具有二肽转运活性的蛋白质的基因的转录调控区和启动子区、例如该蛋白质的起始密码子上游侧200bp、优选100bp的碱基序列的DNA,供给体外的诱变处理或易错PCR等,在该DNA中导入突变,然后使用公知的方法[Proc.Natl.Acad.Sci.USA.,97,6640(2000)],使该突变DNA取代亲本株的染色体DNA上存在的导入突变前的编码具有二肽转运活性的蛋白质的基因的转录调控区和启动子区,由此制作具有突变型转录调控区或启动子区的变异体,通过RT-PCR或Northern杂交等,比较亲本株和变异体的编码具有二肽转运活性的蛋白质的基因的转录量,或者,通过SDS-PAGE等比较亲本株和变异体的编码具有二肽转运活性的蛋白质的产量。
另外,通过将亲本株的编码具有二肽转运活性的蛋白质的基因的启动子区取代为公知的强启动子序列,也能够得到与亲本株相比具有二肽转运活性的蛋白质的产量提高的微生物。
作为这样的启动子,可以列举在大肠杆菌中发挥功能的trp启动子(P trp )、lac启动子(P lac )、PL启动子、PR启动子、PSE启动子等大肠杆菌、噬菌体等来源的启动子、SPO1启动子、SPO2启动子、penP启动子等。另外,还可以列举2个Ptrp串联的启动子、tac启动子、lacT7启动子、letI启动子等人工构建的启动子。
下面,对编码具有二肽转运活性的蛋白质的DNA的获得方法和用该DNA转化亲本株而得到的微生物的制备方法进行详细说明。
(a)编码具有二肽转运活性的蛋白质的DNA的获得
编码具有二肽转运活性的蛋白质的DNA,例如可以如下获得:使用能够基于编码具有序列号6~10中任何一者所示的氨基酸序列的蛋白质的DNA的碱基序列进行设计的探针DNA,对大肠杆菌等微生物的染色体DNA文库进行Southern杂交,或者,使用能够基于该碱基序列进行设计的引物DNA,以微生物、优选大肠杆菌的染色体DNA为模
板进行PCR[PCR Protocols,美国学术出版社(1990)]。
另外,在各种基因序列数据库中,检索与编码具有序列号6~10中任何一者所示的氨基酸序列的蛋白质的DNA的碱基序列有80%以上、优选90%以上、更优选95%以上、进一步优选97%以上、特别优选98%以上、最优选99%以上同源性的序列,基于该检索所得到的碱基序列,通过上述方法也能够由具有该碱基序列的微生物的染色体DNA、cDNA文库等获得编码具有二肽转运活性的蛋白质的DNA。
将获得的DNA直接或者用适当的限制性内切酶等酶切后,通过常法整合到载体中,将得到的重组体DNA导入宿主细胞,然后使用常用的碱基序列分析方法、例如双脱氧法[Proc.Natl.Acad.Sci.,USA.,74,5463(1977)]或使用3700 DNA分析仪(美国应用生物系统公司制)等碱基序列分析装置进行分析,由此能够确定该DNA的碱基序列。
作为上述载体,可以列举:pBluescriptII KS(+)(Stratagene公司制)、pDIRECT[Nucleic Acids Res.,18,6069(1990)]、pCR-ScriptAmpSK(+)(Stratagene公司制)、pT7Blue(Novagen公司制)、pCR II(英杰生命技术有限公司制)及pCR-TRAP(ジ一ンハンタ一公司制)等。
作为宿主细胞,可以列举属于埃希氏菌属的微生物等。作为属于埃希氏菌属的微生物,可以列举例如:大肠杆菌XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌MC1000、大肠杆菌ATCC12435、大肠杆菌W1485、大肠杆菌JM109、大肠杆菌HB101、大肠杆菌No.49、大肠杆菌W3110、大肠杆菌NY49、大肠杆菌MP347、大肠杆菌NM522、大肠杆菌BL21、大肠杆菌ME8415等。
作为重组体DNA的导入方法,只要是在宿主细胞中导入DNA的方法均可以使用,可以列举例如:使用钙离子的方法[Proc.Natl.Acad.Sci.,USA.,69,2110(1972)]、原生质体法(日本特开昭63-248394)、电穿孔法[ucleic Acids Res.,16,6127(1988)]等。
碱基序列确定后的结果是,在获得的DNA为部分长度时,通过使用该部分长度DNA作为探针,对染色体DNA文库进行Southern杂交法等,能够得到全长DNA。
另外,基于所确定的DNA的碱基序列,通过使用PerseptiveBiosystems公司制8905型DNA合成装置等进行化学合成,也能够得到目标DNA。
作为如上得到的DNA,可以列举例如:编码具有序列号6~10中任何一者所示的氨基酸序列的蛋白质的DNA、和具有序列号1~5中任何一者所示的碱基序列中的编码区的DNA。
(b)用表达具有二肽转运活性的蛋白质的质粒载体转化的微生物的获得
基于通过上述(a)的方法得到的编码具有二肽转运活性的蛋白质的DNA,根据需要制备包含编码具有二肽转运活性的蛋白质的部分的适当长度的DNA片段。另外,通过取代碱基,使编码具有二肽转运活性的蛋白质的部分的碱基序列成为最适合在宿主细胞中表达的密码子,能够得到该蛋白质量提高的转化子。
通过将该DNA片段插入到适当表达载体的启动子的下游,制作重组体DNA。
通过将该重组体DNA导入适合该表达载体的宿主细胞中,能够得到具有二肽转运活性的蛋白质的活性高于宿主细胞、即亲本株的转化子。
作为宿主细胞,可以使用微生物,优选原核生物,更优选细菌,进一步优选属于埃希氏菌属的微生物,最优选大肠杆菌。
作为表达载体,可以使用在上述宿主细胞中能够自主复制或能够整合到染色体中、并且在能够转录编码具有二肽转运活性的蛋白质的DNA的位置含有启动子的表达载体。
使用原核生物作为宿主细胞时,具有编码具有二肽转运活性的蛋白质的DNA的重组体DNA优选为,在原核生物中能够自主复制,并且由启动子、核糖体结合序列、编码具有二肽转运活性的蛋白质的DNA、转录终止序列构成的重组体DNA。也可以含有调控启动子的基因。
作为表达载体,可以例示:pColdI(宝生物工程有限公司制)、pCDF-1b、pRSF-1b(均为Novagen公司制)、pMAL-c2x(纽英伦生物技术有限公司制)、pGEX-4T-1(GE Healthcare Bio-Sciences公司制)、pTrcHis(英杰生命技术有限公司制)、pSE280(英杰生命技术有限公司制)、pGEMEX-1(普洛麦格生物技术有限公司制)、pQE-30(凯杰生物技术有限公司制)、pET-3(Novagen公司制)、pKYP10(日本特开昭58-110600)、pKYP200[Agric.Biol.Chem.,48,669(1984)]、pLSA1[Agric.Biol.Chem.,53,277(1989)]、pGEL1[Proc.Natl.Acad.Sci.,USA,82,4306(1985)]、pBluescriptIISK(+)、pBluescriptII KS(-)(Stratagene公司制)、pTrS30[由大肠杆菌JM109/pTrS30(FERMBP-5407)制备]、pTrS32[由大肠杆菌JM109/pTrS32(FERM BP-5408)制备]、pPAC31(WO98/12343)、pUC19[Gene,33,103(1985)]、pSTV28(宝生物工程有限公司制)、pUC118(宝生物工程有限公司制)、pPA1(日本特开昭63-233798)等。
作为启动子,只要能在大肠杆菌等宿主细胞中发挥功能,则可以是任何启动子。可以列举例如:trp启动子(P trp )、lac启动子(P lac )、PL启动子、PR启动子、PSE启动子等大肠杆菌、噬菌体等来源的启动子、SPO1启动子、SPO2启动子、penP启动子等。另外,还可以使用2个Ptrp串联的启动子、tac启动子、lacT7启动子、letI启动子等人工改变设计的启动子等。
另外,也可以使用用于在属于芽孢杆菌(Bacillus)属的微生物中表达的xylA启动子[Appl.Microbiol.Biotechnol.,35,594-599(1991)]、用于在属于棒状杆菌(Corynebacterium)属的微生物中表达的P54-6启动子[Appl.Microbiol.Biotechnol.,53,674-679(2000)]等。
优选使用将作为核糖体结合序列的Shine-Dalgarno序列与起始密码子之间调节为适当距离(例如6~18个碱基)的质粒。
使编码具有二肽转运活性的蛋白质的DNA结合在表达载体上而得到的重组体DNA中,不一定必须有转录终止序列,但优选紧邻结构基因之后设置转录终止序列。
作为这样的重组体DNA,可以列举例如后述的pSbcr、pSnorE、pSydeE、pSemrD及pSyeeO。
作为该重组体DNA的宿主,可以列举原核生物,更优选细菌。
作为原核生物,可以列举属于埃希氏菌属(Escherichia)、沙雷氏菌属(Serratia)、芽孢杆菌属、短杆菌属(Brevibacterium)、棒状杆菌属(Corynebacterium)、微杆菌属(Microbacterium)、假单胞菌属(Pseudomonas)、农杆菌属(Agrobacterium)、脂环酸芽孢杆菌属(Alicyclobacillus)、鱼腥蓝细菌属(Anabaena)、组囊藻属(Anacystis)、节杆菌属(Arthrobacter)、固氮菌属(Azotobacter)、着色菌属(Chromatium)、欧文氏菌属(Erwinia)、甲基杆菌属(Methylobacterium)、席藻属(Phormidium)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红螺菌属(Rhodospirillum)、栅列藻属(Scenedesmus)、链霉菌属(Streptomyces)、聚球藻属(Synechoccus)、发酵单胞菌属(Zymomonas)等的微生物,例如大肠杆菌、枯草芽孢杆菌(Bacillus subtilis)、巨大芽孢杆菌(Bacillus megaterium)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、凝结芽孢杆菌(Bacillus coagulans)、地衣芽孢杆菌(Bacillus licheniformis)、短小芽孢杆菌(Bacillus pumilus)、产氨短杆菌(Brevibacterium ammoniagenes)、Brevibacteriumimmariophilum、解糖短杆菌(Brevibacterium saccharolyticum)、黄色短杆菌(Brevibacterium flavum)、乳酸发酵短杆菌(Brevibacteriumlactofermentum)、谷氨酸棒杆菌(Corynebacterium glutamicum)、嗜乙酰乙酸棒杆菌(Corynebacterium acetoacidophilum)、嗜氨微杆菌(Microbacterium ammoniaphilum)、无花果沙雷氏菌(Serratia ficaria)、居泉沙雷氏菌(Serratia fonticola)、液化沙雷氏菌(Serratia liquefaciens)、粘质沙雷氏菌(Serratia marcescens)、绿脓杆菌(Pseudomonas aeruginosa)、恶臭假单胞菌(Pseudomonas putida)、放射土壤杆菌(Agrobacteriumradiobacter)、发根农杆菌(Agrobacterium rhizogenes)、悬钩子土壤杆菌(Agrobacterium rubi)、柱孢鱼腥藻(Anabaena cylindrica)、桶形鱼腥藻(Anabaena doliolum)、水华鱼腥藻(Anabaena flos-aquae)、金黄节杆菌(Arthrobacter aurescens)、柠檬节杆菌(Arthrobacter citreus)、球形节杆菌(Arthrobacter globiformis)、裂烃谷氨酸节杆菌(Arthrobacterhydrocarboglutamicus)、迈索尔节杆菌(Arthrobacter mysorens)、烟草节杆菌(Arthrobacter nicotianae)、石蜡节杆菌(Arthrobacter paraffineus)、原玻璃蝇节杆菌(Arthrobacter protophormiae)、玫瑰色石蜡节杆菌(Arthrobacter roseoparaffincus)、硫磺节杆菌(Arthrobacter sulfureus)、产脲节杆菌(Arthrobacter ureafaciens)、巴氏着色菌(Chromatium buderi)、微温着色菌(Chromatium tepidum)、酒色着色菌(Chromatium vinosum)、沃氏着色菌(Chromatium warmingii)、河生着色菌(Chromatiumfluviatile)、噬夏孢欧文氏菌(Erwinia uredovora)、胡萝卜软腐欧文氏菌(Erwinia carotovora)、菠萝欧文氏菌(Erwinia ananas)、草生欧文氏菌(Erwinia herbicola)、斑点欧文氏菌(Erwinia punctata)、土生欧文氏菌(Erwinia terreus)、罗得西亚甲基杆菌(Methylobacterium rhodesianum)、扭脱甲基杆菌(Methylobacterium extorquens)、席藻(Phormidium Sp.)ATCC29409、荚膜红细菌(Rhodobacter capsulatus)、球形红细菌(Rhodobacter sphaeroides)、生芽红假单胞菌(Rhodopseudomonasblastica)、海洋红假单胞菌(Rhodopseudomonas marina)、沼泽红假单胞菌(Rhodopseudomonas palustris)、深红红螺菌(Rhodospirillum rubrum)、需盐红螺菌(Rhodospirillum salexigens)、盐场红螺菌(Rhodospirillumsalinarium)、产二素链霉菌(Streptomyces ambofaciens)、金霉素链霉菌(Streptomyces aureofaciens)、金色链霉菌(Streptomyces aureus)、杀真菌素链霉菌(Streptomyces fungicidicus)、灰色产色链霉菌(Streptomycesgriseochromogenes)、灰色链霉菌(Streptomyces griseus)、浅青紫链霉菌(Streptomyces lividans)、橄榄灰链霉菌(Streptomyces olivogriseus)、枝链霉菌(Streptomyces rameus)、田无链霉菌(Streptomyces tanashiensis)、酒红链霉菌(Streptomyces vinaceus)、运动发酵单胞菌(Zymomonas mobilis)等,作为优选的原核生物,可以列举属于埃希氏菌属、沙雷氏菌属、芽孢杆菌属、短杆菌属、棒状杆菌属、假单胞菌属或链霉菌属等的细菌,例如属于上述埃希氏菌属、沙雷氏菌属、芽孢杆菌属、短杆菌属、棒状杆菌属、假单胞菌属或链霉菌属等的种类,作为更优选的细菌,可以列举:大肠杆菌、谷氨酸棒杆菌、产氨棒杆菌、乳酸发酵棒杆菌、黄色棒杆菌、棒杆菌efficiens(Corynebacterium efficiens)、枯草芽孢杆菌、巨大芽孢杆菌、粘质沙雷氏菌、恶臭假单胞菌、绿脓杆菌、天蓝色链霉菌或浅青紫链霉菌,作为特别优选的细菌可以列举大肠杆菌。
(c)编码具有二肽转运活性的蛋白质的DNA整合到染色体DNA中的微生物的获得
通过将由上述(a)的方法得到的编码具有二肽转运活性的蛋白质的DNA整合到染色体DNA的任意位置上,能够得到具有二肽转运活性的蛋白质的活性高于亲本株的微生物。
作为将编码具有二肽转运活性的蛋白质的DNA整合到微生物的染色体DNA的任意位置上的方法,可以列举利用同源重组的方法,在使用大肠杆菌作为宿主、即亲本株时,可以列举Proc.Natl.Acad.Sci.USA.,97,6640(2000)中记载的方法。
(2)具有二肽合成活性的蛋白质的活性高于亲本株的微生物的制备
具有二肽合成活性的蛋白质的活性高于亲本株的微生物中,比活性高于亲本株的该蛋白质的微生物及该蛋白质的产量高于亲本株的微生物与上述(1)同样,可以如下得到:通过将编码具有二肽合成活性的蛋白质的DNA供给在体外的诱变处理或易错PCR等能够得到突变型酶基因,用该突变型酶基因取代亲本株的基因。
将得到的具有突变型酶基因的微生物和亲本株分别在液体培养基中培养,用公知的方法测定培养物中所含的二肽的量并进行比较,由此能够确认具有二肽合成活性的蛋白质的活性高于亲本株。
下面,对编码具有二肽合成活性的蛋白质的DNA的获得方法和用该DNA转化亲本株而得到的微生物的制备方法进行说明。
(a)编码具有二肽合成活性的蛋白质的DNA的获得
编码具有二肽合成活性的蛋白质的DNA,可以根据上述1(2)的编码具有二肽合成活性的蛋白质的DNA的碱基序列,通过与上述2(1)(a)同样的方法得到。
作为能够通过上述方法得到的DNA,可以列举编码具有序列号11~18所示的氨基酸序列的L-氨基酸连接酶、并且具有序列号20~28中任何一者所示的碱基序列中的编码区的DNA。
(b)用表达具有二肽合成活性的蛋白质的质粒载体转化的微生物的获得
表达具有二肽合成活性的蛋白质的质粒载体,可以使用上述2(2)(a)中得到的编码具有二肽合成活性的蛋白质的DNA,通过与上述2(1)(b)同样的方法得到。
作为能够通过上述方法得到的表达具有二肽合成活性的蛋白质的质粒载体,可以列举例如后述的pPE86usp。
(c)编码具有二肽合成活性的蛋白质的DNA重组到染色体DNA中的微生物的获得
通过将由上述2(2)(a)的方法得到的编码具有二肽合成活性的蛋白质的DNA整合到染色体DNA的任意位置上,能够得到具有二肽合成活性的蛋白质的活性高于亲本株的微生物。
将DNA整合到微生物的染色体DNA的任意位置上,可以通过与上述2(1)(c)同样的方法进行。
(3)具有生产构成二肽的氨基酸中的至少1种氨基酸的能力的微生物的制备
作为本发明的二肽制造方法中使用的、具有生产构成二肽的氨基酸中的至少1种氨基酸的能力的微生物,只要是具有该能力的微生物则可以使用任何一种微生物,可以列举:从自然界分离得到的菌株本身具有该能力情况下的该菌株本身、通过公知的方法人工地赋予了所需的生产构成二肽的氨基酸中的至少一种氨基酸的能力的微生物等。
作为该公知的方法,可以列举如下方法,这些公知的方法可以单独或组合使用:
(a)削弱或消除至少一种调控氨基酸的生物合成的机制的方法;
(b)增强表达至少一种参与氨基酸的生物合成的酶的方法;
(c)增加至少一种参与氨基酸的生物合成的酶基因的拷贝数的方法;
(d)削弱或阻断至少一条从氨基酸的生物合成通路分出的、生成该氨基酸以外的代谢产物的代谢通路的方法;和
(e)筛选与野生株相比对氨基酸的类似物的抗性高的细胞株的方法等。
关于上述(a),例如记载于Agric.Biol.Chem.,43,105-111(1979)、J.Bacteriol.,110,761-763(1972)和Appl.Microbiol.Biotechnol.,39,318-323(1993)等中;关于上述(b),例如记载于Agric.Biol.Chem.,43,105-111(1979)和J.Bacteriol.,110,761-763(1972)等中;关于上述(c),例如记载于Appl.Microbiol.Biotechnol.,39,318-323(1993)和Agric.Biol.Chem.,39,371-377(1987)等中;关于上述(d),例如记载于Appl.Environ.Microbiol.,38,181-190(1979)和Agric.Biol.Chem.,42,1773-1778(1978)等中;关于上述(e),例如记载于Agric.Biol.Chem.,36,1675-1684(1972)、Agric.Biol.Chem.,41,109-116(1977)、Agric.Biol.Chem.,37,2013-2023(1973)和Agric.Biol.Chem.,51,2089-2094(1987)等中。可以参考上述文献等制备具有生产各种氨基酸的能力的微生物。
另外,关于利用上述(a)~(e)中的任何一种方法或组合方法制备具有生产氨基酸的能力的微生物的方法,在Biotechnology 2nd ed.,Vol.6,Products of Primary Metabolism(VCH VerlagsgesellschaftmbH,Weinheim,1996)section 14a,14b、Advances in BiochemicalEngineering/Biotechnology,79,1-35(2003)、以及氨基酸发酵,学会出版中心,相田浩等(1986)中记载了多例,另外,除上述以外,具体的具有生产氨基酸能力的微生物的制备方法,已有日本特开2003-164297、Agric.Biol.Chem.,39,153-160(1975)、Agric.Biol.Chem.,39,1149-1153(1975)、日本特开昭58-13599、J.Gen.Appl.Microbiol.,4,272-283(1958)、日本特开昭63-94985、Agric.Biol.Chem.,37,2013-2023(1973)、WO97/15673、日本特开昭56-18596、日本特开昭56-144092及日本特表2003-511086等很多报道,通过参考上述文献等,能够制备具有生产1种以上氨基酸的能力的微生物。
作为能够通过上述方法制备的具有氨基酸生产能力的微生物,可以列举例如:作为L-谷氨酰胺生产菌的glnE基因和/或glnB基因缺陷的微生物、作为L-丙氨酸生产菌的丙氨酸脱氢酶基因(ald基因)的表达增强的微生物、作为L-脯氨酸生产微生物的表达苯丙氨酸钝感型pheA基因和/或酪氨酸钝感型aroF基因的微生物等。
作为生成、累积上述氨基酸的微生物,只要是能够应用上述(a)~(e)的方法的微生物或者具有上述遗传特征的微生物则可以是任何一种微生物,可以优选列举原核生物,更优选列举细菌。该原核生物和细菌与上述2(1)相同。
作为生产氨基酸的微生物的具体例,可以列举:WO2006/001379号中记载的作为L-谷氨酰胺生产菌株的大肠杆菌JGLE1及大肠杆菌JGLBE1等、作为L-丙氨酸生产菌株的含有ald基因表达质粒的大肠杆菌JM101株等、作为L-苯丙氨酸生产菌株的含有pPHEA2和/或aroF基因表达质粒的大肠杆菌JM101株等、作为L-谷氨酰胺及L-丙氨酸生产菌株的含有ald基因表达质粒的大肠杆菌JGLE1及大肠杆菌JGLBE1等、作为L-丙氨酸及L-苯丙氨酸生产菌株的含有ald基因表达质粒及pPHEA2和/或aroF基因表达质粒的大肠杆菌JM101等、作为L-苏氨酸及L-苯丙氨酸生产菌株的含有pPHEA2和/或aroF基因表达质粒的ATCC21277株等。
另外,作为具有氨基酸生产能力的微生物的具体例,可以列举作为L-谷氨酸生产菌株的FERM BP-5807及ATCC13032等、作为L-谷氨酰胺生产菌株的FERM P-4806及ATCC14751等、作为L-苏氨酸生产菌株的ATCC21148、ATCC21277及ATCC21650等、作为L-赖氨酸生产菌株的FERM P-5084及ATCC13286等、作为L-蛋氨酸生产菌株的FERM P-5479、VKPM B-2175及ATCC21608等、作为L-异亮氨酸生产菌株的FERM BP-3757及ATCC14310等、作为L-缬氨酸生产菌株的ATCC13005及ATCC19561等、作为L-亮氨酸生产菌株的FERMBP-4704及ATCC21302等、作为L-丙氨酸生产菌株的FERM BP-4121及ATCC15108等、作为L-丝氨酸生产菌株的ATCC21523及FERMBP-6576等、作为L-脯氨酸生产菌株的FERM BP-2807及ATCC19224等、作为L-精氨酸生产菌株的FERM P-5616及ATCC21831等、作为L-鸟氨酸生产菌株的ATCC13232等、作为L-组氨酸生产菌株的FERMBP-6674及ATCC21607等、作为L-色氨酸生产菌株的DSM10118、DSM10121、DSM10123及FERM BP-1777等、作为L-苯丙氨酸生产菌株的ATCC13281及ATCC21669等、作为L-酪氨酸生产菌株的ATCC21652等、作为L-半胱氨酸生产菌株的W3110/pHC34(日本特表2003-511086记载)等、作为L-4-羟基脯氨酸生产菌株的大肠杆菌SOLR/pRH71(WO96/27669记载)等、作为L-3-羟基脯氨酸生产菌株的FERM BP-5026及FERM BP-5409等、作为L-瓜氨酸生产菌株的FERMP-5643及FERM P-1645等。
另外,上述由FERM编号表示的菌株可以从日本独立行政法人产业技术综合研究所专利生物保藏中心获得;由ATCC编号表示的菌株可以从美国典型菌种保藏中心(American Type Culture Collection)获得;由VKPM编号表示的菌株可以从俄罗斯国家微生物工业保藏中心(Russian National Collection of Industrial Microorganisms)获得;由DMS编号表示的菌株可以从德国微生物菌种保藏中心(Deutsche Sammlungvon mikroorganismen und Zellkulturen)获得。
(4)肽酶或具有肽摄取活性的蛋白质的活性低于亲本株或丧失的微生物的制备
本发明的微生物及本发明的二肽制造方法中使用的微生物具有生产具有二肽合成活性的蛋白质的能力,并且具有二肽转运活性的蛋白质的活性高于亲本株,除上述性质外,肽酶或具有肽摄取活性的蛋白质的活性可以低于亲本株或丧失。
肽酶或具有肽摄取活性的蛋白质的活性低于亲本株或丧失的微生物可以根据WO2005/045006号中记载的方法进行制备。
3.本发明的二肽的制造方法
(1)使用微生物的培养物或该培养物的处理物作为酶源的二肽的制造方法
本发明的微生物的培养物可以通过使用含有该微生物能够利用的碳源、氮源、无机盐类等、并且能够高效地进行转化子的培养的天然培养基或合成培养基来培养该微生物而获得。
作为碳源,只要能被该微生物利用即可,可以使用葡萄糖、果糖、蔗糖、含有这些糖的糖蜜、淀粉或淀粉水解物等碳水化合物;乙酸、丙酸等有机酸;乙醇、丙醇等醇类等。
作为氮源,可以使用氨水、氯化铵、硫酸铵、乙酸铵、磷酸铵等无机酸或有机酸的铵盐;其它含氮化合物;以及蛋白胨、肉汁、酵母提取物、玉米浆、酪蛋白水解物、豆粕及豆粕水解物、各种发酵菌体及其消化产物等。
作为无机盐,可以使用磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠、硫酸亚铁、硫酸锰、硫酸铜、碳酸钙等。
培养通常在振荡培养或底部通气搅拌培养等有氧条件下进行。培养温度优选为15~40℃,培养时间通常为5小时~7天。培养中的pH保持在3.0~9.0。pH的调节使用无机或有机酸、碱溶液、尿素、碳酸钙、氨水等来进行。
另外,培养中可以根据需要向培养基中添加氨苄青霉素、四环素等抗生素。
培养以使用诱导性启动子作为启动子的表达载体进行转化的微生物时,可以根据需要在培养基中添加诱导剂。例如,培养以使用lac启动子的表达载体转化的微生物时,可以在培养基中添加异丙基-β-D-硫代半乳糖苷等;培养以使用trp启动子的表达载体转化的微生物时,可以在培养基中添加吲哚丙烯酸等。
作为培养物的处理物,可以列举:由上述方法得到的培养物的浓缩物、培养物的干燥物、离心分离培养物后得到的菌体、该菌体的干燥物、该菌体的冻干物、该菌体的表面活性剂处理物、该菌体的超声波处理物、该菌体的机械磨碎处理物、该菌体的溶剂处理物、该菌体的酶处理物及该菌体的固定化物等含有活菌体的处理物。
使用能够通过上述方法得到的本发明的微生物的培养物或该培养物的处理物作为酶源,使水性介质中存在该酶源以及选自氨基酸、氨基酸酯及氨基酸酰胺中的1种以上的底物,使二肽在该水性介质中生成、累积,并从该介质中收集该二肽,由此能够制造二肽。
以下,将上述方法分为(i)~(iii)进行详细说明:
(i)使用该微生物的培养物或培养物的处理物作为酶源,使水性介质中存在该酶源及1种以上、优选1种或2种氨基酸,使二肽在该介质中生成、累积,并从该介质中收集该二肽的二肽制造方法;
(ii)使用该微生物的培养物或该培养物的处理物作为酶源,使水性介质中含有该酶源、1种以上且优选1种氨基酸酯及1种以上且优选1种氨基酸,使二肽在该水性介质中生成、累积,并从该介质中收集该二肽的二肽制造方法;和
(iii)使用该微生物的培养物或该培养物的处理物作为酶源,使水性介质中存在该酶源、1种以上且优选1种氨基酸酰胺及1种以上且优选1种氨基酸,使二肽在该水性介质中生成、累积,并从该介质中收集该二肽的二肽制造方法。
上述(i)的制造方法中,作为用作底物的1种以上的氨基酸、优选1种或2种氨基酸,只要是氨基酸,优选选自由L-氨基酸、甘氨酸(Gly)及β-丙氨酸(β-Ala)组成的组中的氨基酸,则可以以任意组合使用任意氨基酸。作为L-氨基酸,可以列举例如:L-丙氨酸(L-Ala)、L-谷氨酰胺(L-Gln)、L-谷氨酸(L-Glu)、L-缬氨酸(L-Val)、L-亮氨酸(L-Leu)、L-异亮氨酸(L-Ile)、L-脯氨酸(L-Pro)、L-苯丙氨酸(L-Phe)、L-色氨酸(L-Trp)、L-蛋氨酸(L-Met)、L-丝氨酸(L-Ser)、L-苏氨酸(L-Thr)、L-半胱氨酸(L-Cys)、L-天冬酰胺(L-Asn)、L-酪氨酸(L-Tyr)、L-赖氨酸(L-Lys)、L-精氨酸(L-Arg)、L-组氨酸(L-His)、L-天冬氨酸(L-Asp)、L-α-氨基丁酸(L-α-AB)、L-氮杂丝氨酸(L-Azaserine)、L-茶氨酸(L-theanine)、L-4-羟基脯氨酸(L-4-HYP)、L-3-羟基脯氨酸(L-3-HYP)、L-鸟氨酸(L-Orn)、L-瓜氨酸(L-Cit)及L-6-重氮-5-氧代正亮氨酸(L-6-diazo-5-oxo-norleucine)等。
作为上述(i)的制造方法中使用的更优选的氨基酸,可以列举:选自L-Ala、Gly、L-Met、L-Ser、L-Thr、L-Cys、L-α-AB及β-Ala中的1种氨基酸与选自L-Ala、L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-氮杂丝氨酸、L-茶氨酸、L-4-HYP、L-3-HYP、L-Orn、L-Cit及L-6-重氮-5-氧代正亮氨酸中的1种氨基酸的组合;L-Gln与L-Phe的组合,更优选L-Ala与选自L-Ala、L-Gln、Gly、L-Val、L-Leu、L-Ile、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-α-AB、L-氮杂丝氨酸、L-Cit及L-茶氨酸中的1种氨基酸的组合;Gly与选自L-Gln、Gly、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys、L-Arg、L-α-AB及L-Cit中的1种氨基酸的组合;L-Met与选自L-Phe、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys及L-His中的1种氨基酸的组合;L-Ser与选自L-Gln、L-Phe、L-Ser、L-Thr、L-Tyr、L-His及L-α-AB中的1种氨基酸的组合;L-Thr与选自L-Gln、L-Phe、L-Leu、L-Thr及L-α-AB中的1种氨基酸的组合;L-Gln与L-Phe的组合;β-Ala与选自L-Phe、L-Met、L-His及L-Cit中的1种氨基酸的组合;以及L-α-AB与L-Gln、L-Arg或L-α-AB的组合。
上述(i)的制造方法中,在反应开始时或反应过程中,向水性介质中添加用作底物的氨基酸,使其浓度为0.1~500g/L、优选0.2~200g/L。
作为通过上述(i)的制造方法制造的二肽,可以列举下式(I)所示的二肽,
R1-R2 (I)
(式中,R1及R2相同或不同,表示氨基酸)
可以优选列举上述式(I)中R1及R2相同或不同,为选自L-Ala、L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-氮杂丝氨酸、L-茶氨酸、L-4-HYP、L-3-HYP、L-Orn及L-6-重氮-5-氧代正亮氨酸中的氨基酸的二肽;可以更优选列举R1为L-Ala、Gly、L-Met、L-Ser、L-Thr、L-cys、L-α-AB或β-Ala时,R2为L-Ala、L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-氮杂丝氨酸、L-茶氨酸、L-4-HYP、L-3-HYP、L-Orn或L-6-重氮-5-氧代正亮氨酸的二肽;可以进一步优选列举R1为L-Ala时,R2为L-Ala、L-Gln、Gly、L-Val、L-Leu、L-Ile、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-α-AB、L-氮杂丝氨酸或L-茶氨酸的二肽;R1为Gly时,R2为L-Gln、Gly、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys、L-Arg或L-α-AB的二肽;R1为L-Met时,R2为L-Phe、L-Met、L-Cys、L-Tyr、L-Lys或L-His的二肽;R1为L-Ser时,R2为L-Gln、Gly、L-Phe、L-Met、L-Ser、L-Thr、L-Tyr、L-His或L-α-AB的二肽;R1为L-Thr时,R2为L-Gln、L-Gly、L-Phe、L-Met、L-Ser、L-Thr或L-α-AB的二肽;R1为L-Gln时,R2为L-Phe或L-α-AB的二肽;R1为L-Phe时,R2为L-Gln的二肽;R1为L-Trp时,R2为Gly的二肽;R1为L-Cys时,R2为L-Ala、L-Gln、Gly或L-Met的二肽;R1为L-Lys时,R2为L-Ala、Gly或L-Met的二肽;R1为L-Arg时,R2为L-α-AB的二肽;R1为L-His时,R2为L-Met的二肽;以及R1为L-α-AB时,R2为L-Ala、L-Gln、Gly、L-Ser、L-Thr、L-Arg或L-α-AB的二肽。
另外,上述制造方法中,可以根据需要在水性介质中添加能被本发明的微生物代谢而产生ATP的化合物作为ATP的供给源,例如葡萄糖等糖类、乙醇等醇类、乙酸等有机酸类等。
上述(ii)的制造方法中,作为用作底物的1种以上的氨基酸酯及1种以上的氨基酸,只要是能被用作本发明的制造方法的酶源的微生物作为底物利用而生成二肽的氨基酸酯及氨基酸,则可以以任意组合使用任意的氨基酸酯及氨基酸,优选使用1种氨基酸酯及1种氨基酸的组合,作为氨基酸,优选L-氨基酸及甘氨酸。作为更优选的1种氨基酸酯及1种氨基酸的组合,可以列举例如下述组合:氨基酸酯为选自由L-丙氨酸酯、甘氨酸酯、L-缬氨酸酯、L-异亮氨酸酯、L-蛋氨酸酯、L-苯丙氨酸酯、L-丝氨酸酯、L-苏氨酸酯、L-谷氨酰胺酯、L-酪氨酸酯、L-精氨酸酯、L-天冬氨酸-α-酯、L-天冬氨酸-β-酯、L-亮氨酸酯、L-天冬酰胺酯、L-赖氨酸酯、L-天冬氨酸-α,β-二甲基酯及L-谷氨酰胺-γ-酯组成的组中的1种氨基酸酯,氨基酸为选自由L-Gln、L-Asn、Gly、L-Ala、L-Leu、L-Met、L-Pro、L-Phe、L-Trp、L-Ser、L-Thr、L-Tyr、L-Lys、L-Arg、L-His及L-Glu组成的组中的1种氨基酸。
上述(ii)的制造方法中,在反应开始时或反应过程中,向水性介质中添加用作底物的氨基酸酯及氨基酸,使其浓度分别为0.1~500g/L、优选0.2~200g/L。
上述(iii)的制造方法中,作为用作底物的1种以上的氨基酸酰胺及1种以上的氨基酸,只要是能被用作本发明的制造方法的酶源的微生物作为底物利用而生成二肽的氨基酸酰胺及氨基酸,则可以以任意组合使用任意的氨基酸酯及氨基酸,优选使用1种氨基酸酰胺及1种氨基酸的组合,作为氨基酸,优选L-氨基酸及甘氨酸。作为1种氨基酸酰胺及1种氨基酸的组合,可以列举例如下述组合:氨基酸酰胺为选自由L-丙氨酰胺、甘氨酰胺及L-天冬氨酰胺组成的组的1种氨基酸酰胺,氨基酸为选自由L-Gln、L-Asn、Gly、L-Ala、L-Val、L-Leu、L-Ile、L-Met、L-Pro、L-Phe、L-Trp、L-Ser、L-Thr、L-Tyr、L-Lys、L-Arg、L-His及L-Glu组成的组的1种氨基酸。
上述(iii)的制造方法中,在反应开始时或反应过程中,向水性介质中添加用作底物的氨基酸酰胺及氨基酸,使其浓度分别为0.1~500g/L、优选0.2~200g/L。
作为本发明的制造方法中使用的水性介质,只要不阻碍二肽的生成反应,则可以是任何成分、组成的水性介质,可以列举例如:水、磷酸盐、碳酸盐、醋酸盐、硼酸盐、柠檬酸盐、Tris等缓冲液等。另外,还可以含有甲醇、乙醇等醇类,醋酸酯等酯类,丙酮等酮类、乙酰胺等酰胺类。
二肽的生成反应在水性介质中,pH5~11、优选pH6~10,20~60℃、优选25~45℃的条件下进行2~150小时、优选6~120小时。
根据需要,还可以在水性介质中添加表面活性剂或有机溶剂。
作为表面活性剂,只要是十八烷基胺聚氧乙烯醚(例如ナィミ一ンS-215,日本油脂公司制)等非离子表面活性剂,十六烷基三甲基溴化铵、烷基二甲基苄基氯化铵(例如カチォンF2-40E,日本油脂公司制)等阳离子型表面活性剂,月桂酰肌氨酸盐等阴离子型表面活性剂,烷基二甲基胺(例如叔胺FB,日本油脂公司制)等叔胺类等促进二肽的生成的物质,则可以使用任何物质,可以使用1种或者将多种混合使用。表面活性剂通常以0.1~50g/l的浓度使用。作为有机溶剂,可以列举:二甲苯、甲苯、脂肪醇、丙酮、乙酸乙酯等,通常以0.1~50ml/l的浓度使用。
作为酶源使用的培养物或该培养物的处理物的量,根据该酶源的比活性等而有所不同,例如相对于每1mg作为底物的氨基酸、氨基酸甲酯或氨基酸酰胺添加5~1000mg、优选添加10~400mg。
水性介质中生成、累积的二肽的收集,可以通过使用活性碳、离子交换树脂等的通常的方法,或有机溶剂萃取、结晶、薄层色谱、高效液相色谱等来进行。
另外,上述(ii)及(iii)的制造方法可以根据WO03/010189号或WO03/010187号的记载来进行。
(2)利用发酵法制造
在培养基中培养具有生产构成二肽的氨基酸中至少1种氨基酸的能力的本发明的微生物,使该二肽在培养基中生成、累积,并从培养物中收集该二肽,由此能够制造二肽。
在培养基中培养该微生物的方法与上述(1)的培养方法相同,但也可以向该培养基中添加构成所需二肽的至少1种氨基酸。
作为通过上述方法制造的二肽,可以列举1种或2种氨基酸以α键连接成的二肽,优选列举该氨基酸为L-氨基酸或甘氨酸的二肽,更优选列举:下式(II)
R1-R2 (II)
所示的二肽中R1及R2相同或不同,为选自L-Ala、L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、LL-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、L-4-HYP、L-3-HYP、L-鸟氨酸(L-Orn)及L-瓜氨酸(L-Cit)中的氨基酸的二肽,进一步优选列举:R1为L-Ala、Gly、L-Met、L-Ser、L-Cys、L-α-AB或L-Thr时,R2为L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、L-4-HYP、L-3-HYP、L-Orn或L-Cit的二肽,特别优选列举:R1为L-Ala时,R2为L-Gln、Gly、L-Val、L-Leu、L-Ile、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-α-AB或L-Cit的二肽;R1为Gly时,R2为L-Gln、Gly、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys、L-Arg、L-α-AB或L-Cit的二肽;R1为L-Met时,R2为L-Phe、L-Met、L-Cys、L-Tyr、L-Lys或L-His的二肽;R1为L-Ser时,R2为L-Gln、Gly、L-Phe、L-Met、L-Ser、L-Thr、L-Tyr、L-His或L-α-AB的二肽;R1为L-Thr时,R2为L-Gln、L-Leu、L-Phe、L-Met、L-Ser、L-Thr或L-α-AB的二肽;R1为L-Gln时,R2为L-Phe或L-α-AB的二肽;R1为L-Phe时,R2为L-Gln的二肽;R1为L-Trp时,R2为Gly的二肽;R1为L-Cys时,R2为L-Ala、L-Gln、Gly或L-Met的二肽;R1为L-Lys时,R2为L-Ala、Gly或L-Met的二肽;R1为L-Arg时,R2为L-α-AB的二肽;R1为L-His时,R2为L-Met的二肽;及R1为L-α-AB时,R2为L-Ala、L-Gln、Gly、L-Ser、L-Thr、L-Arg或L-α-AB的二肽,最优选列举:L-丙氨酰-L-丙氨酸(L-Ala-L-Ala)、L-丙氨酰-L-谷氨酰胺(L-Ala-L-Gln)、L-丙氨酰-L-苯丙氨酸(L-Ala-L-Phe)及L-苏氨酰-L-苯丙氨酸(L-Thr-L-Phe)。
在水性介质中或培养物中生成、累积的二肽的收集,可以通过使用活性碳、离子交换树脂等的通常的方法,或有机溶剂萃取、结晶、薄层色谱、高效液相色谱等来进行。
以下,给出本发明的实施例,但本发明并不限于下述实施例。
实施例1
bcr基因表达质粒的构建
通过以下的方法构建bcr基因表达质粒。
将大肠杆菌JM101株接种到LB培养基[10g/l细菌用胰蛋白胨(Difco公司制)、5g/l酵母提取物(Difco公司制)、5g/l氯化钠]中,在30℃下静置培养一夜。培养后,根据最新分子生物学实验方法汇编中记载的使用饱和苯酚的方法,分离纯化该微生物的染色体DNA。
基于序列号1所示的碱基序列,合成具有序列号30及31所示的碱基序列的DNA作为用于扩增bcr基因的引物DNA,使用该合成DNA作为引物组,进行PCR。
PCR如下进行:制备含有作为模板的0.1μg染色体DNA、0.5μmol/L各引物、2.5单位Pyrobest DNA聚合酶(宝生物工程有限公司制)、5μLPyrobest DNA聚合酶用×10缓冲液(宝生物工程有限公司制)、200μmol/L各dNTP(dATP、dGTP、dCTP及dTTP)的反应液50μL,以96℃下15秒钟、55℃下30秒钟、72℃下1分钟为1个步骤,反复进行30次。
确认扩增了约1.2kb的DNA片段,通过常法纯化该DNA片段。
将含有该DNA片段及trp启动子的表达载体pTrS30[由大肠杆菌JM109/pTrS30(FERM BP-5407)制备]分别用HindIII、SacI酶切,通过琼脂糖凝胶电泳分离DNA片段后,使用GENECLEAN II试剂盒(BIO 101公司制)分别回收限制性内切酶消化的DNA片段。
将上述得到的包含bcr基因的1.2kb片段和pTrS30的限制性内切酶消化片段用连接试剂盒(宝生物工程有限公司制)进行连接。
使用得到的连接DNA转化大肠杆菌DH5α株(宝生物工程有限公司制),以氨苄青霉素抗性为指标筛选转化子。
根据公知的方法从筛选的转化子的菌落中提取质粒,通过使用限制性内切酶分析其结构,确认得到了在trp启动子下游连接有bcr基因的表达载体pTbcr。
然后,将pTbcr及pSTV28分别用EcoRI及SacI酶切,通过与上述同样的方法回收在trp启动子下游连接有bcr基因的1.6kb片段和pSTV28的限制性内切酶消化片段。
通过与上述同样的方法进行连接,使用得到的连接DNA转化大肠杆菌DH5α株后,以氯霉素抗性为指标筛选转化子。
根据公知的方法从筛选的转化子的菌落中提取质粒,通过使用限制性内切酶分析其结构,确认得到了在trp启动子下游连接有bcr的表达载体,将该表达载体命名为pSbcr。
实施例2
norE基因表达质粒的构建
与实施例1同样,基于序列号2所示的碱基序列,合成具有序列号32及33所示的碱基序列的引物DNA作为用于扩增norE基因的引物DNA,使用该合成DNA作为引物组,进行PCR。
PCR除使用上述引物组作为引物DNA外,在与实施例1相同的条件下进行。
将通过PCR得到的扩增DNA片段及pTrS30分别用HindIII及BamHI消化后,与实施例1同样地将两个DNA连接,使用连接DNA转化大肠杆菌DH5α株。
从得到的转化子中提取在trp启动子下游连接有norE基因的表达载体pTnorE,与实施例1同样地将pTnorE及pSTV28分别用EcoRI、BamHI进行酶切。将两个DNA片段连接,通过与实施例1同样的方法构建了在trp启动子下游连接有norE基因的表达载体,命名为pSnorE。
实施例3
ydeE基因表达质粒的构建
与实施例1同样,基于序列号3所示的碱基序列,合成具有序列号34及35所示的碱基序列的引物DNA作为用于扩增ydeE基因的引物DNA,使用该合成DNA作为引物组,进行PCR。
PCR除使用上述引物组作为引物DNA外,在与实施例1同样的条件下进行。
将通过PCR得到的扩增DNA片段及pSTV28分别用EcoRI及BamHI消化后,与实施例1同样地将两个DNA连接,使用连接DNA转化大肠杆菌DH5α株。通过以上的方法构建了在lac启动子下游连接有ydeE基因的表达载体,命名为pSydeE。
实施例4
emrD基因表达质粒的构建
与实施例1同样,基于序列号4所示的碱基序列,合成具有序列号36及37所示的碱基序列的引物DNA作为用于扩增emrD基因的引物DNA,使用该合成DNA作为引物组,进行PCR。
PCR除使用上述引物组作为引物DNA之外,在与实施例1同样的条件下进行。
将通过PCR得到的扩增DNA片段及pSTV28分别用EcoRI及PstI消化后,与实施例1同样地将两个DNA连接,使用连接DNA转化大肠杆菌DH5α株。通过以上的方法构建了在lac启动子下游连接有emrD基因的表达载体,命名为pSemrD。
实施例5
yeeO基因表达质粒的构建
与实施例1同样,基于序列号5表示的碱基序列,合成具有序列号38及39所示的碱基序列的引物DNA作为用于扩增yeeO基因的引物DNA,使用该合成DNA作为引物组,进行PCR。
PCR除使用上述引物组作为引物DNA外,在与实施例1同样的条件下进行。
将通过PCR得到的扩增DNA片段及pSTV28分别用EcoRI及PstI消化后,与实施例1同样地将两个DNA连接,使用连接DNA转化大肠杆菌DH5α株。通过以上方法构建了在lac启动子下游连接有yeeO基因的表达载体,命名为pSyeeO。
实施例6
ywfE基因及ald基因表达质粒的构建
(1)表达质粒pTrSQE30的构建
以具有序列号40及41所示的碱基序列的DNA作为引物组,使用表达载体pQE60(凯杰生物技术有限公司制)为模板,进行PCR。
PCR如下进行:制备含有10ng质粒DNA、0.5μmol/L各引物、2.5单位Pfu DNA聚合酶、4μL Pfu DNA聚合酶用×10缓冲液、200μmol/L各dNTP的反应液40μL,以94℃下1分钟、55℃下2分钟、72℃下1分钟为1个步骤,反复进行30次。
将通过PCR得到的扩增DNA片段及pTrS30分别用ClaI及SphI消化后,与实施例1同样地将两个DNA连接,使用连接DNA转化大肠杆菌NM522株。通过以上的方法构建了具有trp启动子、且C末端带His标签型的蛋白质表达载体,命名为pTrSQE30。
(2)表达质粒pUATQE30的构建
以具有序列号42及43所示的碱基序列的DNA作为引物组,使用大肠杆菌W3110的染色体DNA为模板,进行PCR。
PCR如下进行:制备含有0.1μg染色体DNA、0.5μmol/L各引物、2.5单位Pfu DNA聚合酶、4μL Pfu DNA聚合酶用×10缓冲液、200μmol/L各dNTP的反应液40μL,以94℃下1分钟、55℃下2分钟、72℃下1分钟为1个步骤,反复进行30次。
将通过PCR得到的扩增DNA片段及上述得到的pTrSQE30分别用EcoRI及ClaI消化后,与实施例1同样地将两个DNA连接,使用连接DNA转化大肠杆菌NM522株。通过以上的方法构建了具有应激蛋白启动子(uspA启动子)、且C末端带His标签型的蛋白质表达载体,命名为pUATQE30。
(3)ywfE基因及ald基因表达质粒的构建
以具有序列号41及42所示的碱基序列的DNA作为引物组,使用上述得到的pUATQE30为模板,进行PCR。
PCR如下进行:制备含有10ng质粒、0.5μmol/L各引物、2.5单位Pfu DNA聚合酶、4μL Pfu DNA聚合酶用×10缓冲液、200μmol/L各dNTP的反应液40μL,以94℃下1分钟、55℃下2分钟、72℃下1分钟构成为1个步骤,反复进行30次。
将通过PCR得到的扩增DNA片段及来源于枯草芽孢杆菌的ywfE基因和来源于枯草芽孢杆菌的ald基因的表达质粒pPE86(WO2006/001379号记载)分别用EcoRI及NcoI消化后,与实施例1同样地将两个DNA连接,使用连接DNA转化大肠杆菌NM522株。通过以上的方法构建了在uspA启动子下游连接有ywfE基因及ald基因的表达质粒,命名为pPE86usp。
实施例7
pepD基因、pepN基因、pepB基因、pepA基因、dpp操纵子、glnE基因及glnB基因缺陷株的制作
使用pepD基因、pepN基因、pepB基因及dpp操纵子缺陷的大肠杆菌JPNDBP7(WO2005/045006)作为亲本株,根据利用λ噬菌体的同源重组系统的方法[Proc.Natl.Acad.Sci.USA,97,6641-6645(2000)],制作其染色体DNA上的pepA基因、glnE基因及glnB基因缺陷的菌株。
以下记载的质粒pKD46、pKD3和pCP20是从美国耶鲁大学大肠杆菌保藏中心(The Coli Genetic Stock Center)获得含有上述质粒的大肠杆菌菌株,利用公知的方法从这些菌株中提取上述质粒后使用。
(1)基因缺陷用DNA片段的克隆
大肠杆菌K12株的编码肽酶的pepA基因、参与L-脯氨酸分解的putA基因、参与L-谷氨酰胺的生物合成调节的glnE及glnB各基因的碱基序列已经明确[Science,5331,1453-1474(1997)]。
为了使pepA、putA、glnE及glnB各基因发生缺陷,基于报道的碱基序列合成具有下述碱基序列的DNA:与大肠杆菌K12株的染色体DNA上位于各缺陷目标基因上游及下游的36bp所构成的碱基序列同源的碱基序列、及酵母来源的Flp重组酶识别的碱基序列。
即,作为序列号用于扩增pepA基因缺陷用DNA片段的引物组,合成具有序列号40及41所示的碱基序列的DNA;作为用于扩增putA基因缺陷用DNA片段的引物组,合成具有序列号42及43所示的碱基序列的DNA;作为用于扩增glnE基因缺陷用DNA片段的引物组,合成具有序列号44及45所示的碱基序列的DNA;作为用于扩增glnB基因缺陷用DNA片段的引物组,合成具有序列号46及47所示的碱基序列的DNA。
然后,使用上述合成DNA作为引物组,以pKD3DNA为模板进行PCR。PCR如下进行:使用含有10ng质粒DNA、0.5μmol/L各引物、2.5单位Pfu_DNA聚合酶、4μL Pfu DNA聚合酶用×10缓冲液、200μmol/L各脱氧NTP的反应液40μL,以94℃下1分钟、55℃下2分钟、72℃下3分钟为1个步骤,反复进行30次。
通过上述PCR,得到用于pepA基因、putA基因、glnE基因及glnB基因缺陷的、含有氯霉素抗性基因的DNA片段。
(2)pepA基因缺陷大肠杆菌JPNDBP7的制作
将大肠杆菌JPNDBP7株用pKD46转化后,涂布到含有100mg/L氨苄青霉素的LB琼脂培养基上,在30℃下进行培养,由此筛选含有pKD46的大肠杆菌JPNDBP7株(以下,称为大肠杆菌JPNDBP7/pKD46)。
质粒pKD46具有λRed重组酶基因,该基因的表达可以通过L-阿拉伯糖来诱导。因此,使用直链DNA转化在L-阿拉伯糖存在下生长的、含有pKD46的大肠杆菌时,会发生高频同源重组。另外,由于pKD46具有温度敏感型复制起点,因此通过使其在42℃下生长,能够容易地使质粒丢失。
通过电脉冲法,向在10mmol/L L-阿拉伯糖和50μg/ml氨苄青霉素存在下培养得到的大肠杆菌JPNDBP7/pKD46中导入上述得到的pepD基因缺陷用含氯霉素抗性基因的DNA片段,将在大肠杆菌JPNDBP7的染色体DNA上通过同源重组整合有pepA基因缺陷用含氯霉素抗性基因的DNA片段的转化子涂布到含有25mg/L氯霉素的LB琼脂培养基(细菌用胰蛋白胨10g/L、细菌用酵母提取物5g/L、氯化钠5g/L、琼脂12g/L)上,在30℃下培养,由此进行筛选。
将筛选的氯霉素抗性株接种到含有25mg/L氯霉素的LB琼脂培养基上,在42℃下培养14小时后,分离单菌落。将得到的各菌落复制到含有25mg/L氯霉素的LB琼脂培养基及含有100mg/L氨苄青霉素的LB琼脂培养基中,在37℃下培养,筛选显示氯霉素抗性和氨苄青霉素敏感性的菌落,由此得到pKD46丢失株。
然后,使用pCP20转化上述得到的pKD46丢失株,在含有100mg/L氨苄青霉素的LB琼脂培养基上进行筛选,由此得到含有pCP20的pKD46丢失株。
质粒pCP20具有酵母来源的Flp重组酶基因,该基因的表达可以在42℃下诱导。
另外,由于Flp重组酶识别的碱基序列存在于上述制造的用于pepA基因、putA基因、glnE基因及glnB基因缺陷的含有氯霉素抗性基因的DNA片段的氯霉素抗性基因的两端,因此通过Flp重组酶催化的同源重组,能够容易地使该抗性基因丢失。
而且,由于pCP20具有温度敏感型复制起点,因此通过使pCP20含有株在42℃下生长,能够同时诱导Flp重组酶的表达和pCP20的丢失。
将上述得到的含有pCP20的pKD46丢失株接种到未添加药剂的LB琼脂培养基上,在42℃下培养14小时后,分离单菌落。将得到的各单菌落复制到未添加药剂的LB琼脂培养基、含有25ml/L氯霉素的LB琼脂培养基及含有100mg/L氨苄青霉素的LB琼脂培养基中,在30℃下培养,筛选显示氯霉素敏感性和氨苄青霉素敏感性的菌落。
由上述筛选的各菌株分别制备染色体DNA,将通过PCR确认了染色体DNA上的pepA基因缺陷的菌株作为pepA基因缺陷株,命名为大肠杆菌JPNDABP株。
然后,使用大肠杆菌JPNDABP株作为亲本株,通过与上述同样的方法依次导入putA基因、glnE基因及glnB基因缺陷,得到pepD、pepN、pepA、pepB、putA、glnE及glnB各基因以及dpp操纵子的多重基因缺陷株,命名为大肠杆菌JPNDABPUTGEB株。
实施例8
L-丙氨酰-L-谷氨酰胺(L-Ala-L-Gln)的生产
将实施例6得到的pPE86usp转化到实施例7得到的JPNDABPUTGEB中,得到具有生产具有二肽合成酶活性的蛋白质的能力的大肠杆菌JPNDABPUTGEB/pPE86usp。
然后,使用实施例1~5得到的pSbcr、pSnorE、pSydeE、pSemrD或pSyeeO,转化大肠杆菌JPNDABPUTGEB/pPE86usp,将得到的转化子分别命名为大肠杆菌JPNDABPUTGEB/pPE86usp/pSbcr、JPNDABPUTGEB/pPE86usp/pSnorE、JPNDABPUTGEB/pPE86usp/pSydeE、JPNDABPUTGEB/pPE86usp/pSemrD和JPNDABPUTGEB/pPE86usp/pSyeeO。通过同样的方法得到含有pSTV28的转化子(JPNDABPUTGEB/pPE86usp/pSTV28)。
将上述得到的转化子接种到装有含有50μg/ml氨苄青霉素及25μg/ml氯霉素的8ml LB培养基的粗试管中,在30℃下培养17小时。将该培养液以1%的量接种到装有含有100μg/ml氨苄青霉素及25μg/ml氯霉素的8ml培养基[16g/L磷酸氢二钾、14g/L磷酸二氢钾、2g/L硫酸铵、1g/L柠檬酸(酐)、1g/L酪蛋白氨基酸(Difco公司制)、10g/L葡萄糖、10mg/L维生素B1、2g/L七水合硫酸镁、10mg/L五水合硫酸锰、50mg/L七水合硫酸铁、0.1g/L L-Pro,用10mol/L氢氧化钠调节pH至7.2,葡萄糖、维生素B1、七水合硫酸镁、七水合硫酸铁、L-Pro在另外蒸煮后添加]的试管中,在30℃下培养24小时后,离心分离该培养液得到培养上清。通过F-moc化法诱导该培养上清中的培养生成物后,使用HPLC分析该生成物。结果示于表1。
[表1]
菌株 | L-Ala-L-Gln(g/l) |
JPNDABPUTGEB/pPE86usp/pSTV28 | 0.34 |
JPNDABPUTGEB/pPE86usp/pSbcr | 0.55 |
JPNDABPUTGEB/pPE86usp/pSnorE | 0.62 |
JPNDABPUTGEB/pPE86usp/pSydeE | 0.69 |
JPNDABPUTGEB/pPE86usp/pSemrD | 0.52 |
JPNDABPUTGEB/pPE86usp/pSyeeO | 0.55 |
如表1所示,通过增强bcr、norE、ydeE、emrD或yeeO基因的表达,L-Ala-L-Gln在培养基中的累积量增加。由此可知,上述基因产物是具有将细胞内的二肽排出到细胞外的活性的、具有二肽转运活性的蛋白质。
实施例9
L-丙氨酰-L-亮氨酸(L-Ala-L-Leu)、L-丙氨酰-L-缬氨酸(L-Ala-L-Val)、L-丙氨酰-L-异亮氨酸(L-Ala-L-Ile)、L-丙氨酰-L-酪氨酸(L-Ala-L-Tyr)的生产
使用实施例6得到的pPE86usp转化大肠杆菌JPNDDP36(WO05/45006),将得到的转化子命名为JPNDDP36/pPE86usp。使用实施例1~5得到的pSbcr、pSnorE、pSydeE、pSemrD或pSyeeO转化大肠杆菌JPNDDP36/pPE86usp,将得到的转化子分别命名为大肠杆菌JPNDDP36/pPE86usp/pSbcr、JPNDDP36/pPE86usp/pSnorE、JPNDDP36/pPE86usp/pSydeE、JPNDDP36/pPE86usp/pSemrD及JPNDDP36/pPE86usp/pSyeeO。另外,通过同样的方法得到含有pSTV28的转化子(JPNDDP36/pPE86usp/pSTV28)。
将上述得到的转化子接种到装有含有50μg/ml氨苄青霉素及25μg/ml氯霉素的8ml LB培养基的粗试管中,在30℃下培养17小时。将该培养液以1%的量添加到装有含有100μg/ml氨苄青霉素、25μg/ml氯霉素及氨基酸(L-Leu、L-Val、L-Ile或L-Lyr)的8ml水性介质(16g/l磷酸氢二钾、14g/l磷酸二氢钾、2g/l硫酸铵、1g/l柠檬酸(酐)、1g/l酪蛋白氨基酸(Difco公司制)、0.1g/l L-Pro、2g/l L-Leu(或L-Val、L-Ile、L-Tyr)、10g/l葡萄糖、10mg/l维生素B1、2g/l七水合硫酸镁、50mg/l七水合硫酸铁、10mg/l五水合硫酸锰,用10mol/L氢氧化钠溶液调节pH至7.2。葡萄糖、维生素B1、七水合硫酸镁、七水合硫酸铁、L-Pro在另外蒸煮后添加)的试管中,在30℃下培养24小时。离心分离该水性介质得到上清。
通过F-moc化法诱导该上清中的生成物后,使用HPLC分析该生成物。结果示于表2。
[表2]
菌株 | L-Ala-L-Leu(g/l) |
JPNDDP36/pPE86usp/pSTV28 | 0.12 |
JPNDDP36/pPE86usp/pSbcr | 0.29 |
JPNDDP36/pPE86usp/pSnorE | 0.39 |
JPNDDP36/pPE86usp/pSydeE | 0.39 |
JPNDDP36/pPE86usp/pSemrD | 0.56 |
JPNDDP36/pPE86usp/pSyeeO | 0.26 |
L-Ala-L-Val(g/l) | |
JPNDDP36/pPE86usp/pSTV28 | 0.68 |
JPNDDP36/pPE86usp/pSbcr | 1.65 |
JPNDDP36/pPE86usp/pSnorE | 1.40 |
JPNDDP36/pPE86usp/pSydeE | 2.21 |
JPNDDP36/pPE86usp/pSemrD | 1.25 |
JPNDDP36/pPE86usp/pSyeeO | 1.46 |
L-Ala-L-Ile(g/l) | |
JPNDDP36/pPE86usp/pSTV28 | 0.26 |
JPNDDP36/pPE86usp/pSbcr | 1.13 |
JPNDDP36/pPE86usp/pSnorE | 0.84 |
JPNDDP36/pPE86usp/pSydeE | 1.15 |
JPNDDP36/pPE86usp/pSemrD | 0.43 |
JPNDDP36/pPE86usp/pSyeeO | 0.51 |
L-Ala-L-Tyr(g/l) | |
JPNDDP36/pPE86usp/pSTV28 | 0.25 |
JPNDDP36/pPE86usp/pSbcr | 0.33 |
JPNDDP36/pPE86usp/pSnorE | 0.81 |
JPNDDP36/pPE86usp/pSydeE | 0.54 |
JPNDDP36/pPE86usp/pSemrD | 0.32 |
JPNDDP36/pPE86usp/pSyeeO | 0.22 |
如表2所示,通过增强bcr、norE、ydeE、emrD或yeeO基因的表达,L-Ala-L-Gln之外的二肽在培养基中的累积量也增加。由此可知,上述基因产物是对全部二肽具有转运活性的蛋白质。
序列表自由文本
序列号30-人工序列的说明:合成DNA
序列号31-人工序列的说明:合成DNA
序列号32-人工序列的说明:合成DNA
序列号33-人工序列的说明:合成DNA
序列号34-人工序列的说明:合成DNA
序列号35-人工序列的说明:合成DNA
序列号36-人工序列的说明:合成DNA
序列号37-人工序列的说明:合成DNA
序列号38-人工序列的说明:合成DNA
序列号39-人工序列的说明:合成DNA
序列号40-人工序列的说明:合成DNA
序列号41-人工序列的说明:合成DNA
序列号42-人工序列的说明:合成DNA
序列号43-人工序列的说明:合成DNA
序列号44-人工序列的说明:合成DNA
序列号45-人工序列的说明:合成DNA
序列号46-人工序列的说明:合成DNA
序列号47-人工序列的说明:合成DNA
产业上的利用可能性
根据本发明,通过增强微生物的具有将菌体内的二肽转运到菌体外的活性的蛋白质的活性,能够使用该微生物高效地制造二肽。
序列表
<110>协和发酵生化株式会社(KYOWA HAKKO BIO CO.,LTD.)
<120>二肽的制造方法(Process for producing dipeptides)
<130>SCT093767-80
<150>JP2007-99956
<151>2007-04-06
<160>47
<170>PatentIn Ver.3.3
<210>1
<211>1491
<212>DNA
<213>Escherichia coli
<220>
<221>CDS
<222>(201)..(1388)
<400>1
gtctgaccat cagcgaaggg cgttatcatc aggtgaaacg catgttcgcc gccgtgggta 60
accacgtggt tgagctgcat cgtgaacgta ttggcggtat tacgctggat gctgatttag 120
cccccggtga atatcgtccg ttaactgaag aagaaattgc cagcgtcgtc taacttttca 180
atgactttca ggagcccgtt gtg acc acc cga cag cat tcg tcg ttt gct att 233
Met Thr Thr Arg Gln His Ser Ser Phe Ala Ile
1 5 10
gtt ttt atc ctt ggc ctg ctg gcc atg ttg atg ccg ctg tcg att gat 281
Val Phe Ile Leu Gly Leu Leu Ala Met Leu Met Pro Leu Ser Ile Asp
15 20 25
atg tat ctg ccc gcg cta ccg gta att tca gcg cag ttt ggc gta ccg 329
Met Tyr Leu Pro Ala Leu Pro Val Ile Ser Ala Gln Phe Gly Val Pro
30 35 40
gcg ggc agt acg cag atg acc ctc agt act tat att ctg ggc ttt gcg 377
Ala Gly Ser Thr Gln Met Thr Leu Ser Thr Tyr Ile Leu Gly Phe Ala
45 50 55
ttg ggg cag tta atc tac ggg ccg atg gca gac agc ttc ggg cgt aag 425
Leu Gly Gln Leu Ile Tyr Gly Pro Met Ala Asp Ser Phe Gly Arg Lys
60 65 70 75
ccg gtg gtg ctc ggc ggt acg ctg gtg ttt gcc gcc gcc gcg gtg gcg 473
Pro Val Val Leu Gly Gly Thr Leu Val Phe Ala Ala Ala Ala Val Ala
80 85 90
tgt gcg ttg gca aac acc atc gat cag ctg att gtg atg cgt ttc ttc 521
Cys Ala Leu Ala Asn Thr Ile Asp Gln Leu Ile Val Met Arg Phe Phe
95 100 105
cac ggg ctg gct gcg gct gcg gcc agc gtg gtc att aac gcc ctg atg 569
His Gly Leu Ala Ala Ala Ala Ala Ser Val Val Ile Asn Ala Leu Met
110 115 120
cgc gat att tac ccg aaa gaa gag ttc tcg cgg atg atg tcg ttt gtc 617
Arg Asp Ile Tyr Pro Lys Glu Glu Phe Ser Arg Met Met Ser Phe Val
125 130 135
atg ctg gtg aca acc att gca ccg ctg atg gca ccg ata gtt ggc ggc 665
Met Leu Val Thr Thr Ile Ala Pro Leu Met Ala Pro Ile Val Gly Gly
140 145 150 155
tgg gtg ctg gtg tgg ctg agc tgg cat tac atc ttc tgg atc ctg gca 713
Trp Val Leu Val Trp Leu Ser Trp His Tyr Ile Phe Trp Ile Leu Ala
160 165 170
tta gcg gcg att ctg gct tcg gca atg att ttc ttc ctg att aaa gaa 761
Leu Ala Ala Ile Leu Ala Ser Ala Met Ile Phe Phe Leu Ile Lys Glu
175 180 185
acc tta cca ccg gag cgt cgt cag cca ttt cac att cgt acc act att 809
Thr Leu Pro Pro Glu Arg Arg Gln Pro Phe His Ile Arg Thr Thr Ile
190 195 200
ggt aac ttt gcg gcg ctg ttc cgc cat aaa cgt gtc ctg agc tac atg 857
Gly Asn Phe Ala Ala Leu Phe Arg His Lys Arg Val Leu Ser Tyr Met
205 210 215
ctt gcc agt ggt ttc agc ttt gcc ggg atg ttc tca ttc tta agc gcc 905
Leu Ala Ser Gly Phe Ser Phe Ala Gly Met Phe Ser Phe Leu Ser Ala
220 225 230 235
gga ccg ttt gtt tat att gaa att aac cac gtc gcg ccg gaa aac ttt 953
Gly Pro Phe Val Tyr Ile Glu Ile Asn His Val Ala Pro Glu Asn Phe
240 245 250
ggt tat tac ttt gcg cta aac att gtt ttt ctg ttc gtg atg acc atc 1001
Gly Tyr Tyr Phe Ala Leu Asn Ile Val Phe Leu Phe Val Met Thr Ile
255 260 265
ttt aac agc cgc ttc gtc cgc cgc att ggc gcg tta aat atg ttc cgc 1049
Phe Asn Ser Arg Phe Val Arg Arg Ile Gly Ala Leu Asn Met Phe Arg
270 275 280
tcg ggg ttg tgg ata caa ttt att atg gca gcg tgg atg gtc atc agt 1097
Ser Gly Leu Trp Ile Gln Phe Ile Met Ala Ala Trp Met Val Ile Ser
285 290 295
gcg ctg ctg ggg ctg gga ttt tgg tcg ctg gtg gtt ggc gtt gcg gcg 1145
Ala Leu Leu Gly Leu Gly Phe Trp Ser Leu Val Val Gly Val Ala Ala
300 305 310 315
ttt gtg ggc tgc gtg tcg atg gtg tca tcc aat gcg atg gcg gtc att 1193
Phe Val Gly Cys Val Ser Met Val Ser Ser Asn Ala Met Ala Val Ile
320 325 330
ctt gat gag ttt ccc cat atg gcg gga acg gca tct tcg ctg gca gga 1241
Leu Asp Glu Phe Pro His Met Ala Gly Thr Ala Ser Ser Leu Ala Gly
335 340 345
acc ttc cgt ttt ggc ata ggg gca att gtt ggc gca ttg ctt tct ctt 1289
Thr Phe Arg Phe Gly Ile Gly Ala Ile Val Gly Ala Leu Leu Ser Leu
350 355 360
gcg acc ttt aac tct gca tgg ccg atg att tgg tca att gca ttc tgc 1337
Ala Thr Phe Asn Ser Ala Trp Pro Met Ile Trp Ser Ile Ala Phe Cys
365 370 375
gca acc agc tcc att ctc ttc tgt ctg tac gcc agt cgg ccg aaa aaa 1385
Ala Thr Ser Ser Ile Leu Phe Cys Leu Tyr Ala Ser Arg Pro Lys Lys
380 385 390 395
cgg tgatctattg cacaacgagg aagctaaaag gcttcctttg ttgatgcatg 1438
Arg
tcaaccacaa atctatcatt cccccgatat atgtttattt tatgtaaaat caa 1491
<210>2
<211>1674
<212>DNA
<213>Escherichia coli
<220>
<221>CDS
<222>(201)..(1571)
<400>2
aaatcagtta agacattctg ttcagcacaa tagcaggtgg aaaacgccct taccagtgaa 60
ggggtaagaa tggctatttt ttcactggag aattaataaa tcctcgctac aatagactga 120
atttcccctg cttcttcttt ttgctgccca ttcaggcggc tttttagtct ctcatataac 180
tacaaataaa aggtgttcac gtg cag aag tat atc agt gaa gcg cgt ctg tta 233
Met Gln Lys Tyr Ile Ser Glu Ala Arg Leu Leu
1 5 10
tta gca tta gca atc ccg gtg att ctc gcg caa atc gcc caa act gcg 281
Leu Ala Leu Ala Ile Pro Val Ile Leu Ala Gln Ile Ala Gln Thr Ala
15 20 25
atg ggt ttt gtc gat acc gtg atg gcg ggc ggc tat agt gcc acc gac 329
Met Gly Phe Val Asp Thr Val Met Ala Gly Gly Tyr Ser Ala Thr Asp
30 35 40
atg gcg gcg gtc gct atc ggt act tct atc tgg ctt ccg gcg atc ctc 377
Met Ala Ala Val Ala Ile Gly Thr Ser Ile Trp Leu Pro Ala Ile Leu
45 50 55
ttt ggt cac gga ctg ctg ctg gca tta acg ccg gtt atc gcg caa tta 425
Phe Gly His Gly Leu Leu Leu Ala Leu Thr Pro Val Ile Ala Gln Leu
60 65 70 75
aat ggt tcc ggt cga cgt gag cgc att gcg cat cag gtg cga caa ggt 473
Asn Gly Ser Gly Arg Arg Glu Arg Ile Ala His Gln Val Arg Gln Gly
80 85 90
ttc tgg ctg gca ggt ttt gtt tcc gtt ctc att atg ctg gtg ctg tgg 521
Phe Trp Leu Ala Gly Phe Val Ser Val Leu Ile Met Leu Val Leu Trp
95 100 105
aat gca ggt tac att atc cgc tcc atg gaa aac atc gat ccg gct ctg 569
Asn Ala Gly Tyr Ile Ile Arg Ser Met Glu Asn Ile Asp Pro Ala Leu
110 115 120
gcg gac aaa gcc gtg ggt tat ctg cgt gcg ttg ttg tgg ggc gcg ccg 617
Ala Asp Lys Ala Val Gly Tyr Leu Arg Ala Leu Leu Trp Gly Ala Pro
125 130 135
gga tat ctg ttc ttc cag gtt gcc cgt aac cag tgt gaa ggt ctg gca 665
Gly Tyr Leu Phe Phe Gln Val Ala Arg Asn Gln Cys Glu Gly Leu Ala
140 145 150 155
aaa acc aag ccg ggt atg gta atg ggc ttt atc ggc ctg ctg gtg aac 713
Lys Thr Lys Pro Gly Met Val Met Gly Phe Ile Gly Leu Leu Val Asn
160 165 170
atc ccg gtg aac tat atc ttt att tat ggt cat ttc ggt atg cct gag 761
Ile Pro Val Asn Tyr Ile Phe Ile Tyr Gly His Phe Gly Met Pro Glu
175 180 185
ctc ggt ggc gtt ggt tgt ggc gtg gct act gcg gcg gtg tat tgg gtc 809
Leu Gly Gly Val Gly Cys Gly Val Ala Thr Ala Ala Val Tyr Trp Val
190 195 200
atg ttc ctt gcc atg gtt tct tac att aaa cgc gcc cgc tcc atg cgc 857
Met Phe Leu Ala Met Val Ser Tyr Ile Lys Arg Ala Arg Ser Met Arg
205 210 215
gat att cgt aac gaa aaa ggc acc gca aaa ccc gat cct gcg gtt atg 905
Asp Ile Arg Asn Glu Lys Gly Thr Ala Lys Pro Asp Pro Ala Val Met
220 225 230 235
aaa cga ctg att caa ctc ggt ttg ccg att gcg ctg gca ctg ttc ttt 953
Lys Arg Leu Ile Gln Leu Gly Leu Pro Ile Ala Leu Ala Leu Phe Phe
240 245 250
gaa gtg aca ctg ttt gcc gtc gtg gct ctg tta gtg tct ccg ctc ggt 1001
Glu Val Thr Leu Phe Ala Val Val Ala Leu Leu Val Ser Pro Leu Gly
255 260 265
att gtt gat gtc gca gga cac cag att gcc ctg aac ttt agt tca cta 1049
Ile Val Asp Val Ala Gly His Gln Ile Ala Leu Asn Phe Ser Ser Leu
270 275 280
atg ttc gtg ctt cca atg tcg ctg gcg gca gcg gta act atc cgc gta 1097
Met Phe Val Leu Pro Met Ser Leu Ala Ala Ala Val Thr Ile Arg Val
285 290 295
ggt tat cgt ctg ggt cag ggc tca acg ctg gat gcg caa acc gct gcg 1145
Gly Tyr Arg Leu Gly Gln Gly Ser Thr Leu Asp Ala Gln Thr Ala Ala
300 305 310 315
cgg acc ggg ctt atg gtg ggt gtc tgt atg gca acc ctg acg gcc att 1193
Arg Thr Gly Leu Met Val Gly Val Cys Met Ala Thr Leu Thr Ala Ile
320 325 330
ttc acg gtt tca ctg cgg gag caa atc gcc ctg ttg tac aac gac aat 1241
Phe Thr Val Ser Leu Arg Glu Gln Ile Ala Leu Leu Tyr Asn Asp Asn
335 340 345
ccc gag gtt gta acg ctg gct gcg cat ttg atg ttg ctg gcg gcg gta 1289
Pro Glu Val Val Thr Leu Ala Ala His Leu Met Leu Leu Ala Ala Val
350 355 360
tat cag att tct gac tca atc cag gtg att ggc agt ggg att ttg cgt 1337
Tyr Gln Ile Ser Asp Ser Ile Gln Val Ile Gly Ser Gly Ile Leu Arg
365 370 375
ggt tat aaa gat acg cgt tcc att ttc tat att acc ttt acg gct tac 1385
Gly Tyr Lys Asp Thr Arg Ser Ile Phe Tyr Ile Thr Phe Thr Ala Tyr
380 385 390 395
tgg gtg ctg ggc ttg cca agc ggc tat att ctg gca ctg acc gat ctg 1433
Trp Val Leu Gly Leu Pro Ser Gly Tyr Ile Leu ala Leu Thr Asp Leu
400 405 410
gtc gtt gaa cct atg ggg cca gca ggc ttc tgg ata ggc ttt att att 1481
Val Val Glu Pro Met Gly Pro Ala Gly Phe Trp Ile Gly Phe Ile Ile
415 420 425
ggc ctg acg tcg gca gcc att atg atg atg ttg cgt atg cgg ttc ctg 1529
Gly Leu Thr Ser Ala Ala Ile Met Met Met Leu Arg Met Arg Phe Leu
430 435 440
caa cgt ctg ccg tca gcc atc att ctg caa cga gca tcc cgc 1571
Gln Arg Leu Pro Ser Ala Ile Ile Leu Gln Arg Ala Ser Arg
445 450 455
taataaagac aaggcgcaac cttcacgggt tgcgcctgta tttttacgca ggctggagcg 1631
ttgcgccaat cccgtcttcg tctggctgta atttcagagc gtt 1674
<210>3
<211>1488
<212>DNA
<213>Escherichia coli
<220>
<221>CDS
<222>(201)..(1385)
<400>3
cgacattcta ccgcctctga atttcatctt ttgtaagcaa tcaacttagc tgaatttact 60
tttctttaac agttgattcg ttagtcgccg gttacgacgg cattaatgcg caaataagtc 120
gctatacttc ggatttttgc catgctattt ctttacatct ctaaaacaaa acataacgaa 180
acgcactgcc ggacagacaa atg aac tta tcc cta cga cgc tct acc agc gcc 233
Met Asn Leu Ser Leu Arg Arg Ser Thr Ser Ala
1 5 10
ctt ctt gcc tcg tcg ttg tta tta acc atc gga cgc ggc gct acg ctg 281
Leu Leu Ala Ser Ser Leu Leu Leu Thr Ile Gly Arg Gly Ala Thr Leu
15 20 25
cca ttt atg acc att tac ttg agt cgc cag tac agc ctg agt gtc gat 329
Pro Phe Met Thr Ile Tyr Leu Ser Arg Gln Tyr Ser Leu Ser Val Asp
30 35 40
cta atc ggt tat gcg atg aca att gcg ctc act att ggc gtc gtt ttt 377
Leu Ile Gly Tyr Ala Met Thr Ile Ala Leu Thr Ile Gly Val Val Phe
45 50 55
agc ctc ggt ttt ggt atc ctg gcg gat aag ttc gac aag aaa cgc tat 425
Ser Leu Gly Phe Gly Ile Leu Ala Asp Lys Phe Asp Lys Lys Arg Tyr
60 65 70 75
atg tta ctg gca att acc gcc ttc gcc agc ggt ttt att gcc att act 473
Met Leu Leu Ala Ile Thr Ala Phe Ala Ser Gly Phe Ile Ala Ile Thr
80 85 90
tta gtg aat aac gtg acg ctg gtt gtg ctc ttt ttt gcc ctc att aac 521
Leu Val Asn Asn Val Thr Leu Val Val Leu Phe Phe Ala Leu Ile Asn
95 100 105
tgc gcc tat tct gtt ttt gct acc gtg ctg aaa gcc tgg ttt gcc gac 569
Cys Ala Tyr Ser Val Phe Ala Thr Val Leu Lys Ala Trp Phe Ala Asp
110 115 120
aat ctt tcg tcc acc agc aaa acg aaa atc ttc tca atc aac tac acc 617
Asn Leu Ser Ser Thr Ser Lys Thr Lys Ile Phe Ser Ile Asn Tyr Thr
125 130 135
atg cta aac att ggc tgg acc atc ggt ccg ccg ctc ggc acg ctg ttg 665
Met Leu Asn Ile Gly Trp Thr Ile Gly Pro Pro Leu Gly Thr Leu Leu
140 145 150 155
gta atg cag agc atc aat ctg ccc ttc tgg ctg gca gct atc tgt tcc 713
Val Met Gln Ser Ile Asn Leu Pro Phe Trp Leu Ala Ala Ile Cys Ser
160 165 170
gcg ttt ccc atg ctt ttc att caa att tgg gta aag cgc agc gag aaa 761
Ala Phe Pro Met Leu Phe Ile Gln Ile Trp Val Lys Arg Ser Glu Lys
175 180 185
atc atc gcc acg gaa aca ggc agt gtc tgg tcg ccg aaa gtt tta tta 809
Ile Ile Ala Thr Glu Thr Gly Ser Val Trp Ser Pro Lys Val Leu Leu
190 195 200
caa gat aaa gca ctg ttg tgg ttt acc tgc tct ggt ttt ctg gct tct 857
Gln Asp Lys Ala Leu Leu Trp Phe Thr Cys Ser Gly Phe Leu Ala Ser
205 210 215
ttt gta agc ggc gca ttt gct tca tgc att tca caa tat gtg atg gtg 905
Phe Val Ser Gly Ala Phe Ala Ser Cys Ile Ser Gln Tyr Val Met Val
220 225 230 235
att gct gat ggg gat ttt gcc gaa aag gtg gtc gcg gtt gtt ctt ccg 953
Ile Ala Asp Gly Asp Phe Ala Glu Lys Val Val Ala Val Val Leu Pro
240 245 250
gtg aat gct gcc atg gtg gtt acg ttg caa tat tcc gtg ggc cgc cga 1001
Val Asn Ala Ala Met Val Val Thr Leu Gln Tyr Ser Val Gly Arg Arg
255 260 265
ctt aac ccg gct aac atc cgc gcg ctg atg aca gca ggc acc ctc tgt 1049
Leu Asn Pro Ala Asn Ile Arg Ala Leu Met Thr Ala Gly Thr Leu Cys
270 275 280
ttc gtc atc ggt ctg gtc ggt ttt att ttt tcc ggc aac agc ctg cta 1097
Phe Val Ile Gly Leu Val Gly Phe Ile Phe Ser Gly Asn Ser Leu Leu
285 290 295
ttg tgg ggt atg tca gct gcg gta ttt act gtc ggt gaa atc att tat 1145
Leu Trp Gly Met Ser Ala Ala Val Phe Thr Val Glt Gly Ile Ile Tyr
300 305 310 315
gcg ccg ggc gag tat atg ttg att gac cat att gcg ccg cca gaa atg 1193
Ala Pro Gly Glu Tyr Met Leu Ile Asp His Ile Ala Pro Pro Glu Met
320 325 330
aaa gcc agc tat ttt tcc gcc cag tct tta ggc tgg ctt ggt gcc gcg 1241
Lys Ala Ser Tyr Phe Ser Ala Gln Ser Leu Gly Trp Leu Gly Ala Ala
335 340 345
att aac cca tta gtg agt ggc gta gtg cta acc agc ctg ccg cct tcc 1289
Ile Asn Pro Leu Val Ser Gly Val Val Leu Thr Ser Leu Pro Pro Ser
350 355 360
tcg ctg ttt gtc atc tta gcg ttg gtg atc att gct gcg tgg gtg ctg 1337
Ser Leu Phe Val Ile Leu Ala Leu Val Ile Ile Ala Ala Trp Val Leu
365 370 375
atg tta aaa ggg att cga gca aga ccg tgg ggg cag ccc gcg ctt tgt 1385
Met Leu Lys Gly Ile Arg Ala Arg Pro Trp Gly Gln Pro Ala Leu Cys
380 385 390 395
tgatttaagt cgaacacaat aaagatttaa ttcagccttc gtttaggtta cctctgctaa 1445
tatctttctc attgagatga aaattaaggt aagcgaggaa aca 1488
<210>4
<211>1485
<212>DNA
<213>Escherichia coli
<220>
<221>CDS
<222>(201)..(1382)
<400>4
atgctgacgc atcttatccg ccctaccatc tctcccggca acatttattg ccgcttttgt 60
ttacatattc tgccgctaaa caattcccca ttcctggcgt atatctggct aacattcatc 120
aatgtgatag attcctctcc cgcatttatg ggaatgcgta gtgacttatt ctaattattt 180
ttataaaagc atccgtgata atg aaa agg caa aga aac gtc aat ttg tta ttg 233
Met Lys Arg Gln Arg Asn Val Asn Leu Leu Leu
1 5 10
atg ttg gta tta ctc gtg gcc gtc ggt cag atg gcg caa acc att tat 281
Met Leu Val Leu Leu Val Ala Val Gly Gln Met Ala Gln Thr Ile Tyr
15 20 25
att cca gct att gcc gat atg gcg cgc gat ctc aac gtc cgt gaa ggg 329
Ile Pro Ala Ile Ala Asp Met Ala Arg Asp Leu Asn Val Arg Glu Gly
30 35 40
gcg gtg cag agc gta atg ggc gct tat ctg ctg act tac ggt gtc tca 377
Ala Val Gln Ser Val Met Gly Ala Tyr Leu Leu Thr Tyr Gly Val Ser
45 50 55
cag ctg ttt tat ggc ccg att tcc gac cgc gtg ggc cgc cga ccg gtg 425
Gln Leu Phe Tyr Gly Pro Ile Ser Asp Arg Val Gly Arg Arg Pro Val
60 65 70 75
atc ctc gtc gga atg tcc att ttt atg ctg gca acg ctg gtc gcg gtc 473
Ile Leu Val Gly Met Ser Ile Phe Met Leu Ala Thr Leu Val Ala Val
80 85 90
acg acc tcc agt ttg acg gtg ttg att gcc gcc agc gcg atg cag ggg 521
Thr Thr Ser Ser Leu Thr Val Leu Ile Ala Ala Ser Ala Met Gln Gly
95 100 105
atg ggc acc ggc gtt ggc ggc gta atg gcg cgt act tta ccg cga gat 569
Met Gly Thr Gly Val Gly Gly Val Met Ala Arg Thr Leu Pro Arg Asp
110 115 120
tta tat gaa cgg aca cag ttg cgc cat gct aac agc ctg tta aac atg 617
Leu Tyr Glu Arg Thr Gln Leu Arg His Ala Asn Ser Leu Leu Asn Met
125 130 135
ggg att ctc gtc agt ccg ttg ctc gca ccg cta atc ggc ggt ctg ctg 665
Gly Ile Leu Val Ser Pro Leu Leu Ala Pro Leu Ile Gly Gly Leu Leu
140 145 150 155
gat acg atg tgg aac tgg cgc gcc tgt tat ctc ttt ttg ttg gtt ctt 713
Asp Thr Met Trp Asn Trp Arg Ala Cys Tyr Leu Phe Leu Leu Val Leu
160 165 170
tgt gct ggt gtg acc ttc agt atg gcc cgc tgg atg ccg gaa acg cgt 761
Cys Ala Gly Val Thr Phe Ser Met Ala Arg Trp Met Pro Glu Thr Arg
175 180 185
ccg gtc gat gca ccg cgc acg cgc ctg ctt acc agt tat aaa acg ctt 809
Pro Val Asp Ala Pro Arg Thr Arg Leu Leu Thr Ser Tyr Lys Thr Leu
190 195 200
ttc ggt aac agc ggt ttt aac tgt tat ttg ctg atg ctg att ggc ggt 857
Phe Gly Asn Ser Gly Phe Asn Cys Tyr Leu Leu Met Leu Ile Gly Gly
205 210 215
ctg gcc ggg att gcc gcc ttt gaa gcc tgc tcc ggc gtg ctg atg ggc 905
Leu Ala Gly Ile Ala Ala Phe Glu Ala Cys Ser Gly Val Leu Met Gly
220 225 230 235
gcg gtg tta ggg ctg agc agt atg acg gtc agt att ttg ttt att ctg 953
Ala Val Leu Gly Leu Ser Ser Met Thr Val Ser Ile Leu Phe Ile Leu
240 245 250
ccg att ccg gca gcg ttt ttt ggc gca tgg ttt gcc gga cgt ccc aat 1001
Pro Ile Pro Ala Ala Phe Phe Gly Ala Trp Phe Ala Gly Arg Pro Asn
255 260 265
aaa cgc ttc tcc acg tta atg tgg cag tcg gtt atc tgc tgc ctg ctg 1049
Lys Arg Phe Ser Thr Leu Met Trp Gln Ser Val Ile Cys Cys Leu Leu
270 275 280
gct ggc ttg ctg atg tgg atc ccc gac tgg ttt ggc gtg atg aat gtc 1097
Ala Gly Leu Leu Met Trp Ile Pro Asp Trp Phe Gly Val Met Asn Val
285 290 295
tgg acg ctg ctc gtt ccc gcc gcg ctg ttc ttt ttc ggt gcc ggg atg 1145
Trp Thr Leu Leu Val Pro Ala Ala Leu Phe Phe Phe Gly Ala Gly Met
300 305 310 315
ctg ttt ccg ctg gcg acc agc ggc gcg atg gag ccg ttc ccc ttc ctg 1193
Leu Phe Pro Leu Ala Thr Ser Gly Ala Met Glu Pro Phe Pro Phe Leu
320 325 330
gcg ggc acg gct ggc gcg ctg gtc ggc ggt ctg caa aac att ggt tcc 1241
Ala Gly Thr Ala Gly Ala Leu Val Gly Gly Leu Gln Asn Ile Gly Ser
335 340 345
ggc gtg ctg gcg tcg ctc tct gcg atg ttg ccg caa acc ggt cag ggc 1289
Gly Val Leu Ala Ser Leu Ser Ala Met Leu Pro Gln Thr Gly Gln Gly
350 355 360
agc ctg ggg ttg ttg atg acc tta atg gga ttg ttg atc gtg ctg tgc 1337
Ser Leu Gly Leu Leu Met Thr Leu Met Gly Leu Leu Ile Val Leu Cys
365 370 375
tgg ctg ccg ctg gcg acg cgg atg tcg cat cag ggg cag ccc gtt 1382
Trp Leu Pro Leu Ala Thr Arg Met Ser His Gln Gly Gln Pro Val
380 385 390
taagcgcacg tcaccgcagc atcgtcatca gctccatggg agaacgatgc tgctttatca 1442
gatcacgcat cacccgcata tgcggtgcgg agtaagaata aaa 1485
<210>5
<211>1944
<212>DNA
<213>Escherichia coli
<220>
<221>CDS
<222>(201)..(1841)
<400>5
tttgtaatgc aggactgtca gttgaggata tcaagcggca ggtgatggaa agcagtgaag 60
aggaaattga ttatcagata tagcaaaaat cccgctataa aagcgggctt ttcaggaatt 120
tggctcctct gactggactc gaaccagtga catacggatt aacagtccgc cgttctaccg 180
actgaactac agaggaatcg ttg ttg agg cac atc tta acg gcg aaa aat ctt 233
Met Leu Arg His Ile Leu Thr Ala Lys Asn Leu
1 5 10
ttg tca aac ccg att ttt aaa ttc ccc aac tgt ttg ccg ttt cta tca 281
Leu Ser Asn Pro Ile Phe Lys Phe Pro Asn Cys Leu Pro Phe Leu Ser
15 20 25
aca gtt tgt tgc att tgc aga caa ttt gtt ggc gaa aat ctt tgc agc 329
Thr Val Cys Cys Ile Cys Arg Gln Phe Val Gly Glu Asn Leu Cys Ser
30 35 40
ttt gct gat tct ccc tca tta ttt gaa atg tgg ttt cac ttt ctg caa 377
Phe Ala Asp Ser Pro Ser Leu Phe Glu Met Trp Phe His Phe Leu Gln
45 50 55
tta agg tcg gct ttg aat atc tcc tct gct tta cgc cag gtt gtt cac 425
Leu Arg Ser Ala Leu Asn Ile Ser Ser Ala Leu Arg Gln Val Val His
60 65 70 75
ggc act cgc tgg cac gct aaa cgc aag agc tac aaa gtg ttg ttc tgg 473
Gly Thr Arg Trp His Ala Lys Arg Lys Ser Tyr Lys Val Leu Phe Trp
80 85 90
cgc gag ata acc ccg ctt gct gtt cct atc ttc atg gag aat gcc tgt 521
Arg Glu Ile Thr Pro Leu Ala Val Pro Ile Phe Met Glu Asn Ala Cys
95 100 105
gtc ctg ttg atg ggg gtt ctg agc act ttt ctg gtc agc tgg ctg gga 569
Val Leu Leu Met Gly Val Leu Ser Thr Phe Leu Val Ser Trp Leu Gly
110 115 120
aaa gat gcg atg gcc ggc gtg gga ttg gcg gac agc ttc aat atg gtc 617
Lys Asp Ala Met Ala Gly Val Gly Leu Ala Asp Ser Phe Asn Met Val
125 130 135
att atg gct ttt ttt gct gct atc gat ctt ggt act act gtc gtt gtg 665
Ile Met Ala Phe Phe Ala Ala Ile Asp Leu Gly Thr Thr Val Val Val
140 145 150 155
gca ttt agt ctc ggt aag cgg gat cga cga cga gcg agg gtg gcg acg 713
Ala Phe Ser Leu Gly Lys Arg Asp Arg Arg Arg Ala Arg Val Ala Thr
160 165 170
cgg cag tca ttg gtg atc atg acg ttg ttt gcc gta ctg ttg gca acg 761
Arg Gln Ser Leu Val Ile Met Thr Leu Phe Ala Val Leu Leu Ala Thr
175 180 185
ctt att cat cat ttt ggc gaa caa att att gat ttc gtc gcg ggt gat 809
Leu Ile His His Phe Gly Glu Gln Ile Ile Asp Phe Val Ala Gly Asp
190 195 200
gcc acg aca gaa gtt aaa gca ctg gcg ttg act tat ctg gag ctg acg 857
Ala Thr Thr Glu Val Lys Ala Leu Ala Leu Thr Tyr Leu Glu Leu Thr
205 210 215
gta ctc agt tat cca gca gct gcc atc act ctt att ggt agc ggg gca 905
Val Leu Ser Tyr Pro Ala Ala Ala Ile Thr Leu Ile Gly Ser Gly Ala
220 225 230 235
ctt cgt ggt gca ggg aat acg aaa ata ccg cta ttg att aac ggt agc 953
Leu Arg Gly Ala Gly Asn Thr Lys Ile Pro Leu Leu Ile Asn Gly Ser
240 245 250
ctg aat att ctt aat att att att agc ggc ata ttg att tac ggc ctt 1001
Leu Asn Ile Leu Asn Ile Ile Ile Ser Gly Ile Leu Ile Tyr Gly Leu
255 260 265
ttc tcc tgg ccg gga ctg gga ttt gtc ggg gca ggg ctg ggt tta acc 1049
Phe Ser Trp Pro Gly Leu Gly Phe Val Gly Ala Gly Leu Gly Leu Thr
270 275 280
att tct cgt tat att ggc gca gtt gca att ttg tgg gtg ctg gcg att 1097
Ile Ser Arg Tyr Ile Gly Ala Val Ala Ile Leu Trp Val Leu Ala Ile
285 290 295
ggt ttt aat cct gcg cta agg att tcg tta aag agc tat ttt aaa ccg 1145
Gly Phe Asn Pro Ala Leu Arg Ile Ser Leu Lys Ser Tyr Phe Lys Pro
300 305 310 315
ctg aat ttt agc att atc tgg gaa gtc atg ggg att ggt att ccc gcg 1193
Leu Asn Phe Ser Ile Ile Trp Glu Val Met Gly Ile Gly Ile Pro Ala
320 325 330
agt gtc gaa tca gtg tta ttt acc agt ggt cgg tta tta acc caa atg 1241
Ser Val Glu Ser Val Leu Phe Thr Ser Gly Arg Leu Leu Thr Gln Met
335 340 345
ttc gtt gcc ggg atg ggg acc agt gtt att gcc gga aat ttt atc gcg 1289
Phe Val Ala Gly Met Gly Thr Ser Val Ile Ala Gly Asn Phe Ile Ala
350 355 360
ttt tca att gcg gct ctt atc aac tta ccc gga agt gcg ctc ggc tct 1337
Phe Ser Ile Ala Ala Leu Ile Asn Leu Pro Gly Ser Ala Leu Gly Ser
365 370 375
gct tct acg atc att aca ggc cga agg ttg ggg gta ggg cag ata gcg 1385
Ala Ser Thr Ile Ile Thr Gly Arg Arg Leu Gly Val Gly Gln Ile Ala
380 385 390 395
caa gca gag att cag ttg cgg cat gtg ttc tgg ctt tcc act ctt gga 1433
Gln Ala Glu Ile Gln Leu Arg His Val Phe Trp Leu Ser Thr Leu Gly
400 405 410
tta acg gcc atc gcc tgg cta acg gct ccc ttt gcc ggg gtt atg gca 1481
Leu Thr Ala Ile Ala Trp Leu Thr Ala Pro Phe Ala Gly Val Met Ala
415 420 425
tcg ttt tac acc cag gat cca cag gtt aaa cat gtc gtt gtg att ctg 1529
Ser Phe Tyr Thr Gln Asp Pro Gln Val Lys His Val Val Val Ile Leu
430 435 440
att tgg cta aat gct tta ttt atg cct att tgg tcc gcc tca tgg gtg 1577
Ile Trp Leu Asn Ala Leu Phe Met Pro Ile Trp Ser Ala Ser Trp Val
445 450 455
cta ccc gct gga ttt aaa ggt gct cgt gat gcc cgt tac gcc atg tgg 1625
Leu Pro Ala Gly Phe Lys Gly Ala Arg Asp Ala Arg Tyr Ala Met Trp
460 465 470 475
gtt tcg atg ttg agc atg tgg ggt tgt cgg gtt gta gtc ggt tat gtg 1673
Val Ser Met Leu Ser Met Trp Gly Cys Arg Val Val Val Gly Tyr Val
480 485 490
ctg gga atc atg ctt ggc tgg ggt gtg gtt ggt gtc tgg atg gga atg 1721
Leu Gly Ile Met Leu Gly Trp Gly Val Val Gly Val Trp Met Gly Met
495 500 505
ttt gcc gac tgg gct gtg cgg gcc gtg ctg ttt tac tgg cga atg gtt 1769
Phe Ala Asp Trp Ala Val Arg Ala Val Leu Phe Tyr Trp Arg Met Val
510 515 520
act gga cgt tgg cta tgg aaa tac cct cga ccc gag ccg caa aag tgt 1817
Thr Gly Arg Trp Leu Trp Lys Tyr Pro Arg Pro Glu Pro Gln Lys Cys
525 530 535
gaa aaa aag cca gtt gtg tcg gaa taaacgacaa aatgcagatt atttcagcaa 1871
Glu Lys Lys Pro Val Val Ser Glu
540 545
acgatttcaa atttaaaaaa caggctttga cattgtgggt gggcatcgct aatattcgcc 1931
tcgttctcac gat 1944
<210>6
<211>396
<212>PRT
<213>Escherichia coli
<400>6
Met Thr Thr Arg Gln His Ser Ser Phe Ala Ile Val Phe Ile Leu Gly
1 5 10 15
Leu Leu Ala Met Leu Met Pro Leu Ser Ile Asp Met Tyr Leu Pro Ala
20 25 30
Leu Pro Val Ile Ser Ala Gln Phe Gly Val Pro Ala Gly Ser Thr Gln
35 40 45
Met Thr Leu Ser Thr Tyr Ile Leu Gly Phe Ala Leu Gly Gln Leu Ile
50 55 60
Tyr Gly Pro Met Ala Asp Ser Phe Gly Arg Lys Pro Val Val Leu Gly
65 70 75 80
Gly Thr Leu Val Phe Ala Ala Ala Ala Val Ala Cys Ala Leu Ala Asn
85 90 95
Thr Ile Asp Gln Leu Ile Val Met Arg Phe Phe His Gly Leu Ala Ala
100 105 110
Ala Ala Ala Ser Val Val Ile Asn Ala Leu Met Arg Asp Ile Tyr Pro
115 120 125
Lys Glu Glu Phe Ser Arg Met Met Ser Phe Val Met Leu Val Thr Thr
130 135 140
Ile Ala Pro Leu Met Ala Pro Ile Val Gly Gly Trp Val Leu Val Trp
145 150 155 160
Leu Ser Trp His Tyr Ile Phe Trp Ile Leu Ala Leu Ala Ala Ile Leu
165 170 175
Ala Ser Ala Met Ile Phe Phe Leu Ile Lys Glu Thr Leu Pro Pro Glu
180 185 190
Arg Arg Gln Pro Phe His Ile Arg Thr Thr Ile Gly Asn Phe Ala Ala
195 200 205
Leu Phe Arg His Lys Arg Val Leu Ser Tyr Met Leu Ala Ser Gly Phe
210 215 220
Ser Phe Ala Gly Met Phe Ser Phe Leu Ser Ala Gly Pro Phe Val Tyr
225 230 235 240
Ile Glu Ile Asn His Val Ala Pro Glu Asn Phe Gly Tyr Tyr Phe Ala
245 250 255
Leu Asn Ile Val Phe Leu Phe Val Met Thr Ile Phe Asn Ser Arg Phe
260 265 270
Val Arg Arg Ile Gly Ala Leu Asn Met Phe Arg Ser Gly Leu Trp Ile
275 280 285
Gln Phe Ile Met Ala Ala Trp Met Val Ile Ser Ala Leu Leu Gly Leu
290 295 300
Gly Phe Trp Ser Leu Val Val Gly Val Ala Ala Phe Val Gly Cys Val
305 310 315 320
Ser Met Val Ser Ser Asn Ala Met Ala Val Ile Leu Asp Glu Phe Pro
325 330 335
His Met Ala Gly Thr Ala Ser Ser Leu Ala Gly Thr Phe Arg Phe Gly
340 345 350
Ile Gly Ala Ile Val Gly Ala Leu Leu Ser Leu Ala Thr Phe Asn Ser
355 360 365
Ala Trp Pro Met Ile Trp Ser Ile Ala Phe Cys Ala Thr Ser Ser Ile
370 375 380
Leu Phe Cys Leu Tyr Ala Ser Arg Pro Lys Lys Arg
385 390 395
<210>7
<211>457
<212>PRT
<213>Escherichia coli
<400>7
Met Gln Lys Tyr Ile Ser Glu Ala Arg Leu Leu Leu Ala Leu Ala Ile
1 5 10 15
Pro Val Ile Leu Ala Gln Ile Ala Gln Thr Ala Met Gly Phe Val Asp
20 25 30
Thr Val Met Ala Gly Gly Tyr Ser Ala Thr Asp Met Ala Ala Val Ala
35 40 45
Ile Gly Thr Ser Ile Trp Leu Pro Ala Ile Leu Phe Gly His Gly Leu
50 55 60
Leu Leu Ala Leu Thr Pro Val Ile Ala Gln Leu Asn Gly Ser Gly Arg
65 70 75 80
Arg Glu Arg Ile Ala His Gln Val Arg Gln Gly Phe Trp Leu Ala Gly
85 90 95
Phe Val Ser Val Leu Ile Met Leu Val Leu Trp Asn Ala Gly Tyr Ile
100 105 110
Ile Arg Ser Met Glu Asn Ile Asp Pro Ala Leu Ala Asp Lys Ala Val
115 120 125
Gly Tyr Leu Arg Ala Leu Leu Trp Gly Ala Pro Gly Tyr Leu Phe Phe
130 135 140
Gln Val Ala Arg Asn Gln Cys Glu Gly Leu Ala Lys Thr Lys Pro Gly
145 150 155 160
Met Val Met Gly Phe Ile Gly Leu Leu Val Asn Ile Pro Val Asn Tyr
165 170 175
Ile Phe Ile Tyr Gly His Phe Gly Met Pro Glu Leu Gly Gly Val Gly
180 185 190
Cys Gly Val Ala Thr Ala Ala Val Tyr Trp Val Met Phe Leu Ala Met
195 200 205
Val Ser Tyr Ile Lys Arg Ala Arg Ser Met Arg Asp Ile Arg Asn Glu
210 215 220
Lys Gly Thr Ala Lys Pro Asp Pro Ala Val Met Lys Arg Leu Ile Gln
225 230 235 240
Leu Gly Leu Pro Ile Ala Leu Ala Leu Phe Phe Glu Val Thr Leu Phe
245 250 255
Ala Val Val Ala Leu Leu Val Ser Pro Leu Gly Ile Val Asp Val Ala
260 265 270
Gly His Gln Ile Ala Leu Asn Phe Ser Ser Leu Met Phe Val Leu Pro
275 280 285
Met Ser Leu Ala Ala Ala Val Thr Ile Arg Val Gly Tyr Arg Leu Gly
290 295 300
Gln Gly Ser Thr Leu Asp Ala Gln Thr Ala Ala Arg Thr Gly Leu Met
305 310 315 320
Val Gly Val Cys Met Ala Thr Leu Thr Ala Ile Phe Thr Val Ser Leu
325 330 335
Arg Glu Gln Ile Ala Leu Leu Tyr Asn Asp Asn Pro Glu Val Val Thr
340 345 350
Leu Ala Ala His Leu Met Leu Leu Ala Ala Val Tyr Gln Ile Ser Asp
355 360 365
Ser Ile Gln Val Ile Gly Ser Gly Ile Leu Arg Gly Tyr Lys Asp Thr
370 375 380
Arg Ser Ile Phe Tyr Ile Thr Phe Thr Ala Tyr Trp Val Leu Gly Leu
385 390 395 400
Pro Ser Gly Tyr Ile Leu Ala Leu Thr Asp Leu Val Val Glu Pro Met
405 410 415
Gly Pro Ala Gly Phe Trp Ile Gly Phe Ile Ile Gly Leu Thr Ser Ala
420 425 430
Ala Ile Met Met Met Leu Arg Met Arg Phe Leu Gln Arg Leu Pro Ser
435 440 445
Ala Ile Ile Leu Gln Arg Ala Ser Arg
450 455
<210>8
<211>395
<212>PRT
<213>Escherichia coli
<400>8
Met Asn Leu Ser Leu Arg Arg Ser Thr Ser Ala Leu Leu Ala Ser Ser
1 5 10 15
Leu Leu Leu Thr Ile Gly Arg Gly Ala Thr Leu Pro Phe Met Thr Ile
20 25 30
Tyr Leu Ser Arg Gln Tyr Ser Leu Ser Val Asp Leu Ile Gly Tyr Ala
35 40 45
Met Thr Ile Ala Leu Thr Ile Gly Val Val Phe Ser Leu Gly Phe Gly
50 55 60
Ile Leu Ala Asp Lys Phe Asp Lys Lys Arg Tyr Met Leu Leu Ala Ile
65 70 75 80
Thr Ala Phe Ala Ser Gly Phe Ile Ala Ile Thr Leu Val Asn Asn Val
85 90 95
Thr Leu Val Val Leu Phe Phe Ala Leu Ile Asn Cys Ala Tyr Ser Val
100 105 110
Phe Ala Thr Val Leu Lys Ala Trp Phe Ala Asp Asn Leu Ser Ser Thr
115 120 125
Ser Lys Thr Lys Ile Phe Ser Ile Asn Tyr Thr Met Leu Asn Ile Gly
130 135 140
Trp Thr Ile Gly Pro Pro Leu Gly Thr Leu Leu Val Met Gln Ser Ile
145 150 155 160
Asn Leu Pro Phe Trp Leu Ala Ala Ile Cys Ser Ala Phe Pro Met Leu
165 170 175
Phe Ile Gln Ile Trp Val Lys Arg Ser Glu Lys Ile Ile Ala Thr Glu
180 185 190
Thr Gly Ser Val Trp Ser Pro Lys Val Leu Leu Gln Asp Lys Ala Leu
195 200 205
Leu Trp Phe Thr Cys Ser Gly Phe Leu Ala Ser Phe Val Ser Gly Ala
210 215 220
Phe Ala Ser Cys Ile Ser Gln Tyr Val Met Val Ile Ala Asp Gly Asp
225 230 235 240
Phe Ala Glu Lys Val Val Ala Val Val Leu Pro Val Asn Ala Ala Met
245 250 255
Val Val Thr Leu Gln Tyr Ser Val Gly Arg Arg Leu Asn Pro Ala Asn
260 265 270
Ile Arg Ala Leu Met Thr Ala Gly Thr Leu Cys Phe Val Ile Gly Leu
275 280 285
Val Gly Phe Ile Phe Ser Gly Asn Ser Leu Leu Leu Trp Gly Met Ser
290 295 300
Ala Ala Val Phe Thr Val Gly Glu Ile Ile Tyr Ala Pro Gly Glu Tyr
305 310 315 320
Met Leu Ile Asp His Ile Ala Pro Pro Glu Met Lys Ala Ser Tyr Phe
325 330 335
Ser Ala Gln Ser Leu Gly Trp Leu Gly Ala Ala Ile Asn Pro Leu Val
340 345 350
Ser Gly Val Val Leu Thr Ser Leu Pro Pro Ser Ser Leu Phe Val Ile
355 360 365
Leu Ala Leu Val Ile Ile Ala Ala Trp Val Leu Met Leu Lys Gly Ile
370 375 380
Arg Ala Arg Pro Trp Gly Gln Pro Ala Leu Cys
385 390 395
<210>9
<211>394
<212>PRT
<213>Escherichia coli
<400>9
Met Lys Arg Gln Arg Asn Val Asn Leu Leu Leu Met Leu Val Leu Leu
1 5 10 15
Val Ala Val Gly Gln Met Ala Gln Thr Ile Tyr Ile Pro Ala Ile Ala
20 25 30
Asp Met Ala Arg Asp Leu Asn Val Arg Glu Gly Ala Val Gln Ser Val
35 40 45
Met Gly Ala Tyr Leu Leu Thr Tyr Gly Val Ser Gln Leu Phe Tyr Gly
50 55 60
Pro Ile Ser Asp Arg Val Gly Arg Arg Pro Val Ile Leu Val Gly Met
65 70 75 80
Ser Ile Phe Met Leu Ala Thr Leu Val Ala Val Thr Thr Ser Ser Leu
85 90 95
Thr Val Leu Ile Ala Ala Ser Ala Met Gln Gly Met Gly Thr Gly Val
100 105 110
Gly Gly Val Met Ala Arg Thr Leu Pro Arg Asp Leu Tyr Glu Arg Thr
115 120 125
Gln Leu Arg His Ala Asn Ser Leu Leu Asn Met Gly Ile Leu Val Ser
130 135 140
Pro Leu Leu Ala Pro Leu Ile Gly Gly Leu Leu Asp Thr Met Trp Asn
145 150 155 160
Trp Arg Ala Cys Tyr Leu Phe Leu Leu Val Leu Cys Ala Gly Val Thr
165 170 175
Phe Ser Met Ala Arg Trp Met Pro Glu Thr Arg Pro Val Asp Ala Pro
180 185 190
Arg Thr Arg Leu Leu Thr Ser Tyr Lys Thr Leu Phe Gly Asn Ser Gly
195 200 205
Phe Asn Cys Tyr Leu Leu Met Leu Ile Gly Gly Leu Ala Gly Ile Ala
210 215 220
Ala Phe Glu Ala Cys Ser Gly Val Leu Met Gly Ala Val Leu Gly Leu
225 230 235 240
Ser Ser Met Thr Val Ser Ile Leu Phe Ile Leu Pro Ile Pro Ala Ala
245 250 255
Phe Phe Gly Ala Trp Phe Ala Gly Arg Pro Asn Lys Arg Phe Ser Thr
260 265 270
Leu Met Trp Gln Ser Val Ile Cys Cys Leu Leu Ala Gly Leu Leu Met
275 280 285
Trp Ile Pro Asp Trp Phe Gly Val Met Asn Val Trp Thr Leu Leu Val
290 295 300
Pro Ala Ala Leu Phe Phe Phe Gly Ala Gly Met Leu Phe Pro Leu Ala
305 310 315 320
Thr Ser Gly Ala Met Glu Pro Phe Pro Phe Leu Ala Gly Thr Ala Gly
325 330 335
Ala Leu Val Gly Gly Leu Gln Asn Ile Gly Ser Gly Val Leu Ala Ser
340 345 350
Leu Ser Ala Met Leu Pro Gln Thr Gly Gln Gly Ser Leu Gly Leu Leu
355 360 365
Met Thr Leu Met Gly Leu Leu Ile Val Leu Cys Trp Leu Pro Leu Ala
370 375 380
Thr Arg Met Ser His Gln Gly Gln Pro Val
385 390
<210>10
<211>547
<212>PRT
<213>Escherichia coli
<400>10
Met Leu Arg His Ile Leu Thr Ala Lys Asn Leu Leu Ser Asn Pro Ile
1 5 10 15
Phe Lys Phe Pro Asn Cys Leu Pro Phe Leu Ser Thr Val Cys Cys Ile
20 25 30
Cys Arg Gln Phe Val Gly Glu Asn Leu Cys Ser Phe Ala Asp Ser Pro
35 40 45
Ser Leu Phe Glu Met Trp Phe His Phe Leu Gln Leu Arg Ser Ala Leu
50 55 60
Asn Ile Ser Ser Ala Leu Arg Gln Val Val His Gly Thr Arg Trp His
65 70 75 80
Ala Lys Arg Lys Ser Tyr Lys Val Leu Phe Trp Arg Glu Ile Thr Pro
85 90 95
Leu Ala Val Pro Ile Phe Met Glu Asn Ala Cys Val Leu Leu Met Gly
100 105 110
Val Leu Ser Thr Phe Leu Val Ser Trp Leu Gly Lys Asp Ala Met Ala
115 120 125
Gly Val Gly Leu Ala Asp Ser Phe Asn Met Val Ile Met Ala Phe Phe
130 135 140
Ala Ala Ile Asp Leu Gly Thr Thr Val Val Val Ala Phe Ser Leu Gly
145 150 155 160
Lys Arg Asp Arg Arg Arg Ala Arg Val Ala Thr Arg Gln Ser Leu Val
165 170 175
Ile Met Thr Leu Phe Ala Val Leu Leu Ala Thr Leu Ile His His Phe
180 185 190
Gly Glu Gln Ile Ile Asp Phe Val Ala Gly Asp Ala Thr Thr Glu Val
195 200 205
Lys Ala Leu Ala Leu Thr Tyr Leu Glu Leu Thr Val Leu Ser Tyr Pro
210 215 220
Ala Ala Ala Ile Thr Leu Ile Gly Ser Gly Ala Leu Arg Gly Ala Gly
225 230 235 240
Asn Thr Lys Ile Pro Leu Leu Ile Asn Gly Ser Leu Asn Ile Leu Asn
245 250 255
Ile Ile Ile Ser Gly Ile Leu Ile Tyr Gly Leu Phe Ser Trp Pro Gly
260 265 270
Leu Gly Phe Val Gly Ala Gly Leu Gly Leu Thr Ile Ser Arg Tyr Ile
275 280 285
Gly Ala Val Ala Ile Leu Trp Val Leu Ala Ile Gly Phe Asn Pro Ala
290 295 300
Leu Arg Ile Ser Leu Lys Ser Tyr Phe Lys Pro Leu Asn Phe Ser Ile
305 310 315 320
Ile Trp Glu Val Met Gly Ile Gly Ile Pro Ala Ser Val Glu Ser Val
325 330 335
Leu Phe Thr Ser Gly Arg Leu Leu Thr Gln Met Phe Val Ala Gly Met
340 345 350
Gly Thr Ser Val Ile Ala Gly Asn Phe Ile Ala Phe Ser Ile Ala Ala
355 360 365
Leu Ile Asn Leu Pro Gly Ser Ala Leu Gly Ser Ala Ser Thr Ile Ile
370 375 380
Thr Gly Arg Arg Leu Gly Val Gly Gln Ile Ala Gln Ala Glu Ile Gln
385 390 395 400
Leu Arg His Val Phe Trp Leu Ser Thr Leu Gly Leu Thr Ala Ile Ala
405 410 415
Trp Leu Thr Ala Pro Phe Ala Gly Val Met Ala Ser Phe Tyr Thr Gln
420 425 430
Asp Pro Gln Val Lys His Val Val Val Ile Leu Ile Trp Leu Asn Ala
435 440 445
Leu Phe Met Pro Ile Trp Ser Ala Ser Trp Val Leu Pro Ala Gly Phe
450 455 460
Lys Gly Ala Arg Asp Ala Arg Tyr Ala Met Trp Val Ser Met Leu Ser
465 470 475 480
Met Trp Gly Cys Arg Val Val Val Gly Tyr Val Leu Gly Ile Met Leu
485 490 495
Gly Trp Gly Val Val Gly Val Trp Met Gly Met Phe Ala Asp Trp Ala
500 505 510
Val Arg Ala Val Leu Phe Tyr Trp Arg Met Val Thr Gly Arg Trp Leu
515 520 525
Trp Lys Tyr Pro Arg Pro Glu Pro Gln Lys Cys Glu Lys Lys Pro Val
530 535 540
Val Ser Glu
545
<210>11
<211>472
<212>PRT
<213>Bacillus subtilis 168
<400>11
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>12
<211>472
<212>PRT
<213>Bacillus subtilis ATCC6633
<400>12
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>13
<211>472
<212>PRT
<213>Bacillus subtilis IAM1213
<400>13
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>14
<211>472
<212>PRT
<213>Bacillus subtilis IAM1107
<400>14
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>15
<211>472
<212>PRT
<213>Bacillus subtilis IAM1214
<400>15
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>16
<211>472
<212>PRT
<213>Bacillus subtilis ATCC21555
<400>16
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385 390 395 400
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
405 410 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Ala Leu Ser Val
465 470
<210>17
<211>472
<212>PRT
<213>Bacillus amyloliquefaciens IFO3022
<400>17
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385 390 395 400
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Ala Leu Pro Val
465 470
<210>18
<211>476
<212>PRT
<213>Bacillus pumilus NRRL B-12025
<400>18
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
1 5 10 15
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
20 25 30
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
35 40 45
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
50 55 60
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
65 70 75 80
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
85 90 95
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
100 105 110
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
115 120 125
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
130 135 140
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145 150 155 160
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
165 170 175
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
180 185 190
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
195 200 205
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
210 215 220
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225 230 235 240
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
245 250 255
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
260 265 270
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
275 280 285
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
290 295 300
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305 310 315 320
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
325 330 335
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
340 345 350
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
355 360 365
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
370 375 380
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385 390 395 400
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
405 410 415
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
420 425 430
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
435 440 445
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
450 455 460
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465 470 475
<210>19
<211>93
<212>PRT
<213>Bacillus subtilis 168
<400>19
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
1 5 10 15
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
20 25 30
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
35 40 45
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
50 55 60
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
65 70 75 80
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
85 90
<210>20
<211>1416
<212>DNA
<213>Bacillus subtilis 168
<400>20
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gaa cac cct gat tcc att tat tgg gcg cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg g c ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>21
<211>1416
<212>DNA
<213>Bacillus subtilis ATCC6633
<400>21
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att 336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt 1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>22
<211>1416
<212>DNA
<213>Bacillus subtilis IAM1213
<400>22
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctc gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa at gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggt ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aat aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta att gaa tcg gca gcc aga ttc gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctt tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg caa cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat ctg cct gac ggg ctt tta aaa ggg gat act gag atc gtt 1248
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca gga act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>23
<211>1416
<212>DNA
<213>Bacillus subtilis IAM1107
<400>23
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc gta aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttc ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag gtc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta att gaa tcg gca gcc aga ttt gcc ggc tgg aat atg atc cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gat gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtc gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc ttt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>24
<211>1416
<212>DNA
<213>Bacillus subtilis IAM1214
<400>24
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att 336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt 1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>25
<211>1416
<212>DNA
<213>Bacillus subtilis ATCC21555
<400>25
atg gag aga aaa aca gta ttg gtt atc gct gat ctt ggg ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga ccc ttt gca att aca gcc tct cat gcg gcc tta att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg att gcg gtc att aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
ctg gct gat ttt gaa cat ccc gat tcg att tat tgg gct cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aaa cct gag gaa gaa gtc gtc gaa gaa atc gtg aaa gtg gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
gac atg ttt ggg gtt gac gcc att acg acc aac aat gaa ctg ttt atc 336
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gca aaa gcg tgt aaa cgt ctc ggc ctg cgg gga gcg ggc 384
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gta cag gcc gct gaa aac gcc aga gat aaa aat aaa atg aga gcc gcc 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
ttc aac cgg gcc ggc gtc aaa tcc atc aaa aac aaa cgg gtg acg acc
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctt att 528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
ctg aag cct aca tat ctg gca agc tcg atc ggc gtg acg ctt att aaa 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
gag atg gaa acg gcc gaa gct gaa ttc aac aga gtc aat gag tac ttg 624
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
aaa tcg att aat gta ccg aaa gcg gtg acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gcg gaa gaa ttc ttg cag ggc gag tat gat gac tgg tac gaa aca agc 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
ggt tat tcc gac tat atc agc atc gaa ggc atc atg gcc gac gga gaa 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tac ttc ccc gtt gcg atc cat gat aaa aca ccg caa atc gga ttc acg 816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca gcg cat att acg ccg tcc atc ctg gat gat gac gcc aag cgg 864
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
aaa atc gtc gaa gct gcc aag aag gcg aat gaa gga ctc ggc ctc gaa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
aac tgt gca acg cat aca gaa ata aaa tta atg aaa aac cgg gaa gcc 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
gga ctg att gag tca gcg gcc aga ttc gcg gga tgg aat atg att ccg 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttc ggc gtt gat atg gcg cag cta tta ttg gat 1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt tac gga aaa gaa gct gat ctg ccg aaa gga tta ttg gag 1104
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
cag gag cca tgc tat gtc gca gac tgc cac ttg tat cct cag cat ttc 1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa gag aac ggc cag ctg cct gag acg gtt gtc gat ttc gtc att gaa 1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385 390 395 400
agc att gaa att cct gac ggc gtc tta aag gga gac act gaa ctc gtt 1248
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
405 410 415
tct ttc tca gcg gct gag gcg ggt acg tca gtg gat ctg cgg ctg ttc 1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
gaa gcg ttc aac agc att gcg gcg ttt gag ctg aaa gga agc aat tcg 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
aac gac gtg gcc gaa tca atc aaa caa att cag cag cag gcg aag ctg 1392
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
act gca aag tat gcg tta tcg gta 1416
Thr Ala Lys Tyr Ala Leu Ser Val
465 470
<210>26
<211>1416
<212>DNA
<213>Bacillus amyloliquefaciens IFO3022
<400>26
atg gag aga aaa aca gta ttg gtt atc gct gac ctt ggg gga tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca att aca gcc tct cat gcg gca tta att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
ctg gct gat ttt gag cat ccc gat tcg att tac tgg gct cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aaa cct gag gaa gaa gta gtc gaa gaa atc gtc aag gtg gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
ggc atg ttc gcg gtt gac gcc att acg acc aac aat gaa ctg ttt atc 336
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gca aaa gcg tgt gaa cgt ctc ggc ctg cgg gga gcg ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gta cag gcc gct gaa aat gcc aga gat aaa aac aaa atg aga gcc gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
ttc aac cgg gcc ggc gtc aag tct atc aaa aac aga cgg gtg acg acg 480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145 150 155 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctc att 528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
ctg aag cct aca tat ctg gcg agc tcc atc ggc gtg acg ctc atc aaa 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
gag agg gaa acg gcc gaa gcc gaa ttt aac aga gtc aat gaa tac ctg 624
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
aag tcg atc aac gta ccg aaa gcg gtc acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gcg gaa gaa ttt ttg cag ggc gag tat gac gac tgg tac gaa aca agc 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
ggt tat tcc gac tat atc agc ata gaa ggc atc atg gcc gac gga gaa 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tac ttc cct gtc gca att cat gat aaa aca ccg caa atc gga ttc acg 816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcg cat att acg ccg tcc atc ctg gat gat gac gcg aag cgg 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
aaa atc gtc gaa gca gcc aaa aag gcg aat gaa gga ctc ggc ctc gaa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
aac tgc gca acc cat aca gag att aaa tta atg aaa aac cgg gaa gcc 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
gga ctg att gaa tca gcg gca cga ttt gcg ggc tgg aac atg att ccg 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttc ggc gtc gat atg gcg cag ctg tta ttg gat 1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gaa gcc gat ctg ccg aaa gga tta ttg gag 1104
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
cag gag ccg tgc tat gtc gcc gac tgc cac ttg tat cct cag cat ttc 1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa gag aac ggc cag ctg cct gag acg gct gtc gat ttc gtc att gaa 1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385 390 395 400
agc att gac att ccc gac ggc gtc tta aag gga gac acc gaa atc gtt 1248
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttc tcg gcg gcc gag gcg ggt aca tcc gtg gat ctg cgg ctg ttc 1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
gaa gcg ttc aac agc att gcg gcg ttc gag ctg aaa gga agc aat tcg 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
ggt gac gtg gcc gaa tca atc aaa caa att cag cag cag gcg aag ctg 1392
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
act gca aag tat gcg tta ccg gta 1416
Thr Ala Lys Tyr Ala Leu Pro Val
465 470
<210>27
<211>1428
<212>DNA
<213>Bacillus pumilus NRRL B-12025
<400>27
gtg ctt tca ttg agt aaa aaa act gta ctt gtc att gct gac tta gga 48
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
1 5 10 15
ggg tgc ccg ccc cat atg ttt tat gaa agc gtg gcg gca tca tac cat 96
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
20 25 30
atc gtt tct tat atc cca aga ccc ttt gcg att aca aag gga cat gcc 144
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
35 40 45
gag cta atc gaa aaa tac tcc att gcc gtc atc aaa gac cgt gat tat 192
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
50 55 60
ttt gag aca cac cct tct ttt gaa cac cct gat tct att tac tgg gca 240
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
65 70 75 80
cat gat gat tat cca aaa tca gaa gaa gaa gtt gtg gaa gac ttc att 288
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
85 90 95
cga gta gct tcc ttt ttc aaa gca gat gca atc acg acc aat aat gaa 336
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
100 105 110
tta ttc att gca ccg atg gca aag gcc gct gaa cgt ctt ggg cta cga 384
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
115 120 125
ggt gcc ggt gtc aag gca gcc gaa atg gcg cgt gat aaa agc caa atg 432
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
130 135 140
agg gct gca ttc aat gcc tct ggc gtc aaa gcg gtg aaa act cag cct 480
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145 150 155 160
gtc acg act tta tct gat ttc caa caa gcc att gag tct atc gga aca 528
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
165 170 175
ccg ctc att tta aag cct aca tat tta gcc agt tct att ggc gtc acc 576
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
180 185 190
ttg ttt cat gac aaa gcc gga agt gat gac ttg ttt tta caa gta caa 624
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
195 200 205
tcg tat ttg gaa acc ata cca gtc cca gac gct gtc acg tat gaa gca 672
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
210 215 220
ccg ttt gtc gct gaa aca tat tta gag ggt gct tac gaa gat tgg tat 720
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225 230 235 240
gaa gac gaa gga tat gct gat tat gtc agt gta gaa ggg ctg gtc gta 768
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
245 250 255
gag ggc gaa tat ctc cct ttt gtc ata cat gat aaa acc cct caa atc 816
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
260 265 270
ggc ttt aca gaa acg gct cat atc act ccg acg atc tta gac aat gaa 864
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
275 280 285
gcc aag caa atc atc att gaa gca gca agg aag gca aat gaa ggg cta 912
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
290 295 300
ggt ctt gaa cat tgt gca acc cat aca gaa atc aaa ctc atg aaa aat 960
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305 310 315 320
cga gaa act gga ctg atc gag gca gcg gct cga ttc gct ggc tgg aat 1008
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
325 330 335
atg atc ccg aat att aaa aaa gtc ttt ggc gtc gat atg gcg aag cta 1056
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
340 345 350
ttg att gat gta tta gtt gat ggt aaa aag gct gta ctg cca aaa cag 1104
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
355 360 365
ctg ctt tct gga cat aca ttt tat gta gcg gac tgc cac ctg tac cct 1152
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
370 375 380
cag cat ttt aaa gag agt ggg ctt atc ccg cct gaa gcc aca cat att 1200
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385 390 395 400
acc att gat cat gtg tct att ccg cag gaa gca ttc gtt gga gat act 1248
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
405 410 415
gcg att gtc agt caa tca ttc cct gcc aaa ggg act att gtg gat ctt 1296
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
420 425 430
gaa tta ttt gaa gct ttt aat gga atc gta tct ctt gaa tta aaa gga 1344
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
435 440 445
tca tcc tca caa gat gtt gcc gcg tcc atc cgc aac att cag aaa cag 1392
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
450 455 460
gca acg att cag tta atg gat gaa tta gtg aag gga 1428
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465 470 475
<210>28
<211>1416
<212>DNA
<213>Bacillus subtilis ATCC 15245 and Bacillus subtilis IAM 1033
<400>28
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gat tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tca ttt tca gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gca aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>29
<211>279
<212>DNA
<213>Bacillus subtilis 168
<400>29
ggt gcc ggc gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg 48
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
1 5 10 15
agg gac gct ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga 96
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
20 25 30
gtc aca act ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca 144
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
35 40 45
cct ctt atc tta aag cct aca tac tta gcg agt tct atc ggt gta acg 192
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
50 55 60
ctg att acg gac act gag acg gca gaa gat gaa ttt aac aga gtc aat 240
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
65 70 75 80
gac tat ctg aaa tca att aac gtg cca aag gcg gtt acg 279
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
85 90
<210>30
<211>29
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>30
tttaagcttt gactttcagg agcccgttg 29
<210>31
<211>29
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>31
tttgagctca tatatcgggg gaatgatag 29
<210>32
<211>29
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>32
tttaagctta aaaggtgttc acgtgcaga 29
<210>33
<211>29
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>33
tttggatcct tagcgggatg ctcgttgca 29
<210>34
<211>30
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>34
atagaattct taacagttga ttcgttagtc 30
<210>35
<211>30
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>35
ataggatcct caacaaagcg cgggctgccc 30
<210>36
<211>30
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>36
tttgaattcg gtgataatga aaaggcaaag 30
<210>37
<211>29
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>37
tttctgcagt taaacgggct gcccctgat 29
<210>38
<211>29
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>38
tttgaattcg ttgttgaggc acatcttaa 29
<210>39
<211>29
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>39
tttctgcagt tattccgaca caactggct 29
<210>40
<211>56
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>40
atggagttta gtgtaaaaag cggtagcccg gagaaagtgt aggctggagc tgcttc 56
<210>41
<211>56
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>41
ttactcttcg ccgttaaacc cagcgcggtt taacagcata tgaatatcct ccttag 56
<210>42
<211>56
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>42
catcatggat atttcacgat aacgttaagt tgcaccgtgt aggctggagc tgcttc 56
<210>43
<211>56
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>43
agatgccgga ggaggttgta acatcctccg gctacccata tgaatatcct ccttag 56
<210>44
<211>56
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>44
gttgagcggc tgccagagcc tttagccgag gaatcagtgt aggctggagc tgcttc 56
<210>45
<211>56
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>45
ctgccagctt gcccgcacca gttcacgctc tgcggtcata tgaatatcct ccttag 56
<210>46
<211>56
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>46
ctggacgatg tccgcgaagc actggccgaa gtcggtgtgt aggctggagc tgcttc 56
<210>47
<211>56
<212>DNA
<213>Artificial Sequence
<220>
<223>Description of Artificial Sequence:Synthetic DNA
<400>47
tgccgcgtcg tcctcttcac cggtacggat gcgaatcata tgaatatcct ccttag 56
Claims (6)
1.一种微生物,具有生产具有二肽合成活性的蛋白质的能力,并且以下[1]所述的具有将菌体内的二肽转运到菌体外的活性(以下称为二肽转运活性)的蛋白质的活性高于亲本株,
[1]由序列号6~10中任何一者所示的氨基酸序列构成的蛋白质。
2.如权利要求1所述的微生物,其为使用以下[1]~[2]中任一项所述的DNA转化亲本株而得到的微生物,
[1]编码权利要求1的[1]所述的蛋白质的DNA;
[2]由序列号1~5中任何一者所示的碱基序列中的编码区的碱基序列构成的DNA。
3.如权利要求1或2所述的微生物,其为属于埃希氏菌属、棒状杆菌属、芽孢杆菌属、沙雷氏菌属、假单胞菌属或链霉菌属的微生物。
4.一种二肽的制造方法,其中,使水性介质中存在权利要求1~3中任一项所述的微生物的培养物或该培养物的处理物及氨基酸、氨基酸酯或氨基酸酰胺,使二肽在该水性介质中生成、累积,并从该介质中收集该二肽。
5.一种二肽的制造方法,其中,在培养基中培养具有生产构成二肽的氨基酸中至少1种氨基酸的能力的权利要求1或2所述的微生物,使该二肽在培养基中生成、累积,并从培养物中收集该二肽。
6.如权利要求4或5所述的二肽的制造方法,其中,微生物为属于埃希氏菌属、棒状杆菌属、芽孢杆菌属、沙雷氏菌属、假单胞菌属或链霉菌属的微生物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP099956/2007 | 2007-04-06 | ||
JP2007099956 | 2007-04-06 | ||
PCT/JP2008/056758 WO2008126783A1 (ja) | 2007-04-06 | 2008-04-04 | ジペプチドの製造法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101715484A CN101715484A (zh) | 2010-05-26 |
CN101715484B true CN101715484B (zh) | 2014-02-19 |
Family
ID=39863882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880019211.2A Active CN101715484B (zh) | 2007-04-06 | 2008-04-04 | 二肽的制造方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8673590B2 (zh) |
EP (1) | EP2143786B1 (zh) |
JP (1) | JP5319521B2 (zh) |
CN (1) | CN101715484B (zh) |
ES (1) | ES2526490T3 (zh) |
WO (1) | WO2008126783A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2890340A1 (en) * | 2012-11-15 | 2014-05-22 | International Stem Cell Corporation | Differentiation of human fibroblast cells |
CN106480009B (zh) * | 2016-12-25 | 2020-12-11 | 河北周酶生物科技有限公司 | 一种固定化氨基酸酯酰转移酶及在制备丙谷二肽中的应用 |
CN107354207B (zh) * | 2017-07-11 | 2019-12-10 | 大连晶泰生物技术有限公司 | 基于双链探针的液相杂交捕获试剂盒、洗涤试剂盒及其应用 |
KR102251946B1 (ko) * | 2019-10-31 | 2021-05-17 | 대상 주식회사 | yeeO 유전자 불활성에 의해 방향족 아미노산 생산능력이 향상된 균주 |
CN116622795B (zh) * | 2023-07-20 | 2023-10-13 | 凯莱英生命科学技术(天津)有限公司 | L-氨基酸连接酶的制备方法及其在二肽合成上的应用 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5618596A (en) | 1979-07-23 | 1981-02-21 | Ajinomoto Co Inc | Production of l-lysine through fermentation process |
JPS56144092A (en) | 1980-04-14 | 1981-11-10 | Ajinomoto Co Inc | Preparation of l-methionine by fermentation |
DE3127361A1 (de) | 1981-07-08 | 1983-02-03 | Schering Ag, 1000 Berlin Und 4619 Bergkamen | Herstellung und anwendung von plasmiden mit genen fuer die biosynthese von l-prolin |
JPS58110600A (ja) | 1981-12-25 | 1983-07-01 | Kyowa Hakko Kogyo Co Ltd | ヒトβ型インタ−フエロン遺伝子を含む組みかえ体プラスミド |
JPS63233798A (ja) | 1986-10-09 | 1988-09-29 | Kyowa Hakko Kogyo Co Ltd | 5′−グアニル酸の製造法 |
JPS6394985A (ja) | 1986-10-09 | 1988-04-26 | Kyowa Hakko Kogyo Co Ltd | L−チロシンの製造法 |
JP2545078B2 (ja) | 1987-04-06 | 1996-10-16 | 協和醗酵工業株式会社 | 核酸関連物質の製造法 |
JPH02113887A (ja) | 1988-10-21 | 1990-04-26 | Ajinomoto Co Inc | プロリンイミノペプチダーゼをコードする遺伝子を有する組換えdna及び該組換えdnaを有する細胞を用いるプロリンイミノペプチダーゼの製造法 |
ATE219142T1 (de) | 1995-03-07 | 2002-06-15 | Kyowa Hakko Kogyo Kk | Verfahren zur herstellung von trans-4-hydroxy-l- prolin |
DE19539952A1 (de) | 1995-10-26 | 1997-04-30 | Consortium Elektrochem Ind | Verfahren zur Herstellung von O-Acetylserin, L-Cystein und L-Cystein-verwandten Produkten |
JPH09121860A (ja) | 1995-10-31 | 1997-05-13 | Rikagaku Kenkyusho | プロリンイミノペプチダーゼ |
DE19548222A1 (de) | 1995-12-22 | 1997-06-26 | Forschungszentrum Juelich Gmbh | Verfahren zur mikrobiellen Herstellung von Aminosäuren durch gesteigerte Aktivität von Exportcarriern |
AU4220397A (en) | 1996-09-17 | 1998-04-14 | Kyowa Hakko Kogyo Co. Ltd. | Processes for producing sugar nucleotides and complex carbohydrates |
RU2144564C1 (ru) | 1998-10-13 | 2000-01-20 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | ФРАГМЕНТ ДНК rhtB, КОДИРУЮЩИЙ СИНТЕЗ БЕЛКА RhtB, ПРИДАЮЩЕГО УСТОЙЧИВОСТЬ К L-ГОМОСЕРИНУ БАКТЕРИЯМ ESCHERICHIA COLI, И СПОСОБ ПОЛУЧЕНИЯ L-АМИНОКИСЛОТ |
RU2148642C1 (ru) | 1998-12-23 | 2000-05-10 | ЗАО "Научно-исследовательский институт АДЖИНОМОТО-Генетика" (ЗАО "АГРИ") | Фрагмент днк rhtc, кодирующий синтез белка rhtc, придающего повышенную устойчивость к l-треонину бактериям escherichia coli, и способ получения l-аминокислоты |
DE19949579C1 (de) | 1999-10-14 | 2000-11-16 | Consortium Elektrochem Ind | Verfahren zur fermentativen Herstellung von L-Cystein oder L-Cystein-Derivaten |
US7252978B2 (en) | 2001-07-25 | 2007-08-07 | Ajinomoto Co., Inc. | Method for producing L-arginine |
DK1411116T3 (da) | 2001-07-26 | 2008-08-25 | Ajinomoto Kk | Peptidsyntasegen, peptidsyntase samt fremgangsmåde til fremstilling af dipeptid |
RU2230114C2 (ru) | 2001-11-30 | 2004-06-10 | Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" | Мутантная глутаминсинтетаза, фрагмент днк, штамм escherichia coli - продуцент l-глутамина и способ получения l-аминокислот |
KR101043562B1 (ko) | 2002-12-26 | 2011-06-22 | 교와 핫꼬 바이오 가부시키가이샤 | 디펩티드의 제조법 |
US20050106703A1 (en) | 2003-11-05 | 2005-05-19 | Kyowa Hakko Kogyo Co., Ltd. | Microorganisms producing dipeptides and process for producing dipeptides using the microorganisms |
US20050148048A1 (en) | 2003-11-27 | 2005-07-07 | Kyowa Hakko Kogyo Co., Ltd. | Process for producing dipeptides |
EP1698703A4 (en) | 2003-11-28 | 2011-08-17 | Kyowa Hakko Bio Co Ltd | PROCESS FOR DIPEPTIDE PRODUCTION |
ES2331956T3 (es) | 2004-01-30 | 2010-01-21 | Ajinomoto Co., Inc. | Microorganismo que produce l-aminoacidos y procedimiento para producir l-aminoacidos. |
JP4665537B2 (ja) | 2004-01-30 | 2011-04-06 | 味の素株式会社 | L−アミノ酸生産菌及びl−アミノ酸の製造法 |
JP4604537B2 (ja) | 2004-03-31 | 2011-01-05 | 味の素株式会社 | L−システイン生産菌及びl−システインの製造法 |
WO2005103260A1 (ja) | 2004-04-21 | 2005-11-03 | Kyowa Hakko Kogyo Co., Ltd. | ジペプチドの製造法 |
US8257943B2 (en) | 2004-06-25 | 2012-09-04 | Kyowa Hakko Bio Co., Ltd. | Process for producing dipeptides or dipeptide derivatives |
ES2347875T3 (es) | 2004-06-25 | 2010-11-22 | Kyowa Hakko Bio Co., Ltd. | Procedimiento para la produccion de dipeptidos. |
WO2006001381A1 (ja) | 2004-06-25 | 2006-01-05 | Kyowa Hakko Kogyo Co., Ltd. | ジペプチドまたはジペプチド誘導体の製造法 |
-
2008
- 2008-04-04 CN CN200880019211.2A patent/CN101715484B/zh active Active
- 2008-04-04 ES ES08739864.0T patent/ES2526490T3/es active Active
- 2008-04-04 EP EP08739864.0A patent/EP2143786B1/en active Active
- 2008-04-04 US US12/594,903 patent/US8673590B2/en active Active
- 2008-04-04 JP JP2009509317A patent/JP5319521B2/ja active Active
- 2008-04-04 WO PCT/JP2008/056758 patent/WO2008126783A1/ja active Application Filing
Non-Patent Citations (5)
Title |
---|
acute * |
Mo´ |
Mo& * |
Monica Riley等.Escherichia coli K-12: a cooperatively developed annotation snapshot—2005.《Nucleic Acids Research》.2006,第34卷(第1期),1-9. * |
nica A. Delgado等.YojI of Escherichia coli Functions as a Microcin J25 Efflux Pump.《JOURNAL OF BACTERIOLOGY》.2005,第187卷(第10期),3465-3470. * |
Also Published As
Publication number | Publication date |
---|---|
JPWO2008126783A1 (ja) | 2010-07-22 |
CN101715484A (zh) | 2010-05-26 |
EP2143786A4 (en) | 2010-06-16 |
US8673590B2 (en) | 2014-03-18 |
EP2143786B1 (en) | 2014-12-10 |
US20100129867A1 (en) | 2010-05-27 |
WO2008126783A1 (ja) | 2008-10-23 |
JP5319521B2 (ja) | 2013-10-16 |
ES2526490T3 (es) | 2015-01-12 |
EP2143786A1 (en) | 2010-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7939302B2 (en) | Process for producing dipeptides | |
US8623619B2 (en) | Process for producing L-amino acid | |
CN101715490B (zh) | 谷胱甘肽及γ-谷氨酰半胱氨酸的制造方法 | |
US8685914B2 (en) | L-alanyl-L-glutamine crystal | |
CN101715484B (zh) | 二肽的制造方法 | |
ES2622512T3 (es) | Proceso para producir dipéptidos | |
JPWO2005052153A1 (ja) | ジペプチドの製造法 | |
CN115667517A (zh) | 二肽的制造方法 | |
US20100248307A1 (en) | Peptide production method | |
US20070218525A1 (en) | Process for Producing Dipeptides | |
JP2011239707A (ja) | ペプチドの製造法 | |
HK1083345B (zh) | 生產二肽的流程 | |
WO2011083860A1 (ja) | L-アミノ酸の製造法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |