KR20190120238A - 발효에 의한 티라민의 제조를 위해 조작된 생합성 경로 - Google Patents
발효에 의한 티라민의 제조를 위해 조작된 생합성 경로 Download PDFInfo
- Publication number
- KR20190120238A KR20190120238A KR1020197025667A KR20197025667A KR20190120238A KR 20190120238 A KR20190120238 A KR 20190120238A KR 1020197025667 A KR1020197025667 A KR 1020197025667A KR 20197025667 A KR20197025667 A KR 20197025667A KR 20190120238 A KR20190120238 A KR 20190120238A
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- gly
- val
- glu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/001—Amines; Imines
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/001—Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1022—Transferases (2.) transferring aldehyde or ketonic groups (2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1085—Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1205—Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/90—Isomerases (5.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y103/00—Oxidoreductases acting on the CH-CH group of donors (1.3)
- C12Y103/01—Oxidoreductases acting on the CH-CH group of donors (1.3) with NAD+ or NADP+ as acceptor (1.3.1)
- C12Y103/01012—Prephenate dehydrogenase (1.3.1.12)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y202/00—Transferases transferring aldehyde or ketonic groups (2.2)
- C12Y202/01—Transketolases and transaldolases (2.2.1)
- C12Y202/01002—Transaldolase (2.2.1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y205/00—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
- C12Y205/01—Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
- C12Y205/01054—3-Deoxy-7-phosphoheptulonate synthase (2.5.1.54)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y207/00—Transferases transferring phosphorus-containing groups (2.7)
- C12Y207/01—Phosphotransferases with an alcohol group as acceptor (2.7.1)
- C12Y207/01071—Shikimate kinase (2.7.1.71)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01025—Tyrosine decarboxylase (4.1.1.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y504/00—Intramolecular transferases (5.4)
- C12Y504/99—Intramolecular transferases (5.4) transferring other groups (5.4.99)
- C12Y504/99005—Chorismate mutase (5.4.99.5)
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
본 개시 내용은 티라민의 발효적 생성을 위한 미생물 세포의 조작을 기술하고 신규한 조작된 미생물 세포 및 배양물을 비롯하여, 관련된 티라민 제조 방법을 제공한다.
Description
관련 출원에 관한 교차-참조
본 출원은 그 전문을 참조로 본 명세서에 편입시키는, 2017년 2월 6일 출원된 미국 가출원 제62/455,428호의 이득을 청구한다.
연방 정부 지원에 의한 연구 및 개발로 수행된 발명에 관한 진술
본 발명은 DARPA가 수여하는 협약 번호 HR0011-15-9-0014 하의 정부 지원에 의해 수행되었다. 정부는 본 발명의 일정 권리를 갖는다.
서열 목록의 참조 편입
본 출원은 ASCII 형식으로 전자 제출된 서열 목록을 포함하고, 그 전문을 참조로 본 명세서에 편입시킨다. 2018년 2월 6일 생성된 이러한 ASCII 사본은 파일명이 2018-02-05_ZMGNP001WO_seqlist.txt이고 크기는 331,364 바이트이다.
발명의 분야
본 개시 내용은 일반적으로 발효에 의한 티라민의 과생산을 위해 미생물을 조작하는 분야에 관한 것이다.
티라민은 티로신의 디카복실화 생성물로서 자연계에 존재하는 것으로 알려져 있다. 종종 티라민은 단백질이 풍부한 재료가 썩거나 또는 부패하는 과정이나 또는 환경에서 생산된다. 티라민은 단백질-풍부 물질 예컨대 동물의 젖이나 또는 콩과식물의 발효로 생산되는 음식물에 존재한다. 이들 과정은 방향족 아미노산을 함유하는 단백질의 외부 공급원 및 티로신 디카복실라제를 발현하는 미생물에 의존한다.
본 명세서에서 고려되는 다양한 실시형태들은 다음 중 하나 이상을 포함할 수 있으나, 이들에 제한될 필요는 없다:
실시형태 1: 조작된 미생물 세포로서, 조작된 미생물 세포는 (a) 이종성 티로신 디카복실라제 (TYDC)를 발현하고; (b) 조작된 미생물 세포는 티라민 생합성 경로의 하나 이상의 상류 효소(들)의 증가된 활성을 포함하며, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이다.
실시형태 2: 실시형태 1의 조작된 미생물 세포로서, 하나 이상의 상류 효소(들)는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제를 포함한다.
실시형태 3: 조작된 미생물 세포로서, 조작된 미생물 세포는 (a) 이종성 티로신 디카복실라제 (TYDC)를 발현하고; (b) 조작된 미생물 세포는 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소,코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 및 티로신 아미노트랜스퍼라제로 이루어진 군으로부터 선택되는 하나 이상의 효소(들)의 증가된 활성을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이고, 조작된 미생물 세포는 티라민을 생성한다.
실시형태 4: 실시형태 3의 조작된 미생물 세포로서, 조작된 미생물 세포는 추가적으로 (c) 피드백-이상조절된 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제 또는 피드백-이상조절된 코리스메이트 뮤타제를 발현한다.
실시형태 5: 조작된 미생물 세포, 조작된 미생물 세포는 (a) 이종성 티로신 디카복실라제 (TYDC)를 발현하기 위한 수단; 및 (b) 티라민 생합성 경로의 하나 이상의 상류 효소(들)의 활성을 증가시키기 위한 수단을 포함한다.
실시형태 6: 실시형태 5의 조작된 미생물 세포로서, 하나 이상의 상류 효소(들)는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제를 포함한다.
실시형태 7: 조작된 미생물 세포로서, 조작된 미생물 세포는 (a) 이종성 티로신 디카복실라제 (TYDC)를 발현하기 위한 수단; 및 (b) 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 및 티로신 아미노트랜스퍼라제로 이루어진 군으로부터 선택되는 하나 이상의 효소(들)의 활성을 증가시키기 위한 수단을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이고; 조작된 미생물 세포는 티라민을 생성한다.
실시형태 8: 실시형태 7의 조작된 미생물 세포로서, 조작된 미생물 세포는 추가적으로 (c) 피드백-이상조절된 DAHP 신타제 또는 피드백-이상조절된 코리스메이트 뮤타제를 발현하기 위한 수단을 발현한다.
실시형태 9: 실시형태 1 내지 8 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 기질의 발효에 의해 티라민을 생성하고, 기질의 적어도 50%는 단백질 또는 아미노산 공급원으로부터 유래되는 것이 아니다.
실시형태 10: 실시형태 4, 8 또는 9 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 (a) 이종성 TYDC; 및 (b) 피드백-이상조절된 DAHP 신타제를 포함한다.
실시형태 11: 실시형태 3 내지 10 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 진균 세포를 포함한다.
실시형태 12: 실시형태 3 내지 11 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 효모 세포를 포함한다.
실시형태 13: 실시형태 8의 조작된 미생물 세포로서, 효모 세포는 사카로마이세스 (Saccharomyces) 속의 세포를 포함한다.
실시형태 14: 실시형태 13의 조작된 미생물 세포로서, 효모 세포는 세레비지아 (cerevisiae) 종의 세포이다.
실시형태 15: 실시형태 4, 8, 또는 9 내지 14 중 어느 하나의 조작된 미생물 세포로서, DAHP 신타제는 에스. 세레비지아 (S. cerevisiae) DAHP 신타제의 변이체이다.
실시형태 16: 실시형태 3 내지 15 중 어느 하나의 조작된 미생물 세포로서, 이종성 TYDC는 파파베르 솜니페럼 (Papaver somniferum) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함한다.
실시형태 17: 실시형태 4, 8, 또는 9 내지 16 중 어느 하나의 조작된 미생물 세포로서, (a) 이종성 TYDC는 피. 솜니페럼 티로신/DOPA 디카복실라제 2를 포함하고; (b) 피드백-이상조절된 DAHP 신타제는 추가로 K229L 돌연변이를 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제이다.
실시형태 18: 실시형태 3 내지 17 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 대조군 세포에 비해서 프리페네이트 디히드로게나제의 증가된 활성을 포함한다.
실시형태 19: 실시형태 18의 조작된 미생물 세포로서, 조작된 미생물 세포는 야생형 에스. 세레비지아 프리페네이트 디히드로게나제 유전자의 추가 카피를 발현한다.
실시형태 20: 실시형태 18의 조작된 미생물 세포로서, 조작된 미생물 세포는 야생형 에스. 세레비지아 트랜스알돌라제 유전자의 추가 카피를 발현한다.
실시형태 21: 실시형태 2 또는 실시형태 6의 조작된 미생물 세포로서, 조작된 미생물 세포는 효모 세포를 포함한다.
실시형태 22: 실시형태 21의 조작된 미생물 세포로서, 효모 세포는 야로위아 (Yarrowia) 속의 세포를 포함한다.
실시형태 23: 실시형태 22의 조작된 미생물 세포로서, 효모 세포는 리폴리티카 (lipolytica) 종의 세포이다.
실시형태 24: 실시형태 22 또는 실시형태 23의 조작된 미생물 세포로서, 이종성 TYDC는 엔테로코커스 패시움 (Enterococcus faecium) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함한다.
실시형태 25: 실시형태 22 내지 24 중 어느 하나의 조작된 미생물 세포로서, DAHP 신타제는 에스. 세레비지아 유래 DAHP 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 DAHP 신타제를 포함한다.
실시형태 26: 실시형태 25의 조작된 미생물 세포로서, (a) 이종성 TYDC는 이. 패시움 Com15 유래의 피리독살-의존성 디카복실라제 (TYDC)를 포함하고; (b) DAHP 신타제는 에스. 세레비지아 S288c 유래의 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)를 포함한다.
실시형태 27: 파파베르 솜니페럼 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 효모 세포인 조작된 미생물 세포로서, 조작된 효모 세포는 티라민을 생성한다.
실시형태 28: 실시형태 27의 조작된 미생물 세포로서, 조작된 효모 세포는 사카로마이세스 속의 세포이다.
실시형태 29: 실시형태 28의 조작된 미생물 세포로서, 조작된 효모 세포는 세레비지아 종의 세포이다.
실시형태 30: 실시형태 3 내지 10 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 박테리아 세포이다.
실시형태 31: 실시형태 30의 조작된 미생물 세포로서, 박테리아 세포는 코리네박테리아 (Corynebacteria) 속의 세포이다.
실시형태 32: 실시형태 31의 조작된 미생물 세포로서, 박테리아 세포는 글루타미컴 (glutamicum) 종의 세포이다.
실시형태 33: 실시형태 30 내지 32 중 어느 하나의 조작된 미생물 세포로서, 박테리아 세포는 에스. 세레비지아 DAHP 신타제의 변이체인 피드백-이상조절된 DAHP 신타제를 포함한다.
실시형태 34: 실시형태 30 내지 33 중 어느 하나의 조작된 미생물 세포로서, 이종성 TYDC는 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖거나 또는 자이고사카로마이세스 바일리 (Zygosaccharomyces bailii) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함한다.
실시형태 35: 실시형태 33 또는 실시형태 34의 조작된 미생물 세포로서, (a) 이종성 TYDC는 이. 패시움 TYDC를 포함하고; (b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제이다.
실시형태 36: 실시형태 33 또는 실시형태 34의 조작된 미생물 세포로서, (a) 이종성 TYDC는 지. 바일리 (Z. bailii) TYDC를 포함하고; (b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제이다.
실시형태 37: 실시형태 34의 조작된 미생물 세포로서, 대조군 세포에 비해서, 코리스메이트 신타제 또는 프리프레네이트 디히드로게나제의 증가된 활성을 추가로 포함한다.
실시형태 38: 실시형태 37의 조작된 미생물 세포로서, 조작된 미생물 세포는 코리스메이트 신타제의 증가된 활성을 포함하고, 이종성 코리스메이트 신타제를 발현한다.
실시형태 39: 실시형태 38의 조작된 미생물 세포로서, 이종성 코리스메이트 신타제는 에스. 세레비지아 코리스메이트 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 코리스메이트 신타제를 포함한다.
실시형태 40: 실시형태 39의 조작된 미생물 세포로서, 이종성 코리스메이트 신타제는 에스. 세레비지아 코리스메이트 신타제를 포함한다.
실시형태 41: 실시형태 37의 조작된 미생물 세포로서, 조작된 미생물 세포는 프리페네이트 디히드로게나제의 증가된 활성을 포함하고, 프리페네이트 디히드로게나제 유전자의 추가 카피를 발현한다.
실시형태 42: 실시형태 41의 조작된 미생물 세포로서, 프리페네이트 디히드로게나제 유전자의 추가 카피는 에스. 세레비지아 유래 프리페네이트 디히드로게나제와 적어도 70%의 아미노산 서열 동일성을 갖는 프리페네이트 디히드로게나제를 코딩한다.
실시형태 43: 실시형태 42의 조작된 미생물 세포로서, 프리페네이트 디히드로게나제 유전자의 추가 카피는 에스. 세레비지아 유래 프리페네이트 디히드로게나제를 코딩한다.
실시형태 44: 실시형태 2 또는 실시형태 6의 조작된 미생물 세포로서, 조작된 미생물 세포는 박테리아 세포를 포함한다.
실시형태 45: 실시형태 44의 조작된 미생물 세포로서, 박테리아 세포는 코리네박테리움 (Corynebacterium) 또는 바실러스 (Bacillus) 속의 세포를 포함한다.
실시형태 46: 실시형태 45의 조작된 미생물 세포로서, 박테리아 세포는 각각 글루타미컴 (glutamicum) 또는 서브틸리스 (subtilis) 종의 세포이다.
실시형태 47: 실시형태 45 또는 실시형태 46의 조작된 미생물 세포로서, 이종성 TYDC는 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함한다.
실시형태 48: 실시형태 45 내지 47 중 어느 하나의 조작된 미생물 세포로서, DAHP 신타제는 에스. 세레비지아 유래 DAHP 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 DAHP 신타제를 포함한다.
실시형태 49: 실시형태 45 내지 48 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 대조군 세포에 비해 시키메이트 키나제의 증가된 활성을 포함한다.
실시형태 50: 실시형태 49의 조작된 미생물로서, 시키메이트 키나제는 에스케리치아 콜라이 유래 시키메이트 키나제와 적어도 70%의 아미노산 서열 동일성을 갖는 시키메이트 키나제를 포함한다.
실시형태 51: 실시형태 50의 조작된 미생물 세포로서, (a) 이종성 TYDC는 이. 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC)를 포함하고; (b) DAHP 신타제는 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)를 포함하고; (c) 시키메이트 키나제는 이. 콜라이 K12 유래 시키메이트 키나제를 포함한다.
실시형태 52: 실시형태 13 내지 43 중 어느 하나의 조작된 미생물 세포로서, 배양시, 조작된 미생물 세포는 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 생성한다.
실시형태 53: 실시형태 52의 조작된 미생물 세포로서, 조작된 미생물 세포는 적어도 2.5 g/배양 배지의 L의 수준으로 티라민을 생성한다.
실시형태 54: 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 박테리아 세포인 조작된 미생물 세포로서, 조작된 박테리아 세포는 티라민을 생성한다.
실시형태 55: 실시형태 54의 조작된 미생물 세포로서, 박테리아 세포는 코리네박테리아 속의 것이다.
실시형태 56: 실시형태 55의 조작된 미생물 세포로서, 박테리아 세포는 글루타미컴 종의 것이다.
실시형태 57: 자이고사카로마이세스 바일리 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 박테리아 세포인 조작된 미생물 세포로서, 조작된 박테리아 세포는 티라민을 생성한다.
실시형태 58: 실시형태 57의 조작된 미생물 세포로서, 박테리아 세포는 코리네박테리아 속의 것이다.
실시형태 59: 실시형태 58의 조작된 미생물 세포로서, 박테리아 세포는 글루타미컴 종의 것이다.
실시형태 60: 실시형태 13 내지 59 중 어느 하나에 따른 조작된 미생물 세포의 배양물.
실시형태 61: 실시형태 60의 배양물로서, 티라민은 기질의 발효로부터 생성되고, 기질의 적어도 50%는 단백질 또는 아미노산 공급원으로부터 유래하는 것이 아니다.
실시형태 62: 실시형태 61의 배양물로서, 기질은 우레아, 암모늄 염, 암모니아, 및 이의 임의 조합으로 이루어진 군으로부터 선택되는 질소원 및 탄소원을 포함한다.
실시형태 63: 실시형태 60 내지 62 중 어느 하나의 배양물로서, 조작된 미생물 세포는 배양물이 10 내지 600의 600 nm에서의 광학 밀도를 갖는 농도로 존재한다.
실시형태 64: 실시형태 60 내지 63 중 어느 하나의 배양물로서, 배양물은 티라민을 포함한다.
실시형태 65: 실시형태 60 내지 64 중 어느 하나의 배양물로서, 배양물은 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 포함한다.
실시형태 66: 실시형태 60 내지 65 중 어느 하나의 배양물로서, 배양물은 적어도 2.5 g/배양 배지의 L의 수준으로 티라민을 포함한다.
실시형태 67: 실시형태 1 내지 59 중 어느 하나에 따른 조작된 미생물 세포를 배양하는 방법으로서, 방법은 비단백질 탄소 및 비단백질 질소 공급원을 포함하는 발효 기질의 존재 하에서 세포를 배양하는 단계를 포함하고, 조작된 미생물 세포는 티라민을 생성한다.
실시형태 68: 실시형태 67의 방법으로서, 방법은 1 내지 100 g/L 범위의 초기 포도당 수준과, 이후 당류 공급 제어가 후속되는 유가식 배양을 포함한다.
실시형태 69: 실시형태 67 또는 실시형태 68의 방법으로서, 발효 기질은 우레아, 암모늄 염, 암모니아, 및 이의 임의 조합으로 이루어진 군으로부터 선택되는 질소원 및 포도당을 포함한다.
실시형태 70: 실시형태 67 내지 69 중 어느 하나의 방법으로서, 배양물은 배양 단계 동안 pH-제어된다.
실시형태 71: 실시형태 67 내지 70 중 어느 하나의 방법으로서, 배양물은 배양 단계 동안 통기된다.
실시형태 72: 실시형태 67 내지 71 중 어느 하나의 방법으로서, 조작된 미생물 세포는 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 생성한다.
실시형태 73: 실시형태 67 내지 72 중 어느 하나의 방법으로서, 조작된 미생물 세포는 적어도 2.5 g/배양 배지의 L 의 수준으로 티라민을 생성한다.
실시형태 74: 실시형태 67 내지 73 중 어느 하나의 방법으로서, 방법은 배양물로부터 티라민을 회수하는 단계를 추가로 포함한다.
도 1: 발효에 의한 티라민의 생성 경로.
도 2: 에스. 세레비지아 균주를 조작하기 위해 개발된, "분할-마커, 이중-크로스오버" 게놈 통합 전략. 상보성 5' 및 3' 상동성 팔부 및 URA3 선별 마커의 중복된 절반 (해시 막대로 표시된 직접 반복부)을 갖는 2개 플라스미드는 메가뉴클레아제로 분해시켰고 선형 단편으로서 형질전환되었다. 삼중-크로스오버 사건은 바람직한 이종성 유전자를 표적화된 유전자좌에 통합시켰고 전체 URA3 유전자를 재구성시켰다. 이러한 통합 사건으로부터 유래된 콜로니는 5' 및 3' 접합부 둘 모두를 확인하기 위해서 2개 3-프라이머 (UF/IF/wt-R 및 DR/IF/wt-F) 반응을 사용하여 어세이되었다. 실시예 1을 참조한다.
도 3: 씨. 글루타미컴 균주를 조작하기 위해 개발된 "루프-인, 단일-크로스오버" 게놈 통합 전략. 루프-인 단독 구성체 (제목 "루프-인"으로 표시)는 단일 2-kb 상동성 팔부 ("통합 유전자좌"로 표시), 양성 선별 마커 ("마커"로 표시)), 및 관심 유전자(들) ("프로모터-유전자-종결인자"로 표시)를 함유하였다. 단일 크로스오버 사건은 플라스미드를 씨. 글루타미컴 염색체에 통합시켰다. 통합 사건은 항생제 (예를 들어, 25 ㎍/㎖ 카나마이신)의 존재 하에서 성장에 의해 게놈에서 안정하게 유지된다. 루프-인 통합으로부터 유래된 콜로니 중 올바른 게놈 통합은 UF/IR 및 DR/IF PCR 프라이머를 사용한 콜로니 PCR에 의해 확인하였다. 루프-인, 루프-아웃 구성체 (제목 "루프-인, 루프-아웃으로 표시)는 2개 2-kb 상동성 팔부 (5' 및 3' 팔부), 관심 유전자(들) (화살표), 양성 선별 마커 ("마커"로 표시됨), 및 역선별 마커를 함유하였다. "루프-인" 단독 구성체와 유사하게, 단일 크로스오버 사건은 플라스미드를 씨. 글루타미컴의 염색체에 통합시켰다. 주: 2가지 가능한 통합 중 오직 하나만 여기에 도시되어 있다. 올바른 게놈 통합은 콜로니 PCR에 의해 확인되었고 역선별은 플라스미드 골격 및 역선별 마커가 절개될 수 있도록 적용되었다. 이러한 결과로 2가지 가능성 중 하나가 발생된다: 야생형으로의 복귀 또는 바람직한 경로 통합. 역시, 올바른 게놈 루프-아웃은 콜로니 PCR로 확인된다. (약어: 프라이머: UF = 상류 전방향, DR = 하류 역방향, IR = 내부 역방향, IF = 내부 전방향). 실시예 1을 참조한다.
도 4A-4C: 도 4A는 티라민을 생성시키도록 조작된 에스. 세레비지아의 배양을 위한 상이한 공정 조건 하에서 배양 시간의 함수에 따른 생물량의 그래프를 도시한다. 이 데이타는 실시예 2에 기술된 실험에 의한 것이다. 도 4B는 동일한 배양에 대한 티라민 역가를 도시한다. 도 4C는 배양 시간의 함수에 따른 이 배양물 중 포도당 농도를 도시한다.
도 5: 1회차 조작된 숙주 야로위아 리폴리티카에 의한 발효 이후 세포외 액체배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 6: 1회차 조작된 숙주 바실러스 서브틸리스에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 7: 티라민의 생성을 위해 숙주 평가 디자인을 발현하도록 조작된 숙주 에스. 세레비지아에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가.
도 8: 티라민의 생성을 위해 숙주 평가 디자인을 발현하도록 조작된 숙주 씨. 글루타미컴에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가.
도 9: (3회차) 조작된 숙주 에스. 세레비지아에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 10: 티라민의 구조.
도 2: 에스. 세레비지아 균주를 조작하기 위해 개발된, "분할-마커, 이중-크로스오버" 게놈 통합 전략. 상보성 5' 및 3' 상동성 팔부 및 URA3 선별 마커의 중복된 절반 (해시 막대로 표시된 직접 반복부)을 갖는 2개 플라스미드는 메가뉴클레아제로 분해시켰고 선형 단편으로서 형질전환되었다. 삼중-크로스오버 사건은 바람직한 이종성 유전자를 표적화된 유전자좌에 통합시켰고 전체 URA3 유전자를 재구성시켰다. 이러한 통합 사건으로부터 유래된 콜로니는 5' 및 3' 접합부 둘 모두를 확인하기 위해서 2개 3-프라이머 (UF/IF/wt-R 및 DR/IF/wt-F) 반응을 사용하여 어세이되었다. 실시예 1을 참조한다.
도 3: 씨. 글루타미컴 균주를 조작하기 위해 개발된 "루프-인, 단일-크로스오버" 게놈 통합 전략. 루프-인 단독 구성체 (제목 "루프-인"으로 표시)는 단일 2-kb 상동성 팔부 ("통합 유전자좌"로 표시), 양성 선별 마커 ("마커"로 표시)), 및 관심 유전자(들) ("프로모터-유전자-종결인자"로 표시)를 함유하였다. 단일 크로스오버 사건은 플라스미드를 씨. 글루타미컴 염색체에 통합시켰다. 통합 사건은 항생제 (예를 들어, 25 ㎍/㎖ 카나마이신)의 존재 하에서 성장에 의해 게놈에서 안정하게 유지된다. 루프-인 통합으로부터 유래된 콜로니 중 올바른 게놈 통합은 UF/IR 및 DR/IF PCR 프라이머를 사용한 콜로니 PCR에 의해 확인하였다. 루프-인, 루프-아웃 구성체 (제목 "루프-인, 루프-아웃으로 표시)는 2개 2-kb 상동성 팔부 (5' 및 3' 팔부), 관심 유전자(들) (화살표), 양성 선별 마커 ("마커"로 표시됨), 및 역선별 마커를 함유하였다. "루프-인" 단독 구성체와 유사하게, 단일 크로스오버 사건은 플라스미드를 씨. 글루타미컴의 염색체에 통합시켰다. 주: 2가지 가능한 통합 중 오직 하나만 여기에 도시되어 있다. 올바른 게놈 통합은 콜로니 PCR에 의해 확인되었고 역선별은 플라스미드 골격 및 역선별 마커가 절개될 수 있도록 적용되었다. 이러한 결과로 2가지 가능성 중 하나가 발생된다: 야생형으로의 복귀 또는 바람직한 경로 통합. 역시, 올바른 게놈 루프-아웃은 콜로니 PCR로 확인된다. (약어: 프라이머: UF = 상류 전방향, DR = 하류 역방향, IR = 내부 역방향, IF = 내부 전방향). 실시예 1을 참조한다.
도 4A-4C: 도 4A는 티라민을 생성시키도록 조작된 에스. 세레비지아의 배양을 위한 상이한 공정 조건 하에서 배양 시간의 함수에 따른 생물량의 그래프를 도시한다. 이 데이타는 실시예 2에 기술된 실험에 의한 것이다. 도 4B는 동일한 배양에 대한 티라민 역가를 도시한다. 도 4C는 배양 시간의 함수에 따른 이 배양물 중 포도당 농도를 도시한다.
도 5: 1회차 조작된 숙주 야로위아 리폴리티카에 의한 발효 이후 세포외 액체배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 6: 1회차 조작된 숙주 바실러스 서브틸리스에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 7: 티라민의 생성을 위해 숙주 평가 디자인을 발현하도록 조작된 숙주 에스. 세레비지아에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가.
도 8: 티라민의 생성을 위해 숙주 평가 디자인을 발현하도록 조작된 숙주 씨. 글루타미컴에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가.
도 9: (3회차) 조작된 숙주 에스. 세레비지아에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 10: 티라민의 구조.
본 개시 내용은 티라민의 발효적 생성을 위한 미생물 세포의 조작을 기술하고, 신규한 조작된 미생물 세포 및 배양물을 비롯하여, 관련된 티라민 제조 방법을 제공한다.
정의
청구항 및 명세서에서 사용되는 용어는 달리 명시하지 않으면 하기 기재된 바와 같이 정의된다.
용어 "발효"는 임의의 화학적 전환 단계를 필요로 하지 않고, 하나 이상의 생물학적 전환 단계를 통해서 미생물 세포가 하나 이상의 기질(들)을 바람직한 생성물 (예컨대 티라민)로 전환시키는 과정을 의미하고자 본 명세서에서 사용된다.
용어 "조작된"은 세포에 대해서, 그 세포가 천연 발생 세포로부터 조작된 세포를 구별하는 인간에 의해 도입된 적어도 하나의 표적화된 유전자 변경을 함유한다는 것을 의미하기 위해 본 명세서에서 사용된다.
용어 "내생성"은 특정 세포에 천연적으로 존재하는 세포 성분, 예컨대 폴리뉴클레오티드 또는 폴리펩티드를 의미하고자 본 명세서에서 사용된다.
용어 "이종성"은 숙주 세포에 도입된 폴리뉴클레오티드 또는 폴리펩티드에 대해서, 개별적으로, 숙주 세포의 것 이외의 상이한 유기체, 종, 또는 균주로부터 유래된 폴리뉴클레오티드 또는 폴리펩티드를 의미하고자 본 명세서에서 사용된다. 이종성 폴리뉴클레오티드 또는 폴리펩티드는 동일한 숙주 세포에 존재하는 임의의 서열(들)과 상이한 서열을 갖는다.
폴리펩티드와 관련하여 사용시, 용어 "야생형"은 분자의 공급원과 무관하게, 천연 발생 유기체 유래의 폴리펩티드에 존재하는 아미노산 서열을 갖는 임의의 폴리펩티드를 의미하며; 다시 말해서, 용어 "야생형"은 분자가 천연 공급원으로부터 정제되는지, 재조합적으로 발현된 후에 정제되는지, 또는 합성되는지 여부와 무관하게, 서열 특징을 의미한다. 용어 야생형은 또한 천연 발생 세포를 의미하고자 사용된다.
"대조군 세포"는 조작된 세포와 동일한 속 및 종인 것을 포함하여, 시험되는 조작된 세포와 동일하지만, 조작된 세포에서 시험하는 특별한 유전자 변형(들)은 결여된 세포이다.
본 명세서에서 효소는 그들이 촉매하는 반응으로 식별되고, 달리 표시하지 않으면, 식별된 반응을 촉매할 수 있는 임의의 폴리펩티드를 의미한다. 달리 표시하지 않으면, 효소는 임의의 유기체로부터 유래될 수 있고 천연 발생되거나 또는 돌연변이된 아미노산 서열을 가질 수 있다. 충분히 공지된 바와 같이, 효소는 때때로 그들이 유래되는 공급 유기체에 따라서 다수의 기능 및/또는 수의 명칭을 가질 수 있다. 본 명세서에서 사용되는 효소 명칭은 하나 이상의 추가적인 기능을 가질 수 있는 효소를 포함하여, 오르쏘로그 또는 상이한 명칭을 포괄한다.
용어 "피드백-이상조절된"은 특정한 세포에서 효소 경로의 하류 생성물에 의해 정상적으로 음성적으로 조절되는 효소 (즉, 피드백-억제)와 관련하여 본 명세서에서 사용된다. 본 문맥에서, "피드백-이상조절된" 효소는 세포에 내생성인 야생형 효소보다 피드백-억제에 덜 민감한 효소의 형태이다. 피드백-이상조절된 효소는 하나 이상의 돌연변이를 야생형 효소에 도입시켜 생성될 수 있다. 대안적으로, 피드백-이상조절된 효소는 간단히 특정한 미생물 세포에 도입시, 내생성, 야생형 효소만큼 피드백-억제에 민감하지 않은 이종성, 야생형 효소일 수 있다. 일부 실시형태에서, 피드백-이상조절된 효소는 미생물 세포에서 피드백-억제를 보이지 않는다.
용어 "티라민"은 4-(2-아미노에틸)페놀 (CAS#51-67-2)을 의미한다.
둘 이상의 아미노산 또는 뉴클레오티드 서열의 상황에서, 용어 "서열 동일성"은 서열 비교 알고리즘 또는 육안 검사를 사용해 측정시에, 최대 일치도로 비교 및 정렬할 때, 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 백분율을 갖거나 또는 동일한 둘 이상의 서열을 의미한다.
뉴클레오티드 또는 아미노산 서열 동일성 백분율을 결정하기 위한 서열 비교의 경우에, 전형적으로 한 서열은 "시험" 서열이 비교되는, "기준 서열"로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열이 컴퓨터에 입력되고, 필요하면, 하위서열 좌표가 지정되며, 서열 알고리즘 프로그램 매개변수가 지정된다. 그러고 나면, 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로, 기준 서열에 대한 시험 서열의 서열 동일성 백분율을 계산한다. 비교를 위한 서열의 정렬은 디폴트 매개변수로 설정된 BLAST를 사용해 수행될 수 있다.
본 명세서에서 사용되는 용어 "역가"는 배양 부피로 나눈 미생물 세포의 배양물에 의해 생성된 생성물 (예를 들어, 티라민)의 질량을 의미한다.
세포 배양물로부터 티라민을 회수하는 단계와 관련하여 본 명세서에서 사용시, "회수하는"은 세포 배양 배지의 적어도 하나의 다른 성분으로부터 티라민을 분리시키는 것을 의미한다.
티라민 생성을 위해 조작된 미생물
티라민 생합성 경로
티라민은 전구체 포스포에놀피루베이트 (PEP) 및 에리쓰로스-4-포스페이트 (E4P)를 기반으로, 아미노산 생합성의 방향족 분지로부터 유래된다. 이러한 경로는 도 1에 예시되어 있다. 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제에 의해 촉매되는, 아미노산 생합성 경로의 제1 단계는 방향족 아미노산 티로신, 트립토판 및 페닐알라닌에 의한 피드백 억제를 겪는다. 많은 미생물은 이러한 경로의 최종 단계를 촉매하는 효소, 즉 티로신 디카복실라제 (TYDC)가 결여되어 있다. 이러한 미생물 숙주에서 티라민의 생성은 적어도 하나의 이종성 TYDC 효소의 첨가를 필요로 한다.
미생물 티라민 생성을 위한 조작
조작되는 미생물 세포에서 활성인 임의의 TYDC는 전형적으로 표준 유전자 조작 기술을 사용하여 효소를 코딩하는 유전자를 도입시켜 발현시킴으로써 세포로 도입될 수 있다. 적합한 TYDC는 식물, 고세균, 진균, 그람-양성 박테리아 및 그람-음성 박테리아 공급원을 포함하는 임의의 공급원으로부터 유래될 수 있다. 예시적인 공급원은 제한없이 파파베르 솜니페럼 (Papaver somniferum), 페트로셀리늄 크리스펌 (Petroselinum crispum), 오리자 사티바 (Oryza sativa), 메타노스파에룰라 팔루스트리스 (Methanosphaerula palustris), 메타노칼도코커스 잔나시 (Methanocaldococcus jannaschii), 자이고사카로마이세스 바일리 (Zygosaccharomyces bailii), 페니실리움 마르네페이 (Penicillium marneffei), 탈라로마이세스 스티피타터스 (Talaromyces stipitatus), 트리코피톤 에퀴넘 (Trichophyton equinum), 프로피오니박테리움 (Propionibacterium) 종 경구 분류군, 엔테로코커스 패시움 (Enterococcus faecium), 스트렙토마이세스 히그로스코피커스 (Streptomyces hygroscopicus), 스트렙토마이세스 스비세우스 (Streptomyces sviceus), 모데스토박터 마리너스 (Modestobacter marinus), 슈도모나스 푸티다 (Pseudomonas putida), 시노리조비움 프레디 (Sinorhizobium fredii)를 포함한다. 일부 공급원, 예컨대 피. 솜니페럼은 하나를 초과하는 TYDC를 포함할 수 있고, 이들 중 어느 하나가 본 명세서에 기술된 방법에서 사용될 수 있다.
TYDC의 하나 이상의 카피가 선택된 미생물 숙주 세포에 도입될 수 있다. TYDC 유전자의 하나를 초과하는 카피가 도입되면, 카피들은 동일하거나 또는 상이한 TYDC 유전자의 카피일 수 있다. 일부 실시형태에서, 이종성 TYDC 유전자(들)는 강력한 항상성 프로모터로부터 발현된다. 일부 실시형태에서, 이종성 TYDC 유전자(들)는 유도성 프로모터로부터 발현된다. 임의로 이종성 유전자는 선택된 미생물 숙주 세포에서 발현을 증강시키기 위해 코돈-최적화될 수 있다. 코돈-최적화 표는 일반적인 미생물 숙주 세포로부터 입수가능하다. 실시예에서 사용된 코돈-최적화 표는 다음과 같다: 바실러스 서브틸리스 카즈사 코돈 표: www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=1423&aa=1&style=N; 야로위아 리폴리티카 카즈사 코돈 표: www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=4952&aa=1&style=N; 코리네박테리아 글루타미컴 카즈사 코돈 표: www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=340322&aa=1&style=N; 사카로마이세스 세레비지아 카즈사 코돈 표: http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=4932&aa=1&style=N. 또한 하기에서 재현된, 에스. 세레비지아 및 씨. 글루타미컴에 대한 변형된, 조합 용법 계획도 사용되었다.
실시예 1에서, 씨. 글루타미컴은 80 ㎍/L의 티라민 역가를 산출하는 이. 패시움 유래 TYDC (SEQ ID NO: 1)를 발현하도록 조작되었다.
증가된 티라민 생성을 위한 조작
내생성 상류 효소의 활성 증가
이종성 TYDC를 발현하는 미생물 세포에서 티라민 생성을 증가시키기 위한 한가지 접근법은 티라민 생합성 경로의 하나 이상의 상류 효소의 활성을 증가시키는 것이다. 상류 경로 효소는 공급원료로부터 완전히 티로신으로의 전환에 관여되는 모든 효소를 포함한다. 일정 실시형태에서, 상류 경로 효소는 특히 티라민으로 이어지는 경로에서 핵심 전구체 (즉, E4P 및 PEP)의 마지막 천연 대사산물 (즉, 티로신)로의 전환에 관여되는 효소를 의미한다. 일부 실시형태에서, 하나 이상의 상류 경로 효소의 활성은 내생성 효소(들)의 발현 또는 활성을 조정하여 증가된다. 일부 실시형태에서, 하나 이상의 상류 경로 효소의 활성은 TYDC-발현 미생물 숙주 세포로 해당 유전자 중 하나 이상의 도입에 의해 보충된다. 이러한 유전자는 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 방향족 아미노산 트랜스퍼라제 예컨대 티로신 아미노트랜스퍼라제, 글리세르알데히드-3-포스페이트 디히드로게나제, 트랜스알돌라제, 트랜스케톨라제, DAHP 신타제, 포스포에놀피루베이트 신타제, 글루타메이트 신타제를 코딩하는 것들을 포함한다. 적합한 상류 경로 유전자는 예를 들어 이종성 TYDC 유전자의 공급원으로서 상기에 기술된 것들을 포함하여, 임의 공급원으로부터 유래될 수 있다.
실시예 1은 상류 유전자로서, 코리스메이트 신타제 또는 프리페네이트 디히드로게나제를 코딩하는 도입된 유전자와 함께, 이종성 TYDC를 발현하기 위한 미생물 숙주 세포의 성공적 조작을 기술한다. 특히, 에스. 세레비지아는 피. 솜니페럼 (SEQ ID NO:2) 유래 TYDC 및 코리스메이트 신타제 (SEQ ID NO:3) 또는 프리페네이트 디히드로게나제 (SEQ ID NO:4)를 코딩하는 에스. 세레비지아 유전자의 추가 카피를 발현하도록 조작되었다. 결과는 하기 실시예 1에 제공된다.
도입된 상류 경로 유전자는 이종성일 수 있거나 또는 단순히 내생성 유전자의 추가 카피일 수 있다. 일부 실시형태에서, 하나 이상의 이러한 유전자는 TYDC-발현 미생물 숙주 세포로 도입되어 강력한 항상성 프로모터로부터 발현되고/되거나 임의로 선택된 미생물 숙주 세포에서의 발현을 증강시키도록 코돈-최적화될 수 있다. TYDC-발현 미생물 세포는 예를 들어 하나 이상의 상류 경로 유전자의 하나 이상의 카피를 발현하도록 조작될 수 있다.
다양한 실시형태에서, 하나 이상의 상류 경로 효소의 활성을 증가시키기 위한 TYDC-발현 미생물 세포의 조작은 티라민 역가를 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90% 또는 적어도 2-배, 2.5-배, 3-배, 3.5-배, 4-배, 4.5-배, 5-배, 5.5-배, 6-배, 6.5-배, 7-배, 7.5-배, 8-배, 8.5-배, 9-배, 9.5-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 21-배, 22-배, 23-배, 24-배, 25-배, 30-배, 35-배, 40-배, 45-배, 50-배, 55-배, 60-배, 65-배, 70-배, 75-배, 80-배, 85-배, 90-배, 95-배, 또는 100배 까지 증가시킨다. 다양한 실시형태에서, 티라민 역가의 증가는 10% 내지 100-배, 2-배 내지 50-배, 5-배 내지 40-배, 10-배 내지 30-배의 범위이거나, 또는 상기 열거된 임의 값으로 한정되는 임의 범위이다. (본 명세서에서 범위는 그들 종료점을 포함함). 이들 증가는 상류 경로 효소의 활성에서 임의의 증가가 결여된 티라민-생성 미생물 세포에서 관찰되는 티라민 역가와 비교하여 결정된다. 이러한 기준 세포는 티라민 생성 증가를 목표로 하는 하나 이상의 다른 유전자 변경을 가질 수 있으며, 예를 들어 세포는 피드백-이상조절된 효소를 발현할 수 있다.
다양한 실시형태에서, 하나 이상의 상류 경로 유전자의 활성을 증가시켜 획득되는 티라민 역가는 적어도 10, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 또는 900 ㎎/L 또는 적어도 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 또는 10 gm/L이다. 다양한 실시형태에서, 역가는 10 ㎎/L 내지 10 gm/L, 100 ㎎/L 내지 5 gm/L, 200 ㎎/L 내지 4 gm/L, 300 ㎎/L 내지 3 gm/L 범위이거나, 또는 상기 열거된 임의 값으로 한정된 임의 범위이다.
피드백-이상조절된 효소의 도입
방향족 아미노산 생합성이 피드백 억제를 겪기 때문에, 이종성 TYDC를 발현하도록 조작된 미생물 세포에서 티라민 생성을 증가시키기 위한 다른 접근법은 정상적으로 TYDC-발현 미생물 세포에서 피드백 억제를 겪는 하나 이상의 효소의 피드백-이상조절된 형태를 도입하는 것이다. 이러한 효소의 예는 DAHP 신타제 및 코리스메이트 뮤타제를 포함한다. 피드백-이상조절된 형태는 특정한 미생물 숙주 세포에서 내생성 효소보다 피드백 억제에 덜 민감한 이종성, 야생형 효소일 수 있다. 대안적으로, 피드백-이상조절된 형태는 상응하는 야생형 효소보다 피드백 억제에 대해 덜 민감하게 만드는 하나 이상의 돌연변이를 갖는 내생성 또는 이종성 효소의 변이체일 수 있다. 후자의 예는 그들을 피드백 억제에 내성이게 만드는 기지의 점 돌연변이를 갖는 변이체 DAHP 신타제 (에스. 세레비지아로부터 2종, 이. 콜라이로부터 1종), 예를 들어, 에스. 세레비지아 ARO4Q166K (SEQ ID NO:5), 에스. 세레비지아 ARO4K229L (SEQ ID NO:6), 및 이. 콜라이 AroGD146N (SEQ ID NO:7)을 포함한다. 이들 명칭의 마지막 5 글자는 아미노산 치환을 의미하는 것으로서, 아미노산에 대한 표준 1-글자 코드를 사용하여, 처음 글자는 야생형 잔기를 의미하고, 마지막 글자는 치환 잔기를 의미하며, 번호는 번역된 단백질 중 아미노산 치환의 위치를 의미한다.
실시예 1은 피드백-이상조절된 DAHP 신타제를 코딩하는 도입된 유전자와 함께, 이종성 TYDC를 발현하기 위한 진균 및 박테리아 숙주 세포의 성공적인 조작을 기술한다. 특히, 에스. 세레비지아는 387 ㎍/L의 티라민 역가를 제공하는 피. 솜니페럼 (SEQ ID NO:2) 및 에스. 세레비지아 ARO4K229L (SEQ ID NO:6) 유래 TYDC 2를 발현하도록 조작되었다.
다양한 실시형태에서, 피드백-이상조절된 효소를 발현하기 위한 TYDC-발현 미생물 세포의 조작은 티라민 역가를 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90% 또는 적어도 2-배, 2.5-배, 3-배, 3.5-배, 4-배, 4.5-배, 5-배, 5.5-배, 6-배, 6.5-배, 7-배, 7.5-배, 8-배, 8.5-배, 9-배, 9.5-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 21-배, 22-배, 23-배, 24-배, 25-배, 30-배, 35-배, 40-배, 45-배, 50-배, 55-배, 60-배, 65-배, 70-배, 75-배, 80-배, 85-배, 90-배, 95-배, 또는 100-배까지 증가시킨다. 다양한 실시형태에서, 티라민 역가의 증가는 10% 내지 100-배, 2-배 내지 50-배, 5-배 내지 40-배, 10-배 내지 30-배의 범위, 또는 상기 열거된 임의 값으로 한정되는 임의 범위이다. 이들 증가는 피드백-이상조절된 효소를 발현하지 않는 티라민-생성 미생물 세포에서 관찰되는 티라민 역가와 비교하여 결정된다. 이러한 기준 세포는 티라민 생성 증가를 목표로 하는 다른 유전자 변경을 가질 수 있고 (그러나, 그럴 필요는 없음), 즉 세포는 피드백-무감응성보다는 일부 수단으로 초래되는 상류 경로 효소의 증가된 활성을 가질 수 있다.
다양한 실시형태에서, 티라민 생합성 경로를 통한 흐름을 증가시키기 위해 피드백-이상조절된 효소를 사용하여 획득된 티라민 역가는 적어도 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 또는 900 ㎎/L 또는 적어도 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 또는 5 gm/L이다. 다양한 실시형태에서, 역가는 100 ㎎/L 내지 5 gm/L, 200 ㎎/L 내지 4 gm/L, 300 ㎎/L 내지 3 gm/L의 범위이거나, 또는 상기 열거된 임의 값으로 한정된 임의 범위이다.
하나 이상의 내생성 효소의 활성을 보충하고/하거나 하나 이상의 피드백-이상조절된 효소를 도입시키는 접근법은 심지어 더 높은 티라민 생성 수준을 획득하하기 위해 TYDC-발현 미생물 세포에서 조합될 수 있다.
미생물 숙주 세포
도입된 유전자를 발현시키기 위해 사용할 수 있는 임의의 미생물은 상기 기술된 바와 같은 티라민의 발효적 생성을 위해 조작될 수 있다. 일정 실시형태에서, 미생물은 티라민의 발효적 생성이 천연적으로 가능하지 않은 것이다. 일부 실시형태에서, 미생물은 쉽게 배양되는 것, 예컨대, 예를 들어, 관심 화합물의 발효적 생성에서 숙주 세포로서 유용하다고 알려진 미생물이다. 그람 양성 또는 그람 음성 박테리아를 포함하는 박테리아 세포가 상기 기술된 바와 같이 조작될 수 있다. 예로는 씨. 글루타미컴 세포 이외에도, 피. 시트레아 (P. citrea), 비. 서브틸리스 (B. subtilis), 비. 리체니포르미스 (B. licheniformis), 비. 렌터스 (B. lentus), 비. 브레비스 (B. brevis), 비. 스테아로써모필러스 (B. stearothermophilus), 비. 알칼로필러스 (B. alkalophilus), 비. 아밀로리케파시엔스 (B. amyloliquefaciens), 비. 클라우시 (B. clausii), 비. 할로두란스 (B. halodurans), 비. 메가테리움 (B. megaterium), 비. 코아굴란스 (B. coagulans), 비. 서쿨란스 (B. circulans), 비. 라우터스 (B. lautus), 비. 투린지엔시스 (B. thuringiensis), 에스. 알부스 (S. albus), 에스. 리비단스 (S. lividans), 에스. 코엘리콜로르 (S. coelicolor), 에스. 그리세우스 (S. griseus), 슈도모나스 (Pseudomonas) sp., 피. 알칼리제네스 (P. alcaligenes), 락토바실리스 (Lactobacilis) sp., 예컨대 엘. 락티스 (L. lactis), 엘. 플란타럼 (L. plantarum), 엘. 그라이 (L. grayi), 이. 콜라이 (E. coli), 이. 패시움 (E. faecium), 이. 갈리나럼 (E. gallinarum), 이. 카셀리플라버스 (E. casseliflavus), 및/또는 이. 패칼리스 (E. faecalis) 세포를 포함한다.
본 명세서에 기술된 방법에서 미생물 숙주 세포로서 사용할 수 있는 많은 유형의 혐기성 세포가 존재한다. 일부 실시형태에서, 미생물 세포는 절대 혐기성 세포이다. 절대 혐기성 미생물은 전형적으로 성장하더라도, 산소가 존재하는 조건 하에서는 충분히 성장하지 않는다. 소량의 산소가 존재할 수 있으며, 즉, 절대 혐기성 미생물이 낮은 수준의 산소에 대해서 약간의 내성 수준이 존재한다는 것을 이해해야 한다. 상기 기술된 바와 같이 조작된 절대 혐기성 미생물은 실질적으로 무산소 조건 하에서 성장될 수 있으며, 여기서 존재하는 산소의 양은 혐기성 미생물의 성장, 유지 및/또는 발효에 유해하지 않다.
대안적으로, 본 명세서에 기술된 방법에서 사용되는 미생물은 조건적 혐기성 세포일 수 있다. 조건적 혐기성 미생물은 산소가 존재하면 통기성 호흡 (예를 들어, TCA 사이클의 이용)을 통해 세포 ATP를 발생시킬 수 있다. 그러나, 조건적 혐기성 미생물은 또한 산소의 부재 하에서도 성장할 수 있다. 상기 기술된 바와 같이 조작된 조건적 혐기성 미생물은 실질적으로 무산소 조건 하에서 성장될 수 있고, 여기서 존재하는 산소의 양은 혐기성 미생물의 성장, 유지, 및/또는 발효에 유해하지 않거나, 또는 대안적으로 상당량의 산소의 존재 하에서 성장될 수 있다.
일부 실시형태에서, 본 명세서에서 기술된 방법에서 사용되는 미생물 숙주 세포는 섬유상 진균 세포이다 (예를 들어, Berka & Barnett, Biotechnology Advances, (1989), 7(2):127-154 참조). 예에는 트리코더마 롱기브라키아텀 (Trichoderma longibrachiatum), 티. 비리데 (T. viride), 티. 코닌지 (T. koningii), 티. 하르지아넘 (T. harzianum), 페니실륨 (Penicillium) sp., 후미콜라 인솔렌스 (Humicola insolens), 에이치. 라누지노스 (H. lanuginose), 에이치. 그리세아 (H. grisea), 크리소스포륨 (Chrysosporium) sp., 씨. 루크노웬스 (C. lucknowense), 글리오클라듐 (Gliocladium) sp., 아스퍼질러스 (Aspergillus) sp. (예컨대 에이. 오리재 (A. oryzae), 에이. 니거 (A. niger), 에이. 소재 (A. sojae), 에이. 자포니커스 (A. japonicus), 에이. 니둘란스 (A. nidulans), 또는 에이. 아와모리 (A. awamori)), 푸사리움 (Fusarium) sp. (예컨대, 에프. 로세움 (F. roseum), 에프. 그라미넘 (F. graminum), 에프 세레알리스 (F. cerealis), 에프. 옥시스포루임 (F. oxysporuim), 또는 에프. 베네나텀 (F. venenatum)), 뉴로스포라 (Neurospora) sp. (예컨대, 엔. 크라싸 (N. crassa) 또는 히포크레아 (Hypocrea) sp.)), 무코르 (Mucor) sp. (예컨대, 엠. 미에헤이 (M. miehei)), 리조푸스 (Rhizopus) sp., 및 에메리셀라 (Emericella) sp. 세포가 포함된다. 특정 실시형태에서, 상기 기술된 바와 같이 조작된 진균 세포는 에이. 니둘란스, 에이. 아와모리, 에이. 오리재, 에이. 아쿨레아터스 (A. aculeatus), 에이. 니거 (A. niger), 에이. 자포니커스 (A. japonicus), 티. 레에세이 (T. reesei), 티. 비리데, 에프. 옥시스포럼 (F. oxysporum), 또는 에프. 솔라니(F. solani)를 포함한다. 이러한 숙주와 함께 사용을 위한 예시적인 플라스미드 또는 플라스미드 성분은 미국 공개 특허 출원 제2011/0045563호에 기술된 것들을 포함한다.
효모가 또한 본 명세서에 기술된 방법에서 미생물 숙주 세포로서 사용될 수 있다. 예에는 사카로마이세스 (Saccharomyces) sp., 스키조사카로마이세스 (Schizosaccharomyces) sp., 피키아 (Pichia) sp., 한세눌라 폴리모르파 (Hansenula polymorpha), 피키아 스티피테스 (Pichia stipites), 클루이베로마이세스 마르시아너스 (Kluyveromyces marxianus), 클루이베로마이세스 (Kluyveromyces) spp., 야로위아 리폴리티카 (Yarrowia lipolytica) 및 캔디다 (Candida) sp.을 포함한다. 일부 실시형태에서, 사카로마이세스 sp.는 에스. 세레비지아 (예를 들어, Romanos et al., Yeast, (1992), 8(6):423-488 참조)이다. 이러한 숙주와 함께 사용을 위한 예시적인 플라스미드 또는 플라스미드 성분은 미국 특허 제7,659,097호 및 미국 공개 특허 출원 제2011/0045563호에 기술된 것들을 포함한다.
일부 실시형태에서, 숙주 세포는 녹조류, 홍조류, 회조류, 클로라라크니오파이트 (chlorarachniophyte), 유글레니드 (euglenid), 크로미스타 (chromista), 또는 디노플라젤레이트 (dinoflagellate)로부터 유래되는 조류 세포일 수 있다. (예를 들어, Saunders & Warmbrodt, "Gene Expression in Algae and Fungi, Including Yeast," (1993), National Agricultural Library, Beltsville, Md. 참조). 조류 세포에서 사용을 위한 예시적인 플라스미드 또는 플라스미드 성분은 미국 공개 특허 출원 제2011/0045563호에 기술된 것들을 포함한다.
다른 실시형태에서, 숙주 세포는 시아노박테리움 (cyanobacterium), 예컨대 형태학을 기반으로 다음의 그룹 중 어느 하나로 분류되는 시아노박테리움이다: 클로로코칼레스 (Chlorococcales), 플레우로캡살레스 (Pleurocapsales), 오실라토리알레스 (Oscillatoriales), 노스토칼레스 (Nostocales), 시네코시스틱 (Synechosystic) 또는 스티고네마탈레스 (Stigonematales) (예를 들어, Lindberg et al., Metab. Eng., (2010) 12(1):70-79 참조). 시아노박테리아 세포에서 사용을 위한 예시적인 플라스미드 또는 플라스미드 성분은 미국 공개 특허 출원 제 2010/0297749호 및 제2009/0282545호 및 국제 공개 특허 출원 번호 WO 2011/034863에 기술된 것들을 포함한다.
유전자 조작 방법
미생물 세포는 당업자가 속하는 분자 생물학 (재조합 기술 포함), 미생물학, 세포 생물학, 및 생화학의 통상의 기술을 사용하여 발효적 티라민 생성을 위해 조작될 수 있다. 이러한 기술은 문헌에 완전하게 설명되어 있고, 예를 들어 다음의 문헌들을 참조한다: "Molecular Cloning: A Laboratory Manual," fourth edition (Sambrook et al., 2012); "Oligonucleotide Synthesis" (M. J. Gait, ed., 1984); "Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications" (R. I. Freshney, ed., 6th Edition, 2010); "Methods in Enzymology" (Academic Press, Inc.); "Current Protocols in Molecular Biology" (F. M. Ausubel et al., eds., 1987, and periodic updates); "PCR: The Polymerase Chain Reaction," (Mullis et al., eds., 1994); Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994).
벡터는 세포로 유전자 물질을 도입시키기 위해 사용되는 폴리뉴클레오티드 비히클이다. 본 명세서에 기술된 방법에서 유용한 벡터는 선형일 수 있거나 또는 원형일 수 있다. 벡터는 숙주 세포의 표적 게놈으로 통합될 수 있거나 또는 숙주 세포에서 독립적으로 복제될 수 있다. 많은 적용 분야에서, 안정한 형질전환체를 생성시키는 통합 벡터가 바람직하다. 벡터는 예를 들어 복제 기원, 다중 클로닝 부위 (MCS), 및/또는 선별 마커를 포함할 수 있다. 발현 벡터는 전형적으로 특정한 숙주 세포에서 폴리뉴클레오티드 서열 (흔히 코딩 서열)의 발현을 촉진하는 조절 엘리먼트를 함유하는 발현 카세트를 포함한다. 벡터는 제한없이, 통합 벡터, 원핵생물 플라스미드, 에피솜, 바이러스 벡터, 코스미드 및 인공 염색체를 포함한다.
발현 카세트에서 사용될 수 있는 예시적인 조절 엘리먼트는 프로모터, 인핸서, 내부 리보솜 진입 부위 (IRES), 및 다른 발현 제어 엘리먼트 (예를 들어, 전사 종결 신호, 예컨대 폴리아데닐화 신호 및 폴리-U 서열)를 포함한다. 이러한 조절 엘리먼트는 예를 들어, 다음의 문헌에 기술되어 있다: Goeddel, Gene Expression Technology: Methods In Enzymology 185, Academic Press, San Diego, Calif. (1990).
일부 실시형태에서, 벡터는 CRISPR 시스템과 같은 게놈 편집을 수행할 수 있는 시스템을 도입시키는데 사용될 수 있다. 2014년 3월 6일에 공개된 미국 공개 특허 출원 제2014/0068797호를 참조하고, 또한, 다음의 문헌을 참조한다: Jinek M., et al., "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity," Science 337:816-21, 2012). II형 CRISPR-Cas9 시스템에서, Cas9는 부위-지정 엔도뉴클레아제로서, 즉, 2개의 별개 엔도뉴클레아제 도메인 (HNH 및 RuvC/RNase H-유사 도메인)을 사용하여 특정한 표적 서열에서 폴리뉴클레오티드를 절단하도록 유도되거나 또는 유도할 수 있는 효소이다. Cas9는 Cas9가 RNA에 의해 이의 절단 부위로 유도되기 때문에 임의의 바람직한 부위에서 DNA를 절단하도록 조작될 수 있다. 그러므로, Cas9는 "RNA-가이딩된 뉴클레아제"로서 설명된다. 보다 특히, Cas9는 표적 폴리뉴클레오티드의 특별한 서열과 RNA 분자(들)의 적어도 일부분의 하이브리드화를 기반으로 특별한 폴리뉴클레오티드 표적으로 Cas9를 가이딩하는, 하나 이상의 RNA 분자와 연합된다. Ran, F.A. 등 ("In vivo genome editing using Staphylococcus aureus Cas9," Nature 520(7546):186-91, 2015, Apr 9], 모든 증보된 데이타 포함)은 crRNA/tracrRNA 서열 및 8종의 II형 CRISPR-Cas9 시스템의 구조를 제시한다. Cas9-유사 합성 단백질이 또한 당분야에 공지되어 있다 (2014년 10월 23일 공개된, 미국 공개 특허 출원 제2014-0315985호 참조).
실시예 1은 에스. 세레비지아 및 씨. 글루타미컴 세포의 게놈으로 폴리뉴클레오티드를 도입시키기 위한 2가지 예시적인 통합 접근법을 기술한다.
벡터 또는 다른 폴리뉴클레오티드는 형질전환, 접합, 전기천공, 핵 미세주사, 형질도입, 형질감염 (예를 들어, 리포펙션 매개 또는 DEAE-덱스트린 매개 형질감염 또는 재조합 파지 바이러스를 사용한 형질감염), 인산칼슘 DNA 침전제와의 인큐베이션, DNA-코팅된 미세투사체에 의한 고속 충격, 및 원형질체 융합과 같은 임의의 다양한 표준 방법을 통해서 미생물 세포로 도입될 수 있다. 형질전환체는 당분야에 공지된 임의의 방법으로 선별될 수 있다. 형질전환체를 선별하기 위한 적합한 방법은 미국 공개 특허 출원 제2009/0203102호, 제2010/0048964호, 및 제2010/0003716호, 및 국제 공개 특허 출원 번호 WO 2009/076676, WO 2010/003007, 및 WO 2009/132220에 기술되어 있다.
조작된 미생물 세포
상기 기술된 방법은 티라민을 생성시키고, 일정 실시형태에서, 과생성시키는 조작된 미생물 세포를 생성시키기 위해 사용될 수 있다. 조작된 미생물 세포는 본 명세서에 기술된 임의의 미생물 숙주 세포와 같은, 야생형 미생물 세포와 비교하여, 적어도 1, 2, 3, 4, 5, 6 ,7, 8, 9, 10개 이상의 유전자 변경, 예컨대 30-40개 변경을 가질 수 있다. 하기 실시예에 기술된 조작된 미생물 세포는 하나, 둘, 또는 3개의 유전자 변경을 갖지만, 당업자는 본 명세서에 기재된 지침에 따라서, 추가 변경을 갖는 미생물 세포를 디자인할 수 있다. 일부 실시형태에서, 조작된 미생물 세포는 야생형 미생물 세포와 비교하여, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 또는 4개 이하의 유전자 변경을 갖는다. 다양한 실시형태에서, 티라민 생성을 위해 조작된 미생물 세포는 임의의 하기에 예시된 범위 내에 속하는 다수의 유전자 변경을 가질 수 있다: 1-10, 1-9, 1-8, 2-7, 2-6, 2-5, 2-4, 2-3, 3-7, 3-6, 3-5, 3-4 등.
일부 실시형태에서, 조작된 미생물 세포는 적어도 하나의 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 이것은 천연적으로 티라민을 생성시키지 않는 미생물 숙주 세포의 경우에 필수적이다. 다양한 실시형태에서, 미생물 세포는 예를 들어 (1) 단일 이종성 TYDC 유전자, (2) 동일하거나 또는 상이할 수 있는 둘 이상의 이종성 TYDC 유전자 (달리 말해서, 동일한 이종성 TYDC 유전자의 다수 카피가 도입될 수 있거나 또는 다수의 상이한 이종성 TYDC 유전자가 도입될 수 있음), (3) 단일 이종성 TYDC 유전자 및 내생성 TYDC 유전자의 하나 이상의 추가 카피, 또는 (4) 동일하거나 또는 상이할 수 있는 둘 이상의 이종성 TYDC 유전자, 및 내생성 TYDC 유전자의 하나 이상의 추가 카피를 포함하고 발현시킬 수 있다.
이러한 조작된 숙주 세포는 티로신 (티라민의 중간 전구체)의 생성으로 이어지는 경로를 통하는 흐름을 증가시키는 적어도 하나의 추가적인 유전자 변경을 포함할 수 있다. 경로에서 이들 "상류" 효소는 이들 효소 활성을 갖는 임의의 이소폼, 파라로그, 또는 오르쏘로그를 포함하여, 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 및 티로신 아미노트랜스퍼라제를 포함한다 (당업자가 쉽게 이해하는 바와 같이 상이한 명칭으로 공지될 수 있음). 적어도 하나의 추가적인 변경은 임의의 이용가능한 수단에 의해서, 예를 들어, (1) 내생성 효소(들)의 발현 또는 활성의 변경, (2) 내생성 효소에 대한 유전자의 하나 이상의 추가 카피의 발현, 또는 (3) 하나 이상의 이종성 효소에 대한 유전자의 하나 이상의 카피의 발현에 의해서, 상류 경로 효소(들)의 활성을 증가시킬 수 있다.
일부 실시형태에서, 경로를 통해서 증가된 흐름은 상기에 기술된 바와 같이, 피드백-이상조절된 효소를 코딩하는 하나 이상의 유전자를 발현하여 달성될 수 있다. 예를 들어, 조작된 숙주 세포는 (1) 하나 이상의 피드백-이상조절된 DAHP 신타제 유전자, (2) 하나 이상의 피드백-이상조절된 코리스메이트 뮤타제 유전자, 또는 (3) 하나 이상의 피드백-이상조절된 DAHP 신타제 유전자 및 하나 이상의 피드백-이상조절된 코리스메이트 뮤타제 유전자를 포함할 수 있고 발현할 수 있다. 따라서, 임의의 이들 유전자 변경을 갖는 조작된 미생물 세포는 또한 적어도 하나의 이종성 TYDC, 및 임의로 하나 이상의 상류 경로 효소의 활성을 증가시키는 하나 이상의 유전자 변경을 포함할 수 있다.
조작된 미생물 세포는 야생형 뉴클레오티드 서열을 갖거나 또는 야생형과 상이한 도입된 유전자를 함유할 수 있다. 예를 들어, 야생형 뉴클레오티드 서열은 특정한 숙주 세포에서의 발현을 위해 코돈-최적화될 수 있다. 임의의 이들 도입된 유전자에 의해 코딩되는 아미노산 서열은 야생형일 수 있거나 또는 야생형과 상이할 수 있다. 다양한 실시형태에서, 아미노산 서열은 야생형 아미노산 서열과 적어도 0%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는다.
조작된 미생물 세포는 다양한 실시형태에서, 상기 기술된 바와 같이, 고역가로 티라민을 생성시킬 수 있다. 일부 실시형태에서, 조작된 미생물 세포는 기질의 발효에 의해 티라민을 생성시킬 수 있고, 여기서 기질의 적어도 20%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 다양한 실시형태에서, 기질의 적어도 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 일부 실시형태에서, 단백질 또는 아미노산 공급원으로부터 유래되지 않는 발효 기질의 백분율은 임의의 하기의 예시적인 범위 내에 속한다: 40-100%, 40-90%, 40-80%, 50-100%, 50-90%, 50-80%, 60-100%, 60-90%, 60-80% 등.
본 명세서에 기술된 접근법은 진균 세포, 즉 효모 에스. 세레비지아 (진핵생물), 및 박테리아 세포, 즉 씨. 글루타미컴 (원핵생물)에서 수행되었다. (실시예 1 참조)
예시적인 조작된 진균 세포
예시적인 조작된 사카로마이세스 세레비지아 세포
일정한 실시형태에서, 조작된 효모 (예를 들어, 에스. 세레비지아) 세포는 파파베르 솜니페럼 유래의 TYDC와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 다양한 실시형태에서, 피. 솜니페럼 TYDC는 SEQ ID NO:20을 포함한다. 이것은 보다 일반적으로 상기에 기술된 바와 같이, 조작된 효모 세포의 유일한 유전자 변경일 수 있거나, 또는 효모 세포는 하나 이상의 추가적인 유전자 변경을 포함할 수 있다.
특정한 실시형태에서, 조작된 효모 (예를 들어, 에스. 세레비지아) 세포는 야생형 에스. 세레비지아 DAHP 신타제와 전형적으로 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 에스. 세레비지아 DAHP 신타제의 변이체를 추가적으로 발현한다. 예시적인 실시형태에서, 조작된 효모 (예를 들어, 에스. 세레비지아) 세포는 피. 솜니페럼 티로신/DOPA 디카복실라제 2 (SEQ ID NO:2) 및 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 피드백-이상조절된 에스. 세레비지아 DAHP 신타제 (SEQ ID NO:6)를 발현한다.
제3의 유전자 변경을 갖는 예시적인 효모 (예를 들어, 에스. 세레비지아) 세포는 대조군 세포에 비해, 세포에 야생형 에스. 세레비지아 프리페네이트 디히드로게나제 (SEQ ID NO:4) 유전자의 추가 카피 또는 야생형 에스. 세레비지아 프리페네이트 디히드로게나제와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 프리페네이트 디히드로게나제를 코딩하는 유전자를 도입시켜 생성되는, 상류 경로 효소, 예컨대 프리페네이트 디히드로게나제의 증가된 활성을 추가로 가질 수 있다.
제4 유전자 변경을 갖는 예시적인 효모 (예를 들어, 에스. 세레비지아) 세포는 대조군 세포에 비해, 세포에 야생형 에스. 세레비지아 트랜스알돌라제 (SEQ ID NO:8) 유전자의 추가 카피 또는 야생형 에스. 세레비지아 트랜스알돌라제와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 트랜스알돌라제를 코딩하는 유전자를 도입시켜 생성되는, 상류 경로 효소, 예컨대 트랜스알돌라제의 증가된 활성을 추가로 가질 수 있다. 예시적인 실시형태에서, 조작된 에스. 세레비지아 세포는 코리네박테리움 글루타미컴 및 에스. 세레비지아에 대한 변형된 조합 코돈을 사용하여 코돈-최적화된 이들 유전자의 형태를 발현시킨다.
예시적인 조작된 야로위아 리폴리티카 세포
일정한 실시형태에서, 조작된 효모 (예를 들어, 야로위아 리폴리티카) 세포는 엔테로코커스 패시움 (예를 들어, Com15) 유래 피리독살-의존성 디카복실라제 (TYDC)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 다양한 실시형태에서, 이. 패시움 TYDC는 SEQ ID NO:1을 포함한다. 이것은 조작된 효모 세포의 유일한 유전자 변경일 수 있거나, 또는 효모 세포는 보다 일반적으로 상기에 기술된 바와 같이, 하나 이상의 추가적인 유전자 변경을 포함할 수 있다.
특정한 실시형태에서, 조작된 효모 (예를 들어, 와이. 리폴리티카) 세포는 야생형 에스. 세레비지아 (예를 들어, S288c) 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)(SEQ ID NO: 9)와 전형적으로 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는, 에스. 세레비지아 DAHP 신타제를 추가로 발현한다. 예시적인 실시형태에서, 조작된 와이. 리폴리티카 세포는 와이. 리폴리티카에 대해 코돈-최적화된 이들 유전자의 형태를 발현한다 (SEQ ID NO: 10).
예시적인 조작된 박테리아 세포
예시적인 조작된 코리네박테리움 글루타미컴 세포
일정한 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 엔테로코커스 패시움 (예를 들어, Com15) 또는 자이고사카로마이세스 바일리 유래 TYDC와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 예를 들어, 이. 패시움 TYDC는 SEQ ID NO:1을 포함할 수 있고, 지. 바일리 TYDC는 SEQ ID NO:11을 포함할 수 있다. 이종성 TYDC의 발현은 조작된 박테리아 세포의 유일한 유전자 변경일 수 있거나, 또는 박테리아 세포는 상기에 보다 일반적으로 기술된 바와 같이, 하나 이상의 추가적인 유전자 변경을 포함할 수 있다.
특정한 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 에스. 세레비지아 DAHP 신타제 (예를 들어, 균주 288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제) 또는 전형적으로 야생형 에스. 세레비지아 DAHP 신타제 (SEQ ID NO:9)와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 이의 변이체를 추가로 발현한다. 양쪽 유전자는 예를 들어 에스. 세레비지아에 대해 코돈-최적화될 수 있다. 예시적인 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 피드백-이상조절된 에스. 세레비지아 DAHP 신타제 (SEQ ID NO:6)와 조합하여 이. 패시움 TYDC (SEQ ID NO:1) 또는 지. 바일리 TYDC (SEQ ID NO:11) 중 하나 (또는 둘 모두)를 발현한다.
DAHP 신타제 변이체를 발현시키는 것 이외에도, 또는 대안적으로, TYDC-발현 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 대조군 세포에 비해서 상류 경로 효소, 예컨대 코리스메이트 신타제 및/또는 프리프레네이트 디히드로게나제의 증가된 활성을 가질 수 있다. 예시적인 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 야생형 에스. 세레비지아 코리스메이트 신타제 (SEQ ID NO:12) 유전자의 카피 또는 야생형 에스. 세레비지아 코리스메이트 신타제와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 코리스메이트 신타제를 코딩하는 유전자 (SEQ ID NO: 3)와 조합하여 이. 패시움 TYDC (SEQ ID NO:1)를 발현한다. 다른 예시적인 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 야생형 에스. 세레비지아 프리페네이트 디히드로게나제 (SEQ ID NO:13) 유전자의 카피 또는 야생형 에스. 세레비지아 프리페네이트 디히드로게나제와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 프리페네이트 디히드로게나제를 코딩하는 유전자 (SEQ ID NO: 4)와 조합하여 이. 패시움 TYDC (SEQ ID NO:1)를 발현한다.
예시적인 조작된 바실러스 서브틸리스 세포
일정한 실시형태에서 조작된 박테리아 (예를 들어, 바실러스 서브틸리스) 세포는 엔테로코커스 패시움 (예를 들어, Com15) 유래 TYDC와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 예를 들어, 이. 패시움 TYDC는 SEQ ID NO:1을 포함할 수 있다. 이종성 TYDC의 발현은 조작된 박테리아 세포의 유일한 유전자 변경일 수 있거나, 또는 박테리아 세포는 상기에 보다 일반적으로 기술되는 바와 같이, 하나 이상의 추가적인 유전자 변경을 포함할 수 있다.
특정한 실시형태에서, 조작된 박테리아 (예를 들어, 비. 서브틸리스) 세포는 야생형 에스. 세레비지아 DAHP 신타제 (SEQ ID NO:9)와 전형적으로 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 에스. 세레비지아 DAHP 신타제 (예를 들어, 균주 288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제)의 변이체를 추가적으로 발현한다.
제3의 유전자 변경을 갖는 예시적인 박테리아 (예를 들어, 비. 서브틸리스)는 대조군 세포에 비해, 세포에 야생형 이. 콜라이 (예를 들어, K12) 시키메이트 키나제 2 (SEQ ID NO:14) 유전자의 추가 카피 또는 야생형 이. 콜라이 시키메이트 키나제 2와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 시키메이트 키나제를 코딩하는 유전자 (SEQ ID NO: 15)를 도입시켜 생성되는, 상류 경로 효소, 예컨대 시키메이트 키나제의 증가된 활성을 추가로 가질 수 있다. 예시적인 실시형태에서, 조작된 비. 서브틸리스 세포는 에스. 세레비지아에 대해 코돈-최적화된 이들 유전자의 형태를 발현한다.
조작된 미생물 세포의 배양
본 명세서에 기술된 임의의 미생물 세포는 예를 들어, 유지, 성장, 및/또는 티라민 생성을 위해서 배양될 수 있다. 일반적으로, 티라민은 기질의 발효로부터 생성되고 여기서 기질의 적어도 20%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 따라서, 본 명세서에 기술된 조작된 미생물 세포의 배양은 발효 기질을 포함하고, 여기서 기질의 적어도 20%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 다양한 실시형태에서, 기질의 적어도 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 일부 실시형태에서, 단백질 또는 아미노산 공급원으로부터 유래되지 않는 발효 기질의 백분율은 임의의 하기의 예시적인 범위 내에 속한다: 40-100%, 40-90%, 40-80%, 50-100%, 50-90%, 50-80%, 60-100%, 60-90%, 60-80% 등.
일부 실시형태에서, 배양은 10-500의 600 nm에서의 광학 밀도, 예컨대 50-150의 광학 밀도까지 성장된다.
다양한 실시형태에서, 배양물은 적어도 10, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 또는 900 ㎎/L 또는 적어도 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 또는 10 gm/L의 역가로 생성된 티라민을 포함한다. 다양한 실시형태에서, 역가는 10 ㎎/L 내지 10 gm/L, 100 ㎎/L 내지 5 gm/L, 200 ㎎/L 내지 4 gm/L, 300 ㎎/L 내지 3 gm/L의 범위, 또는 상기 열거된 임의 값으로 한정되는 임의 범위이다.
배양 배지
미생물 세포는 제한없이, 최소 배지 즉 세포 성장을 위해 가능한 최소 영양분을 함유하는 것을 포함하는, 임의의 적합한 배지에서 배양될 수 있다. 전형적으로, 최소 배지는 (1) 미생물 성장을 위한 탄소원; (2) 특정한 미생물 세포 및 성장 조건에 의해 좌우될 수 있는 염; 및 (3) 물을 함유한다. 적합한 배지는 또한 다음의 임의 조합을 포함할 수 있다: 성장 및 생성물 형성을 위한 질소원, 성장을 위한 황원, 성장을 위한 포스페이트원, 성장을 위한 금속염, 성장을 위한 비타민, 및 성장을 위한 다른 보조인자.
임의의 적합한 탄소원은 숙주 세포를 배양하는데 사용될 수 있다. 용어 "탄소원"은 미생물 세포에 의해 물질대사될 수 있는 하나 이상의 탄소-함유 화합물을 의미한다. 다양한 실시형태에서, 탄소원은 탄수화물 (예컨대, 모노사카라이드, 디사카라이드, 올리고사카라이드, 또는 폴리사카라이드), 또는 전화당 (예를 들어, 효소적으로 처리된 수크로스 시럽)이다. 예시적인 모노사카라이드는 포도당 (덱스트로스), 프룩토스 (레불로스), 및 갈락토스를 포함하고, 예시적인 올리고사카라이드는 덱스트란 또는 글루칸을 포함하고, 예시적인 폴리사카라이드는 전분 및 셀룰로스를 포함한다. 적합한 당류는 C6 당류 (예를 들어, 프룩토스, 만노스, 갈락토스, 또는 포도당) 및 C5 당류 (예를 들어, 자일로스 또는 아라비노스)를 포함한다. 다른, 덜 값비싼 탄소원은 사탕수수액, 비트액, 수수액 등을 포함하고, 이들 중 어느 하나는 그럴 필요는 없지만, 완전하게 또는 부분적으로 탈이온화된다.
배양 배지 내 염은 일반적으로 세포가 단백질 및 핵산을 합성할 수 있도록 필수 원소, 예컨대 마그네슘, 질소, 인 및 황을 제공한다.
최소 배지는 하나 이상의 선별제, 예컨대 항생제가 보충될 수 있다.
티라민을 생성시키기 위해서, 배양 배지는 포도당 및/또는 질소원 예컨대 우레아, 암모늄 염, 암모니아, 또는 이의 임의 조합이 배양 동안 포함될 수 있고/있거나 보충된다.
배양 조건
미생물 세포의 유지 및 성장을 위해 적합한 재료 및 방법은 당분야에 충분히 공지되어 있다. 예를 들어, 미국 공개 특허 출원 제2009/0203102호, 제2010/0003716호, 및 제2010/0048964호, 및 국제 공개 특허 출원 번호 WO 2004/033646, WO 2009/076676, WO 2009/132220, 및 WO 2010/003007, [Manual of Methods for General Bacteriology, Gerhardt et al., eds, American Society for Microbiology, Washington, D.C. (1994)] 또는 [Brock in Biotechnology: A Textbook of Industrial Microbiology, Second Edition (1989) Sinauer Associates, Inc., Sunderland, Mass]를 참조한다.
일반적으로, 세포는 적절한 온도, 가스 혼합물, 및 pH (예컨대, 약 20℃ 내지 약 37℃, 약 6% 내지 약 84% CO2, 및 약 5 내지 약 9의 pH)에서 성장되고 유지된다. 일부 양상에서, 세포는 35℃에서 성장된다. 일정 실시형태에서, 예컨대 호열성 박테리아가 숙주 세포로서 사용되는 경우에, 고온 (예를 들어, 50℃ 내지 75℃)이 사용될 수 있다. 일부 양상에서, 발효를 위한 pH 범위는 약 pH 5.0 내지 약 pH 9.0 (예컨대 약 pH 6.0 내지 약 pH 8.0 또는 약 6.5 내지 약 7.0)이다. 세포는 특정한 세포의 요건을 기반으로 통기성, 저산소성, 또는 혐기성 조건 하에서 성장될 수 있다.
사용될 수 있는 회분식, 유가식 또는 연속 발효와 같은, 표준 배양 조건 및 발효 방식은 미국 공개 특허 출원 제2009/0203102호, 제2010/0003716호, 및 제2010/0048964호, 및 국제 공개 특허 출원 번호 WO 2009/076676, WO 2009/132220, 및 WO 2010/003007에 기술되어 있다. 회분식 및 유가식 발효는 당분야에서 일반적이고 충분히 공지되어 있으며, 그 예는 [Brock, Biotechnology: A Textbook of Industrial Microbiology, Second Edition (1989) Sinauer Associates, Inc.]에서 확인할 수 있다.
일부 실시형태에서, 세포는 제한된 당 (예를 들어, 포도당) 조건 하에서 배양된다. 다양한 실시형태에서, 첨가되는 당의 양은 세포에 의해 소모될 수 있는 당의 양의 약 105% 이하 (예컨대 약 100%, 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 또는 10%)이다. 특정한 실시형태에서, 배양 배지에 첨가되는 당의 양은 지정된 시간 동안 세포에 의해 소모되는 당의 양과 대략 동일하다. 일부 실시형태에서, 세포 성장 속도는 세포 배지 중 당의 양에 의해 지지될 수 있는 속도로 세포가 성장하도록 첨가되는 당의 양을 제한하여 제어된다. 일부 실시형태에서, 당은 세포가 배양되는 시간 동안 축적되지 않는다. 다양한 실시형태에서, 세포는 약 1, 2, 3, 5, 10, 15, 20, 25, 30, 35, 40, 50, 60, 또는 70시간 이상 동안 또는 심지어 최대 약 5 내지 10일의 시간 동안 제한된 당 조건 하에서 배양된다. 다양한 실시형태에서, 세포는 세포가 배양되는 총 시간 길이의 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 95, 또는 100% 이상 동안 제한된 당 조건 하에서 배양된다. 임의의 특정한 이론으로 한정하려는 의도는 아니지만, 제한된 당 조건은 세포의 보다 호의적인 조절을 가능하게 할 수 있다고 믿는다.
일부 양상에서, 세포는 회분식 배양으로 성장된다. 세포는 또한 유가식 배양 또는 연속 배양으로 성장될 수 있다. 추가적으로, 세포는 제한없이, 상기 기술된 임의의 최소 배지를 포함하여, 최소 배지에서 배양될 수 있다. 최소 배지는 1.0% (w/v) 이하의 포도당 (또는 임의의 다른 6-탄소당)이 더 보충될 수 있다. 특히, 최소 배지는 1% (w/v), 0.9% (w/v), 0.8% (w/v), 0.7% (w/v), 0.6% (w/v), 0.5% (w/v), 0.4% (w/v), 0.3% (w/v), 0.2% (w/v), 또는 0.1% (w/v)의 포도당이 보충될 수 있다. 일부 배양에서, 유의하게 더 높은 수준의 당 (예를 들어, 포도당)이, 예를 들어, 적어도 10% (w/v), 20% (w/v), 30% (w/v), 40 % (w/v), 50% (w/v), 60% (w/v), 70% (w/v), 또는 최대 배지 중 당의 가용 한계로 사용된다. 일부 실시형태에서, 당의 수준은 상기 값의 임의의 2개의 범위 내에 속한다: 예를 들어, 0.1-10% (w/v), 1.0-20% (w/v), 10-70% (w/v), 20-60% (w/v), 또는 30-50% (w/v). 뿐만 아니라, 상이한 당 수준이 배양 단계의 상이한 시기 동안 사용될 수 있다. (예를 들어, 에스. 세레비지아 또는 씨. 글루타미컴의) 유가식 배양의 경우, 당의 수준은 회분식 시기에는 약 100-200 g/L (10-20% (w/v))일 수 있고 그 다음으로 최대 약 500-700 g/L (공급물 중 50-70%)일 수 있다.
추가적으로, 최소 배지는 0.1% (w/v) 이하의 효모 추출물이 보충될 수 있다. 특히, 최소 배지는 0.1% (w/v), 0.09% (w/v), 0.08% (w/v), 0.07% (w/v), 0.06% (w/v), 0.05% (w/v), 0.04% (w/v), 0.03% (w/v), 0.02% (w/v), 또는 0.01% (w/v)의 효모 추출물이 보충될 수 있다. 대안적으로, 최소 배지는 1% (w/v), 0.9% (w/v), 0.8% (w/v), 0.7% (w/v), 0.6% (w/v), 0.5% (w/v), 0.4% (w/v), 0.3% (w/v), 0.2% (w/v), 또는 0.1% (w/v)의 포도당 및 0.1% (w/v), 0.09% (w/v), 0.08% (w/v), 0.07% (w/v), 0.06% (w/v), 0.05% (w/v), 0.04% (w/v), 0.03% (w/v), 또는 0.02% (w/v)의 효모 추출물이 보충될 수 있다. 일부 배양에서, 유의하게 더 높은 수준의 효모 추출물이, 예를 들어, 적어도 1.5% (w/v), 2.0% (w/v), 2.5% (w/v), 또는 3% (w/v)로 사용될 수 있다. (예를 들어, 에스. 세레비지아 또는 씨. 글루타미컴의) 일부 배양에서, 효모 추출물 수준은 상기 값의 임의의 2개의 범위 내에 속한다: 예를 들어, 0.5-3.0% (w/v), 1.0-2.5% (w/v), 또는 1.5-2.0% (w/v).
본 명세서에 기술된 조작된 미생물 세포의 유지 및 성장을 위해 적합한 예시적인 재료 및 방법은 하기 실시예에서 확인할 수 있다.
티라민 생성 및 회수
본 명세서에 기술된 임의의 방법은 티라민을 회수하는 단계를 더 포함할 수 있다. 일부 실시형태에서, 소위 회수 스트립에 함유된 생성된 티라민은 생성 용기로부터 회수/수확된다. 회수 스트림은 예를 들어, 생성 용기 중 휴면 세포에 의한 생성 기질의 전환의 결과로서 티라민을 함유하는, 생성 용기로부터 발생되는 세포-무함유 또는 세포-함유 수용액을 포함할 수 있다. 회수 스트림에 여전히 존재하는 세포는 당분야에 공지된 임의의 작업, 예컨대, 예를 들어 여과, 원심분리, 디캔테이션, 막 직교류 한외여과 또는 미세여과, 접선 유동 한외여과 또는 미세여과 또는 데드 엔드 여과에 의해 티라민으로부터 분리될 수 있다. 이러한 세포 분리 작업 이후에, 회수 스트림은 본질적으로 세포를 함유하지 않는다.
회수 스트림에 함유된 다른 성분으로부터 생성된 티라민의 분리 및/또는 정제의 추가 단계, 즉 소위 하류 프로세싱 단계는 임의로 수행될 수 있다. 이들 단계는 당업자에게 공지된 임의의 수단, 예컨대, 예를 들어 농축, 추출, 결정화, 침전, 흡착, 이온 교환, 크로마토그래피, 증류, 전기투석, 이중극성막 전기투석 및/또는 역삼투압을 포함할 수 있다. 임의의 이들 절차는 티라민을 정제하기 위해 단독으로 또는 조합하여 사용될 수 있다. 추가 정제 단계는 예를 들어, 농축, 결정화, 침전, 세척 및 건조, 활성 탄소 처리, 이온 교환 및/또는 재결정화 중 하나 이상을 포함할 수 있다. 적합한 정제 프로토콜의 디자인은 세포, 배양 배지, 배양의 크기, 생성 용기 등에 따라 좌우될 수 있고, 당업자의 수준 내이다.
하기의 실시예는 본 개시 내용의 다양한 실시형태를 예시하려는 목적으로 제공되고 임의 방식으로 본 개시 내용을 제한하는 것을 의미하지 않는다. 청구항의 범주에 의해 한정되는, 본 개시 내용의 사조 내에 포괄되는 그의 변화 및 다른 용도는 당업자가 확인할 수 있을 것이다.
실시예 1 - 티라민을 생성시키도록 조작된 사카로마이세스 세레비지아 및 코리네박테리움 글루타미컴의 균주의 구축 및 선별
플라스미드/DNA 디자인
이 작업에 시험된 모든 균주는 사유 소프트웨어를 사용해 디자인된 플라스미드 DNA로 형질감염된다. 플라스미드 디자인은 이 작업에서 조작된 2종의 숙주 유기체 중 하나에 특이적이었다. 플라스미드 DNA는 물리적으로 표준 DNA 조립 방법으로 구축되었다. 그리고 이 플라스미드 DNA는 각각 하기에 기술된 2가지 숙주-특이적 방법 중 하나에 의해 물질대사 경로 삽입체를 통합시키는데 사용되었다.
에스. 세레비지아 경로 통합
"분할-마커, 이중-크로스오버" 게놈 통합 전략이 에스. 세레비지아 균주를 조작하기 위해 개발되었다. 도 2는 상보성, 분할-마커 플라스미드의 게놈 통합 및 에스. 세레비지아에서 콜로니 PCR을 통한 올바른 게놈 통합의 검증을 예시한다. 상보성 5' 및 3' 상동성 및 URA3 선별 마커의 중복된 절반 (해시 바로 표시된 직접 반복부)을 갖는 2개 플라스미드를 메가뉴클레아제로 분해시켰고 선형 단편으로서 형질전환시켰다. 삼중-크로스오버 사건은 표적화된 유전자좌에 바람직한 이종성 유전자를 통합시켰고 완전한 URA3 유전자를 재구성시켰다. 이러한 통합 사건으로부터 유래된 콜로니는 5' 및 3' 접합부 둘 모두를 확인하기 위해 2개 3-프라이머 (UF/IF/wt-R 및 DR/IF/wt-F) 반응을 사용해 어세이하였다. 추가 조작이 바람직한 균주의 경우, 균주는 5-FOA 플레이트 상에 플레이팅시켜서 본래 직접 반복부의 소형 단일 카피는 남겨두고, URA3의 제거에 대해 선별될 수 있다. 이러한 게놈 통합 전략은 동일한 작업흐름으로 유전자 넉-아웃, 유전자 넉-인, 및 프로모터 적정을 위해 사용될 수 있다.
씨. 글루타미컴 경로 통합
"루프-인, 단일-크로스오버" 게놈 통합 전략이 씨. 글루타미컴 균주를 조작하기 위해 개발되었다. 도 3은 루프-인 단독 및 루프-인/루프-아웃 구성체의 게놈 통합 및 콜로니 PCR을 통한 올바른 통합의 검증을 예시한다. 루프-인 단독 구성체 (제목 "루프-인"에 도시)는 단일 2-kb 상동성 팔부 ("통합 유전자좌"로서 표시됨), 양성 선별 마커 ("마커"로 표시됨)), 및 관심 유전자(들) ("프로모터-유전자-종결인자"로 표시됨)를 함유하였다. 단일 크로스오버 사건이 씨. 글루타미컴 염색체로 플라스미드를 통합시켰다. 통합 사건은 항생제 (25 ㎍/㎖ 카나마이신)의 존재 하에서 성장에 의해 게놈에서 안정하게 유지된다. 루프-인 통합으로부터 유래된 콜로니에서 올바른 게놈 통합은 UF/IR 및 DR/IF PCR 프라이머를 사용한 콜로니 PCR로 확인하였다.
루프-인, 루프-아웃 구성체 (제목 "루프-인, 루프-아웃으로 표시)는 2개 2-kb 상보성 팔부 (5' 및 3' 팔부), 관심 유전자(들) (화살표), 양성 선별 마커 ("마커"로 표시), 및 역선별 마커를 함유하였다. "루프-인" 단독 구성체와 유사하게, 단일 크로스오버 사건은 플라스미드를 씨. 글루타미컴의 염색체로 통합시켰다. 주: 2가지 가능한 통합중 오직 하나만을 여기에 도시한다. 올바른 게놈 통합은 콜로니 PCR을 통해 확인하였고 플라스미드 골격 및 역선별 마커가 절개될 수 있도록 역선별이 적용되었다. 그 결과로 2가지 가능성 중 하나가 일어난다: 야생형으로의 복귀 (아래 좌측 박스) 또는 바람직한 경로 통합 (아래 우측 박스). 역시, 올바른 게놈 루프-아웃은 콜로니 PCR로 확인한다. (약어: 프라이머: UF = 상류 전방향, DR = 하류 역방향, IR = 내부 역방향, IF = 내부 전방향.)
세포 배양
배지 요건 및 성장의 차이에 기인하여 씨. 글루타미컴 및 에스. 세레비지아에 대한 개별 작업흐름을 확립시켰다. 양쪽 과정은 플레이트의 균주를 임의추출하는 자동화 작업흐름을 사용하여 성공적으로 구축된 균주를 강화시키는 히트-피킹 단계를 포함하였다. 성공적으로 구축된 각 균주의 경우에, 콜로니 대 콜로니 변동 및 다른 과정중 변동을 시험하기 위해 별개 콜로니로부터 최대 4개의 복제물을 시험하였다. 4개보다 적게 콜로니가 수득되었다면, 존재하는 콜로니는 각각의 바람직한 유전자형으로부터 적어도 4개 웰이 시험되도록 복제하였다.
콜로니는 선별 배지 (씨. 글루타미컴의 경우 BHI, 에스. 세레비지아의 경우 SD-ura)를 포함하는 95-웰 플레이트에서 강화시켰고 포화까지 2일 동안 배양하였으며 이후 16.6% 글리세롤을 포함시켜 -80℃에서 저장을 위해 냉동시켰다. 이후에 냉동된 스톡은 냉동으로부터 성장 및 회수를 돕도록 저수준의 아미노산이 포함된 최소 배지 중에서 씨드 단계를 접종하는데 사용되었다. 씨드 플레이트는 1일 내지 2일 동안 30℃에서 성장시켰다. 그리고 씨드 플레이트는 최소 배지를 포함하는 주요 배양 플레이트에 접종하여 48시간 내지 88시간 동안 성장시키는데 사용되었다. 플레이트는 바람직한 시점에 제거되었고 세포 밀도 (OD600), 생존능 및 포도당에 대해 시험되었으며, 상청액 샘플은 관심 생성물에 대한 LC-MS 분석을 위해 저장되었다.
세포 밀도
세포 밀도는 600 nm에서 각 웰의 흡광도를 검출하는 분광광도 어세이를 사용해 측정되었다. 고정량의 배양물을 각 배양 플레이트로부터 어세이 플레이트로 전달한 후에, 175 mM 소듐 포스페이트 (pH 7.0)와 혼합하여 10-배 희석물을 생성시키는데 로봇공학이 사용되었다. 어세이 플레이트는 Tecan M1000 분광광도계를 사용하여 측정하였고 어세이 데이타를 LIMS 데이타베이스에 업로딩하였다. 비접종 대조군을 사용하여 배경치 흡광도를 빼주었다. 세포 성장은 각 단계에서 다수 플레이트를 접종하고, 그 이후 각 시점에 전체 플레이트를 희생시켜 모니터링하였다.
대량의 플레이트를 취급하는 동안 세포의 침강 (그 결과로 측정동안 비대표적 샘플이 야기될 수 있음)을 최소화하기 위해서 각 플레이트는 각 판독 전에 10 내지 15초 동안 진탕시켰다. 플레이트 내에서 세포 밀도의 광범위한 변동은 또한 직선 검출 범위의 바깥쪽에서 흡광도 측정을 초래할 수 있고, 그 결과로 더 높은 OD 배양물을 과소평가하게 될 수 있다. 일반적으로, 지금까지 시험된 균주는 이것이 우려될 만큼 충분히 유의하게 변동되지 않았다.
세포 생존능
2종의 방법을 사용하여 세포 생존능을 측정하였다. 첫번째 어세이는 세포 생존능을 평가하기 위해, 단일 염색제, 프로피듐 아이오다이드를 이용하였다. 프로피듐 아이오다이드는 DNA에 결합하고 세포막이 손상된 세포로 투과가능하다. 프로피듐 요오다이드를 흡수한 세포는 비생존으로 간주된다. 죽은 세포 대조군은 10분 동안 95℃에서 대조군 배양물의 세포 샘플을 인큐베이션시킴으로써, 세포의 전체 개수에 대해 정규화하는데 사용되었다. 이들 대조군 샘플 및 시험 샘플은 5분 동안 프로피듐 아이오다이드 염색제와 인큐베이션시켰고, 2회 175 mM 포스페이트 완충액으로 세척하였으며, 형광도는 617 nm에서 검은색 고형-바닥 96웰 플레이트에서 측정하였다.
포도당
포도당은 175 mM 소듐 포스페이트 완충액, pH 7 중 0.2 U/㎖ 홀스래디쉬 퍼옥시다제 (Sigma) 및 0.2 mM 앰플렉스 레드와 16 U/㎖ 포도당 옥시다제 (Sigma)를 사용하는 효소 어세이를 사용하여 측정된다. 포도당의 산화는 히드로겐 퍼옥시다제를 발생시키고, 이후에 산화되어 앰플렉스 레드로 환원되어, 560 nm에서 흡광도를 변화시킨다. 변화는 흡광도이고 기지 농도의 표준물을 사용하는 샘플 중 포도당 농도와 상관성이 있다.
액체-고체 분리
LC-MS에 의한 분석을 위해 세포외 샘플을 수확하기 위해서, 액체 및 고체 상은 원심분리를 통해서 분리시켰다. 배양 플레이트는 2000 rpm에서 4분 동안 원심분리시켰고, 상청액은 로봇공학을 사용해 목적 플레이트로 전달하였다. 75 ㎕의 상청액을 각 플레이트로 전달하였고, 하나는 4℃에 저장하였고, 두번째는 장기간 저장을 위해 80℃에 저장하였다.
1회차의 유전자 조작 및 스크리닝은 숙주 세포로서 씨. 글루타미컴 및 에스. 세레비지아를 사용해 수행되었다. 이종성 TYDC는 일부 경우에서, 피드백-이상조절된 DAHP 신타제와 함께 숙주 세포에서 발현시켰다. 일부 경우에, TYDC 뉴클레오티드 서열은 씨. 글루타미컴 또는 에스. 세레비지아에 대해 코돈-최적화되었다. 균주는 상기에 기술된 바와 같이 생성시켰고 배양하였으며, 배양 배지 중 티라민 역가는 LC-MS로 측정하였다. 균주 및 결과는 표 1에 표시되어 있다. 최고-성능 균주는 K229L 아미노산 치환을 갖는 에스. 세레비지아 DAHP 신타제 (SEQ ID NO: 6)와 함께, 피. 솜니페럼 TYDC (SEQ ID NO: 2)를 발현하는 에스. 세레비지아 균주였고, 배양 배지의 L 기준으로 거의 387 ㎍/L의 티라민 역가를 제공하였다. 이러한 균주는 2회차의 유전자 조작 및 스크리닝을 위해 선택되었다.
2회차의 조작/스크리닝에서, 제3 효소는 1회차로부터의 K229L 아미노산 치환을 갖는 에스. 세레비지아 DAHP 신타제와 함께, 피. 솜니페럼 TYDC를 발현하는 에스. 세레비지아 균주에서 발현시켰다. 일부 경우에서, 제3 효소를 코딩하는 뉴클레오티드 서열은 코돈-최적화되었다. 표 2는 시험된 제3 효소 및 최종 티라민 역가를 표시하고 있다. 더 높은 역가는 약 346 ㎎/L로서, 거의 1000-배 개선이 제3 효소로서 천연 에스. 세레비지아 프리페네이트 디히드로게나제를 발현하는 균주에 의해 달성되었다.
실시예 2A - 에스. 세레비지아 구축물에서 개선-회차 (3회차) 결과 및 티라민의 생성을 위한 상이한 미생물 숙주 세포의 평가
요약
실시예 1의 최고-성능 균주는 사카로마이세스 세레비지아에서 티라민을 개선시키려는 노력으로 3회차 유전자 조작 ("개선 회차")을 시험하기 위한 대조군 균주로서 선택되었다. 대조군 균주는 에스. 세레비지아 유래 프리페네이트 디히드로게나제 (UniProt ID P20049)(SEQ ID NO: 4), 아미노산 치환 K229L을 보유하는 에스. 세레비지아 S288c 유래 DAHP 신타제 (UniProt ID P32449)(SEQ ID NO: 6) 및 파파베르 솜니페럼 유래 티로신/DOPA 디카복실라제 2 (UniProt ID P54769)(SEQ ID NO: 2)를 발현하였다. 티라민 생성은 대조군에 비해서 8종 균주의 경우에 에스. 세레비지아에서 개선되었고, 이들 균주 중에서, 최고 역가를 제공하는 균주 (300 ㎎/L vs. 대조군의 경우 266 ㎎/L)는 에스. 세레비지아 유래 트랜스알돌라제 (UniProt ID P15019)(SEQ ID NO: 8)를 발현하였다.
시험된 균주 디자인
티라민 생성은 대조군 대비 하기 이종성 효소 각각 또는 이종성 효소의 조합의 발현에 의해 개선되었다:
1) 방향족 아미노산 아미노트랜스퍼라제 (SEQ ID NO: 28)
2) 에스케리치아 콜라이 K12 유래 포스포에놀피루베이트 신타제 (UniProt ID P23538) (SEQ ID NO: 29)
3) 에스. 세레비지아 유래 트랜스케톨라제 (UniProt ID P23254) (SEQ ID NO: 30)
4) 에스. 세레비지아 유래 트랜스알돌라제 (UniProt ID P15019) (SEQ ID NO: 8)
5) 에스. 세레비지아 유래 트랜스케톨라제 (UniProt ID P23254) (SEQ ID NO: 30) 및 에스. 세레비지아 유래 트랜스알돌라제 (UniProt ID P15019) (SEQ ID NO: 8)
6) 에스. 세레비지아 유래 트랜스케톨라제 (UniProt ID P23254) (SEQ ID NO: 30) 및 이. 콜라이 K12 유래 포스포에놀피루베이트 신타제 (UniProt ID P23538) (SEQ ID NO: 29).
7) 에스. 세레비지아 유래 트랜스알돌라제 (UniProt ID P15019) (SEQ ID NO: 8) 및 아미노산 치환 K299L을 보유하는 에스. 세레비지아 유래 DAHP 신타제 (UniProt ID P32449) (SEQ ID NO: 6).
8) 그라실라리아 그라실리스 (Gracilaria gracilis) 유래 글리세르알데히드-3-포스페이트 디히드로게나제 (UniProt ID P30724) (SEQ ID NO: 31)
결과
결과는 표 7 (하기) 및 도 9에 표시되어 있다.
추가의 디자인, 티라민의 생성은 이 실시예로부터의 최고-성능 균주에 하기 이종성 효소 또는 이종성 효소의 조합의 첨가를 함유하는 균주에서 개선에 대해 시험될 수 있다:
1) 2-디히드로-3-데옥시포스포헵토네이트 알돌라제 (SEQ ID NO: 32)
2) 코리스메이트 뮤타제 (SEQ ID NO: 33)
3) 코리스메이트 뮤타제 (SEQ ID NO: 33) 및 프리페네이트 디히드로게나제 (SEQ ID NO: 4)
4) 시키메이트 키나제 1 (SEQ ID NO: 34)
5) 시키메이트 디히드로게나제 (SEQ ID NO: 35)
6) 프리페네이트 디히드로게나제 (SEQ ID NO: 4)
7) 티로신 아미노트랜스퍼라제 (SEQ ID NO: 36)
8) 프리페네이트 디히드로게나제 (SEQ ID NO: 4)
9) 글루타메이트 신타제 (GOGAT) 대형 서브유닛 (SEQ ID NO: 37)
10) 글루타민 신써타제 (GS) (SEQ ID NO: 39)
11) 글루타메이트 신타제 소형 서브유닛 (SEQ ID NO: 38)
12) 시키메이트 디히드로게나제 (SEQ ID NO: 35)
13) 시키메이트 키나제 2 (SEQ ID NO: 15)
14) 코리스메이트 뮤타제 (SEQ ID NO: 33) 및 프리페네이트 디히드로게나제 (SEQ ID NO: 4)
실시예 2B - 티라민의 생성을 위한 상이한 미생물 숙주 세포의 평가
요약
숙주 평가 디자인은 야로위아 리폴리티카, 바실러스 서브틸리스, 에스. 세레비지아 및 코리네박테리아 글루타미컴에서 시험되었다. 티라민 생성은 시험된 모든 균주에서 입증되었다. 최고-성능 와이. 리폴리티카 균주는 평균 54.5 ㎎/L 티라민을 생성하였다. 최고-성능 비. 서브틸러스 균주는 19.9 ㎎/L 티라민을 생성하였다. 숙주 평가로부터의 최고-성능 에스. 세레비지아 균주는 189 ㎎/L 티라민을 생성하였다. 최고-성능 씨. 글루타미컴 균주는 467 ㎎/L 티라민을 생성하였다.
결과
최고 성능 와이. 리폴리티카 균주는 평균 54.5 ㎎/L 티라민을 생성하였고 엔테로코커스 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC) (UniProt ID C9ASN2) (SEQ ID NO: 1), 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제) (UniProt ID P32449) (SEQ ID NO: 9)를 발현하였으며, 여기서 양쪽 효소에 대한 DNA 서열은 와이. 리폴리티카에 대해 코돈-최적화되었다. (표 3, 도 5) (각각, SEQ ID No: 40 및 10).
최고-성능 비. 서브틸리스 균주는 19.9 ㎎/L 티라민을 생성시켰고 엔테로코커스 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC) (UniProt ID C9ASN2) (SEQ ID NO: 1), 사카로마이세스 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제) (UniProt ID P32449) (SEQ ID NO: 9), 및 에스케리치아 콜라이 K12 유래 시키메이트 키나제 2 (UniProt ID P0A6E1) (SEQ ID NO: 15)를 발현하였고, 여기서 모든 3종 효소에 대한 DNA 서열은 에스. 세레비지아에 대해 코돈-최적화되었다. (표 4, 도 6) (SEQ ID NO: 43, 42, 41)
숙주 평가로부터의 최고-성능 에스. 세레비지아 균주는 189 ㎎/L 티라민을 생성하였고 이. 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC) (UniProt ID C9ASN2) (SEQ ID NO: 1), 에스. 세레비지아 S288c 유래의 아미노산 치환 K229L을 보유하는 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제) (UniProt ID P32449) (SEQ ID NO: 6)를 발현하였고, 여기서 양쪽 효소에 대한 DNA 서열은 씨. 글루타미컴 및 에스. 세레비지아에 대한 변형된 조합 코돈 표를 사용하여 코돈-최적화되었다. (표 5, 도 7) (SEQ ID NO: 45, 44).
최고-성능 씨. 글루타미컴 균주는 467 ㎎/L 티라민을 생성하였고 이. 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC) (UniProt ID C9ASN2) (SEQ ID NO: 1), 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)(UniProt ID P32449) (SEQ ID NO: 9)를 발현하였고, 여기서 양쪽 효소에 대한 DNA 서열은 에스. 세레비지아에 대해 코돈-최적화되었다. (표 6, 도 8) (SEQ ID NO: 43, 42).
스틸벤 및 (2S)-플라바논의 생성을 위한 플랫폼 씨. 글루타미컴 균주를 개선시키기 위해서, Kallscheuer 등 (하기 참조문헌 참조)은 폴리프로파노이드 분해 오페론 (phdBCDE, cg0344-47); 4-히드록시벤조에이트-3-히드롤라제 (pobA (cg1226); 4-히드록시벤조에이트, 카테콜, 벤조에이트, 및 프로토카테추에이트의 분해에 필수적인, cat, ben, pca를 보유하는 유전자 클러스터 (cg2625-40); 및 동화적 시키메이트 경로의 필수 유전자로 구성된 오페론의 일부인 qsuE (cg0502)를 포함하는, 방향족 고리를 분해시키는 유전자 및 오페론을 결실시켰다. 씨. 글루타미컴에서 티라민의 생성은 또한 티라민이 방향족 고리를 함유하므로, 방향족을 분해하는 이들 효소의 발현을 결실시키거나 또는 저하시켜 추가 개선에 대해 시험될 수 있다.
참조문헌
Noda, S. et al., PLoS One, DOI:10.1371/journal.pone.0125488 May 21, 2015.
Koma, D. et al., Appl Microbiol Biotechnol (2012) 93:815-829, DOI 10.1007/s00253-011-3735-z, November, 2011.
WO 2008/064835 (2007년 11월 27일 출원, 우선일: 2006년 11월 27, DSM IP ASSETS B.V.에게 양도됨)
Zhang, C. et al., FEMS Microbiol Lett 353 (2014) 11-18, 0.1111/1574-6968.12397, 2014.
Kallscheuer, N., et al., Construction of a Corynebacterium glutamicum platform strain for the production of stilbenes and (2S)-flavanones. Metab Eng, 2016. 38: p. 47-55.
SEQUENCE LISTING
<110> Zymergen Inc.
<120> ENGINEERED BIOSYNTHETIC PATHWAYS FOR PRODUCTION OF TYRAMINE BY
FERMENTATION
<130> ZMGNP001WO/ZMN0012-WO-00
<140> Not Assigned
<141> 2018-02-06
<150> 62/455,428
<151> 2017-02-06
<160> 122
<170> PatentIn version 3.5
<210> 1
<211> 625
<212> PRT
<213> Enterococcus faecium Com15
<400> 1
Met Ser Glu Ser Leu Ser Lys Asp Leu Asn Leu Asn Ala Leu Phe Ile
1 5 10 15
Gly Asp Lys Ala Glu Asn Gly Gln Ile Tyr Lys Ala Leu Leu Asn Glu
20 25 30
Leu Val Asp Glu His Leu Gly Trp Arg Gln Asn Tyr Met Pro Gln Asp
35 40 45
Met Pro Ile Ile Thr Pro Glu Glu Lys Ser Ser Ala Ser Phe Glu His
50 55 60
Thr Val Asn Lys Thr Lys Asp Val Leu Ser Glu Ile Ser Ala Arg Met
65 70 75 80
Arg Thr His Ser Val Pro Trp His Asn Ala Gly Arg Tyr Trp Gly His
85 90 95
Met Asn Ser Glu Thr Leu Met Pro Ser Leu Leu Ala Tyr Asn Phe Ala
100 105 110
Met Leu Trp Asn Gly Asn Asn Val Ala Tyr Glu Ser Ser Pro Ala Thr
115 120 125
Ser Gln Met Glu Glu Glu Val Gly Met Glu Phe Ala Lys Leu Met Ser
130 135 140
Tyr Lys Asp Gly Trp Gly His Ile Val Ala Asp Gly Ser Leu Ala Asn
145 150 155 160
Leu Glu Gly Leu Trp Tyr Ala Arg Asn Ile Lys Ser Leu Pro Leu Ala
165 170 175
Met Lys Glu Val Thr Pro Glu Leu Val Ala Gly Lys Ser Asp Trp Glu
180 185 190
Leu Met Asn Leu Ser Thr Glu Glu Ile Met Asn Leu Leu Asp Ser Val
195 200 205
Pro Glu Lys Ile Asp Glu Ile Lys Ala His Ser Ala Arg Ser Gly Lys
210 215 220
His Leu Glu Lys Leu Gly Lys Trp Leu Val Pro Gln Thr Lys His Tyr
225 230 235 240
Ser Trp Leu Lys Ala Ala Asp Ile Ile Gly Ile Gly Leu Asp Gln Val
245 250 255
Ile Pro Val Pro Val Asp His Asn Tyr Arg Met Asp Ile Asn Glu Leu
260 265 270
Glu Lys Ile Val Arg Gly Leu Ala Ala Glu Lys Thr Pro Ile Leu Gly
275 280 285
Val Val Gly Val Val Gly Ser Thr Glu Glu Gly Ala Ile Asp Gly Ile
290 295 300
Asp Lys Ile Val Ala Leu Arg Arg Val Leu Glu Lys Asp Gly Ile Tyr
305 310 315 320
Phe Tyr Leu His Val Asp Ala Ala Tyr Gly Gly Tyr Gly Arg Ala Ile
325 330 335
Phe Leu Asp Glu Asp Asn Asn Phe Ile Pro Phe Glu Asp Leu Lys Asp
340 345 350
Val His Tyr Lys Tyr Asn Val Phe Thr Glu Asn Lys Asp Tyr Ile Leu
355 360 365
Glu Glu Val His Ser Ala Tyr Lys Ala Ile Glu Glu Ala Glu Ser Val
370 375 380
Thr Ile Asp Pro His Lys Met Gly Tyr Val Pro Tyr Ser Ala Gly Gly
385 390 395 400
Ile Val Ile Lys Asp Ile Arg Met Arg Asp Val Ile Ser Tyr Phe Ala
405 410 415
Thr Tyr Val Phe Glu Lys Gly Ala Asp Ile Pro Ala Leu Leu Gly Ala
420 425 430
Tyr Ile Leu Glu Gly Ser Lys Ala Gly Ala Thr Ala Ala Ser Val Trp
435 440 445
Ala Ala His His Val Leu Pro Leu Asn Val Thr Gly Tyr Gly Lys Leu
450 455 460
Met Gly Ala Ser Ile Glu Gly Ala His Arg Phe Tyr Asn Phe Leu Asn
465 470 475 480
Asp Leu Ser Phe Lys Val Gly Asp Lys Glu Ile Glu Val His Pro Leu
485 490 495
Thr Tyr Pro Asp Phe Asn Met Val Asp Tyr Val Phe Lys Glu Lys Gly
500 505 510
Asn Asp Asp Leu Val Ala Met Asn Lys Leu Asn His Asp Val Tyr Asp
515 520 525
Tyr Ser Ser Tyr Val Lys Gly Ser Ile Tyr Gly Asn Glu Phe Leu Thr
530 535 540
Ser His Thr Asp Phe Ala Ile Pro Asp Tyr Gly Asn Ser Pro Leu Gln
545 550 555 560
Phe Val Asn Gln Leu Gly Phe Ser Asp Glu Glu Trp Asn Arg Ala Gly
565 570 575
Lys Val Thr Val Leu Arg Ala Ser Val Met Thr Pro Tyr Met Asn Lys
580 585 590
Glu Glu His Phe Glu Glu Tyr Ala Glu Lys Ile Lys Ala Ala Leu Gln
595 600 605
Glu Lys Leu Glu Lys Ile Tyr Ala Asp Gln Leu Leu Ala Ser Glu Ala
610 615 620
Lys
625
<210> 2
<211> 531
<212> PRT
<213> Papaver somniferum (Opium poppy)
<400> 2
Met Gly Ser Leu Asn Thr Glu Asp Val Leu Glu Asn Ser Ser Ala Phe
1 5 10 15
Gly Val Thr Asn Pro Leu Asp Pro Glu Glu Phe Arg Arg Gln Gly His
20 25 30
Met Ile Ile Asp Phe Leu Ala Asp Tyr Tyr Arg Asp Val Glu Lys Tyr
35 40 45
Pro Val Arg Ser Gln Val Glu Pro Gly Tyr Leu Arg Lys Arg Leu Pro
50 55 60
Glu Thr Ala Pro Tyr Asn Pro Glu Ser Ile Glu Thr Ile Leu Gln Asp
65 70 75 80
Val Thr Thr Glu Ile Ile Pro Gly Leu Thr His Trp Gln Ser Pro Asn
85 90 95
Tyr Tyr Ala Tyr Phe Pro Ser Ser Gly Ser Val Ala Gly Phe Leu Gly
100 105 110
Glu Met Leu Ser Thr Gly Phe Asn Val Val Gly Phe Asn Trp Met Ser
115 120 125
Ser Pro Ala Ala Thr Glu Leu Glu Ser Val Val Met Asp Trp Phe Gly
130 135 140
Lys Met Leu Asn Leu Pro Glu Ser Phe Leu Phe Ser Gly Ser Gly Gly
145 150 155 160
Gly Val Leu Gln Gly Thr Ser Cys Glu Ala Ile Leu Cys Thr Leu Thr
165 170 175
Ala Ala Arg Asp Arg Lys Leu Asn Lys Ile Gly Arg Glu His Ile Gly
180 185 190
Arg Leu Val Val Tyr Gly Ser Asp Gln Thr His Cys Ala Leu Gln Lys
195 200 205
Ala Ala Gln Val Ala Gly Ile Asn Pro Lys Asn Phe Arg Ala Ile Lys
210 215 220
Thr Phe Lys Glu Asn Ser Phe Gly Leu Ser Ala Ala Thr Leu Arg Glu
225 230 235 240
Val Ile Leu Glu Asp Ile Glu Ala Gly Leu Ile Pro Leu Phe Val Cys
245 250 255
Pro Thr Val Gly Thr Thr Ser Ser Thr Ala Val Asp Pro Ile Ser Pro
260 265 270
Ile Cys Glu Val Ala Lys Glu Tyr Glu Met Trp Val His Val Asp Ala
275 280 285
Ala Tyr Ala Gly Ser Ala Cys Ile Cys Pro Glu Phe Arg His Phe Ile
290 295 300
Asp Gly Val Glu Glu Ala Asp Ser Phe Ser Leu Asn Ala His Lys Trp
305 310 315 320
Phe Phe Thr Thr Leu Asp Cys Cys Cys Leu Trp Val Lys Asp Pro Ser
325 330 335
Ala Leu Val Lys Ala Leu Ser Thr Asn Pro Glu Tyr Leu Arg Asn Lys
340 345 350
Ala Thr Glu Ser Arg Gln Val Val Asp Tyr Lys Asp Trp Gln Ile Ala
355 360 365
Leu Ser Arg Arg Phe Arg Ser Leu Lys Leu Trp Met Val Leu Arg Ser
370 375 380
Tyr Gly Val Thr Asn Leu Arg Asn Phe Leu Arg Ser His Val Lys Met
385 390 395 400
Ala Lys Thr Phe Glu Gly Leu Ile Cys Met Asp Gly Arg Phe Glu Ile
405 410 415
Thr Val Pro Arg Thr Phe Ala Met Val Cys Phe Arg Leu Leu Pro Pro
420 425 430
Lys Thr Ile Lys Val Tyr Asp Asn Gly Val His Gln Asn Gly Asn Gly
435 440 445
Val Val Pro Leu Arg Asp Glu Asn Glu Asn Leu Val Leu Ala Asn Lys
450 455 460
Leu Asn Gln Val Tyr Leu Glu Thr Val Asn Ala Thr Gly Ser Val Tyr
465 470 475 480
Met Thr His Ala Val Val Gly Gly Val Tyr Met Ile Arg Phe Ala Val
485 490 495
Gly Ser Thr Leu Thr Glu Glu Arg His Val Ile Tyr Ala Trp Lys Ile
500 505 510
Leu Gln Glu His Ala Asp Leu Ile Leu Gly Lys Phe Ser Glu Ala Asp
515 520 525
Phe Ser Ser
530
<210> 3
<211> 376
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 3
Met Ser Thr Phe Gly Lys Leu Phe Arg Val Thr Thr Tyr Gly Glu Ser
1 5 10 15
His Cys Lys Ser Val Gly Cys Ile Val Asp Gly Val Pro Pro Gly Met
20 25 30
Ser Leu Thr Glu Ala Asp Ile Gln Pro Gln Leu Thr Arg Arg Arg Pro
35 40 45
Gly Gln Ser Lys Leu Ser Thr Pro Arg Asp Glu Lys Asp Arg Val Glu
50 55 60
Ile Gln Ser Gly Thr Glu Phe Gly Lys Thr Leu Gly Thr Pro Ile Ala
65 70 75 80
Met Met Ile Lys Asn Glu Asp Gln Arg Pro His Asp Tyr Ser Asp Met
85 90 95
Asp Lys Phe Pro Arg Pro Ser His Ala Asp Phe Thr Tyr Ser Glu Lys
100 105 110
Tyr Gly Ile Lys Ala Ser Ser Gly Gly Gly Arg Ala Ser Ala Arg Glu
115 120 125
Thr Ile Gly Arg Val Ala Ser Gly Ala Ile Ala Glu Lys Phe Leu Ala
130 135 140
Gln Asn Ser Asn Val Glu Ile Val Ala Phe Val Thr Gln Ile Gly Glu
145 150 155 160
Ile Lys Met Asn Arg Asp Ser Phe Asp Pro Glu Phe Gln His Leu Leu
165 170 175
Asn Thr Ile Thr Arg Glu Lys Val Asp Ser Met Gly Pro Ile Arg Cys
180 185 190
Pro Asp Ala Ser Val Ala Gly Leu Met Val Lys Glu Ile Glu Lys Tyr
195 200 205
Arg Gly Asn Lys Asp Ser Ile Gly Gly Val Val Thr Cys Val Val Arg
210 215 220
Asn Leu Pro Thr Gly Leu Gly Glu Pro Cys Phe Asp Lys Leu Glu Ala
225 230 235 240
Met Leu Ala His Ala Met Leu Ser Ile Pro Ala Ser Lys Gly Phe Glu
245 250 255
Ile Gly Ser Gly Phe Gln Gly Val Ser Val Pro Gly Ser Lys His Asn
260 265 270
Asp Pro Phe Tyr Phe Glu Lys Glu Thr Asn Arg Leu Arg Thr Lys Thr
275 280 285
Asn Asn Ser Gly Gly Val Gln Gly Gly Ile Ser Asn Gly Glu Asn Ile
290 295 300
Tyr Phe Ser Val Pro Phe Lys Ser Val Ala Thr Ile Ser Gln Glu Gln
305 310 315 320
Lys Thr Ala Thr Tyr Asp Gly Glu Glu Gly Ile Leu Ala Ala Lys Gly
325 330 335
Arg His Asp Pro Ala Val Thr Pro Arg Ala Ile Pro Ile Val Glu Ala
340 345 350
Met Thr Ala Leu Val Leu Ala Asp Ala Leu Leu Ile Gln Lys Ala Arg
355 360 365
Asp Phe Ser Arg Ser Val Val His
370 375
<210> 4
<211> 452
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 4
Met Val Ser Glu Asp Lys Ile Glu Gln Trp Lys Ala Thr Lys Val Ile
1 5 10 15
Gly Ile Ile Gly Leu Gly Asp Met Gly Leu Leu Tyr Ala Asn Lys Phe
20 25 30
Thr Asp Ala Gly Trp Gly Val Ile Cys Cys Asp Arg Glu Glu Tyr Tyr
35 40 45
Asp Glu Leu Lys Glu Lys Tyr Ala Ser Ala Lys Phe Glu Leu Val Lys
50 55 60
Asn Gly His Leu Val Ser Arg Gln Ser Asp Tyr Ile Ile Tyr Ser Val
65 70 75 80
Glu Ala Ser Asn Ile Ser Lys Ile Val Ala Thr Tyr Gly Pro Ser Ser
85 90 95
Lys Val Gly Thr Ile Val Gly Gly Gln Thr Ser Cys Lys Leu Pro Glu
100 105 110
Ile Glu Ala Phe Glu Lys Tyr Leu Pro Lys Asp Cys Asp Ile Ile Thr
115 120 125
Val His Ser Leu His Gly Pro Lys Val Asn Thr Glu Gly Gln Pro Leu
130 135 140
Val Ile Ile Asn His Arg Ser Gln Tyr Pro Glu Ser Phe Glu Phe Val
145 150 155 160
Asn Ser Val Met Ala Cys Leu Lys Ser Lys Gln Val Tyr Leu Thr Tyr
165 170 175
Glu Glu His Asp Lys Ile Thr Ala Asp Thr Gln Ala Val Thr His Ala
180 185 190
Ala Phe Leu Ser Met Gly Ser Ala Trp Ala Lys Ile Lys Ile Tyr Pro
195 200 205
Trp Thr Leu Gly Val Asn Lys Trp Tyr Gly Gly Leu Glu Asn Val Lys
210 215 220
Val Asn Ile Ser Leu Arg Ile Tyr Ser Asn Lys Trp His Val Tyr Ala
225 230 235 240
Gly Leu Ala Ile Thr Asn Pro Ser Ala His Gln Gln Ile Leu Gln Tyr
245 250 255
Ala Thr Ser Ala Thr Glu Leu Phe Ser Leu Met Ile Asp Asn Lys Glu
260 265 270
Gln Glu Leu Thr Asp Arg Leu Leu Lys Ala Lys Gln Phe Val Phe Gly
275 280 285
Lys His Thr Gly Leu Leu Leu Leu Asp Asp Thr Ile Leu Glu Lys Tyr
290 295 300
Ser Leu Ser Lys Ser Ser Ile Gly Asn Ser Asn Asn Cys Lys Pro Val
305 310 315 320
Pro Asn Ser His Leu Ser Leu Leu Ala Ile Val Asp Ser Trp Phe Gln
325 330 335
Leu Gly Ile Asp Pro Tyr Asp His Met Ile Cys Ser Thr Pro Leu Phe
340 345 350
Arg Ile Phe Leu Gly Val Ser Glu Tyr Leu Phe Leu Lys Pro Gly Leu
355 360 365
Leu Glu Gln Thr Ile Asp Ala Ala Ile His Asp Lys Ser Phe Ile Lys
370 375 380
Asp Asp Leu Glu Phe Val Ile Ser Ala Arg Glu Trp Ser Ser Val Val
385 390 395 400
Ser Phe Ala Asn Phe Asp Ile Tyr Lys Lys Gln Phe Gln Ser Val Gln
405 410 415
Lys Phe Phe Glu Pro Met Leu Pro Glu Ala Asn Leu Ile Gly Asn Glu
420 425 430
Met Ile Lys Thr Ile Leu Ser His Ser Ser Asp Arg Ser Ala Ala Glu
435 440 445
Lys Arg Asn Thr
450
<210> 5
<211> 370
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 5
Met Ser Glu Ser Pro Met Phe Ala Ala Asn Gly Met Pro Lys Val Asn
1 5 10 15
Gln Gly Ala Glu Glu Asp Val Arg Ile Leu Gly Tyr Asp Pro Leu Ala
20 25 30
Ser Pro Ala Leu Leu Gln Val Gln Ile Pro Ala Thr Pro Thr Ser Leu
35 40 45
Glu Thr Ala Lys Arg Gly Arg Arg Glu Ala Ile Asp Ile Ile Thr Gly
50 55 60
Lys Asp Asp Arg Val Leu Val Ile Val Gly Pro Cys Ser Ile His Asp
65 70 75 80
Leu Glu Ala Ala Gln Glu Tyr Ala Leu Arg Leu Lys Lys Leu Ser Asp
85 90 95
Glu Leu Lys Gly Asp Leu Ser Ile Ile Met Arg Ala Tyr Leu Glu Lys
100 105 110
Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro Asp Val
115 120 125
Asn Asn Thr Phe Asn Ile Asn Lys Gly Leu Gln Ser Ala Arg Gln Leu
130 135 140
Phe Val Asn Leu Thr Asn Ile Gly Leu Pro Ile Gly Ser Glu Met Leu
145 150 155 160
Asp Thr Ile Ser Pro Lys Tyr Leu Ala Asp Leu Val Ser Phe Gly Ala
165 170 175
Ile Gly Ala Arg Thr Thr Glu Ser Gln Leu His Arg Glu Leu Ala Ser
180 185 190
Gly Leu Ser Phe Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr Leu
195 200 205
Asn Val Ala Val Asp Ala Cys Gln Ala Ala Ala His Ser His His Phe
210 215 220
Met Gly Val Thr Lys His Gly Val Ala Ala Ile Thr Thr Thr Lys Gly
225 230 235 240
Asn Glu His Cys Phe Val Ile Leu Arg Gly Gly Lys Lys Gly Thr Asn
245 250 255
Tyr Asp Ala Lys Ser Val Ala Glu Ala Lys Ala Gln Leu Pro Ala Gly
260 265 270
Ser Asn Gly Leu Met Ile Asp Tyr Ser His Gly Asn Ser Asn Lys Asp
275 280 285
Phe Arg Asn Gln Pro Lys Val Asn Asp Val Val Cys Glu Gln Ile Ala
290 295 300
Asn Gly Glu Asn Ala Ile Thr Gly Val Met Ile Glu Ser Asn Ile Asn
305 310 315 320
Glu Gly Asn Gln Gly Ile Pro Ala Glu Gly Lys Ala Gly Leu Lys Tyr
325 330 335
Gly Val Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Asp
340 345 350
Val Leu Arg Lys Leu Ala Ala Ala Val Arg Gln Arg Arg Glu Val Asn
355 360 365
Lys Lys
370
<210> 6
<211> 370
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 6
Met Ser Glu Ser Pro Met Phe Ala Ala Asn Gly Met Pro Lys Val Asn
1 5 10 15
Gln Gly Ala Glu Glu Asp Val Arg Ile Leu Gly Tyr Asp Pro Leu Ala
20 25 30
Ser Pro Ala Leu Leu Gln Val Gln Ile Pro Ala Thr Pro Thr Ser Leu
35 40 45
Glu Thr Ala Lys Arg Gly Arg Arg Glu Ala Ile Asp Ile Ile Thr Gly
50 55 60
Lys Asp Asp Arg Val Leu Val Ile Val Gly Pro Cys Ser Ile His Asp
65 70 75 80
Leu Glu Ala Ala Gln Glu Tyr Ala Leu Arg Leu Lys Lys Leu Ser Asp
85 90 95
Glu Leu Lys Gly Asp Leu Ser Ile Ile Met Arg Ala Tyr Leu Glu Lys
100 105 110
Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro Asp Val
115 120 125
Asn Asn Thr Phe Asn Ile Asn Lys Gly Leu Gln Ser Ala Arg Gln Leu
130 135 140
Phe Val Asn Leu Thr Asn Ile Gly Leu Pro Ile Gly Ser Glu Met Leu
145 150 155 160
Asp Thr Ile Ser Pro Gln Tyr Leu Ala Asp Leu Val Ser Phe Gly Ala
165 170 175
Ile Gly Ala Arg Thr Thr Glu Ser Gln Leu His Arg Glu Leu Ala Ser
180 185 190
Gly Leu Ser Phe Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr Leu
195 200 205
Asn Val Ala Val Asp Ala Cys Gln Ala Ala Ala His Ser His His Phe
210 215 220
Met Gly Val Thr Leu His Gly Val Ala Ala Ile Thr Thr Thr Lys Gly
225 230 235 240
Asn Glu His Cys Phe Val Ile Leu Arg Gly Gly Lys Lys Gly Thr Asn
245 250 255
Tyr Asp Ala Lys Ser Val Ala Glu Ala Lys Ala Gln Leu Pro Ala Gly
260 265 270
Ser Asn Gly Leu Met Ile Asp Tyr Ser His Gly Asn Ser Asn Lys Asp
275 280 285
Phe Arg Asn Gln Pro Lys Val Asn Asp Val Val Cys Glu Gln Ile Ala
290 295 300
Asn Gly Glu Asn Ala Ile Thr Gly Val Met Ile Glu Ser Asn Ile Asn
305 310 315 320
Glu Gly Asn Gln Gly Ile Pro Ala Glu Gly Lys Ala Gly Leu Lys Tyr
325 330 335
Gly Val Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Asp
340 345 350
Val Leu Arg Lys Leu Ala Ala Ala Val Arg Gln Arg Arg Glu Val Asn
355 360 365
Lys Lys
370
<210> 7
<211> 350
<212> PRT
<213> Escherichia coli (strain K12)
<400> 7
Met Asn Tyr Gln Asn Asp Asp Leu Arg Ile Lys Glu Ile Lys Glu Leu
1 5 10 15
Leu Pro Pro Val Ala Leu Leu Glu Lys Phe Pro Ala Thr Glu Asn Ala
20 25 30
Ala Asn Thr Val Ala His Ala Arg Lys Ala Ile His Lys Ile Leu Lys
35 40 45
Gly Asn Asp Asp Arg Leu Leu Val Val Ile Gly Pro Cys Ser Ile His
50 55 60
Asp Pro Val Ala Ala Lys Glu Tyr Ala Thr Arg Leu Leu Ala Leu Arg
65 70 75 80
Glu Glu Leu Lys Asp Glu Leu Glu Ile Val Met Arg Val Tyr Phe Glu
85 90 95
Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro His
100 105 110
Met Asp Asn Ser Phe Gln Ile Asn Asp Gly Leu Arg Ile Ala Arg Lys
115 120 125
Leu Leu Leu Asp Ile Asn Asp Ser Gly Leu Pro Ala Ala Gly Glu Phe
130 135 140
Leu Asn Met Ile Thr Pro Gln Tyr Leu Ala Asp Leu Met Ser Trp Gly
145 150 155 160
Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Val His Arg Glu Leu Ala
165 170 175
Ser Gly Leu Ser Cys Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr
180 185 190
Ile Lys Val Ala Ile Asp Ala Ile Asn Ala Ala Gly Ala Pro His Cys
195 200 205
Phe Leu Ser Val Thr Lys Trp Gly His Ser Ala Ile Val Asn Thr Ser
210 215 220
Gly Asn Gly Asp Cys His Ile Ile Leu Arg Gly Gly Lys Glu Pro Asn
225 230 235 240
Tyr Ser Ala Lys His Val Ala Glu Val Lys Glu Gly Leu Asn Lys Ala
245 250 255
Gly Leu Pro Ala Gln Val Met Ile Asp Phe Ser His Ala Asn Ser Ser
260 265 270
Lys Gln Phe Lys Lys Gln Met Asp Val Cys Ala Asp Val Cys Gln Gln
275 280 285
Ile Ala Gly Gly Glu Lys Ala Ile Ile Gly Val Met Val Glu Ser His
290 295 300
Leu Val Glu Gly Asn Gln Ser Leu Glu Ser Gly Glu Pro Leu Ala Tyr
305 310 315 320
Gly Lys Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Asp Thr Asp Ala
325 330 335
Leu Leu Arg Gln Leu Ala Asn Ala Val Lys Ala Arg Arg Gly
340 345 350
<210> 8
<211> 335
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 8
Met Ser Glu Pro Ala Gln Lys Lys Gln Lys Val Ala Asn Asn Ser Leu
1 5 10 15
Glu Gln Leu Lys Ala Ser Gly Thr Val Val Val Ala Asp Thr Gly Asp
20 25 30
Phe Gly Ser Ile Ala Lys Phe Gln Pro Gln Asp Ser Thr Thr Asn Pro
35 40 45
Ser Leu Ile Leu Ala Ala Ala Lys Gln Pro Thr Tyr Ala Lys Leu Ile
50 55 60
Asp Val Ala Val Glu Tyr Gly Lys Lys His Gly Lys Thr Thr Glu Glu
65 70 75 80
Gln Val Glu Asn Ala Val Asp Arg Leu Leu Val Glu Phe Gly Lys Glu
85 90 95
Ile Leu Lys Ile Val Pro Gly Arg Val Ser Thr Glu Val Asp Ala Arg
100 105 110
Leu Ser Phe Asp Thr Gln Ala Thr Ile Glu Lys Ala Arg His Ile Ile
115 120 125
Lys Leu Phe Glu Gln Glu Gly Val Ser Lys Glu Arg Val Leu Ile Lys
130 135 140
Ile Ala Ser Thr Trp Glu Gly Ile Gln Ala Ala Lys Glu Leu Glu Glu
145 150 155 160
Lys Asp Gly Ile His Cys Asn Leu Thr Leu Leu Phe Ser Phe Val Gln
165 170 175
Ala Val Ala Cys Ala Glu Ala Gln Val Thr Leu Ile Ser Pro Phe Val
180 185 190
Gly Arg Ile Leu Asp Trp Tyr Lys Ser Ser Thr Gly Lys Asp Tyr Lys
195 200 205
Gly Glu Ala Asp Pro Gly Val Ile Ser Val Lys Lys Ile Tyr Asn Tyr
210 215 220
Tyr Lys Lys Tyr Gly Tyr Lys Thr Ile Val Met Gly Ala Ser Phe Arg
225 230 235 240
Ser Thr Asp Glu Ile Lys Asn Leu Ala Gly Val Asp Tyr Leu Thr Ile
245 250 255
Ser Pro Ala Leu Leu Asp Lys Leu Met Asn Ser Thr Glu Pro Phe Pro
260 265 270
Arg Val Leu Asp Pro Val Ser Ala Lys Lys Glu Ala Gly Asp Lys Ile
275 280 285
Ser Tyr Ile Ser Asp Glu Ser Lys Phe Arg Phe Asp Leu Asn Glu Asp
290 295 300
Ala Met Ala Thr Glu Lys Leu Ser Glu Gly Ile Arg Lys Phe Ser Ala
305 310 315 320
Asp Ile Val Thr Leu Phe Asp Leu Ile Glu Lys Lys Val Thr Ala
325 330 335
<210> 9
<211> 370
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 9
Met Ser Glu Ser Pro Met Phe Ala Ala Asn Gly Met Pro Lys Val Asn
1 5 10 15
Gln Gly Ala Glu Glu Asp Val Arg Ile Leu Gly Tyr Asp Pro Leu Ala
20 25 30
Ser Pro Ala Leu Leu Gln Val Gln Ile Pro Ala Thr Pro Thr Ser Leu
35 40 45
Glu Thr Ala Lys Arg Gly Arg Arg Glu Ala Ile Asp Ile Ile Thr Gly
50 55 60
Lys Asp Asp Arg Val Leu Val Ile Val Gly Pro Cys Ser Ile His Asp
65 70 75 80
Leu Glu Ala Ala Gln Glu Tyr Ala Leu Arg Leu Lys Lys Leu Ser Asp
85 90 95
Glu Leu Lys Gly Asp Leu Ser Ile Ile Met Arg Ala Tyr Leu Glu Lys
100 105 110
Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro Asp Val
115 120 125
Asn Asn Thr Phe Asn Ile Asn Lys Gly Leu Gln Ser Ala Arg Gln Leu
130 135 140
Phe Val Asn Leu Thr Asn Ile Gly Leu Pro Ile Gly Ser Glu Met Leu
145 150 155 160
Asp Thr Ile Ser Pro Gln Tyr Leu Ala Asp Leu Val Ser Phe Gly Ala
165 170 175
Ile Gly Ala Arg Thr Thr Glu Ser Gln Leu His Arg Glu Leu Ala Ser
180 185 190
Gly Leu Ser Phe Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr Leu
195 200 205
Asn Val Ala Val Asp Ala Cys Gln Ala Ala Ala His Ser His His Phe
210 215 220
Met Gly Val Thr Lys His Gly Val Ala Ala Ile Thr Thr Thr Lys Gly
225 230 235 240
Asn Glu His Cys Phe Val Ile Leu Arg Gly Gly Lys Lys Gly Thr Asn
245 250 255
Tyr Asp Ala Lys Ser Val Ala Glu Ala Lys Ala Gln Leu Pro Ala Gly
260 265 270
Ser Asn Gly Leu Met Ile Asp Tyr Ser His Gly Asn Ser Asn Lys Asp
275 280 285
Phe Arg Asn Gln Pro Lys Val Asn Asp Val Val Cys Glu Gln Ile Ala
290 295 300
Asn Gly Glu Asn Ala Ile Thr Gly Val Met Ile Glu Ser Asn Ile Asn
305 310 315 320
Glu Gly Asn Gln Gly Ile Pro Ala Glu Gly Lys Ala Gly Leu Lys Tyr
325 330 335
Gly Val Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Asp
340 345 350
Val Leu Arg Lys Leu Ala Ala Ala Val Arg Gln Arg Arg Glu Val Asn
355 360 365
Lys Lys
370
<210> 10
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 10
atgtctgagt ccccaatgtt cgccgcaaac ggtatgccta aagtcaacca gggagcagag 60
gaggacgtgc ggatcctggg ttacgatccc cttgcctcgc ctgcactgct ccaggttcag 120
attccagcca cgcccacctc tctggagacc gccaaacgag gtcgacgaga agcaattgac 180
atcattactg gcaaggatga ccgagtcctg gtgattgttg gcccctgttc tatccacgac 240
ctcgaggccg cacaggagta cgcccttcga cttaaaaagc tttccgatga gcttaagggc 300
gatctgtcga tcatcatgcg tgcttacctg gagaagcccc gtacgactgt cggatggaag 360
ggactgatta acgatcccga cgtcaataac acatttaaca ttaacaaggg cctgcagtcc 420
gctagacagc ttttcgttaa cctcaccaac attggcctcc ccattggctc cgagatgctc 480
gacactattt cgccccagta tctcgccgat ctcgtgtcct ttggtgctat cggtgctcga 540
acaaccgagt cccagctgca tcgagagctg gcatctggcc tctctttccc cgtcggcttc 600
aagaacggaa ccgatggtac cctcaacgtt gccgtggacg cctgtcaggc cgctgcccac 660
tctcaccact tcatgggagt gaccaagcac ggtgtcgctg ctattactac caccaaggga 720
aacgagcact gcttcgttat tctccgaggt ggcaagaagg gtactaacta cgatgccaag 780
tccgtggctg aagccaaggc ccagctgccc gccggctcta acggcctgat gattgattac 840
agccatggta attccaacaa ggatttccga aaccagccta aggtcaacga tgtggtctgc 900
gagcaaatcg ctaacggaga aaatgccatc accggcgtca tgattgagtc taacatcaac 960
gagggcaatc agggtatccc tgctgaggga aaggccggcc tgaagtacgg agtttccatt 1020
acagacgcct gcatcggatg ggagactaca gaggatgtcc tccgaaagct ggctgccgct 1080
gtgcgacagc gtcgggaggt gaacaagaag 1110
<210> 11
<211> 510
<212> PRT
<213> Zygosaccharomyces bailii ISA1307
<400> 11
Met Asp Ala Thr Asn Ile Ser Ala Ser Glu Gln Glu Lys Ile Leu Gly
1 5 10 15
Asn Leu Trp Lys Ala Ala Gln Gly Pro Gly Glu Gly His Val Leu Pro
20 25 30
Thr Val Asp Gln Leu Asn Arg Ala Arg Ala Ser Leu Tyr Asn Ser Leu
35 40 45
Pro Glu Glu Gly Val Gly Tyr Gln Ser Val Gln Arg His Ile Leu Asp
50 55 60
Asp Ile Val Pro Ala Phe Asn Gly Gly Ser Ile Asn Pro Asn Tyr Tyr
65 70 75 80
Gly Phe Val Thr Gly Gly Val Thr Pro Ala Ala Leu Phe Ala Asp Ala
85 90 95
Val Val Ser Ala Tyr Asp Gln Asn Val Gln Val His Leu Gln Ser His
100 105 110
Ser Ile Val Thr Asp Val Glu Phe Lys Thr Leu Gly Leu Leu Leu Gln
115 120 125
Leu Leu Lys Leu Asp Val Pro Ser Trp Leu Asn Gly Thr Phe Thr Thr
130 135 140
Gly Ala Thr Ala Ser Asn Ile Ile Gly Leu Ala Cys Gly Arg Glu Phe
145 150 155 160
Val Ile Gln Lys Ala Ala Gln Arg Lys Gly Ser Pro Ile Lys Ser Thr
165 170 175
Ala Asp Ala Gly Leu His Glu Val Leu Gln Ser Ile Gly Ala Ser Gly
180 185 190
Ile Gln Val Leu Ser Thr Leu Pro His Ser Ser Leu Val Lys Ala Ala
195 200 205
Gly Val Leu Gly Ile Gly Arg Met Asn Val Arg Asp Ile Ser Thr Glu
210 215 220
Ala Asn Pro Leu Asp Ile Asp Leu Lys Lys Leu Gln Thr Glu Leu Ser
225 230 235 240
Arg Val Asp Val Val Ser Ile Val Ala Ile Ser Cys Gly Glu Val Asn
245 250 255
Ser Gly Arg Phe Ala Ser Ala Gly Leu His Glu Leu Arg Lys Ile Arg
260 265 270
Gln Leu Cys Asp Arg His Gly Ala Trp Leu His Val Asp Gly Ala Phe
275 280 285
Gly Ile Phe Gly Arg Leu Val Gly Asp Asp Thr Glu Phe Met Ala Ile
290 295 300
Lys Glu Gly Cys Asp Gly Ile Glu Leu Ala Asp Ser Ile Thr Gly Asp
305 310 315 320
Ala His Lys Leu Leu Asn Val Pro Tyr Asp Cys Gly Phe Phe Phe Cys
325 330 335
Arg His Ala Ser Ile Ala Arg Glu Val Phe Gln Asn Ala Asn Ala Ala
340 345 350
Tyr Leu Ala Ser Val Asp Gly Arg Asp Ser Phe Ile Pro Ser Pro Leu
355 360 365
Asn Ile Gly Ile Glu Asn Ser Arg Arg Phe Arg Ala Leu Pro Val Tyr
370 375 380
Ala Ser Leu Leu Ala Tyr Gly Glu Val Glu Tyr Arg Lys Met Leu His
385 390 395 400
Arg Gln Ile Arg Leu Ala Arg Met Ile Tyr Gly Trp Ile Phe Asp His
405 410 415
Pro Gly Tyr Thr Ala Leu Pro Glu Thr Thr Ser Arg Glu Glu Leu Leu
420 425 430
Asp Leu Thr Tyr Met Val Val Leu Phe Arg Ala Lys Asp Gly Gly Leu
435 440 445
Asn Arg Thr Leu Glu Ala Lys Ile Asn Ala Thr Ser Arg Met Phe Val
450 455 460
Ser Gly Thr Ser Trp Ala Asp Ala Pro Ala Cys Arg Ile Ala Ile Ser
465 470 475 480
Asn Trp Arg Val Asp Glu Lys Arg Asp Phe Ala Leu Val Thr Gly Val
485 490 495
Leu Glu Ser Ala Leu Arg Ser Ser Gly Ser Ala Val Ser Cys
500 505 510
<210> 12
<211> 1128
<212> DNA
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 12
atgtcaacgt ttgggaaact gttccgcgtc accacatatg gtgaatcgca ttgtaagtct 60
gtcggttgca ttgtcgacgg tgttcctcca ggaatgtcat taaccgaagc tgacattcag 120
ccacaattga ccagaagaag accgggtcaa tctaagctat cgacccctag agacgaaaag 180
gatagagtgg aaatccagtc cggtaccgag ttcggcaaga ctctaggtac acccatcgcc 240
atgatgatca aaaacgagga ccaaagacct cacgactact ccgacatgga caagttccct 300
agaccttccc atgcggactt cacgtactcg gaaaagtacg gtatcaaggc ctcctctggt 360
ggtggcagag cttctgctag agaaacgatt ggccgtgtcg cttcaggtgc cattgctgag 420
aagttcttag ctcagaactc taatgtcgag atcgtagcct ttgtgacaca aatcggggaa 480
atcaagatga acagagactc tttcgatcct gaatttcagc atctgttgaa caccatcacc 540
agggaaaaag tggactcaat gggtcctatc agatgtccag acgcctccgt tgctggtttg 600
atggtcaagg aaatcgaaaa gtacagaggc aacaaggact ctatcggtgg tgtcgtcact 660
tgtgtcgtga gaaacttgcc taccggtctc ggtgagccat gctttgacaa gttggaagcc 720
atgttggctc atgctatgtt gtccattcca gcatccaagg gtttcgaaat tggctcaggt 780
tttcagggtg tctctgttcc agggtccaag cacaatgacc cattttactt tgaaaaagaa 840
acaaacagat taagaacaaa gaccaacaat tcaggtggtg tacaaggtgg tatctctaat 900
ggtgagaaca tctatttctc tgtcccattc aagtcagtgg ccactatctc tcaagaacaa 960
aaaaccgcca cttacgatgg tgaagaaggt atcttagccg ctaagggtag acatgaccct 1020
gctgtcactc caagagctat tcctattgtg gaagccatga ccgctctggt gttggctgac 1080
gcgcttttga tccaaaaggc aagagatttc tccagatccg tggttcat 1128
<210> 13
<211> 1356
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 13
atggtatcag aggataagat tgagcaatgg aaagccacaa aagtcattgg tataattggt 60
ctgggtgata tgggcctatt atacgctaat aaatttacag atgctggatg gggtgttata 120
tgttgtgata gggaagaata ttatgatgaa ctgaaagaaa aatatgcctc agctaaattc 180
gaactggtga aaaatggtca tttggtatcc aggcaaagcg actatattat ctatagtgtt 240
gaagcatcca atattagtaa gatcgtcgca acgtatggac catcttctaa ggttggaaca 300
attgttgggg gtcaaacgag ttgtaagctg ccggaaatcg aggctttcga aaagtattta 360
cccaaggact gcgacatcat taccgtgcat tcccttcatg ggcctaaagt taatactgaa 420
ggccaaccac tagttattat caatcacaga tcacagtacc cagaatcttt tgagttcgtt 480
aattctgtta tggcatgttt gaaaagtaag caagtttatt tgacatatga agagcatgac 540
aagattaccg ctgatacaca agctgtgaca catgctgctt tcttaagtat gggatctgcg 600
tgggcaaaga taaagattta tccttggact ctgggtgtaa acaaatggta cggtggccta 660
gaaaatgtga aagttaatat atcactaaga atctattcga acaagtggca tgtttacgca 720
ggattagcca taacaaaccc aagtgcacat cagcaaattc ttcaatatgc aaccagtgca 780
acagaactat ttagtttaat gatagataac aaagaacaag aacttactga tagactatta 840
aaagctaagc aatttgtatt tggaaagcat actggtctct tactattgga tgacacgatt 900
ttagagaaat attcgctatc aaaaagcagc attggtaaca gcaacaattg caagccagtg 960
ccgaattcac atttatcatt gttggcgatt gttgattcgt ggtttcaact tggtattgat 1020
ccatatgatc atatgatttg ttcgacgcca ttattcagaa tattcctggg tgtgtccgaa 1080
tatctttttt taaaacctgg cttattagaa cagacaattg atgcagctat ccatgataaa 1140
tcattcataa aagatgattt agaatttgtt atttcggcta gagaatggag ctcggttgtt 1200
tcttttgcca attttgatat atacaaaaag caatttcaga gtgttcaaaa gttctttgag 1260
ccaatgcttc cagaggctaa tctcattggc aacgagatga taaaaaccat tctgagtcat 1320
tctagtgacc gttcggccgc tgaaaaaaga aataca 1356
<210> 14
<211> 522
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 14
atgacacaac cgttattctt gataggcccg cgcggctgtg gcaagactac agtaggaatg 60
gcgttggcag actcactgaa ccgacggttc gtggatacag accagtggct tcaatcgcaa 120
ttaaatatga cggtcgccga aatcgtagaa cgggaggagt gggcggggtt tagagcgcgg 180
gagactgctg cgctggaagc ggtcacagca ccgtcaaccg tgattgcgac aggggggggt 240
atcatcctta cggagtttaa tagacacttt atgcagaata atggaatcgt agtgtatctt 300
tgcgcaccgg tgagcgtctt ggtgaataga ctgcaagcag ccccggaaga agatttgaga 360
ccaaccctga ccggcaagcc gttgagcgaa gaggtccagg aggtgttgga agaacgggac 420
gcgctgtatc gggaggtggc acacatcatt attgatgcta cgaatgaacc gtctcaagtc 480
ataagcgaga ttcgtagcgc gttagcccaa acgattaatt gc 522
<210> 15
<211> 174
<212> PRT
<213> Escherichia coli (strain K12)
<400> 15
Met Thr Gln Pro Leu Phe Leu Ile Gly Pro Arg Gly Cys Gly Lys Thr
1 5 10 15
Thr Val Gly Met Ala Leu Ala Asp Ser Leu Asn Arg Arg Phe Val Asp
20 25 30
Thr Asp Gln Trp Leu Gln Ser Gln Leu Asn Met Thr Val Ala Glu Ile
35 40 45
Val Glu Arg Glu Glu Trp Ala Gly Phe Arg Ala Arg Glu Thr Ala Ala
50 55 60
Leu Glu Ala Val Thr Ala Pro Ser Thr Val Ile Ala Thr Gly Gly Gly
65 70 75 80
Ile Ile Leu Thr Glu Phe Asn Arg His Phe Met Gln Asn Asn Gly Ile
85 90 95
Val Val Tyr Leu Cys Ala Pro Val Ser Val Leu Val Asn Arg Leu Gln
100 105 110
Ala Ala Pro Glu Glu Asp Leu Arg Pro Thr Leu Thr Gly Lys Pro Leu
115 120 125
Ser Glu Glu Val Gln Glu Val Leu Glu Glu Arg Asp Ala Leu Tyr Arg
130 135 140
Glu Val Ala His Ile Ile Ile Asp Ala Thr Asn Glu Pro Ser Gln Val
145 150 155 160
Ile Ser Glu Ile Arg Ser Ala Leu Ala Gln Thr Ile Asn Cys
165 170
<210> 16
<211> 363
<212> PRT
<213> Escherichia coli (D146N) DAHP synthase
<400> 16
Met Leu Asn Lys Gly Leu Ala Glu Glu Glu Leu Phe Ser Phe Leu Ser
1 5 10 15
Lys Lys Arg Glu Glu Asp Leu Cys His Ser His Ile Leu Ser Ser Met
20 25 30
Cys Thr Val Pro His Pro Ile Ala Val Lys Ala His Leu Met Phe Met
35 40 45
Glu Thr Asn Leu Gly Asp Pro Gly Leu Phe Pro Gly Thr Ala Ser Leu
50 55 60
Glu Arg Leu Leu Ile Glu Arg Leu Gly Asp Leu Phe His His Arg Glu
65 70 75 80
Ala Gly Gly Tyr Ala Thr Ser Gly Gly Thr Glu Ser Asn Ile Gln Ala
85 90 95
Leu Arg Ile Ala Lys Ala Gln Lys Lys Val Asp Lys Pro Asn Val Val
100 105 110
Ile Pro Glu Thr Ser His Phe Ser Phe Lys Lys Ala Cys Asp Ile Leu
115 120 125
Gly Ile Gln Met Lys Thr Val Pro Ala Asp Arg Ser Met Arg Thr Asp
130 135 140
Ile Ser Glu Val Ser Asp Ala Ile Asp Lys Asn Thr Ile Ala Leu Val
145 150 155 160
Gly Ile Ala Gly Ser Thr Glu Tyr Gly Met Val Asp Asp Ile Gly Ala
165 170 175
Leu Ala Thr Ile Ala Glu Glu Glu Asp Leu Tyr Leu His Val Asp Ala
180 185 190
Ala Phe Gly Gly Leu Val Ile Pro Phe Leu Pro Asn Pro Pro Ala Phe
195 200 205
Asp Phe Ala Leu Pro Gly Val Ser Ser Ile Ala Val Asp Pro His Lys
210 215 220
Met Gly Met Ser Thr Leu Pro Ala Gly Ala Leu Leu Val Arg Glu Pro
225 230 235 240
Gln Met Leu Gly Leu Leu Asn Ile Asp Thr Pro Tyr Leu Thr Val Lys
245 250 255
Gln Glu Tyr Thr Leu Ala Gly Thr Arg Pro Gly Ala Ser Val Ala Gly
260 265 270
Ala Leu Ala Val Leu Asp Tyr Met Gly Arg Asp Gly Met Glu Ala Val
275 280 285
Val Ala Gly Cys Met Lys Asn Thr Ser Arg Leu Ile Arg Gly Met Glu
290 295 300
Thr Leu Gly Phe Pro Arg Ala Val Thr Pro Asp Val Asn Val Ala Thr
305 310 315 320
Phe Ile Thr Asn His Pro Ala Pro Lys Asn Trp Val Val Ser Gln Thr
325 330 335
Arg Arg Gly His Met Arg Ile Ile Cys Met Pro His Val Thr Ala Asp
340 345 350
Met Ile Glu Gln Phe Leu Ile Asp Ile Gly Glu
355 360
<210> 17
<211> 384
<212> PRT
<213> Propionibacterium sp. oral taxon 192 str. F0372
<400> 17
Met Gly Met Asp Ile Ser Ser Arg Pro Val Glu Trp Ala Ser Leu Ser
1 5 10 15
Glu Ile Thr Ala Ser Asp Val Ser Phe Glu Gly Gly Ala Ile Phe Asn
20 25 30
Ser Ile Cys Thr Arg Pro His Pro Leu Ala Ala Gln Val Met Ala Asp
35 40 45
Asn Leu His Leu Asn Ala Gly Asp Gly Arg Leu Phe Pro Ser Val Ala
50 55 60
Arg Cys Glu Ser Glu Ile Thr Asn Phe Leu Gly Gly Leu Met Gly Leu
65 70 75 80
Pro Arg Ala Val Gly Met Cys Thr Ser Gly Ala Thr Glu Ala Asn Leu
85 90 95
Ile Ala Val His Ser Ala Ile Glu Asn Trp Arg Arg Lys Gly Gly Gln
100 105 110
Gly Arg Pro Gln Val Ile Leu Gly Arg Gly Gly His Phe Ser Phe Asp
115 120 125
Lys Ile Ser Val Leu Leu Gly Val Glu Leu Val Leu Ala Trp Ser Asp
130 135 140
Ile Asp Thr Leu Lys Val Asp Pro Glu Ser Val Ser Glu Leu Ile Ser
145 150 155 160
Pro Arg Thr Ala Leu Ile Val Ala Thr Ala Gly Ser Ser Glu Thr Gly
165 170 175
Ala Val Asp Asp Val Glu Trp Leu Ser Arg Val Ala Leu Ser Lys Gly
180 185 190
Val Pro Leu His Val Asp Ala Ala Ser Gly Gly Leu Leu Ile Pro Phe
195 200 205
Leu Arg Asp Leu Gly Gly Ala Leu Pro Asp Ile Gly Phe Arg Asn Asp
210 215 220
Gly Val Thr Thr Ile Ala Ile Asp Pro His Lys Phe Gly Ser Ala Pro
225 230 235 240
Ile Pro Ser Gly His Leu Val Ala Arg Glu Trp Thr Trp Ile Glu Gly
245 250 255
Leu Arg Thr Glu Ser His Tyr Gln Gly Thr Ala Arg His Leu Thr Phe
260 265 270
Leu Gly Thr Arg Ser Gly Gly Ser Ile Leu Ala Thr Tyr Ala Leu Phe
275 280 285
Gly His Leu Gly Glu Lys Gly Leu Arg Gly Met Ala Glu Gln Leu Lys
290 295 300
Ala Leu Arg Ser His Leu Val Asp Arg Leu Arg Lys Ala Gly Ala Thr
305 310 315 320
Leu Ala Tyr Val Pro Glu Leu Met Val Val Ala Leu Lys Ala Asp Ser
325 330 335
Asp Ala Val Lys Val Leu Glu Arg Arg Gly Ile Phe Thr Ser Tyr Ala
340 345 350
Lys Arg Leu Gly Tyr Leu Arg Ile Val Val Gln Leu His Met Ser Glu
355 360 365
Gly Gln Val Asp Gly Leu Val Asp Ala Leu Leu Met Glu Gly Ile Val
370 375 380
<210> 18
<211> 514
<212> PRT
<213> Petroselinum crispum
<400> 18
Met Gly Ser Ile Asp Asn Leu Thr Glu Lys Leu Ala Ser Gln Phe Pro
1 5 10 15
Met Asn Thr Leu Glu Pro Glu Glu Phe Arg Arg Gln Gly His Met Met
20 25 30
Ile Asp Phe Leu Ala Asp Tyr Tyr Arg Lys Val Glu Asn Tyr Pro Val
35 40 45
Arg Ser Gln Val Ser Pro Gly Tyr Leu Arg Glu Ile Leu Pro Glu Ser
50 55 60
Ala Pro Tyr Asn Pro Glu Ser Leu Glu Thr Ile Leu Gln Asp Val Gln
65 70 75 80
Thr Lys Ile Ile Pro Gly Ile Thr His Trp Gln Ser Pro Asn Phe Phe
85 90 95
Ala Tyr Phe Pro Ser Ser Gly Ser Thr Ala Gly Phe Leu Gly Glu Met
100 105 110
Leu Ser Thr Gly Phe Asn Val Val Gly Phe Asn Trp Met Val Ser Pro
115 120 125
Ala Ala Thr Glu Leu Glu Asn Val Val Thr Asp Trp Phe Gly Lys Met
130 135 140
Leu Gln Leu Pro Lys Ser Phe Leu Phe Ser Gly Gly Gly Gly Gly Val
145 150 155 160
Leu Gln Gly Thr Thr Cys Glu Ala Ile Leu Cys Thr Leu Val Ala Ala
165 170 175
Arg Asp Lys Asn Leu Arg Gln His Gly Met Asp Asn Ile Gly Lys Leu
180 185 190
Val Val Tyr Cys Ser Asp Gln Thr His Ser Ala Leu Gln Lys Ala Ala
195 200 205
Lys Ile Ala Gly Ile Asp Pro Lys Asn Phe Arg Ala Ile Glu Thr Thr
210 215 220
Lys Ser Ser Asn Phe Gln Leu Cys Pro Lys Arg Leu Glu Ser Ala Ile
225 230 235 240
Leu His Asp Leu Gln Asn Gly Leu Ile Pro Leu Tyr Leu Cys Ala Thr
245 250 255
Val Gly Thr Thr Ser Ser Thr Thr Val Asp Pro Leu Pro Ala Leu Thr
260 265 270
Glu Val Ala Lys Lys Tyr Asp Leu Trp Val His Val Asp Ala Ala Tyr
275 280 285
Ala Gly Ser Ala Cys Ile Cys Pro Glu Phe Arg Gln Tyr Leu Asp Gly
290 295 300
Val Glu Asn Ala Asp Ser Phe Ser Leu Asn Ala His Lys Trp Phe Leu
305 310 315 320
Thr Thr Leu Asp Cys Cys Cys Leu Trp Val Arg Asn Pro Ser Ala Leu
325 330 335
Ile Lys Ser Leu Ser Thr Tyr Pro Glu Phe Leu Lys Asn Asn Ala Ser
340 345 350
Glu Thr Asn Lys Val Val Asp Tyr Lys Asp Trp Gln Ile Met Leu Ser
355 360 365
Arg Arg Phe Arg Ala Leu Lys Leu Trp Phe Val Leu Arg Ser Tyr Gly
370 375 380
Val Gly Gln Leu Arg Glu Phe Ile Arg Gly His Val Gly Met Ala Lys
385 390 395 400
Tyr Phe Glu Gly Leu Val Asn Met Asp Lys Arg Phe Glu Val Val Ala
405 410 415
Pro Arg Leu Phe Ser Met Val Cys Phe Arg Ile Lys Pro Ser Ala Met
420 425 430
Ile Gly Lys Asn Asp Glu Asp Glu Val Asn Glu Ile Asn Arg Lys Leu
435 440 445
Leu Glu Ser Val Asn Asp Ser Gly Arg Ile Tyr Val Ser His Thr Val
450 455 460
Leu Gly Gly Ile Tyr Val Ile Arg Phe Ala Ile Gly Gly Thr Leu Thr
465 470 475 480
Asp Ile Asn His Val Ser Ala Ala Trp Lys Val Leu Gln Asp His Ala
485 490 495
Gly Ala Leu Leu Asp Asp Thr Phe Thr Ser Asn Lys Leu Val Glu Val
500 505 510
Leu Ser
<210> 19
<211> 517
<212> PRT
<213> Trichophyton equinum (strain ATCC MYA-4606 CBS 127.97) (Horse ringworm fungus)
<400> 19
Met Glu Arg Asn His Leu Lys Asp Ser Val Gly Val Gln Val Asp Asp
1 5 10 15
Gly His Ser Lys Glu Leu Trp Glu Thr Ala Leu Asn Pro Pro Arg Arg
20 25 30
Ser Val Leu Pro Pro Ala Ala Ser Leu Ala His Ser Arg Ser Ser Ile
35 40 45
Ile Thr Glu Leu Pro His Ala Gly Gln Gly Tyr Thr Gln Thr Lys Val
50 55 60
His Leu Phe Asn Asp Ile Ile Pro Gly Leu Asn Asp Cys Ala Ile Asn
65 70 75 80
Ala Asn Tyr Tyr Gly Phe Val Thr Gly Gly Val Thr Pro Ala Ala Leu
85 90 95
Leu Ala Asp Asn Val Val Ser Val Tyr Asp Gln Asn Val Cys Val His
100 105 110
Leu Val Asp His Ser Val Ala Thr Asp Val Asp Tyr Ala Ala Leu Cys
115 120 125
Leu Leu Lys Asp Leu Phe Gly Leu Lys Arg Asp Glu Trp Pro His Gly
130 135 140
Ile Phe Thr Thr Gly Ala Thr Ala Ser Asn Leu Val Gly Leu Ala Cys
145 150 155 160
Gly Arg Glu Tyr Val Leu Arg Lys Ala Ala Gln Lys Arg Gly Leu Ser
165 170 175
Gly Asn Ile Ala Ser Gly Asn Ile Thr Asp Ser Val Gly Glu Tyr Gly
180 185 190
Met Pro Ala Val Leu Glu Ala Ala Gly Leu Lys Gly Leu Gln Val Leu
195 200 205
Ser Thr Met Pro His Ser Ser Val Gly Lys Val Ala Gly Ile Leu Gly
210 215 220
Ile Gly Arg Ala Asn Val Lys Ser Ile Val Ser Lys Thr Gly Glu Ser
225 230 235 240
His Gly Gln Pro Leu Glu Phe Asp Phe Glu Leu Phe Glu Lys Glu Leu
245 250 255
Ala Arg Ala Gly Phe Ala Ser Ile Val Ser Ile Ser Cys Gly Glu Val
260 265 270
Asn Thr Gly Arg Phe Ala Thr Lys Gly Val Asp Glu Phe Arg Arg Val
275 280 285
Arg Ala Leu Cys Asp Lys Tyr Asn Ala Trp Leu His Val Asp Ala Ala
290 295 300
Phe Gly Met Phe Gly Arg Val Leu Asp Asp Ser Pro Glu Phe Glu Thr
305 310 315 320
Ile Lys Lys Gly Ser Glu Gly Ile Glu Leu Ala Asp Ser Ile Thr Gly
325 330 335
Asp Gly His Lys Leu Leu Asn Val Pro Tyr Asp Cys Gly Phe Phe Phe
340 345 350
Ser Arg His Gly Asp Ile Ala Glu Glu Val Phe Arg Asn Pro Asn Ala
355 360 365
Val Tyr Leu Ser Ser Ser Ala Gly Glu His Ile Pro Thr Pro Leu Asn
370 375 380
Ile Gly Val Glu Asn Ser Arg Arg Phe Arg Ala Leu Pro Val Tyr Ser
385 390 395 400
Thr Leu Val Ala Tyr Gly Lys Asp Gly Tyr Arg Ala Met Val Glu Arg
405 410 415
Gln Ile Arg Leu Ala Arg Leu Ile Thr Gly Trp Leu His Glu His Pro
420 425 430
Lys Tyr Thr Val Leu Gly Gly Gly Ala Ser Lys Glu Asp Leu Ile Ala
435 440 445
Ala Thr Tyr Val Ile Val Leu Phe Arg Ala Lys Asp Glu Ala Leu Asn
450 455 460
Ala Arg Leu Ala Ser Ala Ile Asn Gly Thr Gly Lys Met Phe Val Ser
465 470 475 480
Gly Thr Lys Trp Ala Gly Glu Pro Ala Cys Arg Val Ala Ile Ser Asn
485 490 495
Trp Lys Val Gln Val Glu Arg Asp Phe Thr Leu Val Lys Glu Val Leu
500 505 510
Asp Glu Val Ser Arg
515
<210> 20
<211> 481
<212> PRT
<213> Streptomyces sviceus ATCC 29083
<400> 20
Met Pro Asp Leu Glu Pro Asp Glu Phe Arg Arg Gln Gly His Gln Leu
1 5 10 15
Val Asp Trp Val Ala Arg Tyr Arg Thr Ser Leu Pro Ser Leu His Val
20 25 30
Arg Pro Lys Val Val Pro Gly Ser Val Lys Ala Gln Leu Pro Arg Glu
35 40 45
Leu Pro Glu Gln Pro Ser Gln Ala Leu Gly Asp Asp Leu Ile Ala Leu
50 55 60
Leu Asn Asp Val Val Val Pro Ser Ser Leu His Trp Gln His Pro Gly
65 70 75 80
Phe Phe Gly Tyr Phe Pro Ala Asn Ala Ser Leu Leu Ser Leu Leu Gly
85 90 95
Asp Ile Ala Ser Gly Gly Ile Gly Ala Gln Gly Met Leu Trp Ser Thr
100 105 110
Ser Pro Ala Gly Thr Glu Ile Glu Gln Val Leu Leu Asp Gly Leu Ala
115 120 125
Asp Ala Leu Gly Leu Gly Arg Glu Phe Thr Phe Ala Gly Gly Gly Gly
130 135 140
Gly Ser Leu Gln Asp Ser Ala Ser Ser Ala Ser Leu Ala Ala Leu Leu
145 150 155 160
Ala Ala Leu Gln Arg Ser Asn Pro Asp Trp Arg Glu His Gly Val Asp
165 170 175
Gly Thr Glu Thr Val Tyr Val Thr Ala Glu Thr His Ser Ser Leu Ala
180 185 190
Lys Ala Val Arg Val Ala Gly Leu Gly Ala Arg Ala Leu Arg Ile Val
195 200 205
Pro Phe Thr Gln Gly Thr Leu Ser Met Ser Ala Asp Ala Leu Ala Asp
210 215 220
Met Leu Ala Lys Asp Thr Ala Ala Gly Lys Arg Pro Val Met Val Cys
225 230 235 240
Pro Thr Val Gly Thr Thr Gly Thr Gly Ala Ile Asp Pro Val Arg Glu
245 250 255
Val Ala Leu Ala Ala Arg Thr Tyr Glu Ala Trp Val His Val Asp Ala
260 265 270
Ala Trp Ala Gly Val Ala Ala Leu Cys Pro Glu Phe Arg Trp Leu Leu
275 280 285
Asp Gly Val Asn Leu Val Asp Ser Phe Cys Thr Asp Ala His Lys Trp
290 295 300
Phe Tyr Thr Ala Phe Asp Ala Ser Phe Met Trp Val Arg Asp Ala Arg
305 310 315 320
Ala Leu Pro Thr Ala Leu Ser Ile Thr Pro Glu Tyr Leu Arg Asn Ala
325 330 335
Ala Thr Glu Ser Gly Glu Val Ile Asp Tyr Arg Asp Trp Gln Val Pro
340 345 350
Leu Gly Arg Arg Met Arg Ala Leu Lys Ile Trp Ser Val Val His Gly
355 360 365
Ala Gly Leu Glu Gly Leu Arg Glu Ser Ile Arg Gly His Val Ala Met
370 375 380
Ala Asn Ser Leu Ala Gly Arg Ile Glu Ser Glu Ser Gly Phe Ala Leu
385 390 395 400
Ala Thr Pro Pro Ser Leu Ala Leu Val Cys Leu Tyr Leu Val Asp Gln
405 410 415
Glu Gly Arg Pro Asp Asp Ala Ala Thr Lys Ala Ala Met Glu Ala Val
420 425 430
Asn Ala Glu Gly His Ser Phe Leu Thr His Thr Ser Val Asn Gly His
435 440 445
Phe Ala Ile Arg Val Ala Ile Gly Ala Thr Thr Thr Leu Pro Asp His
450 455 460
Ile Asp Thr Leu Trp Asp Ser Leu Cys Lys Ala Ala Arg Gln Ser Gly
465 470 475 480
Gly
<210> 21
<211> 470
<212> PRT
<213> Pseudomonas putida (strain KT2440)
<400> 21
Met Thr Pro Glu Gln Phe Arg Gln Tyr Gly His Gln Leu Ile Asp Leu
1 5 10 15
Ile Ala Asp Tyr Arg Gln Thr Val Gly Glu Arg Pro Val Met Ala Gln
20 25 30
Val Glu Pro Gly Tyr Leu Lys Ala Ala Leu Pro Ala Thr Ala Pro Gln
35 40 45
Gln Gly Glu Pro Phe Ala Ala Ile Leu Asp Asp Val Asn Asn Leu Val
50 55 60
Met Pro Gly Leu Ser His Trp Gln His Pro Asp Phe Tyr Gly Tyr Phe
65 70 75 80
Pro Ser Asn Gly Thr Leu Ser Ser Val Leu Gly Asp Phe Leu Ser Thr
85 90 95
Gly Leu Gly Val Leu Gly Leu Ser Trp Gln Ser Ser Pro Ala Leu Ser
100 105 110
Glu Leu Glu Glu Thr Thr Leu Asp Trp Leu Arg Gln Leu Leu Gly Leu
115 120 125
Ser Gly Gln Trp Ser Gly Val Ile Gln Asp Thr Ala Ser Thr Ser Thr
130 135 140
Leu Val Ala Leu Ile Ser Ala Arg Glu Arg Ala Thr Asp Tyr Ala Leu
145 150 155 160
Val Arg Gly Gly Leu Gln Ala Glu Pro Lys Pro Leu Ile Val Tyr Val
165 170 175
Ser Ala His Ala His Ser Ser Val Asp Lys Ala Ala Leu Leu Ala Gly
180 185 190
Phe Gly Arg Asp Asn Ile Arg Leu Ile Pro Thr Asp Glu Arg Tyr Ala
195 200 205
Leu Arg Pro Glu Ala Leu Gln Ala Ala Ile Glu Gln Asp Leu Ala Ala
210 215 220
Gly Asn Gln Pro Cys Ala Val Val Ala Thr Thr Gly Thr Thr Thr Thr
225 230 235 240
Thr Ala Leu Asp Pro Leu Arg Pro Val Gly Glu Ile Ala Gln Ala Asn
245 250 255
Gly Leu Trp Leu His Val Asp Ser Ala Met Ala Gly Ser Ala Met Ile
260 265 270
Leu Pro Glu Cys Arg Trp Met Trp Asp Gly Ile Glu Leu Ala Asp Ser
275 280 285
Val Val Val Asn Ala His Lys Trp Leu Gly Val Ala Phe Asp Cys Ser
290 295 300
Ile Tyr Tyr Val Arg Asp Pro Gln His Leu Ile Arg Val Met Ser Thr
305 310 315 320
Asn Pro Ser Tyr Leu Gln Ser Ala Val Asp Gly Glu Val Lys Asn Leu
325 330 335
Arg Asp Trp Gly Ile Pro Leu Gly Arg Arg Phe Arg Ala Leu Lys Leu
340 345 350
Trp Phe Met Leu Arg Ser Glu Gly Val Asp Ala Leu Gln Ala Arg Leu
355 360 365
Arg Arg Asp Leu Asp Asn Ala Gln Trp Leu Ala Gly Gln Val Glu Ala
370 375 380
Ala Ala Glu Trp Glu Val Leu Ala Pro Val Gln Leu Gln Thr Leu Cys
385 390 395 400
Ile Arg His Arg Pro Ala Gly Leu Glu Gly Glu Ala Leu Asp Ala His
405 410 415
Thr Lys Gly Trp Ala Glu Arg Leu Asn Ala Ser Gly Ala Ala Tyr Val
420 425 430
Thr Pro Ala Thr Leu Asp Gly Arg Trp Met Val Arg Val Ser Ile Gly
435 440 445
Ala Leu Pro Thr Glu Arg Gly Asp Val Gln Arg Leu Trp Ala Arg Leu
450 455 460
Gln Asp Val Ile Lys Gly
465 470
<210> 22
<211> 575
<212> PRT
<213> Modestobacter marinus (strain BC501)
<400> 22
Met Thr Gly His Met Thr Pro Glu Gln Phe Arg Gln His Gly His Glu
1 5 10 15
Val Val Asp Trp Ile Ala Asp Tyr Trp Glu Arg Ile Gly Ser Phe Pro
20 25 30
Val Arg Ser Gln Val Ser Pro Gly Asp Val Arg Ala Ser Leu Pro Pro
35 40 45
Thr Ala Pro Glu Gln Gly Glu Pro Phe Ser Ala Val Leu Ala Asp Leu
50 55 60
Asp Arg Val Val Leu Pro Gly Val Thr His Trp Gln His Pro Gly Phe
65 70 75 80
Phe Gly Tyr Phe Pro Ala Asn Thr Ser Gly Pro Ser Val Leu Gly Asp
85 90 95
Leu Val Ser Ala Gly Leu Gly Val Gln Gly Met Ser Trp Val Thr Ser
100 105 110
Pro Ala Ala Thr Glu Leu Glu Gln His Val Met Asp Trp Phe Ala Asp
115 120 125
Leu Leu Gly Leu Pro Glu Ser Phe Arg Ser Thr Gly Ser Gly Gly Gly
130 135 140
Val Val Gln Asp Ser Ser Ser Gly Ala Asn Leu Val Ala Leu Leu Ala
145 150 155 160
Ala Leu His Arg Ala Ser Lys Gly Ala Thr Leu Arg His Gly Val Arg
165 170 175
Pro Glu Asp His Thr Val Tyr Val Ser Ala Glu Thr His Ser Ser Met
180 185 190
Glu Lys Ala Ala Arg Ile Ala Gly Leu Gly Thr Asp Ala Ile Arg Ile
195 200 205
Val Glu Val Gly Pro Asp Leu Ala Met Asn Pro Arg Ala Leu Ala Gln
210 215 220
Arg Leu Glu Arg Asp Val Ala Arg Gly Tyr Thr Pro Val Leu Val Cys
225 230 235 240
Ala Thr Val Gly Thr Thr Ser Thr Thr Ala Ile Asp Pro Leu Ala Glu
245 250 255
Leu Gly Pro Ile Cys Gln Gln His Gly Val Trp Leu His Val Asp Ala
260 265 270
Ala Tyr Ala Gly Val Ser Ala Val Ala Pro Glu Leu Arg Ala Leu Gln
275 280 285
Ala Gly Val Glu Trp Ala Asp Ser Tyr Thr Thr Asp Ala His Lys Trp
290 295 300
Leu Leu Thr Gly Phe Asp Ala Thr Leu Phe Trp Val Ala Asp Arg Ala
305 310 315 320
Ala Leu Thr Gly Ala Leu Ser Ile Leu Pro Glu Tyr Leu Arg Asn Ala
325 330 335
Ala Thr Asp Thr Gly Ala Val Val Asp Tyr Arg Asp Trp Gln Ile Glu
340 345 350
Leu Gly Arg Arg Phe Arg Ala Leu Lys Leu Trp Phe Val Val Arg Trp
355 360 365
Tyr Gly Ala Glu Gly Leu Arg Glu His Val Arg Ser His Val Ala Leu
370 375 380
Ala Gln Glu Leu Ala Gly Trp Ala Asp Ala Asp Glu Arg Phe Asp Val
385 390 395 400
Ala Ala Pro His Pro Phe Ser Leu Val Cys Leu Arg Pro Arg Trp Ala
405 410 415
Pro Gly Ile Asp Ala Asp Val Ala Thr Met Thr Leu Leu Asp Arg Leu
420 425 430
Asn Asp Gly Gly Glu Val Phe Leu Thr His Thr Thr Val Asp Gly Ala
435 440 445
Ala Val Leu Arg Val Ala Ile Gly Ala Pro Ala Thr Thr Arg Glu His
450 455 460
Val Glu Arg Val Trp Ala Leu Leu Gly Glu Ala His Asp Trp Leu Ala
465 470 475 480
Arg Asp Phe Glu Glu Gln Ala Ala Glu Arg Arg Ala Ala Glu Leu Arg
485 490 495
Glu Arg Glu Ala Ala Glu Glu Gln Leu Arg Ala Arg Arg Glu Ala Glu
500 505 510
Ala Ala Ala Ala Ala Ala Thr Glu Ala Pro Val Glu Pro Ala Ala Glu
515 520 525
Glu Pro Glu Gln Leu Val Val Pro Pro Val Glu Val Pro Ala Val Glu
530 535 540
Thr Pro Ala Ala Trp Asp Glu Ser Ala Thr Gln Val Ala Ala Gln Thr
545 550 555 560
Asp Leu His Ala Asp Pro Ala Pro Gln Pro Ala Asp Gly Gln Gly
565 570 575
<210> 23
<211> 418
<212> PRT
<213> Sinorhizobium fredii USDA 257
<400> 23
Met Lys Gln Ile Pro Ala Lys Gly Leu Glu Arg Asp Val Ile Met Gln
1 5 10 15
Glu Leu Arg Gln Met Lys Ser Leu Asp Phe Asp Trp Arg Ala Gly Arg
20 25 30
Val Pro Ser Tyr Thr Tyr Phe Val Asp Asp Glu Thr Leu Asp Val Gln
35 40 45
Arg Glu Ala Tyr Gly Glu Tyr Ile Ala Glu Asn Gly Leu Gly Ala Gly
50 55 60
Arg Ala Phe Lys Ser Leu Glu Leu Met Thr Asp Asp Ile Lys Ser Met
65 70 75 80
Ala Ile Ser Leu Phe Asn Ala Pro Ala Ala Ala Gly Ala Ser Phe Thr
85 90 95
Ser Gly Gly Thr Glu Ser Ile Phe Met Ala Val Lys Thr Ala Arg Asp
100 105 110
Leu Thr Arg His Arg Arg Gly Glu Pro Asp Gly Arg Tyr Asn Ile Val
115 120 125
Ala Cys Glu Thr Ala His Pro Cys Leu Asp Lys Ala Gly Gln Leu Leu
130 135 140
Gly Val Asp Ile Arg Arg Thr Pro His Thr Ala Glu Phe Arg Ala Asp
145 150 155 160
Pro Ala Leu Leu Arg Thr Ser Ile Asp Gln Lys Thr Met Met Leu Phe
165 170 175
Ala Ser Ala Pro Asn Tyr Pro Phe Gly Thr Phe Asp Pro Ile Ser Lys
180 185 190
Ile Gly Arg Leu Ala Gln Glu Arg Asp Leu Arg Leu His Val Asp Gly
195 200 205
Cys Trp Gly Gly Phe Leu Ser Pro Phe Ala Glu Arg Leu Gly Tyr Pro
210 215 220
Ile Pro Glu Trp Asp Phe Arg Val Pro Gly Val Ser Ser Leu Ser Ala
225 230 235 240
Asp Ile His Lys Phe Gly Tyr Ala Ala Lys Gly Ala Ser Val Val Leu
245 250 255
Tyr Arg Asp Val Glu Asp Gln Glu His Glu Arg Phe Ser Phe Ser Gly
260 265 270
Trp Pro Arg Gly Thr Tyr Ser Thr Pro Thr Phe Leu Gly Thr Lys Ala
275 280 285
Gly Gly Ala Ile Ala Ser Ala Trp Ala Val Met His Phe Leu Gly Val
290 295 300
Glu Gly Tyr Leu Arg Ala Ala Lys Leu Thr Met Asp Ala Thr Met Gln
305 310 315 320
Leu Ile Glu Gly Leu Asn Ala Ile Pro Asp Ile Tyr Cys Leu Thr Pro
325 330 335
Asn Gly Glu Ser Asn Leu Ile Ser Phe Ala Thr Ser Asp Pro Lys Leu
340 345 350
Asp Ile Tyr Ala Val Ala Asp Arg Leu Glu Glu Cys Gly Trp Leu Arg
355 360 365
Gly Arg Met Arg Glu Pro Lys Ala Ile Gln Gln Gly Val Asn Pro Ala
370 375 380
His Leu Ala Thr Val Thr Glu Tyr Leu Ala Glu Val Arg Lys Ala Ile
385 390 395 400
Asp His Val Arg Gly Asn Val Ala Ala Pro Val Ala Tyr Asp Glu His
405 410 415
Ser Tyr
<210> 24
<211> 497
<212> PRT
<213> Oryza sativa subsp. Japonica
<400> 24
Met Glu Gly Val Gly Gly Gly Gly Gly Gly Glu Glu Trp Leu Arg Pro
1 5 10 15
Met Asp Ala Glu Gln Leu Arg Glu Cys Gly His Arg Met Val Asp Phe
20 25 30
Val Ala Asp Tyr Tyr Lys Ser Ile Glu Ala Phe Pro Val Leu Ser Gln
35 40 45
Val Gln Pro Gly Tyr Leu Lys Glu Val Leu Pro Asp Ser Ala Pro Arg
50 55 60
Gln Pro Asp Thr Leu Asp Ser Leu Phe Asp Asp Ile Gln Gln Lys Ile
65 70 75 80
Ile Pro Gly Val Thr His Trp Gln Ser Pro Asn Tyr Phe Ala Tyr Tyr
85 90 95
Pro Ser Asn Ser Ser Thr Ala Gly Phe Leu Gly Glu Met Leu Ser Ala
100 105 110
Ala Phe Asn Ile Val Gly Phe Ser Trp Ile Thr Ser Pro Ala Ala Thr
115 120 125
Glu Leu Glu Val Ile Val Leu Asp Trp Phe Ala Lys Met Leu Gln Leu
130 135 140
Pro Ser Gln Phe Leu Ser Thr Ala Leu Gly Gly Gly Val Ile Gln Gly
145 150 155 160
Thr Ala Ser Glu Ala Val Leu Val Ala Leu Leu Ala Ala Arg Asp Arg
165 170 175
Ala Leu Lys Lys His Gly Lys His Ser Leu Glu Lys Leu Val Val Tyr
180 185 190
Ala Ser Asp Gln Thr His Ser Ala Leu Gln Lys Ala Cys Gln Ile Ala
195 200 205
Gly Ile Phe Ser Glu Asn Val Arg Val Val Ile Ala Asp Cys Asn Lys
210 215 220
Asn Tyr Ala Val Ala Pro Glu Ala Val Ser Glu Ala Leu Ser Ile Asp
225 230 235 240
Leu Ser Ser Gly Leu Ile Pro Phe Phe Ile Cys Ala Thr Val Gly Thr
245 250 255
Thr Ser Ser Ser Ala Val Asp Pro Leu Pro Glu Leu Gly Gln Ile Ala
260 265 270
Lys Ser Asn Asp Met Trp Phe His Ile Asp Ala Ala Tyr Ala Gly Ser
275 280 285
Ala Cys Ile Cys Pro Glu Tyr Arg His His Leu Asn Gly Val Glu Glu
290 295 300
Ala Asp Ser Phe Asn Met Asn Ala His Lys Trp Phe Leu Thr Asn Phe
305 310 315 320
Asp Cys Ser Leu Leu Trp Val Lys Asp Arg Ser Phe Leu Ile Gln Ser
325 330 335
Leu Ser Thr Asn Pro Glu Phe Leu Lys Asn Lys Ala Ser Gln Ala Asn
340 345 350
Ser Val Val Asp Phe Lys Asp Trp Gln Ile Pro Leu Gly Arg Arg Phe
355 360 365
Arg Ser Leu Lys Leu Trp Met Val Leu Arg Leu Tyr Gly Val Asp Asn
370 375 380
Leu Gln Ser Tyr Ile Arg Lys His Ile His Leu Ala Glu His Phe Glu
385 390 395 400
Gln Leu Leu Leu Ser Asp Ser Arg Phe Glu Val Val Thr Pro Arg Thr
405 410 415
Phe Ser Leu Val Cys Phe Arg Leu Val Pro Pro Thr Ser Asp His Glu
420 425 430
Asn Gly Arg Lys Leu Asn Tyr Asp Met Met Asp Gly Val Asn Ser Ser
435 440 445
Gly Lys Ile Phe Leu Ser His Thr Val Leu Ser Gly Lys Phe Val Leu
450 455 460
Arg Phe Ala Val Gly Ala Pro Leu Thr Glu Glu Arg His Val Asp Ala
465 470 475 480
Ala Trp Lys Leu Leu Arg Asp Glu Ala Thr Lys Val Leu Gly Lys Met
485 490 495
Val
<210> 25
<211> 396
<212> PRT
<213> Methanocaldococcus jannaschii
<400> 25
Met Arg Asn Met Gln Glu Lys Gly Val Ser Glu Lys Glu Ile Leu Glu
1 5 10 15
Glu Leu Lys Lys Tyr Arg Ser Leu Asp Leu Lys Tyr Glu Asp Gly Asn
20 25 30
Ile Phe Gly Ser Met Cys Ser Asn Val Leu Pro Ile Thr Arg Lys Ile
35 40 45
Val Asp Ile Phe Leu Glu Thr Asn Leu Gly Asp Pro Gly Leu Phe Lys
50 55 60
Gly Thr Lys Leu Leu Glu Glu Lys Ala Val Ala Leu Leu Gly Ser Leu
65 70 75 80
Leu Asn Asn Lys Asp Ala Tyr Gly His Ile Val Ser Gly Gly Thr Glu
85 90 95
Ala Asn Leu Met Ala Leu Arg Cys Ile Lys Asn Ile Trp Arg Glu Lys
100 105 110
Arg Arg Lys Gly Leu Ser Lys Asn Glu His Pro Lys Ile Ile Val Pro
115 120 125
Ile Thr Ala His Phe Ser Phe Glu Lys Gly Arg Glu Met Met Asp Leu
130 135 140
Glu Tyr Ile Tyr Ala Pro Ile Lys Glu Asp Tyr Thr Ile Asp Glu Lys
145 150 155 160
Phe Val Lys Asp Ala Val Glu Asp Tyr Asp Val Asp Gly Ile Ile Gly
165 170 175
Ile Ala Gly Thr Thr Glu Leu Gly Thr Ile Asp Asn Ile Glu Glu Leu
180 185 190
Ser Lys Ile Ala Lys Glu Asn Asn Ile Tyr Ile His Val Asp Ala Ala
195 200 205
Phe Gly Gly Leu Val Ile Pro Phe Leu Asp Asp Lys Tyr Lys Lys Lys
210 215 220
Gly Val Asn Tyr Lys Phe Asp Phe Ser Leu Gly Val Asp Ser Ile Thr
225 230 235 240
Ile Asp Pro His Lys Met Gly His Cys Pro Ile Pro Ser Gly Gly Ile
245 250 255
Leu Phe Lys Asp Ile Gly Tyr Lys Arg Tyr Leu Asp Val Asp Ala Pro
260 265 270
Tyr Leu Thr Glu Thr Arg Gln Ala Thr Ile Leu Gly Thr Arg Val Gly
275 280 285
Phe Gly Gly Ala Cys Thr Tyr Ala Val Leu Arg Tyr Leu Gly Arg Glu
290 295 300
Gly Gln Arg Lys Ile Val Asn Glu Cys Met Glu Asn Thr Leu Tyr Leu
305 310 315 320
Tyr Lys Lys Leu Lys Glu Asn Asn Phe Lys Pro Val Ile Glu Pro Ile
325 330 335
Leu Asn Ile Val Ala Ile Glu Asp Glu Asp Tyr Lys Glu Val Cys Lys
340 345 350
Lys Leu Arg Asp Arg Gly Ile Tyr Val Ser Val Cys Asn Cys Val Lys
355 360 365
Ala Leu Arg Ile Val Val Met Pro His Ile Lys Arg Glu His Ile Asp
370 375 380
Asn Phe Ile Glu Ile Leu Asn Ser Ile Lys Arg Asp
385 390 395
<210> 26
<211> 370
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 26
Met Phe Ile Lys Asn Asp His Ala Gly Asp Arg Lys Arg Leu Glu Asp
1 5 10 15
Trp Arg Ile Lys Gly Tyr Asp Pro Leu Thr Pro Pro Asp Leu Leu Gln
20 25 30
His Glu Phe Pro Ile Ser Ala Lys Gly Glu Glu Asn Ile Ile Lys Ala
35 40 45
Arg Asp Ser Val Cys Asp Ile Leu Asn Gly Lys Asp Asp Arg Leu Val
50 55 60
Ile Val Ile Gly Pro Cys Ser Leu His Asp Pro Lys Ala Ala Tyr Asp
65 70 75 80
Tyr Ala Asp Arg Leu Ala Lys Ile Ser Glu Lys Leu Ser Lys Asp Leu
85 90 95
Leu Ile Ile Met Arg Ala Tyr Leu Glu Lys Pro Arg Thr Thr Val Gly
100 105 110
Trp Lys Gly Leu Ile Asn Asp Pro Asp Met Asn Asn Ser Phe Gln Ile
115 120 125
Asn Lys Gly Leu Arg Ile Ser Arg Glu Met Phe Ile Arg Leu Val Glu
130 135 140
Lys Leu Pro Ile Ala Gly Glu Met Leu Asp Thr Ile Ser Pro Gln Phe
145 150 155 160
Leu Ser Asp Cys Phe Ser Leu Gly Ala Ile Gly Ala Arg Thr Thr Glu
165 170 175
Ser Gln Leu His Arg Glu Leu Ala Ser Gly Leu Ser Phe Pro Ile Gly
180 185 190
Phe Lys Asn Gly Thr Asp Gly Gly Leu Gln Val Ala Ile Asp Ala Met
195 200 205
Arg Ala Ala Ala His Asp His Tyr Phe Leu Ser Val Thr Lys Pro Gly
210 215 220
Val Thr Ala Ile Val Gly Thr Glu Gly Asn Lys Asp Thr Phe Leu Ile
225 230 235 240
Leu Arg Gly Gly Lys Asn Gly Thr Asn Phe Asp Lys Glu Ser Val Gln
245 250 255
Asn Thr Lys Lys Gln Leu Glu Lys Ala Gly Leu Thr Asp Asp Ser Gln
260 265 270
Lys Arg Ile Met Ile Asp Cys Ser His Gly Asn Ser Asn Lys Asp Phe
275 280 285
Lys Asn Gln Pro Lys Val Ala Lys Cys Ile Tyr Asp Gln Leu Thr Glu
290 295 300
Gly Glu Asn Ser Leu Cys Gly Val Met Ile Glu Ser Asn Ile Asn Glu
305 310 315 320
Gly Arg Gln Asp Ile Pro Lys Glu Gly Gly Arg Glu Gly Leu Lys Tyr
325 330 335
Gly Cys Ser Val Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Gln
340 345 350
Val Leu Glu Leu Leu Ala Glu Gly Val Arg Asn Arg Arg Lys Ala Leu
355 360 365
Lys Lys
370
<210> 27
<211> 500
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 27
Met Thr Leu Pro Glu Ser Arg Asp Phe Ser Tyr Leu Phe Ser Asp Glu
1 5 10 15
Thr Asn Ala Arg Lys Pro Ser Pro Leu Lys Thr Cys Ile His Leu Phe
20 25 30
Gln Asp Pro Asn Ile Ile Phe Leu Gly Gly Gly Leu Pro Leu Lys Asp
35 40 45
Tyr Phe Pro Trp Asp Asn Leu Ser Val Asp Ser Pro Lys Pro Pro Phe
50 55 60
Pro Gln Gly Ile Gly Ala Pro Ile Asp Glu Gln Asn Cys Ile Lys Tyr
65 70 75 80
Thr Val Asn Lys Asp Tyr Ala Asp Lys Ser Ala Asn Pro Ser Asn Asp
85 90 95
Ile Pro Leu Ser Arg Ala Leu Gln Tyr Gly Phe Ser Ala Gly Gln Pro
100 105 110
Glu Leu Leu Asn Phe Ile Arg Asp His Thr Lys Ile Ile His Asp Leu
115 120 125
Lys Tyr Lys Asp Trp Asp Val Leu Ala Thr Ala Gly Asn Thr Asn Ala
130 135 140
Trp Glu Ser Thr Leu Arg Val Phe Cys Asn Arg Gly Asp Val Ile Leu
145 150 155 160
Val Glu Ala His Ser Phe Ser Ser Ser Leu Ala Ser Ala Glu Ala Gln
165 170 175
Gly Val Ile Thr Phe Pro Val Pro Ile Asp Ala Asp Gly Ile Ile Pro
180 185 190
Glu Lys Leu Ala Lys Val Met Glu Asn Trp Thr Pro Gly Ala Pro Lys
195 200 205
Pro Lys Leu Leu Tyr Thr Ile Pro Thr Gly Gln Asn Pro Thr Gly Thr
210 215 220
Ser Ile Ala Asp His Arg Lys Glu Ala Ile Tyr Lys Ile Ala Gln Lys
225 230 235 240
Tyr Asp Phe Leu Ile Val Glu Asp Glu Pro Tyr Tyr Phe Leu Gln Met
245 250 255
Asn Pro Tyr Ile Lys Asp Leu Lys Glu Arg Glu Lys Ala Gln Ser Ser
260 265 270
Pro Lys Gln Asp His Asp Glu Phe Leu Lys Ser Leu Ala Asn Thr Phe
275 280 285
Leu Ser Leu Asp Thr Glu Gly Arg Val Ile Arg Met Asp Ser Phe Ser
290 295 300
Lys Val Leu Ala Pro Gly Thr Arg Leu Gly Trp Ile Thr Gly Ser Ser
305 310 315 320
Lys Ile Leu Lys Pro Tyr Leu Ser Leu His Glu Met Thr Ile Gln Ala
325 330 335
Pro Ala Gly Phe Thr Gln Val Leu Val Asn Ala Thr Leu Ser Arg Trp
340 345 350
Gly Gln Lys Gly Tyr Leu Asp Trp Leu Leu Gly Leu Arg His Glu Tyr
355 360 365
Thr Leu Lys Arg Asp Cys Ala Ile Asp Ala Leu Tyr Lys Tyr Leu Pro
370 375 380
Gln Ser Asp Ala Phe Val Ile Asn Pro Pro Ile Ala Gly Met Phe Phe
385 390 395 400
Thr Val Asn Ile Asp Ala Ser Val His Pro Glu Phe Lys Thr Lys Tyr
405 410 415
Asn Ser Asp Pro Tyr Gln Leu Glu Gln Ser Leu Tyr His Lys Val Val
420 425 430
Glu Arg Gly Val Leu Val Val Pro Gly Ser Trp Phe Lys Ser Glu Gly
435 440 445
Glu Thr Glu Pro Pro Gln Pro Ala Glu Ser Lys Glu Val Ser Asn Pro
450 455 460
Asn Ile Ile Phe Phe Arg Gly Thr Tyr Ala Ala Val Ser Pro Glu Lys
465 470 475 480
Leu Thr Glu Gly Leu Lys Arg Leu Gly Asp Thr Leu Tyr Glu Glu Phe
485 490 495
Gly Ile Ser Lys
500
<210> 28
<211> 513
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 28
Met Thr Ala Gly Ser Ala Pro Pro Val Asp Tyr Thr Ser Leu Lys Lys
1 5 10 15
Asn Phe Gln Pro Phe Leu Ser Arg Arg Val Glu Asn Arg Ser Leu Lys
20 25 30
Ser Phe Trp Asp Ala Ser Asp Ile Ser Asp Asp Val Ile Glu Leu Ala
35 40 45
Gly Gly Met Pro Asn Glu Arg Phe Phe Pro Ile Glu Ser Met Asp Leu
50 55 60
Lys Ile Ser Lys Val Pro Phe Asn Asp Asn Pro Lys Trp His Asn Ser
65 70 75 80
Phe Thr Thr Ala His Leu Asp Leu Gly Ser Pro Ser Glu Leu Pro Ile
85 90 95
Ala Arg Ser Phe Gln Tyr Ala Glu Thr Lys Gly Leu Pro Pro Leu Leu
100 105 110
His Phe Val Lys Asp Phe Val Ser Arg Ile Asn Arg Pro Ala Phe Ser
115 120 125
Asp Glu Thr Glu Ser Asn Trp Asp Val Ile Leu Ser Gly Gly Ser Asn
130 135 140
Asp Ser Met Phe Lys Val Phe Glu Thr Ile Cys Asp Glu Ser Thr Thr
145 150 155 160
Val Met Ile Glu Glu Phe Thr Phe Thr Pro Ala Met Ser Asn Val Glu
165 170 175
Ala Thr Gly Ala Lys Val Ile Pro Ile Lys Met Asn Leu Thr Phe Asp
180 185 190
Arg Glu Ser Gln Gly Ile Asp Val Glu Tyr Leu Thr Gln Leu Leu Asp
195 200 205
Asn Trp Ser Thr Gly Pro Tyr Lys Asp Leu Asn Lys Pro Arg Val Leu
210 215 220
Tyr Thr Ile Ala Thr Gly Gln Asn Pro Thr Gly Met Ser Val Pro Gln
225 230 235 240
Trp Lys Arg Glu Lys Ile Tyr Gln Leu Ala Gln Arg His Asp Phe Leu
245 250 255
Ile Val Glu Asp Asp Pro Tyr Gly Tyr Leu Tyr Phe Pro Ser Tyr Asn
260 265 270
Pro Gln Glu Pro Leu Glu Asn Pro Tyr His Ser Ser Asp Leu Thr Thr
275 280 285
Glu Arg Tyr Leu Asn Asp Phe Leu Met Lys Ser Phe Leu Thr Leu Asp
290 295 300
Thr Asp Ala Arg Val Ile Arg Leu Glu Thr Phe Ser Lys Ile Phe Ala
305 310 315 320
Pro Gly Leu Arg Leu Ser Phe Ile Val Ala Asn Lys Phe Leu Leu Gln
325 330 335
Lys Ile Leu Asp Leu Ala Asp Ile Thr Thr Arg Ala Pro Ser Gly Thr
340 345 350
Ser Gln Ala Ile Val Tyr Ser Thr Ile Lys Ala Met Ala Glu Ser Asn
355 360 365
Leu Ser Ser Ser Leu Ser Met Lys Glu Ala Met Phe Glu Gly Trp Ile
370 375 380
Arg Trp Ile Met Gln Ile Ala Ser Lys Tyr Asn His Arg Lys Asn Leu
385 390 395 400
Thr Leu Lys Ala Leu Tyr Glu Thr Glu Ser Tyr Gln Ala Gly Gln Phe
405 410 415
Thr Val Met Glu Pro Ser Ala Gly Met Phe Ile Ile Ile Lys Ile Asn
420 425 430
Trp Gly Asn Phe Asp Arg Pro Asp Asp Leu Pro Gln Gln Met Asp Ile
435 440 445
Leu Asp Lys Phe Leu Leu Lys Asn Gly Val Lys Val Val Leu Gly Tyr
450 455 460
Lys Met Ala Val Cys Pro Asn Tyr Ser Lys Gln Asn Ser Asp Phe Leu
465 470 475 480
Arg Leu Thr Ile Ala Tyr Ala Arg Asp Asp Asp Gln Leu Ile Glu Ala
485 490 495
Ser Lys Arg Ile Gly Ser Gly Ile Lys Glu Phe Phe Asp Asn Tyr Lys
500 505 510
Ser
<210> 29
<211> 792
<212> PRT
<213> Escherichia coli (strain K12)
<400> 29
Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu
1 5 10 15
Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly
20 25 30
Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly
35 40 45
Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly
50 55 60
Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp
65 70 75 80
Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile
85 90 95
Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr
100 105 110
Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Val Arg Ser
115 120 125
Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln
130 135 140
Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val
145 150 155 160
Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg
165 170 175
Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val
180 185 190
Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser
195 200 205
Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala
210 215 220
Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu
225 230 235 240
Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val
245 250 255
Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr
260 265 270
Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln
275 280 285
Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys
290 295 300
Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu
305 310 315 320
Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg
325 330 335
Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu
340 345 350
His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg
355 360 365
Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn
370 375 380
Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp
385 390 395 400
Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly
405 410 415
Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro
420 425 430
Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu
435 440 445
Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala
450 455 460
Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro
465 470 475 480
Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala
485 490 495
Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu
500 505 510
Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu
515 520 525
Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met
530 535 540
Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr
545 550 555 560
Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile
565 570 575
Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly
580 585 590
Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg
595 600 605
Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu
610 615 620
Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn
625 630 635 640
Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala
645 650 655
Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly
660 665 670
Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala
675 680 685
Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp
690 695 700
Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser
705 710 715 720
Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met
725 730 735
Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly
740 745 750
Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu
755 760 765
Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp
770 775 780
Leu Ser Leu Ala Glu Leu Lys Lys
785 790
<210> 30
<211> 680
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 30
Met Thr Gln Phe Thr Asp Ile Asp Lys Leu Ala Val Ser Thr Ile Arg
1 5 10 15
Ile Leu Ala Val Asp Thr Val Ser Lys Ala Asn Ser Gly His Pro Gly
20 25 30
Ala Pro Leu Gly Met Ala Pro Ala Ala His Val Leu Trp Ser Gln Met
35 40 45
Arg Met Asn Pro Thr Asn Pro Asp Trp Ile Asn Arg Asp Arg Phe Val
50 55 60
Leu Ser Asn Gly His Ala Val Ala Leu Leu Tyr Ser Met Leu His Leu
65 70 75 80
Thr Gly Tyr Asp Leu Ser Ile Glu Asp Leu Lys Gln Phe Arg Gln Leu
85 90 95
Gly Ser Arg Thr Pro Gly His Pro Glu Phe Glu Leu Pro Gly Val Glu
100 105 110
Val Thr Thr Gly Pro Leu Gly Gln Gly Ile Ser Asn Ala Val Gly Met
115 120 125
Ala Met Ala Gln Ala Asn Leu Ala Ala Thr Tyr Asn Lys Pro Gly Phe
130 135 140
Thr Leu Ser Asp Asn Tyr Thr Tyr Val Phe Leu Gly Asp Gly Cys Leu
145 150 155 160
Gln Glu Gly Ile Ser Ser Glu Ala Ser Ser Leu Ala Gly His Leu Lys
165 170 175
Leu Gly Asn Leu Ile Ala Ile Tyr Asp Asp Asn Lys Ile Thr Ile Asp
180 185 190
Gly Ala Thr Ser Ile Ser Phe Asp Glu Asp Val Ala Lys Arg Tyr Glu
195 200 205
Ala Tyr Gly Trp Glu Val Leu Tyr Val Glu Asn Gly Asn Glu Asp Leu
210 215 220
Ala Gly Ile Ala Lys Ala Ile Ala Gln Ala Lys Leu Ser Lys Asp Lys
225 230 235 240
Pro Thr Leu Ile Lys Met Thr Thr Thr Ile Gly Tyr Gly Ser Leu His
245 250 255
Ala Gly Ser His Ser Val His Gly Ala Pro Leu Lys Ala Asp Asp Val
260 265 270
Lys Gln Leu Lys Ser Lys Phe Gly Phe Asn Pro Asp Lys Ser Phe Val
275 280 285
Val Pro Gln Glu Val Tyr Asp His Tyr Gln Lys Thr Ile Leu Lys Pro
290 295 300
Gly Val Glu Ala Asn Asn Lys Trp Asn Lys Leu Phe Ser Glu Tyr Gln
305 310 315 320
Lys Lys Phe Pro Glu Leu Gly Ala Glu Leu Ala Arg Arg Leu Ser Gly
325 330 335
Gln Leu Pro Ala Asn Trp Glu Ser Lys Leu Pro Thr Tyr Thr Ala Lys
340 345 350
Asp Ser Ala Val Ala Thr Arg Lys Leu Ser Glu Thr Val Leu Glu Asp
355 360 365
Val Tyr Asn Gln Leu Pro Glu Leu Ile Gly Gly Ser Ala Asp Leu Thr
370 375 380
Pro Ser Asn Leu Thr Arg Trp Lys Glu Ala Leu Asp Phe Gln Pro Pro
385 390 395 400
Ser Ser Gly Ser Gly Asn Tyr Ser Gly Arg Tyr Ile Arg Tyr Gly Ile
405 410 415
Arg Glu His Ala Met Gly Ala Ile Met Asn Gly Ile Ser Ala Phe Gly
420 425 430
Ala Asn Tyr Lys Pro Tyr Gly Gly Thr Phe Leu Asn Phe Val Ser Tyr
435 440 445
Ala Ala Gly Ala Val Arg Leu Ser Ala Leu Ser Gly His Pro Val Ile
450 455 460
Trp Val Ala Thr His Asp Ser Ile Gly Val Gly Glu Asp Gly Pro Thr
465 470 475 480
His Gln Pro Ile Glu Thr Leu Ala His Phe Arg Ser Leu Pro Asn Ile
485 490 495
Gln Val Trp Arg Pro Ala Asp Gly Asn Glu Val Ser Ala Ala Tyr Lys
500 505 510
Asn Ser Leu Glu Ser Lys His Thr Pro Ser Ile Ile Ala Leu Ser Arg
515 520 525
Gln Asn Leu Pro Gln Leu Glu Gly Ser Ser Ile Glu Ser Ala Ser Lys
530 535 540
Gly Gly Tyr Val Leu Gln Asp Val Ala Asn Pro Asp Ile Ile Leu Val
545 550 555 560
Ala Thr Gly Ser Glu Val Ser Leu Ser Val Glu Ala Ala Lys Thr Leu
565 570 575
Ala Ala Lys Asn Ile Lys Ala Arg Val Val Ser Leu Pro Asp Phe Phe
580 585 590
Thr Phe Asp Lys Gln Pro Leu Glu Tyr Arg Leu Ser Val Leu Pro Asp
595 600 605
Asn Val Pro Ile Met Ser Val Glu Val Leu Ala Thr Thr Cys Trp Gly
610 615 620
Lys Tyr Ala His Gln Ser Phe Gly Ile Asp Arg Phe Gly Ala Ser Gly
625 630 635 640
Lys Ala Pro Glu Val Phe Lys Phe Phe Gly Phe Thr Pro Glu Gly Val
645 650 655
Ala Glu Arg Ala Gln Lys Thr Ile Ala Phe Tyr Lys Gly Asp Lys Leu
660 665 670
Ile Ser Pro Leu Lys Lys Ala Phe
675 680
<210> 31
<211> 416
<212> PRT
<213> Gracilaria gracilis (Red alga)
<400> 31
Met Ala Phe Val Ala Pro Val Ser Ser Val Phe Ser Thr Ser Ser Lys
1 5 10 15
Ser Ala Val Cys Ser Gly Arg Ser Ser Phe Ala Gln Phe Ser Gly Leu
20 25 30
Lys Lys Val Asn Asn Thr Ala Arg Leu Gln Thr Ala Glu Gln Gly Ser
35 40 45
Ala Phe Gly Gly Val Ser Asp Ala Asn Asp Ala Phe Phe Asn Ala Val
50 55 60
Asn Thr Met Gly Ala Pro Ala Arg Thr Ser Asn Ala Pro Ser Met Lys
65 70 75 80
Val Arg Val Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Asn Phe Ile
85 90 95
Arg Cys Trp Ala Gly Arg Thr Asp Ser Asn Met Asp Val Val Cys Ile
100 105 110
Asn Asp Thr Ser Gly Val Lys Thr Ala Ser His Leu Leu Lys Tyr Asp
115 120 125
Ser Ile Leu Gly Thr Phe Asp Ser Asp Val Val Ala Gly Glu Asp Ser
130 135 140
Ile Thr Val Asp Gly Lys Thr Ile Lys Val Val Ser Asn Arg Asn Pro
145 150 155 160
Leu Glu Leu Pro Trp Lys Glu Met Glu Ile Asp Ile Val Val Glu Ala
165 170 175
Thr Gly Val Phe Val Asp Ala Val Gly Ala Gly Lys His Ile Gln Ala
180 185 190
Gly Ala Lys Lys Val Leu Ile Thr Ala Pro Gly Lys Gly Glu Gly Val
195 200 205
Gly Thr Phe Val Val Gly Val Asn Asp His Leu Tyr Ser His Asp Lys
210 215 220
Phe Asp Ile Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Met Ala Pro
225 230 235 240
Phe Met Lys Val Leu Asp Asp Glu Phe Gly Val Val Arg Gly Met Met
245 250 255
Thr Thr Thr His Ser Tyr Thr Gly Asp Gln Arg Leu Leu Asp Ala Gly
260 265 270
His Arg Asp Leu Arg Arg Ala Arg Ser Ala Ala Leu Asn Ile Val Pro
275 280 285
Thr Thr Thr Gly Ala Ala Lys Ala Val Ala Leu Val Val Pro Thr Leu
290 295 300
Ala Gly Lys Leu Asn Gly Ile Ala Leu Arg Val Pro Thr Pro Asn Val
305 310 315 320
Ser Val Cys Asp Val Val Met Gln Val Ser Lys Lys Thr Phe Lys Glu
325 330 335
Glu Val Asn Gly Ala Leu Leu Lys Ala Ala Asn Gly Ser Met Lys Gly
340 345 350
Ile Ile Lys Tyr Ser Asp Glu Pro Leu Val Ser Cys Asp Tyr Arg Gly
355 360 365
Thr Asp Glu Ser Thr Ile Ile Asp Ser Ser Leu Thr Met Val Met Gly
370 375 380
Asp Asp Met Leu Lys Val Val Ala Trp Tyr Asp Asn Glu Trp Gly Tyr
385 390 395 400
Ser Gln Arg Val Val Asp Leu Gly Glu Val Met Ala Ser Gln Trp Lys
405 410 415
<210> 32
<211> 262
<212> PRT
<213> Pyrococcus furiosus (strain ATCC 43587 DSM 3638 JCM 8422 Vc1)
<400> 32
Met Lys Tyr Ser Lys Glu Tyr Lys Glu Lys Thr Val Val Lys Ile Asn
1 5 10 15
Asp Val Lys Phe Gly Glu Gly Phe Thr Ile Ile Ala Gly Pro Cys Ser
20 25 30
Ile Glu Ser Arg Asp Gln Ile Met Lys Val Ala Glu Phe Leu Ala Glu
35 40 45
Val Gly Ile Lys Val Leu Arg Gly Gly Ala Phe Lys Pro Arg Thr Ser
50 55 60
Pro Tyr Ser Phe Gln Gly Tyr Gly Glu Lys Ala Leu Arg Trp Met Arg
65 70 75 80
Glu Ala Ala Asp Glu Tyr Gly Leu Val Thr Val Thr Glu Val Met Asp
85 90 95
Thr Arg His Val Glu Leu Val Ala Lys Tyr Ser Asp Ile Leu Gln Ile
100 105 110
Gly Ala Arg Asn Ser Gln Asn Phe Glu Leu Leu Lys Glu Val Gly Lys
115 120 125
Val Glu Asn Pro Val Leu Leu Lys Arg Gly Met Gly Asn Thr Ile Gln
130 135 140
Glu Leu Leu Tyr Ser Ala Glu Tyr Ile Met Ala Gln Gly Asn Glu Asn
145 150 155 160
Val Ile Leu Cys Glu Arg Gly Ile Arg Thr Phe Glu Thr Ala Thr Arg
165 170 175
Phe Thr Leu Asp Ile Ser Ala Val Pro Val Val Lys Glu Leu Ser His
180 185 190
Leu Pro Ile Ile Val Asp Pro Ser His Pro Ala Gly Arg Arg Ser Leu
195 200 205
Val Ile Pro Leu Ala Lys Ala Ala Tyr Ala Ile Gly Ala Asp Gly Ile
210 215 220
Met Val Glu Val His Pro Glu Pro Glu Lys Ala Leu Ser Asp Ser Gln
225 230 235 240
Gln Gln Leu Thr Phe Asp Asp Phe Leu Gln Leu Leu Lys Glu Leu Glu
245 250 255
Ala Leu Gly Trp Lys Gly
260
<210> 33
<211> 267
<212> PRT
<213> Meyerozyma guilliermondii (strain ATCC 6260 CBS 566 DSM 6381 JCM 1539 NBRC 10279 NRRL Y-324) (Yeast) (Candida guilliermondii)
<400> 33
Met Asp Phe Thr Lys Pro Glu Thr Val Leu Asp Leu Gly Asn Ile Arg
1 5 10 15
Gln Ala Leu Ile Arg Met Glu Asp Thr Ile Val Phe Phe Leu Ile Glu
20 25 30
Arg Ser Gln Phe Tyr Ser Ser Pro Ser Val Tyr Ile Lys Asn Lys Phe
35 40 45
Pro Ile Pro Asn Phe Asp Gly Ser Phe Leu Asp Trp Ser Leu Gln Gln
50 55 60
Met Glu Arg Thr His Ser Gln Ile Arg Arg Tyr Glu Ala Pro Asp Glu
65 70 75 80
Ile Pro Phe Phe Pro Glu Val Leu Leu Glu Ser Phe Leu Pro Pro Ile
85 90 95
Asn Tyr Pro Asn Ile Leu Ala Ser Tyr His Lys Glu Val Asn His Asn
100 105 110
Gln Thr Val Leu Asn Phe Tyr Val Glu Asn Ile Val Pro Gln Val Ala
115 120 125
Cys Glu Ile Gly Glu Gln Glu Glu Asn Ile Gly Ser Val Ser Val Cys
130 135 140
Asp Ile Asp Cys Leu Gln Ser Leu Ser Arg Arg Ile His Phe Gly Lys
145 150 155 160
Phe Val Ala Glu Ala Lys Tyr Gln Ser Asp Lys Pro Lys Tyr Ile Lys
165 170 175
Leu Ile Leu Ala Lys Asp Val Lys Gly Ile Glu Asp Ser Ile Thr Asn
180 185 190
Ser Ala Val Glu Glu Lys Ile Leu Glu Arg Leu Gln Lys Lys Gly Gln
195 200 205
Ser Tyr Gly Thr Asp Pro Thr Leu Met Tyr Ser Gln Asn Pro Gln Ser
210 215 220
Lys Val Arg Pro Glu Val Ile Ala Gln Leu Tyr Lys Asp His Val Ile
225 230 235 240
Pro Leu Thr Lys Lys Val Glu Val Asp Tyr Leu Leu Arg Arg Leu Glu
245 250 255
Asp Glu Asp Glu Ala Val Val Ala Lys Tyr Lys
260 265
<210> 34
<211> 173
<212> PRT
<213> Escherichia coli (strain K12)
<400> 34
Met Ala Glu Lys Arg Asn Ile Phe Leu Val Gly Pro Met Gly Ala Gly
1 5 10 15
Lys Ser Thr Ile Gly Arg Gln Leu Ala Gln Gln Leu Asn Met Glu Phe
20 25 30
Tyr Asp Ser Asp Gln Glu Ile Glu Lys Arg Thr Gly Ala Asp Val Gly
35 40 45
Trp Val Phe Asp Leu Glu Gly Glu Glu Gly Phe Arg Asp Arg Glu Glu
50 55 60
Lys Val Ile Asn Glu Leu Thr Glu Lys Gln Gly Ile Val Leu Ala Thr
65 70 75 80
Gly Gly Gly Ser Val Lys Ser Arg Glu Thr Arg Asn Arg Leu Ser Ala
85 90 95
Arg Gly Val Val Val Tyr Leu Glu Thr Thr Ile Glu Lys Gln Leu Ala
100 105 110
Arg Thr Gln Arg Asp Lys Lys Arg Pro Leu Leu His Val Glu Thr Pro
115 120 125
Pro Arg Glu Val Leu Glu Ala Leu Ala Asn Glu Arg Asn Pro Leu Tyr
130 135 140
Glu Glu Ile Ala Asp Val Thr Ile Arg Thr Asp Asp Gln Ser Ala Lys
145 150 155 160
Val Val Ala Asn Gln Ile Ile His Met Leu Glu Ser Asn
165 170
<210> 35
<211> 1588
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 35
Met Val Gln Leu Ala Lys Val Pro Ile Leu Gly Asn Asp Ile Ile His
1 5 10 15
Val Gly Tyr Asn Ile His Asp His Leu Val Glu Thr Ile Ile Lys His
20 25 30
Cys Pro Ser Ser Thr Tyr Val Ile Cys Asn Asp Thr Asn Leu Ser Lys
35 40 45
Val Pro Tyr Tyr Gln Gln Leu Val Leu Glu Phe Lys Ala Ser Leu Pro
50 55 60
Glu Gly Ser Arg Leu Leu Thr Tyr Val Val Lys Pro Gly Glu Thr Ser
65 70 75 80
Lys Ser Arg Glu Thr Lys Ala Gln Leu Glu Asp Tyr Leu Leu Val Glu
85 90 95
Gly Cys Thr Arg Asp Thr Val Met Val Ala Ile Gly Gly Gly Val Ile
100 105 110
Gly Asp Met Ile Gly Phe Val Ala Ser Thr Phe Met Arg Gly Val Arg
115 120 125
Val Val Gln Val Pro Thr Ser Leu Leu Ala Met Val Asp Ser Ser Ile
130 135 140
Gly Gly Lys Thr Ala Ile Asp Thr Pro Leu Gly Lys Asn Phe Ile Gly
145 150 155 160
Ala Phe Trp Gln Pro Lys Phe Val Leu Val Asp Ile Lys Trp Leu Glu
165 170 175
Thr Leu Ala Lys Arg Glu Phe Ile Asn Gly Met Ala Glu Val Ile Lys
180 185 190
Thr Ala Cys Ile Trp Asn Ala Asp Glu Phe Thr Arg Leu Glu Ser Asn
195 200 205
Ala Ser Leu Phe Leu Asn Val Val Asn Gly Ala Lys Asn Val Lys Val
210 215 220
Thr Asn Gln Leu Thr Asn Glu Ile Asp Glu Ile Ser Asn Thr Asp Ile
225 230 235 240
Glu Ala Met Leu Asp His Thr Tyr Lys Leu Val Leu Glu Ser Ile Lys
245 250 255
Val Lys Ala Glu Val Val Ser Ser Asp Glu Arg Glu Ser Ser Leu Arg
260 265 270
Asn Leu Leu Asn Phe Gly His Ser Ile Gly His Ala Tyr Glu Ala Ile
275 280 285
Leu Thr Pro Gln Ala Leu His Gly Glu Cys Val Ser Ile Gly Met Val
290 295 300
Lys Glu Ala Glu Leu Ser Arg Tyr Phe Gly Ile Leu Ser Pro Thr Gln
305 310 315 320
Val Ala Arg Leu Ser Lys Ile Leu Val Ala Tyr Gly Leu Pro Val Ser
325 330 335
Pro Asp Glu Lys Trp Phe Lys Glu Leu Thr Leu His Lys Lys Thr Pro
340 345 350
Leu Asp Ile Leu Leu Lys Lys Met Ser Ile Asp Lys Lys Asn Glu Gly
355 360 365
Ser Lys Lys Lys Val Val Ile Leu Glu Ser Ile Gly Lys Cys Tyr Gly
370 375 380
Asp Ser Ala Gln Phe Val Ser Asp Glu Asp Leu Arg Phe Ile Leu Thr
385 390 395 400
Asp Glu Thr Leu Val Tyr Pro Phe Lys Asp Ile Pro Ala Asp Gln Gln
405 410 415
Lys Val Val Ile Pro Pro Gly Ser Lys Ser Ile Ser Asn Arg Ala Leu
420 425 430
Ile Leu Ala Ala Leu Gly Glu Gly Gln Cys Lys Ile Lys Asn Leu Leu
435 440 445
His Ser Asp Asp Thr Lys His Met Leu Thr Ala Val His Glu Leu Lys
450 455 460
Gly Ala Thr Ile Ser Trp Glu Asp Asn Gly Glu Thr Val Val Val Glu
465 470 475 480
Gly His Gly Gly Ser Thr Leu Ser Ala Cys Ala Asp Pro Leu Tyr Leu
485 490 495
Gly Asn Ala Gly Thr Ala Ser Arg Phe Leu Thr Ser Leu Ala Ala Leu
500 505 510
Val Asn Ser Thr Ser Ser Gln Lys Tyr Ile Val Leu Thr Gly Asn Ala
515 520 525
Arg Met Gln Gln Arg Pro Ile Ala Pro Leu Val Asp Ser Leu Arg Ala
530 535 540
Asn Gly Thr Lys Ile Glu Tyr Leu Asn Asn Glu Gly Ser Leu Pro Ile
545 550 555 560
Lys Val Tyr Thr Asp Ser Val Phe Lys Gly Gly Arg Ile Glu Leu Ala
565 570 575
Ala Thr Val Ser Ser Gln Tyr Val Ser Ser Ile Leu Met Cys Ala Pro
580 585 590
Tyr Ala Glu Glu Pro Val Thr Leu Ala Leu Val Gly Gly Lys Pro Ile
595 600 605
Ser Lys Leu Tyr Val Asp Met Thr Ile Lys Met Met Glu Lys Phe Gly
610 615 620
Ile Asn Val Glu Thr Ser Thr Thr Glu Pro Tyr Thr Tyr Tyr Ile Pro
625 630 635 640
Lys Gly His Tyr Ile Asn Pro Ser Glu Tyr Val Ile Glu Ser Asp Ala
645 650 655
Ser Ser Ala Thr Tyr Pro Leu Ala Phe Ala Ala Met Thr Gly Thr Thr
660 665 670
Val Thr Val Pro Asn Ile Gly Phe Glu Ser Leu Gln Gly Asp Ala Arg
675 680 685
Phe Ala Arg Asp Val Leu Lys Pro Met Gly Cys Lys Ile Thr Gln Thr
690 695 700
Ala Thr Ser Thr Thr Val Ser Gly Pro Pro Val Gly Thr Leu Lys Pro
705 710 715 720
Leu Lys His Val Asp Met Glu Pro Met Thr Asp Ala Phe Leu Thr Ala
725 730 735
Cys Val Val Ala Ala Ile Ser His Asp Ser Asp Pro Asn Ser Ala Asn
740 745 750
Thr Thr Thr Ile Glu Gly Ile Ala Asn Gln Arg Val Lys Glu Cys Asn
755 760 765
Arg Ile Leu Ala Met Ala Thr Glu Leu Ala Lys Phe Gly Val Lys Thr
770 775 780
Thr Glu Leu Pro Asp Gly Ile Gln Val His Gly Leu Asn Ser Ile Lys
785 790 795 800
Asp Leu Lys Val Pro Ser Asp Ser Ser Gly Pro Val Gly Val Cys Thr
805 810 815
Tyr Asp Asp His Arg Val Ala Met Ser Phe Ser Leu Leu Ala Gly Met
820 825 830
Val Asn Ser Gln Asn Glu Arg Asp Glu Val Ala Asn Pro Val Arg Ile
835 840 845
Leu Glu Arg His Cys Thr Gly Lys Thr Trp Pro Gly Trp Trp Asp Val
850 855 860
Leu His Ser Glu Leu Gly Ala Lys Leu Asp Gly Ala Glu Pro Leu Glu
865 870 875 880
Cys Thr Ser Lys Lys Asn Ser Lys Lys Ser Val Val Ile Ile Gly Met
885 890 895
Arg Ala Ala Gly Lys Thr Thr Ile Ser Lys Trp Cys Ala Ser Ala Leu
900 905 910
Gly Tyr Lys Leu Val Asp Leu Asp Glu Leu Phe Glu Gln Gln His Asn
915 920 925
Asn Gln Ser Val Lys Gln Phe Val Val Glu Asn Gly Trp Glu Lys Phe
930 935 940
Arg Glu Glu Glu Thr Arg Ile Phe Lys Glu Val Ile Gln Asn Tyr Gly
945 950 955 960
Asp Asp Gly Tyr Val Phe Ser Thr Gly Gly Gly Ile Val Glu Ser Ala
965 970 975
Glu Ser Arg Lys Ala Leu Lys Asp Phe Ala Ser Ser Gly Gly Tyr Val
980 985 990
Leu His Leu His Arg Asp Ile Glu Glu Thr Ile Val Phe Leu Gln Ser
995 1000 1005
Asp Pro Ser Arg Pro Ala Tyr Val Glu Glu Ile Arg Glu Val Trp
1010 1015 1020
Asn Arg Arg Glu Gly Trp Tyr Lys Glu Cys Ser Asn Phe Ser Phe
1025 1030 1035
Phe Ala Pro His Cys Ser Ala Glu Ala Glu Phe Gln Ala Leu Arg
1040 1045 1050
Arg Ser Phe Ser Lys Tyr Ile Ala Thr Ile Thr Gly Val Arg Glu
1055 1060 1065
Ile Glu Ile Pro Ser Gly Arg Ser Ala Phe Val Cys Leu Thr Phe
1070 1075 1080
Asp Asp Leu Thr Glu Gln Thr Glu Asn Leu Thr Pro Ile Cys Tyr
1085 1090 1095
Gly Cys Glu Ala Val Glu Val Arg Val Asp His Leu Ala Asn Tyr
1100 1105 1110
Ser Ala Asp Phe Val Ser Lys Gln Leu Ser Ile Leu Arg Lys Ala
1115 1120 1125
Thr Asp Ser Ile Pro Ile Ile Phe Thr Val Arg Thr Met Lys Gln
1130 1135 1140
Gly Gly Asn Phe Pro Asp Glu Glu Phe Lys Thr Leu Arg Glu Leu
1145 1150 1155
Tyr Asp Ile Ala Leu Lys Asn Gly Val Glu Phe Leu Asp Leu Glu
1160 1165 1170
Leu Thr Leu Pro Thr Asp Ile Gln Tyr Glu Val Ile Asn Lys Arg
1175 1180 1185
Gly Asn Thr Lys Ile Ile Gly Ser His His Asp Phe Gln Gly Leu
1190 1195 1200
Tyr Ser Trp Asp Asp Ala Glu Trp Glu Asn Arg Phe Asn Gln Ala
1205 1210 1215
Leu Thr Leu Asp Val Asp Val Val Lys Phe Val Gly Thr Ala Val
1220 1225 1230
Asn Phe Glu Asp Asn Leu Arg Leu Glu His Phe Arg Asp Thr His
1235 1240 1245
Lys Asn Lys Pro Leu Ile Ala Val Asn Met Thr Ser Lys Gly Ser
1250 1255 1260
Ile Ser Arg Val Leu Asn Asn Val Leu Thr Pro Val Thr Ser Asp
1265 1270 1275
Leu Leu Pro Asn Ser Ala Ala Pro Gly Gln Leu Thr Val Ala Gln
1280 1285 1290
Ile Asn Lys Met Tyr Thr Ser Met Gly Gly Ile Glu Pro Lys Glu
1295 1300 1305
Leu Phe Val Val Gly Lys Pro Ile Gly His Ser Arg Ser Pro Ile
1310 1315 1320
Leu His Asn Thr Gly Tyr Glu Ile Leu Gly Leu Pro His Lys Phe
1325 1330 1335
Asp Lys Phe Glu Thr Glu Ser Ala Gln Leu Val Lys Glu Lys Leu
1340 1345 1350
Leu Asp Gly Asn Lys Asn Phe Gly Gly Ala Ala Val Thr Ile Pro
1355 1360 1365
Leu Lys Leu Asp Ile Met Gln Tyr Met Asp Glu Leu Thr Asp Ala
1370 1375 1380
Ala Lys Val Ile Gly Ala Val Asn Thr Val Ile Pro Leu Gly Asn
1385 1390 1395
Lys Lys Phe Lys Gly Asp Asn Thr Asp Trp Leu Gly Ile Arg Asn
1400 1405 1410
Ala Leu Ile Asn Asn Gly Val Pro Glu Tyr Val Gly His Thr Ala
1415 1420 1425
Gly Leu Val Ile Gly Ala Gly Gly Thr Ser Arg Ala Ala Leu Tyr
1430 1435 1440
Ala Leu His Ser Leu Gly Cys Lys Lys Ile Phe Ile Ile Asn Arg
1445 1450 1455
Thr Thr Ser Lys Leu Lys Pro Leu Ile Glu Ser Leu Pro Ser Glu
1460 1465 1470
Phe Asn Ile Ile Gly Ile Glu Ser Thr Lys Ser Ile Glu Glu Ile
1475 1480 1485
Lys Glu His Val Gly Val Ala Val Ser Cys Val Pro Ala Asp Lys
1490 1495 1500
Pro Leu Asp Asp Glu Leu Leu Ser Lys Leu Glu Arg Phe Leu Val
1505 1510 1515
Lys Gly Ala His Ala Ala Phe Val Pro Thr Leu Leu Glu Ala Ala
1520 1525 1530
Tyr Lys Pro Ser Val Thr Pro Val Met Thr Ile Ser Gln Asp Lys
1535 1540 1545
Tyr Gln Trp His Val Val Pro Gly Ser Gln Met Leu Val His Gln
1550 1555 1560
Gly Val Ala Gln Phe Glu Lys Trp Thr Gly Phe Lys Gly Pro Phe
1565 1570 1575
Lys Ala Ile Phe Asp Ala Val Thr Lys Glu
1580 1585
<210> 36
<211> 454
<212> PRT
<213> Homo sapiens (Human)
<400> 36
Met Asp Pro Tyr Met Ile Gln Met Ser Ser Lys Gly Asn Leu Pro Ser
1 5 10 15
Ile Leu Asp Val His Val Asn Val Gly Gly Arg Ser Ser Val Pro Gly
20 25 30
Lys Met Lys Gly Arg Lys Ala Arg Trp Ser Val Arg Pro Ser Asp Met
35 40 45
Ala Lys Lys Thr Phe Asn Pro Ile Arg Ala Ile Val Asp Asn Met Lys
50 55 60
Val Lys Pro Asn Pro Asn Lys Thr Met Ile Ser Leu Ser Ile Gly Asp
65 70 75 80
Pro Thr Val Phe Gly Asn Leu Pro Thr Asp Pro Glu Val Thr Gln Ala
85 90 95
Met Lys Asp Ala Leu Asp Ser Gly Lys Tyr Asn Gly Tyr Ala Pro Ser
100 105 110
Ile Gly Phe Leu Ser Ser Arg Glu Glu Ile Ala Ser Tyr Tyr His Cys
115 120 125
Pro Glu Ala Pro Leu Glu Ala Lys Asp Val Ile Leu Thr Ser Gly Cys
130 135 140
Ser Gln Ala Ile Asp Leu Cys Leu Ala Val Leu Ala Asn Pro Gly Gln
145 150 155 160
Asn Ile Leu Val Pro Arg Pro Gly Phe Ser Leu Tyr Lys Thr Leu Ala
165 170 175
Glu Ser Met Gly Ile Glu Val Lys Leu Tyr Asn Leu Leu Pro Glu Lys
180 185 190
Ser Trp Glu Ile Asp Leu Lys Gln Leu Glu Tyr Leu Ile Asp Glu Lys
195 200 205
Thr Ala Cys Leu Ile Val Asn Asn Pro Ser Asn Pro Cys Gly Ser Val
210 215 220
Phe Ser Lys Arg His Leu Gln Lys Ile Leu Ala Val Ala Ala Arg Gln
225 230 235 240
Cys Val Pro Ile Leu Ala Asp Glu Ile Tyr Gly Asp Met Val Phe Ser
245 250 255
Asp Cys Lys Tyr Glu Pro Leu Ala Thr Leu Ser Thr Asp Val Pro Ile
260 265 270
Leu Ser Cys Gly Gly Leu Ala Lys Arg Trp Leu Val Pro Gly Trp Arg
275 280 285
Leu Gly Trp Ile Leu Ile His Asp Arg Arg Asp Ile Phe Gly Asn Glu
290 295 300
Ile Arg Asp Gly Leu Val Lys Leu Ser Gln Arg Ile Leu Gly Pro Cys
305 310 315 320
Thr Ile Val Gln Gly Ala Leu Lys Ser Ile Leu Cys Arg Thr Pro Gly
325 330 335
Glu Phe Tyr His Asn Thr Leu Ser Phe Leu Lys Ser Asn Ala Asp Leu
340 345 350
Cys Tyr Gly Ala Leu Ala Ala Ile Pro Gly Leu Arg Pro Val Arg Pro
355 360 365
Ser Gly Ala Met Tyr Leu Met Val Gly Ile Glu Met Glu His Phe Pro
370 375 380
Glu Phe Glu Asn Asp Val Glu Phe Thr Glu Arg Leu Val Ala Glu Gln
385 390 395 400
Ser Val His Cys Leu Pro Ala Thr Cys Phe Glu Tyr Pro Asn Phe Ile
405 410 415
Arg Val Val Ile Thr Val Pro Glu Val Met Met Leu Glu Ala Cys Ser
420 425 430
Arg Ile Gln Glu Phe Cys Glu Gln His Tyr His Cys Ala Glu Gly Ser
435 440 445
Gln Glu Glu Cys Asp Lys
450
<210> 37
<211> 1486
<212> PRT
<213> Escherichia coli (strain K12)
<400> 37
Met Leu Tyr Asp Lys Ser Leu Glu Arg Asp Asn Cys Gly Phe Gly Leu
1 5 10 15
Ile Ala His Ile Glu Gly Glu Pro Ser His Lys Val Val Arg Thr Ala
20 25 30
Ile His Ala Leu Ala Arg Met Gln His Arg Gly Ala Ile Leu Ala Asp
35 40 45
Gly Lys Thr Gly Asp Gly Cys Gly Leu Leu Leu Gln Lys Pro Asp Arg
50 55 60
Phe Phe Arg Ile Val Ala Gln Glu Arg Gly Trp Arg Leu Ala Lys Asn
65 70 75 80
Tyr Ala Val Gly Met Leu Phe Leu Asn Lys Asp Pro Glu Leu Ala Ala
85 90 95
Ala Ala Arg Arg Ile Val Glu Glu Glu Leu Gln Arg Glu Thr Leu Ser
100 105 110
Ile Val Gly Trp Arg Asp Val Pro Thr Asn Glu Gly Val Leu Gly Glu
115 120 125
Ile Ala Leu Ser Ser Leu Pro Arg Ile Glu Gln Ile Phe Val Asn Ala
130 135 140
Pro Ala Gly Trp Arg Pro Arg Asp Met Glu Arg Arg Leu Phe Ile Ala
145 150 155 160
Arg Arg Arg Ile Glu Lys Arg Leu Glu Ala Asp Lys Asp Phe Tyr Val
165 170 175
Cys Ser Leu Ser Asn Leu Val Asn Ile Tyr Lys Gly Leu Cys Met Pro
180 185 190
Thr Asp Leu Pro Arg Phe Tyr Leu Asp Leu Ala Asp Leu Arg Leu Glu
195 200 205
Ser Ala Ile Cys Leu Phe His Gln Arg Phe Ser Thr Asn Thr Val Pro
210 215 220
Arg Trp Pro Leu Ala Gln Pro Phe Arg Tyr Leu Ala His Asn Gly Glu
225 230 235 240
Ile Asn Thr Ile Thr Gly Asn Arg Gln Trp Ala Arg Ala Arg Thr Tyr
245 250 255
Lys Phe Gln Thr Pro Leu Ile Pro Asp Leu His Asp Ala Ala Pro Phe
260 265 270
Val Asn Glu Thr Gly Ser Asp Ser Ser Ser Met Asp Asn Met Leu Glu
275 280 285
Leu Leu Leu Ala Gly Gly Met Asp Ile Ile Arg Ala Met Arg Leu Leu
290 295 300
Val Pro Pro Ala Trp Gln Asn Asn Pro Asp Met Asp Pro Glu Leu Arg
305 310 315 320
Ala Phe Phe Asp Phe Asn Ser Met His Met Glu Pro Trp Asp Gly Pro
325 330 335
Ala Gly Ile Val Met Ser Asp Gly Arg Phe Ala Ala Cys Asn Leu Asp
340 345 350
Arg Asn Gly Leu Arg Pro Ala Arg Tyr Val Ile Thr Lys Asp Lys Leu
355 360 365
Ile Thr Cys Ala Ser Glu Val Gly Ile Trp Asp Tyr Gln Pro Asp Glu
370 375 380
Val Val Glu Lys Gly Arg Val Gly Pro Gly Glu Leu Met Val Ile Asp
385 390 395 400
Thr Arg Ser Gly Arg Ile Leu His Ser Ala Glu Thr Asp Asp Asp Leu
405 410 415
Lys Ser Arg His Pro Tyr Lys Glu Trp Met Glu Lys Asn Val Arg Arg
420 425 430
Leu Val Pro Phe Glu Asp Leu Pro Asp Glu Glu Val Gly Ser Arg Glu
435 440 445
Leu Asp Asp Asp Thr Leu Ala Ser Tyr Gln Lys Gln Phe Asn Tyr Ser
450 455 460
Ala Glu Glu Leu Asp Ser Val Ile Arg Val Leu Gly Glu Asn Gly Gln
465 470 475 480
Glu Ala Val Gly Ser Met Gly Asp Asp Thr Pro Phe Ala Val Leu Ser
485 490 495
Ser Gln Pro Arg Ile Ile Tyr Asp Tyr Phe Arg Gln Gln Phe Ala Gln
500 505 510
Val Thr Asn Pro Pro Ile Asp Pro Leu Arg Glu Ala His Val Met Ser
515 520 525
Leu Ala Thr Ser Ile Gly Arg Glu Met Asn Val Phe Cys Glu Ala Glu
530 535 540
Gly Gln Ala His Arg Leu Ser Phe Lys Ser Pro Ile Leu Leu Tyr Ser
545 550 555 560
Asp Phe Lys Gln Leu Thr Thr Met Lys Glu Glu His Tyr Arg Ala Asp
565 570 575
Thr Leu Asp Ile Thr Phe Asp Val Thr Lys Thr Thr Leu Glu Ala Thr
580 585 590
Val Lys Glu Leu Cys Asp Lys Ala Glu Lys Met Val Arg Ser Gly Thr
595 600 605
Val Leu Leu Val Leu Ser Asp Arg Asn Ile Ala Lys Asp Arg Leu Pro
610 615 620
Val Pro Ala Pro Met Ala Val Gly Ala Ile Gln Thr Arg Leu Val Asp
625 630 635 640
Gln Ser Leu Arg Cys Asp Ala Asn Ile Ile Val Glu Thr Ala Ser Ala
645 650 655
Arg Asp Pro His His Phe Ala Val Leu Leu Gly Phe Gly Ala Thr Ala
660 665 670
Ile Tyr Pro Tyr Leu Ala Tyr Glu Thr Leu Gly Arg Leu Val Asp Thr
675 680 685
His Ala Ile Ala Lys Asp Tyr Arg Thr Val Met Leu Asn Tyr Arg Asn
690 695 700
Gly Ile Asn Lys Gly Leu Tyr Lys Ile Met Ser Lys Met Gly Ile Ser
705 710 715 720
Thr Ile Ala Ser Tyr Arg Cys Ser Lys Leu Phe Glu Ala Val Gly Leu
725 730 735
His Asp Asp Val Val Gly Leu Cys Phe Gln Gly Ala Val Ser Arg Ile
740 745 750
Gly Gly Ala Ser Phe Glu Asp Phe Gln Gln Asp Leu Leu Asn Leu Ser
755 760 765
Lys Arg Ala Trp Leu Ala Arg Lys Pro Ile Ser Gln Gly Gly Leu Leu
770 775 780
Lys Tyr Val His Gly Gly Glu Tyr His Ala Tyr Asn Pro Asp Val Val
785 790 795 800
Arg Thr Leu Gln Gln Ala Val Gln Ser Gly Glu Tyr Ser Asp Tyr Gln
805 810 815
Glu Tyr Ala Lys Leu Val Asn Glu Arg Pro Ala Thr Thr Leu Arg Asp
820 825 830
Leu Leu Ala Ile Thr Pro Gly Glu Asn Ala Val Asn Ile Ala Asp Val
835 840 845
Glu Pro Ala Ser Glu Leu Phe Lys Arg Phe Asp Thr Ala Ala Met Ser
850 855 860
Ile Gly Ala Leu Ser Pro Glu Ala His Glu Ala Leu Ala Glu Ala Met
865 870 875 880
Asn Ser Ile Gly Gly Asn Ser Asn Ser Gly Glu Gly Gly Glu Asp Pro
885 890 895
Ala Arg Tyr Gly Thr Asn Lys Val Ser Arg Ile Lys Gln Val Ala Ser
900 905 910
Gly Arg Phe Gly Val Thr Pro Ala Tyr Leu Val Asn Ala Asp Val Ile
915 920 925
Gln Ile Lys Val Ala Gln Gly Ala Lys Pro Gly Glu Gly Gly Gln Leu
930 935 940
Pro Gly Asp Lys Val Thr Pro Tyr Ile Ala Lys Leu Arg Tyr Ser Val
945 950 955 960
Pro Gly Val Thr Leu Ile Ser Pro Pro Pro His His Asp Ile Tyr Ser
965 970 975
Ile Glu Asp Leu Ala Gln Leu Ile Phe Asp Leu Lys Gln Val Asn Pro
980 985 990
Lys Ala Met Ile Ser Val Lys Leu Val Ser Glu Pro Gly Val Gly Thr
995 1000 1005
Ile Ala Thr Gly Val Ala Lys Ala Tyr Ala Asp Leu Ile Thr Ile
1010 1015 1020
Ala Gly Tyr Asp Gly Gly Thr Gly Ala Ser Pro Leu Ser Ser Val
1025 1030 1035
Lys Tyr Ala Gly Cys Pro Trp Glu Leu Gly Leu Val Glu Thr Gln
1040 1045 1050
Gln Ala Leu Val Ala Asn Gly Leu Arg His Lys Ile Arg Leu Gln
1055 1060 1065
Val Asp Gly Gly Leu Lys Thr Gly Val Asp Ile Ile Lys Ala Ala
1070 1075 1080
Ile Leu Gly Ala Glu Ser Phe Gly Phe Gly Thr Gly Pro Met Val
1085 1090 1095
Ala Leu Gly Cys Lys Tyr Leu Arg Ile Cys His Leu Asn Asn Cys
1100 1105 1110
Ala Thr Gly Val Ala Thr Gln Asp Asp Lys Leu Arg Lys Asn His
1115 1120 1125
Tyr His Gly Leu Pro Phe Lys Val Thr Asn Tyr Phe Glu Phe Ile
1130 1135 1140
Ala Arg Glu Thr Arg Glu Leu Met Ala Gln Leu Gly Val Thr Arg
1145 1150 1155
Leu Val Asp Leu Ile Gly Arg Thr Asp Leu Leu Lys Glu Leu Asp
1160 1165 1170
Gly Phe Thr Ala Lys Gln Gln Lys Leu Ala Leu Ser Lys Leu Leu
1175 1180 1185
Glu Thr Ala Glu Pro His Pro Gly Lys Ala Leu Tyr Cys Thr Glu
1190 1195 1200
Asn Asn Pro Pro Phe Asp Asn Gly Leu Leu Asn Ala Gln Leu Leu
1205 1210 1215
Gln Gln Ala Lys Pro Phe Val Asp Glu Arg Gln Ser Lys Thr Phe
1220 1225 1230
Trp Phe Asp Ile Arg Asn Thr Asp Arg Ser Val Gly Ala Ser Leu
1235 1240 1245
Ser Gly Tyr Ile Ala Gln Thr His Gly Asp Gln Gly Leu Ala Ala
1250 1255 1260
Asp Pro Ile Lys Ala Tyr Phe Asn Gly Thr Ala Gly Gln Ser Phe
1265 1270 1275
Gly Val Trp Asn Ala Gly Gly Val Glu Leu Tyr Leu Thr Gly Asp
1280 1285 1290
Ala Asn Asp Tyr Val Gly Lys Gly Met Ala Gly Gly Leu Ile Ala
1295 1300 1305
Ile Arg Pro Pro Val Gly Ser Ala Phe Arg Ser His Glu Ala Ser
1310 1315 1320
Ile Ile Gly Asn Thr Cys Leu Tyr Gly Ala Thr Gly Gly Arg Leu
1325 1330 1335
Tyr Ala Ala Gly Arg Ala Gly Glu Arg Phe Gly Val Arg Asn Ser
1340 1345 1350
Gly Ala Ile Thr Val Val Glu Gly Ile Gly Asp Asn Gly Cys Glu
1355 1360 1365
Tyr Met Thr Gly Gly Ile Val Cys Ile Leu Gly Lys Thr Gly Val
1370 1375 1380
Asn Phe Gly Ala Gly Met Thr Gly Gly Phe Ala Tyr Val Leu Asp
1385 1390 1395
Glu Ser Gly Asp Phe Arg Lys Arg Val Asn Pro Glu Leu Val Glu
1400 1405 1410
Val Leu Ser Val Asp Ala Leu Ala Ile His Glu Glu His Leu Arg
1415 1420 1425
Gly Leu Ile Thr Glu His Val Gln His Thr Gly Ser Gln Arg Gly
1430 1435 1440
Glu Glu Ile Leu Ala Asn Trp Ser Thr Phe Ala Thr Lys Phe Ala
1445 1450 1455
Leu Val Lys Pro Lys Ser Ser Asp Val Lys Ala Leu Leu Gly His
1460 1465 1470
Arg Ser Arg Ser Ala Ala Glu Leu Arg Val Gln Ala Gln
1475 1480 1485
<210> 38
<211> 472
<212> PRT
<213> Escherichia coli (strain K12)
<400> 38
Met Ser Gln Asn Val Tyr Gln Phe Ile Asp Leu Gln Arg Val Asp Pro
1 5 10 15
Pro Lys Lys Pro Leu Lys Ile Arg Lys Ile Glu Phe Val Glu Ile Tyr
20 25 30
Glu Pro Phe Ser Glu Gly Gln Ala Lys Ala Gln Ala Asp Arg Cys Leu
35 40 45
Ser Cys Gly Asn Pro Tyr Cys Glu Trp Lys Cys Pro Val His Asn Tyr
50 55 60
Ile Pro Asn Trp Leu Lys Leu Ala Asn Glu Gly Arg Ile Phe Glu Ala
65 70 75 80
Ala Glu Leu Ser His Gln Thr Asn Thr Leu Pro Glu Val Cys Gly Arg
85 90 95
Val Cys Pro Gln Asp Arg Leu Cys Glu Gly Ser Cys Thr Leu Asn Asp
100 105 110
Glu Phe Gly Ala Val Thr Ile Gly Asn Ile Glu Arg Tyr Ile Asn Asp
115 120 125
Lys Ala Phe Glu Met Gly Trp Arg Pro Asp Met Ser Gly Val Lys Gln
130 135 140
Thr Gly Lys Lys Val Ala Ile Ile Gly Ala Gly Pro Ala Gly Leu Ala
145 150 155 160
Cys Ala Asp Val Leu Thr Arg Asn Gly Val Lys Ala Val Val Phe Asp
165 170 175
Arg His Pro Glu Ile Gly Gly Leu Leu Thr Phe Gly Ile Pro Ala Phe
180 185 190
Lys Leu Glu Lys Glu Val Met Thr Arg Arg Arg Glu Ile Phe Thr Gly
195 200 205
Met Gly Ile Glu Phe Lys Leu Asn Thr Glu Val Gly Arg Asp Val Gln
210 215 220
Leu Asp Asp Leu Leu Ser Asp Tyr Asp Ala Val Phe Leu Gly Val Gly
225 230 235 240
Thr Tyr Gln Ser Met Arg Gly Gly Leu Glu Asn Glu Asp Ala Asp Gly
245 250 255
Val Tyr Ala Ala Leu Pro Phe Leu Ile Ala Asn Thr Lys Gln Leu Met
260 265 270
Gly Phe Gly Glu Thr Arg Asp Glu Pro Phe Val Ser Met Glu Gly Lys
275 280 285
Arg Val Val Val Leu Gly Gly Gly Asp Thr Ala Met Asp Cys Val Arg
290 295 300
Thr Ser Val Arg Gln Gly Ala Lys His Val Thr Cys Ala Tyr Arg Arg
305 310 315 320
Asp Glu Glu Asn Met Pro Gly Ser Arg Arg Glu Val Lys Asn Ala Arg
325 330 335
Glu Glu Gly Val Glu Phe Lys Phe Asn Val Gln Pro Leu Gly Ile Glu
340 345 350
Val Asn Gly Asn Gly Lys Val Ser Gly Val Lys Met Val Arg Thr Glu
355 360 365
Met Gly Glu Pro Asp Ala Lys Gly Arg Arg Arg Ala Glu Ile Val Ala
370 375 380
Gly Ser Glu His Ile Val Pro Ala Asp Ala Val Ile Met Ala Phe Gly
385 390 395 400
Phe Arg Pro His Asn Met Glu Trp Leu Ala Lys His Ser Val Glu Leu
405 410 415
Asp Ser Gln Gly Arg Ile Ile Ala Pro Glu Gly Ser Asp Asn Ala Phe
420 425 430
Gln Thr Ser Asn Pro Lys Ile Phe Ala Gly Gly Asp Ile Val Arg Gly
435 440 445
Ser Asp Leu Val Val Thr Ala Ile Ala Glu Gly Arg Lys Ala Ala Asp
450 455 460
Gly Ile Met Asn Trp Leu Glu Val
465 470
<210> 39
<211> 370
<212> PRT
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 39
Met Ala Glu Ala Ser Ile Glu Lys Thr Gln Ile Leu Gln Lys Tyr Leu
1 5 10 15
Glu Leu Asp Gln Arg Gly Arg Ile Ile Ala Glu Tyr Val Trp Ile Asp
20 25 30
Gly Thr Gly Asn Leu Arg Ser Lys Gly Arg Thr Leu Lys Lys Arg Ile
35 40 45
Thr Ser Ile Asp Gln Leu Pro Glu Trp Asn Phe Asp Gly Ser Ser Thr
50 55 60
Asn Gln Ala Pro Gly His Asp Ser Asp Ile Tyr Leu Lys Pro Val Ala
65 70 75 80
Tyr Tyr Pro Asp Pro Phe Arg Arg Gly Asp Asn Ile Val Val Leu Ala
85 90 95
Ala Cys Tyr Asn Asn Asp Gly Thr Pro Asn Lys Phe Asn His Arg His
100 105 110
Glu Ala Ala Lys Leu Phe Ala Ala His Lys Asp Glu Glu Ile Trp Phe
115 120 125
Gly Leu Glu Gln Glu Tyr Thr Leu Phe Asp Met Tyr Asp Asp Val Tyr
130 135 140
Gly Trp Pro Lys Gly Gly Tyr Pro Ala Pro Gln Gly Pro Tyr Tyr Cys
145 150 155 160
Gly Val Gly Ala Gly Lys Val Tyr Ala Arg Asp Met Ile Glu Ala His
165 170 175
Tyr Arg Ala Cys Leu Tyr Ala Gly Leu Glu Ile Ser Gly Ile Asn Ala
180 185 190
Glu Val Met Pro Ser Gln Trp Glu Phe Gln Val Gly Pro Cys Thr Gly
195 200 205
Ile Asp Met Gly Asp Gln Leu Trp Met Ala Arg Tyr Phe Leu His Arg
210 215 220
Val Ala Glu Glu Phe Gly Ile Lys Ile Ser Phe His Pro Lys Pro Leu
225 230 235 240
Lys Gly Asp Trp Asn Gly Ala Gly Cys His Thr Asn Val Ser Thr Lys
245 250 255
Glu Met Arg Gln Pro Gly Gly Met Lys Tyr Ile Glu Gln Ala Ile Glu
260 265 270
Lys Leu Ser Lys Arg His Ala Glu His Ile Lys Leu Tyr Gly Ser Asp
275 280 285
Asn Asp Met Arg Leu Thr Gly Arg His Glu Thr Ala Ser Met Thr Ala
290 295 300
Phe Ser Ser Gly Val Ala Asn Arg Gly Ser Ser Ile Arg Ile Pro Arg
305 310 315 320
Ser Val Ala Lys Glu Gly Tyr Gly Tyr Phe Glu Asp Arg Arg Pro Ala
325 330 335
Ser Asn Ile Asp Pro Tyr Leu Val Thr Gly Ile Met Cys Glu Thr Val
340 345 350
Cys Gly Ala Ile Asp Asn Ala Asp Met Thr Lys Glu Phe Glu Arg Glu
355 360 365
Ser Ser
370
<210> 40
<211> 1875
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 40
atgtccgagt ccctgtctaa agacctcaac ctcaatgcac tgttcattgg tgacaaggcc 60
gagaatggcc agatctacaa ggccctgctt aacgagcttg tcgatgagca cctcggctgg 120
agacagaact atatgcctca ggacatgccc attattactc cagaagagaa atcttctgca 180
tcctttgagc acaccgtgaa caagaccaag gacgtcctct ctgagatttc ggcccgaatg 240
cgaacacatt ctgtgccctg gcataatgct ggcagatact ggggacacat gaactctgag 300
actctcatgc catcccttct ggcttacaat tttgcaatgc tgtggaatgg aaacaatgtc 360
gcctacgagt cctccccagc tacctcccag atggaggagg aggtcggcat ggagtttgca 420
aagctgatgt cctataaaga cggttggggt cacattgttg ctgatggttc tctcgccaat 480
ctcgaaggcc tgtggtacgc tcgaaatatc aagagccttc ctctggctat gaaggaggtg 540
acccccgagc tcgttgccgg taagtctgat tgggagctca tgaacctctc cactgaagag 600
attatgaacc tcctcgactc tgtgcctgag aaaatcgacg agattaaggc ccattcggct 660
cgttccggca agcatctgga gaagcttggc aagtggcttg tgccacagac gaagcactat 720
tcctggctta aggctgccga tatcatcggt attggcctgg accaagtgat ccctgtgccc 780
gttgatcaca actaccggat ggacatcaat gagctcgaaa agattgttcg aggactggcc 840
gccgagaaga ccccaatcct cggagtcgtg ggtgtcgttg gttccaccga ggagggagct 900
attgatggta tcgacaagat tgtcgctctc cgacgagtcc tcgagaagga tggaatttac 960
ttttacctcc acgttgacgc tgcctacgga ggctacggcc gagctatctt cctcgacgaa 1020
gacaataact ttattccttt tgaggatctt aaggatgtcc actacaagta taacgtcttt 1080
accgagaaca aagattacat cctggaagag gttcatagcg cctacaaggc tattgaggaa 1140
gctgagtcgg tcaccattga cccacacaag atgggttacg tcccctacag cgccggaggc 1200
attgttatta aggacattag aatgcgagac gttatctcct acttcgctac ctacgtgttt 1260
gagaagggcg ctgacatccc cgctcttctc ggagcctaca tcctggaagg ctctaaggcc 1320
ggagccacgg ccgcttctgt ctgggccgcc caccatgttc tgcccctgaa cgtgactggc 1380
tacggaaagc ttatgggtgc ctccattgag ggagcacacc gtttctacaa cttcctcaac 1440
gacctgtctt tcaaggttgg cgacaaggag atcgaagttc accctctcac ttaccctgat 1500
ttcaatatgg ttgactacgt ctttaaggag aagggcaacg atgacctcgt tgccatgaat 1560
aagctcaacc acgatgtgta cgattactcg tcctacgtca agggaagcat ctacggtaac 1620
gagttcctga cttcccacac ggacttcgct atccctgact atggaaacag cccccttcag 1680
ttcgtgaacc agctgggatt ttctgacgag gaatggaacc gagcaggtaa agtcaccgtg 1740
ctgcgagctt cggtcatgac cccctacatg aacaaagaag agcacttcga ggagtacgca 1800
gagaaaatca aggctgccct gcaggagaag cttgagaaga tttacgccga tcagctcctg 1860
gcatccgagg ctaaa 1875
<210> 41
<211> 522
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 41
atgactcaac ccttattctt gattggcccg aggggttgtg gtaagacaac cgttggtatg 60
gccctggctg attctcttaa caggaggttc gtcgataccg atcaatggtt gcaatcacaa 120
cttaatatga ctgtcgcaga gattgttgag agagaggagt gggcaggttt tagggctaga 180
gaaacggcgg cattggaggc tgtaacagct ccgtctaccg tgattgcaac aggagggggt 240
attattttaa cggaatttaa tagacacttt atgcaaaata atggaattgt tgtatacctt 300
tgtgctccgg ttagtgtttt ggtaaacaga ttacaagcgg ccccagaaga agatttgaga 360
cctactttga ccgggaagcc actaagcgaa gaagttcagg aagtcttaga agaaagagat 420
gccctttaca gagaagttgc ccacatcata atcgatgcca ctaacgaacc atctcaggtg 480
atatctgaaa tacgttctgc gttggcccag acgattaatt gc 522
<210> 42
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 42
atgagcgagt caccaatgtt tgcagctaat ggtatgccga aggtcaacca gggcgccgag 60
gaagacgtaa ggattcttgg atatgatccc ttagcatcac cagctttatt acaagttcaa 120
attccagcta cgcctactag tttagaaacg gctaaaagag gtagaagaga agccattgat 180
attatcacag gaaaggacga tagggtcttg gttatagttg ggccttgttc tatccacgat 240
ttggaagcag cacaggaata tgccctaaga ttgaaaaagc taagtgatga attgaagggt 300
gatctgtcaa ttattatgcg tgcatacctg gaaaagccta gaacaaccgt tggttggaaa 360
ggcctaatca atgaccccga tgtcaataat acgtttaata ttaataaagg attacaatca 420
gcgaggcaat tgttcgtgaa cttgacaaac attggtttgc ccattggttc cgaaatgcta 480
gataccattt ctcctcaata cttagccgac ttggtctctt tcggtgcgat aggagctaga 540
actaccgaat ctcagctgca tagagagctt gcatctggtc tgagctttcc agttggtttt 600
aaaaatggca ctgatggtac gcttaatgtt gctgtcgatg cttgccaggc cgcagctcat 660
tcacaccatt tcatgggcgt taccaagcat ggagtagcag ctataactac aaccaaagga 720
aatgagcatt gctttgtaat tttaagaggt ggaaagaagg gcactaatta cgacgccaaa 780
tctgttgcag aggccaaagc ccaattgcct gcaggtagta acggactaat gattgattac 840
agtcatggaa attcaaacaa agatttcaga aaccaaccca aagtaaacga cgtggtttgt 900
gaacaaattg ctaatggtga aaacgctatc accggtgtta tgatagaatc taacattaat 960
gaaggcaacc aaggcattcc agctgaaggt aaagctggtt tgaaatacgg tgtttctata 1020
accgacgcct gcataggatg ggaaacaact gaggacgtat tacgtaaatt agccgccgct 1080
gtgagacaaa gaagggaggt taacaaaaag 1110
<210> 43
<211> 1875
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 43
atgtctgagt cacttagcaa agatttaaac ttaaatgctt tgtttattgg ggataaggct 60
gaaaatggtc aaatttacaa agccctttta aatgaacttg tcgatgagca tttgggttgg 120
agacaaaact acatgccaca ggatatgcca ataatcacac cagaggagaa atctagcgct 180
agctttgaac atacagtcaa taaaacgaag gatgtcttgt ccgaaattag cgctaggatg 240
agaactcata gtgtgccatg gcataatgca ggtagatatt ggggacacat gaactcagaa 300
accttgatgc ccagcttact tgcgtacaat tttgctatgt tgtggaacgg gaataacgtt 360
gcatatgaat cctcccccgc tacatctcaa atggaggagg aggtaggaat ggaatttgca 420
aagctgatgt cctataaaga tggctggggc catattgttg ctgatggtag tttagcaaac 480
ttggaaggtc tttggtacgc aaggaacatt aaaagcctgc cattggccat gaaggaagtg 540
actccagaac tggtagcggg taagtccgat tgggagctga tgaacttgtc tactgaggag 600
ataatgaact tgttagactc cgttccagaa aagatcgatg aaattaaggc acacagcgca 660
aggtccggga aacatctaga aaaactaggg aaatggttgg ttccccaaac aaaacattat 720
tcttggttga aggcggccga cattattggt attggactag atcaagttat acctgtcccg 780
gttgaccaca actatagaat ggatattaat gaattagaaa agatagtgag gggtttagca 840
gcggaaaaga ctccaatctt aggtgtagtg ggggtggtcg gatccaccga agaaggtgca 900
attgatggaa tcgacaagat cgtagcacta aggcgtgtct tggaaaagga cggtatatac 960
ttctacttgc atgtcgacgc tgcctatggg ggttatggcc gtgcaatttt tctggacgaa 1020
gacaataatt tcatcccgtt tgaagatctt aaagatgtgc attataaata taatgttttt 1080
accgagaata aagactacat cttagaagaa gtacactctg catataaagc catcgaagaa 1140
gcggagagtg tcactataga ccctcataag atgggctatg tgccatactc tgctggtggt 1200
atcgttatta aagatataag aatgcgtgac gtaattagtt acttcgctac ctatgtgttt 1260
gagaagggtg cagatatccc tgcactgctt ggcgcttaca ttttggaagg ttcaaaagct 1320
ggtgcgactg cagctagcgt gtgggctgca catcatgtct taccattaaa tgttactggc 1380
tatggaaagt tgatgggtgc atcaatagaa ggcgctcacc gtttctacaa ctttttaaac 1440
gacctatcat ttaaagttgg tgacaaggag attgaggttc accctctaac ataccccgat 1500
ttcaatatgg ttgactatgt ctttaaagag aagggcaacg acgatttagt ggcgatgaat 1560
aagctaaatc atgatgtcta tgactacagt tcctacgtga agggtagcat ttacggtaac 1620
gaatttttaa ctagccatac agacttcgct ataccggact atggtaattc tccgttgcaa 1680
ttcgttaatc aactagggtt ctctgatgag gaatggaata gagcgggtaa agttaccgta 1740
ctacgtgcaa gtgtcatgac cccttatatg aataaggaag aacactttga agaatacgcc 1800
gaaaaaatta aggcagcact tcaggaaaag cttgaaaaaa tttatgcgga tcaattgtta 1860
gcaagtgaag cgaag 1875
<210> 44
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 44
atgagcgagt ctcccatgtt tgcggcgaac ggcatgccga aagttaacca gggtgcagaa 60
gaggatgtgc gtattctcgg ctacgacccg ttggcgtctc cagccctgtt gcaagttcaa 120
atcccagcca ccccgacgtc tctcgagact gctaagcgcg gtcgccgtga agccatcgat 180
attatcacgg gaaaagacga tcgcgttttg gtcatcgtgg gcccatgctc tatccacgac 240
ctggaagcag cacaggagta cgccttgcgc ttgaagaagc tttccgacga actcaagggc 300
gacctttcta tcatcatgcg tgcttacttg gagaagcccc gaaccaccgt cggatggaag 360
ggcttgatta atgatcctga tgttaataac acgttcaata ttaataaggg cttgcagtcc 420
gctcgtcaac tgttcgttaa cctgaccaat atcggccttc cgattggctc tgagatgttg 480
gataccatct cccctcagta cctcgctgat ctcgtttcct ttggcgcgat cggtgctcgt 540
accaccgaat ctcagctgca tcgcgagctg gcgtccggcc tctccttccc tgtcggtttt 600
aaaaatggca cggatggtac cttgaatgtc gcggtggatg catgtcaggc tgcggctcat 660
tcacatcatt tcatgggagt gaccttgcac ggagttgccg ctatcaccac tacgaaggga 720
aacgagcact gctttgtgat ccttcgtggt ggcaaaaaag gcaccaacta tgacgcaaag 780
tcggtggctg aggccaaagc ccagttgcct gcaggcagca atggactcat gattgactat 840
tcccatggaa actcaaacaa agactttcgc aaccagccaa aagtcaatga cgtggtgtgc 900
gaacaaatcg ctaacggtga aaatgcaatc accggcgtga tgatcgaaag caatattaat 960
gagggcaacc aaggcatccc ggctgagggc aaagcgggcc tgaaatacgg tgttagcatc 1020
accgatgcat gtatcggctg ggaaacaacg gaagacgttc tccgaaagct cgctgcggca 1080
gttcgccagc gccgcgaagt taacaagaag 1110
<210> 45
<211> 1875
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 45
atgtccgaat ccctttccaa agacctgaac ctcaacgcat tgttcattgg cgacaaggcc 60
gagaacggtc agatttacaa ggctctgctc aatgagctcg tggacgaaca tctgggctgg 120
cgtcagaact acatgcccca ggacatgccc atcatcaccc ccgaagagaa atctagcgcg 180
tcattcgaac acacggtaaa caaaacaaaa gatgtgctgt ctgaaatctc ggcccgcatg 240
cgcacacatt ccgtgccctg gcataacgcc ggccgctact ggggccatat gaattcagaa 300
accctcatgc cctcactgtt ggcatataat ttcgcgatgc tgtggaacgg taacaacgtt 360
gcgtatgaaa gctctccagc aacctcccag atggaagaag aagttggcat ggagttcgcg 420
aagctcatgt cgtataaaga tggttggggc catatcgtag ccgatggttc tctggcgaat 480
ttggagggct tgtggtatgc gcgtaacatc aagtccttgc cactggcaat gaaagaggtt 540
acaccagagc tcgtggccgg caagtccgat tgggagctga tgaacctctc aacagaggaa 600
attatgaacc ttctggactc ggtgcccgaa aaaatcgacg agatcaaggc ccactccgcc 660
cgttcgggca agcacctgga gaagttgggc aaatggttgg tccctcagac caaacactat 720
tcctggttga aagccgcgga tattatcgga atcggtctgg atcaagttat ccctgttccg 780
gtagaccata actaccgaat ggatattaac gagctcgaga agattgtccg cggcctggcc 840
gccgaaaaga cacccatcct gggtgtcgtt ggcgtcgttg gttcgactga agagggcgcc 900
attgacggca ttgacaagat cgtggcgttg cgccgcgttc ttgaaaagga tggcatttat 960
ttctaccttc acgtggacgc ggcttacggc ggctacggcc gcgccatctt tcttgacgaa 1020
gataataatt tcatcccctt cgaggatctc aaggacgtcc actataagta caacgtattc 1080
accgagaaca aagactacat tttggaggag gttcattccg cttataaggc gattgaggaa 1140
gcggagtccg ttacgattga tccgcacaag atgggctatg tgccttacag cgcgggcggc 1200
atcgtgatca aggatatccg tatgcgtgat gtcatttcct attttgccac ctacgtgttc 1260
gagaagggag cagatatccc tgccctgctc ggagcgtaca tcctggaagg ctcaaaagca 1320
ggtgctactg ctgcctcagt ttgggccgca caccacgtcc tcccattgaa cgtgaccggc 1380
tacggaaaat tgatgggtgc ctccattgaa ggcgcccacc gtttctacaa ctttctgaat 1440
gacctgagct tcaaggtcgg tgataaggaa atcgaagttc atccgctgac ctaccccgat 1500
tttaacatgg tcgattacgt atttaaagaa aaaggaaacg acgatctcgt ggcaatgaac 1560
aagctgaacc acgatgtgta tgattacagc tcttatgtga agggatcgat ttacggtaat 1620
gaattcttga cctcccatac cgatttcgca atcccagatt acggaaattc tcctttgcag 1680
ttcgttaacc agctgggctt ttctgacgag gagtggaatc gcgcaggaaa ggtcaccgta 1740
ttgcgtgcct cagtgatgac cccatacatg aacaaggagg agcattttga ggagtacgcc 1800
gagaaaatta aagcagcact tcaggaaaag ttggagaaaa tctacgctga tcaacttctt 1860
gcgtcggagg ctaag 1875
<210> 46
<211> 540
<212> PRT
<213> Escherichia coli (strain K12)
<400> 46
Met Arg Val Asn Asn Gly Leu Thr Pro Gln Glu Leu Glu Ala Tyr Gly
1 5 10 15
Ile Ser Asp Val His Asp Ile Val Tyr Asn Pro Ser Tyr Asp Leu Leu
20 25 30
Tyr Gln Glu Glu Leu Asp Pro Ser Leu Thr Gly Tyr Glu Arg Gly Val
35 40 45
Leu Thr Asn Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly
50 55 60
Arg Ser Pro Lys Asp Lys Tyr Ile Val Arg Asp Asp Thr Thr Arg Asp
65 70 75 80
Thr Phe Trp Trp Ala Asp Lys Gly Lys Gly Lys Asn Asp Asn Lys Pro
85 90 95
Leu Ser Pro Glu Thr Trp Gln His Leu Lys Gly Leu Val Thr Arg Gln
100 105 110
Leu Ser Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Asn
115 120 125
Pro Asp Thr Arg Leu Ser Val Arg Phe Ile Thr Glu Val Ala Trp Gln
130 135 140
Ala His Phe Val Lys Asn Met Phe Ile Arg Pro Ser Asp Glu Glu Leu
145 150 155 160
Ala Gly Phe Lys Pro Asp Phe Ile Val Met Asn Gly Ala Lys Cys Thr
165 170 175
Asn Pro Gln Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala
180 185 190
Phe Asn Leu Thr Glu Arg Met Gln Leu Ile Gly Gly Thr Trp Tyr Gly
195 200 205
Gly Glu Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Leu Leu Pro
210 215 220
Leu Lys Gly Ile Ala Ser Met His Cys Ser Ala Asn Val Gly Glu Lys
225 230 235 240
Gly Asp Val Ala Val Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr
245 250 255
Leu Ser Thr Asp Pro Lys Arg Arg Leu Ile Gly Asp Asp Glu His Gly
260 265 270
Trp Asp Asp Asp Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys
275 280 285
Thr Ile Lys Leu Ser Lys Glu Ala Glu Pro Glu Ile Tyr Asn Ala Ile
290 295 300
Arg Arg Asp Ala Leu Leu Glu Asn Val Thr Val Arg Glu Asp Gly Thr
305 310 315 320
Ile Asp Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr
325 330 335
Pro Ile Tyr His Ile Asp Asn Ile Val Lys Pro Val Ser Lys Ala Gly
340 345 350
His Ala Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu
355 360 365
Pro Pro Val Ser Arg Leu Thr Ala Asp Gln Thr Gln Tyr His Phe Leu
370 375 380
Ser Gly Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Ile Thr Glu
385 390 395 400
Pro Thr Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu
405 410 415
His Pro Thr Gln Tyr Ala Glu Val Leu Val Lys Arg Met Gln Ala Ala
420 425 430
Gly Ala Gln Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys
435 440 445
Arg Ile Ser Ile Lys Asp Thr Arg Ala Ile Ile Asp Ala Ile Leu Asn
450 455 460
Gly Ser Leu Asp Asn Ala Glu Thr Phe Thr Leu Pro Met Phe Asn Leu
465 470 475 480
Ala Ile Pro Thr Glu Leu Pro Gly Val Asp Thr Lys Ile Leu Asp Pro
485 490 495
Arg Asn Thr Tyr Ala Ser Pro Glu Gln Trp Gln Glu Lys Ala Glu Thr
500 505 510
Leu Ala Lys Leu Phe Ile Asp Asn Phe Asp Lys Tyr Thr Asp Thr Pro
515 520 525
Ala Gly Ala Ala Leu Val Ala Ala Gly Pro Lys Leu
530 535 540
<210> 47
<211> 373
<212> PRT
<213> Escherichia coli (strain K12)
<400> 47
Met Val Ala Glu Leu Thr Ala Leu Arg Asp Gln Ile Asp Glu Val Asp
1 5 10 15
Lys Ala Leu Leu Asn Leu Leu Ala Lys Arg Leu Glu Leu Val Ala Glu
20 25 30
Val Gly Glu Val Lys Ser Arg Phe Gly Leu Pro Ile Tyr Val Pro Glu
35 40 45
Arg Glu Ala Ser Ile Leu Ala Ser Arg Arg Ala Glu Ala Glu Ala Leu
50 55 60
Gly Val Pro Pro Asp Leu Ile Glu Asp Val Leu Arg Arg Val Met Arg
65 70 75 80
Glu Ser Tyr Ser Ser Glu Asn Asp Lys Gly Phe Lys Thr Leu Cys Pro
85 90 95
Ser Leu Arg Pro Val Val Ile Val Gly Gly Gly Gly Gln Met Gly Arg
100 105 110
Leu Phe Glu Lys Met Leu Thr Leu Ser Gly Tyr Gln Val Arg Ile Leu
115 120 125
Glu Gln His Asp Trp Asp Arg Ala Ala Asp Ile Val Ala Asp Ala Gly
130 135 140
Met Val Ile Val Ser Val Pro Ile His Val Thr Glu Gln Val Ile Gly
145 150 155 160
Lys Leu Pro Pro Leu Pro Lys Asp Cys Ile Leu Val Asp Leu Ala Ser
165 170 175
Val Lys Asn Gly Pro Leu Gln Ala Met Leu Val Ala His Asp Gly Pro
180 185 190
Val Leu Gly Leu His Pro Met Phe Gly Pro Asp Ser Gly Ser Leu Ala
195 200 205
Lys Gln Val Val Val Trp Cys Asp Gly Arg Lys Pro Glu Ala Tyr Gln
210 215 220
Trp Phe Leu Glu Gln Ile Gln Val Trp Gly Ala Arg Leu His Arg Ile
225 230 235 240
Ser Ala Val Glu His Asp Gln Asn Met Ala Phe Ile Gln Ala Leu Arg
245 250 255
His Phe Ala Thr Phe Ala Tyr Gly Leu His Leu Ala Glu Glu Asn Val
260 265 270
Gln Leu Glu Gln Leu Leu Ala Leu Ser Ser Pro Ile Tyr Arg Leu Glu
275 280 285
Leu Ala Met Val Gly Arg Leu Phe Ala Gln Asp Pro Gln Leu Tyr Ala
290 295 300
Asp Ile Ile Met Ser Ser Glu Arg Asn Leu Ala Leu Ile Lys Arg Tyr
305 310 315 320
Tyr Lys Arg Phe Gly Glu Ala Ile Glu Leu Leu Glu Gln Gly Asp Lys
325 330 335
Gln Ala Phe Ile Asp Ser Phe Arg Lys Val Glu His Trp Phe Gly Asp
340 345 350
Tyr Val Gln Arg Phe Gln Ser Glu Ser Arg Val Leu Leu Arg Gln Ala
355 360 365
Asn Asp Asn Arg Gln
370
<210> 48
<211> 173
<212> PRT
<213> Dickeya chrysanthemi (Pectobacterium chrysanthemi) (Erwinia chrysanthemi)
<400> 48
Met Thr Glu Pro Ile Phe Met Val Gly Ala Arg Gly Cys Gly Lys Thr
1 5 10 15
Thr Val Gly Arg Glu Leu Ala Arg Ala Leu Gly Tyr Glu Phe Val Asp
20 25 30
Thr Asp Ile Phe Met Gln His Thr Ser Gly Met Thr Val Ala Asp Val
35 40 45
Val Ala Ala Glu Gly Trp Pro Gly Phe Arg Arg Arg Glu Ser Glu Ala
50 55 60
Leu Gln Ala Val Ala Thr Pro Asn Arg Val Val Ala Thr Gly Gly Gly
65 70 75 80
Met Val Leu Leu Glu Gln Asn Arg Gln Phe Met Arg Ala His Gly Thr
85 90 95
Val Val Tyr Leu Phe Ala Pro Ala Glu Glu Leu Ala Leu Arg Leu Gln
100 105 110
Ala Ser Pro Gln Ala His Gln Arg Pro Thr Leu Thr Gly Arg Pro Ile
115 120 125
Ala Glu Glu Met Glu Ala Val Leu Arg Glu Arg Glu Ala Leu Tyr Gln
130 135 140
Asp Val Ala His Tyr Val Val Asp Ala Thr Gln Pro Pro Ala Ala Ile
145 150 155 160
Val Ser Glu Leu Met Gln Thr Met Arg Leu Pro Ala Ala
165 170
<210> 49
<211> 334
<212> PRT
<213> Clostridium acetobutylicum (strain ATCC 824 DSM 792 JCM 1419 LMG 5710 VKM B-1787)
<400> 49
Met Ala Lys Ile Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu Ala
1 5 10 15
Leu Arg Arg Ile Leu Glu Val Pro Gly Leu Glu Val Val Ala Ile Asn
20 25 30
Asp Leu Thr Asp Ala Lys Met Leu Ala His Leu Phe Lys Tyr Asp Ser
35 40 45
Ser Gln Gly Arg Phe Asn Gly Glu Ile Glu Val Lys Glu Gly Ala Phe
50 55 60
Val Val Asn Gly Lys Glu Val Lys Val Phe Ala Glu Ala Asp Pro Glu
65 70 75 80
Lys Leu Pro Trp Gly Asp Leu Gly Ile Asp Val Val Leu Glu Cys Thr
85 90 95
Gly Phe Phe Thr Lys Lys Glu Lys Ala Glu Ala His Val Arg Ala Gly
100 105 110
Ala Lys Lys Val Val Ile Ser Ala Pro Ala Gly Asn Asp Leu Lys Thr
115 120 125
Ile Val Phe Asn Val Asn Asn Glu Asp Leu Asp Gly Thr Glu Thr Val
130 135 140
Ile Ser Gly Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Met Ala Lys
145 150 155 160
Val Leu Asn Asp Lys Phe Gly Ile Glu Lys Gly Phe Met Thr Thr Ile
165 170 175
His Ala Phe Thr Asn Asp Gln Asn Thr Leu Asp Gly Pro His Arg Lys
180 185 190
Gly Asp Leu Arg Arg Ala Arg Ala Ala Ala Val Ser Ile Ile Pro Asn
195 200 205
Ser Thr Gly Ala Ala Lys Ala Ile Ser Gln Val Ile Pro Asp Leu Ala
210 215 220
Gly Lys Leu Asp Gly Asn Ala Gln Arg Val Pro Val Pro Thr Gly Ser
225 230 235 240
Ile Thr Glu Leu Val Ser Val Leu Lys Lys Lys Val Thr Val Glu Glu
245 250 255
Ile Asn Ala Ala Met Lys Glu Ala Ala Asp Glu Ser Phe Gly Tyr Thr
260 265 270
Glu Asp Pro Ile Val Ser Ala Asp Val Val Gly Ile Asn Tyr Gly Ser
275 280 285
Leu Phe Asp Ala Thr Leu Thr Lys Ile Val Asp Val Asn Gly Ser Gln
290 295 300
Leu Val Lys Thr Ala Ala Trp Tyr Asp Asn Glu Met Ser Tyr Thr Ser
305 310 315 320
Gln Leu Val Arg Thr Leu Ala Tyr Phe Ala Lys Ile Ala Lys
325 330
<210> 50
<211> 396
<212> PRT
<213> Arabidopsis thaliana (Mouse-ear cress)
<400> 50
Met Ala Ser Val Thr Phe Ser Val Pro Lys Gly Phe Thr Glu Phe Ser
1 5 10 15
Gly Leu Arg Ser Ser Ser Ala Ser Leu Pro Phe Gly Lys Lys Leu Ser
20 25 30
Ser Asp Glu Phe Val Ser Ile Val Ser Phe Gln Thr Ser Ala Met Gly
35 40 45
Ser Ser Gly Gly Tyr Arg Lys Gly Val Thr Glu Ala Lys Leu Lys Val
50 55 60
Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Asn Phe Leu Arg Cys Trp
65 70 75 80
His Gly Arg Lys Asp Ser Pro Leu Asp Ile Ile Ala Ile Asn Asp Thr
85 90 95
Gly Gly Val Lys Gln Ala Ser His Leu Leu Lys Tyr Asp Ser Thr Leu
100 105 110
Gly Ile Phe Asp Ala Asp Val Lys Pro Ser Gly Glu Thr Ala Ile Ser
115 120 125
Val Asp Gly Lys Ile Ile Gln Val Val Ser Asn Arg Asn Pro Ser Leu
130 135 140
Leu Pro Trp Lys Glu Leu Gly Ile Asp Ile Val Ile Glu Gly Thr Gly
145 150 155 160
Val Phe Val Asp Arg Glu Gly Ala Gly Lys His Ile Glu Ala Gly Ala
165 170 175
Lys Lys Val Ile Ile Thr Ala Pro Gly Lys Gly Asp Ile Pro Thr Tyr
180 185 190
Val Val Gly Val Asn Ala Asp Ala Tyr Ser His Asp Glu Pro Ile Ile
195 200 205
Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Phe Val Lys Val
210 215 220
Leu Asp Gln Lys Phe Gly Ile Ile Lys Gly Thr Met Thr Thr Thr His
225 230 235 240
Ser Tyr Thr Gly Asp Gln Arg Leu Leu Asp Ala Ser His Arg Asp Leu
245 250 255
Arg Arg Ala Arg Ala Ala Ala Leu Asn Ile Val Pro Thr Ser Thr Gly
260 265 270
Ala Ala Lys Ala Val Ala Leu Val Leu Pro Asn Leu Lys Gly Lys Leu
275 280 285
Asn Gly Ile Ala Leu Arg Val Pro Thr Pro Asn Val Ser Val Val Asp
290 295 300
Leu Val Val Gln Val Ser Lys Lys Thr Phe Ala Glu Glu Val Asn Ala
305 310 315 320
Ala Phe Arg Asp Ser Ala Glu Lys Glu Leu Lys Gly Ile Leu Asp Val
325 330 335
Cys Asp Glu Pro Leu Val Ser Val Asp Phe Arg Cys Ser Asp Phe Ser
340 345 350
Thr Thr Ile Asp Ser Ser Leu Thr Met Val Met Gly Asp Asp Met Val
355 360 365
Lys Val Ile Ala Trp Tyr Asp Asn Glu Trp Gly Tyr Ser Gln Arg Val
370 375 380
Val Asp Leu Ala Asp Ile Val Ala Asn Asn Trp Lys
385 390 395
<210> 51
<211> 374
<212> PRT
<213> Chlamydomonas reinhardtii (Chlamydomonas smithii)
<400> 51
Met Ala Ala Met Met Gln Lys Ser Ala Phe Thr Gly Ser Ala Val Ser
1 5 10 15
Ser Lys Ser Gly Val Arg Ala Lys Ala Ala Arg Ala Val Val Asp Val
20 25 30
Arg Ala Glu Lys Lys Ile Arg Val Ala Ile Asn Gly Phe Gly Arg Ile
35 40 45
Gly Arg Asn Phe Leu Arg Cys Trp His Gly Arg Gln Asn Thr Leu Leu
50 55 60
Asp Val Val Ala Ile Asn Asp Ser Gly Gly Val Lys Gln Ala Ser His
65 70 75 80
Leu Leu Lys Tyr Asp Ser Thr Leu Gly Thr Phe Ala Ala Asp Val Lys
85 90 95
Ile Val Asp Asp Ser His Ile Ser Val Asp Gly Lys Gln Ile Lys Ile
100 105 110
Val Ser Ser Arg Asp Pro Leu Gln Leu Pro Trp Lys Glu Met Asn Ile
115 120 125
Asp Leu Val Ile Glu Gly Thr Gly Val Phe Ile Asp Lys Val Gly Ala
130 135 140
Gly Lys His Ile Gln Ala Gly Ala Ser Lys Val Leu Ile Thr Ala Pro
145 150 155 160
Ala Lys Asp Lys Asp Ile Pro Thr Phe Val Val Gly Val Asn Glu Gly
165 170 175
Asp Tyr Lys His Glu Tyr Pro Ile Ile Ser Asn Ala Ser Cys Thr Thr
180 185 190
Asn Cys Leu Ala Pro Phe Val Lys Val Leu Glu Gln Lys Phe Gly Ile
195 200 205
Val Lys Gly Thr Met Thr Thr Thr His Ser Tyr Thr Gly Asp Gln Arg
210 215 220
Leu Leu Asp Ala Ser His Arg Asp Leu Arg Arg Ala Arg Ala Ala Ala
225 230 235 240
Leu Asn Ile Val Pro Thr Thr Thr Gly Ala Ala Lys Ala Val Ser Leu
245 250 255
Val Leu Pro Ser Leu Lys Gly Lys Leu Asn Gly Ile Ala Leu Arg Val
260 265 270
Pro Thr Pro Thr Val Ser Val Val Asp Leu Val Val Gln Val Glu Lys
275 280 285
Lys Thr Phe Ala Glu Glu Val Asn Ala Ala Phe Arg Glu Ala Ala Asn
290 295 300
Gly Pro Met Lys Gly Val Leu His Val Glu Asp Ala Pro Leu Val Ser
305 310 315 320
Ile Asp Phe Lys Cys Thr Asp Gln Ser Thr Ser Ile Asp Ala Ser Leu
325 330 335
Thr Met Val Met Gly Asp Asp Met Val Lys Val Val Ala Trp Tyr Asp
340 345 350
Asn Glu Trp Gly Tyr Ser Gln Arg Val Val Asp Leu Ala Glu Val Thr
355 360 365
Ala Lys Lys Trp Val Ala
370
<210> 52
<211> 336
<212> PRT
<213> Staphylococcus epidermidis (strain ATCC 35984 RP62A)
<400> 52
Met Ala Ile Lys Val Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu
1 5 10 15
Ala Phe Arg Arg Ile Gln Asp Val Glu Gly Leu Glu Val Val Ala Val
20 25 30
Asn Asp Leu Thr Asp Asp Asp Met Leu Ala His Leu Leu Lys Tyr Asp
35 40 45
Thr Met Gln Gly Arg Phe Thr Gly Glu Val Glu Val Ile Glu Gly Gly
50 55 60
Phe Arg Val Asn Gly Lys Glu Ile Lys Ser Phe Asp Glu Pro Asp Ala
65 70 75 80
Gly Lys Leu Pro Trp Gly Asp Leu Asp Ile Asp Val Val Leu Glu Cys
85 90 95
Thr Gly Phe Tyr Thr Asp Lys Glu Lys Ala Gln Ala His Ile Asp Ala
100 105 110
Gly Ala Lys Lys Val Leu Ile Ser Ala Pro Ala Lys Gly Asp Val Lys
115 120 125
Thr Ile Val Phe Asn Thr Asn His Asp Thr Leu Asp Gly Ser Glu Thr
130 135 140
Val Val Ser Gly Ala Ser Cys Thr Thr Asn Ser Leu Ala Pro Val Ala
145 150 155 160
Lys Val Leu Ser Asp Glu Phe Gly Leu Val Glu Gly Phe Met Thr Thr
165 170 175
Ile His Ala Tyr Thr Gly Asp Gln Asn Thr Gln Asp Ala Pro His Arg
180 185 190
Lys Gly Asp Lys Arg Arg Ala Arg Ala Ala Ala Glu Asn Ile Ile Pro
195 200 205
Asn Ser Thr Gly Ala Ala Lys Ala Ile Gly Lys Val Ile Pro Glu Ile
210 215 220
Asp Gly Lys Leu Asp Gly Gly Ala Gln Arg Val Pro Val Ala Thr Gly
225 230 235 240
Ser Leu Thr Glu Leu Thr Val Val Leu Asp Lys Gln Asp Val Thr Val
245 250 255
Asp Gln Val Asn Ser Ala Met Lys Gln Ala Ser Asp Glu Ser Phe Gly
260 265 270
Tyr Thr Glu Asp Glu Ile Val Ser Ser Asp Ile Val Gly Met Thr Tyr
275 280 285
Gly Ser Leu Phe Asp Ala Thr Gln Thr Arg Val Met Thr Val Gly Asp
290 295 300
Arg Gln Leu Val Lys Val Ala Ala Trp Tyr Asp Asn Glu Met Ser Tyr
305 310 315 320
Thr Ala Gln Leu Val Arg Thr Leu Ala His Leu Ala Glu Leu Ser Lys
325 330 335
<210> 53
<211> 356
<212> PRT
<213> Escherichia coli (strain K12)
<400> 53
Met Gln Lys Asp Ala Leu Asn Lys Val His Ile Thr Asp Glu Gln Val
1 5 10 15
Leu Met Thr Pro Glu Gln Leu Lys Ala Ala Phe Pro Leu Ser Leu Gln
20 25 30
Gln Glu Ala Gln Ile Ala Asp Ser Arg Lys Ser Ile Ser Asp Ile Ile
35 40 45
Ala Gly Arg Asp Pro Arg Leu Leu Val Val Cys Gly Pro Cys Ser Ile
50 55 60
His Asp Pro Glu Thr Ala Leu Glu Tyr Ala Arg Arg Phe Lys Ala Leu
65 70 75 80
Ala Ala Glu Val Ser Asp Ser Leu Tyr Leu Val Met Arg Val Tyr Phe
85 90 95
Glu Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro
100 105 110
His Met Asp Gly Ser Phe Asp Val Glu Ala Gly Leu Gln Ile Ala Arg
115 120 125
Lys Leu Leu Leu Glu Leu Val Asn Met Gly Leu Pro Leu Ala Thr Glu
130 135 140
Ala Leu Asp Pro Asn Ser Pro Gln Tyr Leu Gly Asp Leu Phe Ser Trp
145 150 155 160
Ser Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Thr His Arg Glu Met
165 170 175
Ala Ser Gly Leu Ser Met Pro Val Gly Phe Lys Asn Gly Thr Asp Gly
180 185 190
Ser Leu Ala Thr Ala Ile Asn Ala Met Arg Ala Ala Ala Gln Pro His
195 200 205
Arg Phe Val Gly Ile Asn Gln Ala Gly Gln Val Ala Leu Leu Gln Thr
210 215 220
Gln Gly Asn Pro Asp Gly His Val Ile Leu Arg Gly Gly Lys Ala Pro
225 230 235 240
Asn Tyr Ser Pro Ala Asp Val Ala Gln Cys Glu Lys Glu Met Glu Gln
245 250 255
Ala Gly Leu Arg Pro Ser Leu Met Val Asp Cys Ser His Gly Asn Ser
260 265 270
Asn Lys Asp Tyr Arg Arg Gln Pro Ala Val Ala Glu Ser Val Val Ala
275 280 285
Gln Ile Lys Asp Gly Asn Arg Ser Ile Ile Gly Leu Met Ile Glu Ser
290 295 300
Asn Ile His Glu Gly Asn Gln Ser Ser Glu Gln Pro Arg Ser Glu Met
305 310 315 320
Lys Tyr Gly Val Ser Val Thr Asp Ala Cys Ile Ser Trp Glu Met Thr
325 330 335
Asp Ala Leu Leu Arg Glu Ile His Gln Asp Leu Asn Gly Gln Leu Thr
340 345 350
Ala Arg Val Ala
355
<210> 54
<211> 449
<212> PRT
<213> Helicobacter pylori (strain J99 ATCC 700824) (Campylobacter pylori J99)
<400> 54
Met Ser Asn Thr Thr Trp Ser Pro Thr Ser Trp His Ser Phe Lys Ile
1 5 10 15
Glu Gln His Pro Thr Tyr Lys Asp Glu Gln Glu Leu Glu Arg Val Lys
20 25 30
Lys Glu Leu Arg Ser Tyr Pro Pro Leu Val Phe Ala Gly Glu Ala Arg
35 40 45
Asn Leu Gln Glu Arg Leu Ala Gln Val Ile Asp Asn Lys Ala Phe Leu
50 55 60
Leu Gln Gly Gly Asp Cys Ala Glu Ser Phe Ser Gln Phe Ser Ala Asn
65 70 75 80
Arg Ile Arg Asp Met Phe Lys Val Met Met Gln Met Ala Ile Val Leu
85 90 95
Thr Phe Ala Gly Ser Ile Pro Ile Val Lys Val Gly Arg Ile Ala Gly
100 105 110
Gln Phe Ala Lys Pro Arg Ser Asn Ala Thr Glu Ile Leu Asp Asp Glu
115 120 125
Glu Val Leu Ser Tyr Arg Gly Asp Ile Ile Asn Gly Ile Ser Lys Lys
130 135 140
Glu Arg Glu Pro Lys Pro Glu Arg Met Leu Lys Ala Tyr His Gln Ser
145 150 155 160
Val Ala Thr Leu Asn Leu Ile Arg Ala Phe Ala Gln Gly Gly Leu Ala
165 170 175
Asp Leu Glu Gln Val His Arg Phe Asn Leu Asp Phe Val Lys Asn Asn
180 185 190
Asp Phe Gly Gln Lys Tyr Gln Gln Ile Ala Asp Arg Ile Thr Gln Ala
195 200 205
Leu Gly Phe Met Arg Ala Cys Gly Val Glu Ile Glu Arg Thr Pro Ile
210 215 220
Leu Arg Glu Val Glu Phe Tyr Thr Ser His Glu Ala Leu Leu Leu His
225 230 235 240
Tyr Glu Glu Pro Leu Val Arg Lys Asp Ser Leu Thr Asn Gln Phe Tyr
245 250 255
Asp Cys Ser Ala His Met Leu Trp Ile Gly Glu Arg Thr Arg Asp Pro
260 265 270
Lys Gly Ala His Val Glu Phe Leu Arg Gly Val Cys Asn Pro Ile Gly
275 280 285
Val Lys Ile Gly Pro Asn Ala Ser Val Ser Glu Val Leu Glu Leu Cys
290 295 300
Asp Val Leu Asn Pro His Asn Leu Lys Gly Arg Leu Asn Leu Ile Val
305 310 315 320
Arg Met Gly Ser Lys Ile Ile Lys Glu Arg Leu Pro Lys Leu Leu Gln
325 330 335
Gly Val Leu Lys Glu Lys Arg His Ile Leu Trp Ser Ile Asp Pro Met
340 345 350
His Gly Asn Thr Val Lys Thr Asn Leu Gly Val Lys Thr Arg Ala Phe
355 360 365
Asp Ser Val Leu Asp Glu Val Lys Ser Phe Phe Glu Ile His Arg Ala
370 375 380
Glu Gly Ser Leu Ala Ser Gly Val His Leu Glu Met Thr Gly Glu Asn
385 390 395 400
Val Thr Glu Cys Ile Gly Gly Ser Gln Ala Ile Thr Glu Glu Gly Leu
405 410 415
Ser Cys His Tyr Tyr Thr Gln Cys Asp Pro Arg Leu Asn Ala Thr Gln
420 425 430
Ala Leu Glu Leu Ala Phe Leu Ile Ala Asp Met Leu Lys Lys Gln Arg
435 440 445
Thr
<210> 55
<211> 276
<212> PRT
<213> Aeropyrum pernix (strain ATCC 700893 DSM 11879 JCM 9820 NBRC 100138 K1)
<400> 55
Met Trp Arg Trp Leu Pro Val Ala Gly Phe Lys Gly Val Lys Leu Ala
1 5 10 15
Leu Lys Ser Glu Glu Arg Arg Glu Thr Val Val Glu Val Glu Gly Val
20 25 30
Arg Ile Gly Gly Gly Ser Lys Ala Val Ile Ala Gly Pro Cys Ser Val
35 40 45
Glu Ser Trp Glu Gln Val Arg Glu Ala Ala Leu Ala Val Lys Glu Ala
50 55 60
Gly Ala His Met Leu Arg Gly Gly Ala Phe Lys Pro Arg Thr Ser Pro
65 70 75 80
Tyr Ser Phe Gln Gly Leu Gly Leu Glu Gly Leu Lys Leu Leu Arg Arg
85 90 95
Ala Gly Asp Glu Ala Gly Leu Pro Val Val Thr Glu Val Leu Asp Pro
100 105 110
Arg His Val Glu Thr Val Ser Arg Tyr Ala Asp Met Leu Gln Ile Gly
115 120 125
Ala Arg Asn Met Gln Asn Phe Pro Leu Leu Arg Glu Val Gly Arg Ser
130 135 140
Gly Lys Pro Val Leu Leu Lys Arg Gly Phe Gly Asn Thr Val Glu Glu
145 150 155 160
Leu Leu Ala Ala Ala Glu Tyr Ile Leu Leu Glu Gly Asn Trp Gln Val
165 170 175
Val Leu Val Glu Arg Gly Ile Arg Thr Phe Glu Pro Ser Thr Arg Phe
180 185 190
Thr Leu Asp Val Ala Ala Val Ala Val Leu Lys Glu Ala Thr His Leu
195 200 205
Pro Val Ile Val Asp Pro Ser His Pro Ala Gly Arg Arg Ser Leu Val
210 215 220
Pro Ala Leu Ala Lys Ala Gly Leu Ala Ala Gly Ala Asp Gly Leu Ile
225 230 235 240
Val Glu Val His Pro Asn Pro Glu Glu Ala Leu Ser Asp Ala Lys Gln
245 250 255
Gln Leu Thr Pro Gly Glu Phe Ala Arg Leu Met Gly Glu Leu Arg Trp
260 265 270
His Arg Leu Leu
275
<210> 56
<211> 350
<212> PRT
<213> Escherichia coli (strain K12)
<400> 56
Met Asn Tyr Gln Asn Asp Asp Leu Arg Ile Lys Glu Ile Lys Glu Leu
1 5 10 15
Leu Pro Pro Val Ala Leu Leu Glu Lys Phe Pro Ala Thr Glu Asn Ala
20 25 30
Ala Asn Thr Val Ala His Ala Arg Lys Ala Ile His Lys Ile Leu Lys
35 40 45
Gly Asn Asp Asp Arg Leu Leu Val Val Ile Gly Pro Cys Ser Ile His
50 55 60
Asp Pro Val Ala Ala Lys Glu Tyr Ala Thr Arg Leu Leu Ala Leu Arg
65 70 75 80
Glu Glu Leu Lys Asp Glu Leu Glu Ile Val Met Arg Val Tyr Phe Glu
85 90 95
Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro His
100 105 110
Met Asp Asn Ser Phe Gln Ile Asn Asp Gly Leu Arg Ile Ala Arg Lys
115 120 125
Leu Leu Leu Asp Ile Asn Asp Ser Gly Leu Pro Ala Ala Gly Glu Phe
130 135 140
Leu Asp Met Ile Thr Leu Gln Tyr Leu Ala Asp Leu Met Ser Trp Gly
145 150 155 160
Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Val His Arg Glu Leu Ala
165 170 175
Ser Gly Leu Ser Cys Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr
180 185 190
Ile Lys Val Ala Ile Asp Ala Ile Asn Ala Ala Gly Ala Pro His Cys
195 200 205
Phe Leu Ser Val Thr Lys Trp Gly His Ser Ala Ile Val Asn Thr Ser
210 215 220
Gly Asn Gly Asp Cys His Ile Ile Leu Arg Gly Gly Lys Glu Pro Asn
225 230 235 240
Tyr Ser Ala Lys His Val Ala Glu Val Lys Glu Gly Leu Asn Lys Ala
245 250 255
Gly Leu Pro Ala Gln Val Met Ile Asp Phe Ser His Ala Asn Ser Ser
260 265 270
Lys Gln Phe Lys Lys Gln Met Asp Val Cys Ala Asp Val Cys Gln Gln
275 280 285
Ile Ala Gly Gly Glu Lys Ala Ile Ile Gly Val Met Val Glu Ser His
290 295 300
Leu Val Glu Gly Asn Gln Ser Leu Glu Ser Gly Glu Pro Leu Ala Tyr
305 310 315 320
Gly Lys Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Asp Thr Asp Ala
325 330 335
Leu Leu Arg Gln Leu Ala Asn Ala Val Lys Ala Arg Arg Gly
340 345 350
<210> 57
<211> 1593
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 57
atgggctcac tgaacacaga ggacgtactt gaaaactcct cggcatttgg cgtgactaat 60
cctttagatc cggaggagtt tagacgtcag ggacacatga tcattgattt tctcgcggat 120
tattatcgcg acgtcgagaa gtatccggtt cggagtcaag tcgaaccggg atatcttaga 180
aaaagactgc ctgaaactgc gccatataat ccggagtcta tcgaaacaat tttacaagac 240
gtaacgacag agatcattcc gggcctgaca cactggcagt cacctaatta ttacgcgtac 300
tttccgagct cgggctcggt tgccggcttt ttgggtgaaa tgctgtcgac gggattcaat 360
gtcgtcggat ttaactggat gagttctcca gcggcgacag aacttgaatc tgttgttatg 420
gactggttcg gcaaaatgct taacttaccg gaaagcttcc tcttttcagg gagtggaggc 480
ggtgttcttc agggcacaag ttgcgaggct attttatgta cactgactgc agcgcgcgac 540
cggaaactca ataagatagg tagagaacat attggtagac tggtcgtata tggtagcgat 600
cagacacact gcgcgttgca aaaagcggca caggtagccg gcattaaccc gaaaaatttc 660
cgtgcaatca aaacctttaa agaaaactca tttggcctta gcgcggctac actgagagag 720
gttatcctgg aggacattga ggcgggactg attccacttt ttgtgtgtcc gacggtaggt 780
acaacaagtt ccactgcagt tgatccgatt tctccgattt gtgaagttgc aaaggaatat 840
gagatgtggg tccatgtcga tgccgcgtat gctggcagcg cgtgtatttg tcctgaattt 900
cgacatttta tagatggtgt ggaagaagcc gactcctttt ctcttaacgc acataagtgg 960
ttcttcacaa ctctcgattg ctgctgctta tgggttaagg atccttccgc actggtcaag 1020
gccttatcta cgaacccgga atatcttcgc aataaggcga ccgaatccag acaggttgta 1080
gattataaag actggcagat cgcgttatca agacgttttc ggtcattaaa gctgtggatg 1140
gtgctccgga gctatggtgt gacgaacctc cgcaactttc ttagaagcca cgtcaagatg 1200
gcgaaaactt tcgagggatt gatttgcatg gatggtcgct tcgagattac ggttcctcgc 1260
acatttgcga tggtttgctt tcgcctgctt ccaccgaaga cgataaaagt ctatgacaac 1320
ggtgtgcacc agaacggcaa tggtgttgtt ccgctgcgtg atgaaaacga aaatcttgtc 1380
ctggcgaaca aactgaatca agtgtatctg gagacagtca acgccacggg tagtgtatat 1440
atgacgcatg ctgttgtcgg tggcgtgtat atgattagat tcgctgttgg aagtacactt 1500
acggaagaac gccacgtcat ttatgcgtgg aaaatcctgc aagaacacgc tgatttaatt 1560
cttggcaaat tttctgaagc tgatttttcc tct 1593
<210> 58
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 58
atgtctgaaa gcccaatgtt tgctgccaat ggaatgccga aagtaaatca gggtgcagaa 60
gaggacgtcc ggattctggg atatgacccg cttgcatccc cggccctgtt gcaagttcaa 120
atcccagcga cgcctactag ccttgagact gccaagcgcg gccggagaga agcaattgac 180
ataattaccg gaaaggacga tagagtactg gtcattgtag gtccatgctc aatccatgat 240
ttggaggcgg ctcaggaata tgccctgcgg ttaaaaaagt tgtcggatga acttaaaggc 300
gatctgtcga ttattatgcg cgcgtattta gagaagccgc gcacaacagt aggctggaag 360
ggccttatta acgacccaga cgtaaacaac acatttaaca ttaataaagg attacaaagc 420
gctcgccaac tttttgttaa cctcacgaac atcggactcc cgataggaag tgaaatgctg 480
gatacaataa gcccacagta tcttgcagat cttgtctcgt ttggcgctat aggagcccgc 540
acgacggaat ctcaactgca ccgggaactt gccagtggac tgtcattccc ggtggggttt 600
aagaacggca cggatggtac cctgaatgta gcggtcgacg cgtgccaggc ggccgctcac 660
tctcatcatt tcatgggcgt cacactccat ggggtagccg caattacgac gacaaaagga 720
aacgaacact gcttcgtaat tttacgcgga ggtaagaaag gcacgaatta tgacgctaag 780
tcagtcgccg aggcgaaagc acagcttccg gcaggtagca acgggctgat gattgattac 840
tctcatggga attctaataa agatttcaga aaccaaccta aggtcaacga tgttgtatgc 900
gaacagatag ccaatggaga aaacgctatt acaggcgtga tgatagaatc taacattaac 960
gagggaaatc aggggatccc agccgaggga aaggcaggtc ttaagtatgg agtctccatc 1020
acagacgcat gcatagggtg ggaaacgacc gaagatgtcc ttcgcaagtt agcagcggca 1080
gttcgtcaac gccgtgaggt aaataaaaaa 1110
<210> 59
<211> 1593
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 59
atgggcagcc tgaacaccga agatgtcttg gaaaactcct ccgcgtttgg cgtgaccaac 60
cctctggacc cagaagagtt tcgccgtcaa ggacatatga tcatcgattt cctcgcagat 120
tactatcgcg acgttgagaa gtacccggtg cgatctcagg tcgaacctgg ttatctgcgc 180
aagcgtctcc ccgagaccgc cccctataat ccagaatcta ttgagaccat tctgcaggat 240
gttaccactg agatcatccc tggtttgacc cactggcagt ctccaaacta ctacgcttat 300
ttcccttcca gcggttccgt tgcaggtttc ctgggcgaaa tgctgtccac cggctttaac 360
gtggtgggct tcaactggat gtcttctcct gcggctacgg aattggaatc cgtcgtcatg 420
gactggttcg gcaaaatgct gaacctgcca gaatcgtttt tgttttccgg ctctggtggc 480
ggagttctgc aaggcaccag ctgcgaggct atcctctgta cactgacggc cgcgcgcgat 540
cgcaagctca ataaaatcgg ccgcgagcac attggccgtc tcgtagtata tggtagcgac 600
caaacccatt gcgcccttca aaaagcagcg caggtcgcgg gcatcaaccc caaaaacttc 660
cgcgcaatca agacttttaa agagaactcc ttcggtctca gcgctgctac cctgcgcgag 720
gtgattctcg aagatatcga agctggcctg attccactgt ttgtttgtcc taccgtgggc 780
accacttcca gcacggcagt agatccgatc tccccgattt gcgaggtagc taaggaatat 840
gagatgtggg tgcacgtcga tgccgcttat gctggttccg cttgcatctg cccagaattc 900
cgccacttta ttgatggtgt agaggaggcg gattcctttt cccttaatgc tcacaagtgg 960
ttcttcacga cactggattg ttgctgtttg tgggtaaaag atccgtcagc gttggttaaa 1020
gcgttgagca caaaccccga atatctgcgc aataaagcaa ccgagtcccg acaagttgtt 1080
gattataagg actggcagat cgccctctca cgtcgcttcc gctccctgaa gctttggatg 1140
gtgctccgct cctatggtgt cacaaatctg cgcaacttcc tccgctccca tgtaaaaatg 1200
gcgaaaacct tcgaaggact gatctgtatg gatggccgtt ttgagatcac cgtgccacgt 1260
acgttcgcga tggtgtgctt tcgccttctg cctccgaaaa ccattaaggt gtacgacaat 1320
ggtgttcacc agaatggcaa cggcgtcgtc ccattgcgag acgagaacga gaatttggtg 1380
ctggcaaaca agttgaatca ggtctacctg gaaaccgtca acgctacagg aagcgtctac 1440
atgactcacg cagttgttgg cggcgtctac atgatccgtt tcgcagtggg atcgacgctg 1500
acggaagagc gccacgtcat ttacgcgtgg aagatcctgc aagagcacgc ggatttgatc 1560
ttgggcaaat tctctgaggc tgatttctcc tcg 1593
<210> 60
<211> 1593
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 60
atgggctcct taaatacaga agatgtttta gagaatagct ctgcgtttgg cgttacaaat 60
cctttagatc cagaagaatt tagaagacaa ggtcacatga taattgactt tttggctgac 120
tattacagag acgtagaaaa atacccagtt aggtcccaag tggagcctgg ctatttgcgt 180
aaacgtttgc ctgaaacagc tccatataac cctgaatcta tagaaactat tcttcaggat 240
gtgaccactg aaataatccc aggcctaaca cattggcaat cacctaacta ttacgcgtat 300
ttccccagca gtggaagtgt tgcaggtttt ttaggtgaaa tgttatctac aggattcaat 360
gtcgtgggct tcaactggat gtcatcacca gctgctaccg aactagagtc cgtagtaatg 420
gactggtttg ggaaaatgtt aaatttacca gagtcattct tgttttcagg ttctggtggc 480
ggagttcttc aaggaacctc ttgtgaagct attttgtgta ccctaactgc cgccagagat 540
agaaagctga ataaaattgg tagagaacat ataggcagat tggtcgttta cgggtccgat 600
caaacacact gcgctctgca aaaggctgcg caggttgctg gcataaaccc gaaaaacttc 660
agggccatta agacgttcaa agaaaattcc tttggcttat cagcagctac cttgagggaa 720
gtcatattag aagacattga agcaggccta atccctttgt ttgtatgccc tacagtgggt 780
acaacgtctt ccacggctgt cgatccaatt tctcctatct gtgaagtagc gaaagaatac 840
gaaatgtggg ttcacgtcga cgcagcatat gctggatcag catgtatatg tccagaattt 900
agacacttta tagatggtgt agaagaagcc gattcatttt cattgaatgc acataagtgg 960
ttttttacaa cacttgattg ctgttgtttg tgggttaagg acccaagcgc attagttaaa 1020
gcattgtcca caaatcctga gtaccttagg aacaaagcta cagaaagcag gcaagttgtt 1080
gattacaagg attggcagat tgcattgtca aggagattta gaagtttaaa gttatggatg 1140
gtcctgaggt cctatggtgt tactaatttg agaaatttcc tgagatctca tgtaaagatg 1200
gccaagacct tcgaaggctt gatttgcatg gacgggagat ttgaaataac tgtgccgaga 1260
acctttgcga tggtctgttt tagattattg ccacccaaaa ccatcaaggt gtacgataac 1320
ggcgtgcatc aaaatggaaa tggagttgtg ccactgagag acgagaatga aaacttggtt 1380
ttggcaaata agctaaatca agtgtattta gaaaccgtaa atgccacagg ttcagtttat 1440
atgacccatg cagttgtagg tggtgtgtat atgatcagat ttgctgtcgg aagcactcta 1500
accgaagaaa ggcatgtaat ctacgcgtgg aaaattctgc aagaacatgc tgatcttatc 1560
ttggggaagt tttctgaggc tgacttttca tct 1593
<210> 61
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 61
atgtcagaat caccgatgtt tgctgcaaat ggaatgccga aggttaacca gggtgcagaa 60
gaggatgtaa gaatattggg gtatgaccca ctggcatcac cagcattgtt gcaggttcaa 120
attccggcaa ctcctacgtc attagaaacg gcaaagagag gtagacgtga agctatagat 180
attataacag gcaaagacga ccgtgtgctg gtgattgtgg gtccctgctc cattcatgac 240
cttgaagcag cacaggagta tgctttgcgt ctgaagaaac tgtcagacga gcttaaaggt 300
gaccttagta tcattatgag agcctatttg gaaaagccta ggaccaccgt aggctggaaa 360
ggtttgatta atgatccaga tgtaaacaac acctttaata taaataaggg tctacagagt 420
gccagacaac ttttcgtaaa ccttaccaat atcggacttc cgattggctc cgagatgtta 480
gatacaatct caccacaata ccttgccgat cttgtctcat tcggtgctat cggtgctaga 540
actaccgagt ctcagttgca tagagaatta gcttccgggc tatcatttcc agtcggcttc 600
aagaacggta ctgacggcac attgaatgtt gctgtggatg catgtcaagc cgcagcccat 660
agtcaccatt tcatgggcgt tactcttcac ggggttgctg ctataacgac cactaagggg 720
aatgaacatt gctttgtaat cttaaggggt ggcaagaagg gaactaatta cgatgctaaa 780
tctgtagccg aggcgaaagc acagttacca gctgggtcaa acggcttaat gatagattac 840
agtcatggga attctaataa agactttaga aaccaaccaa aagtaaatga tgttgtatgc 900
gagcagattg ctaacggtga aaatgccatc acgggcgtga tgattgaatc caatataaat 960
gagggaaacc aaggcatacc tgccgaaggt aaagctggtc ttaagtacgg cgtttctatt 1020
acagacgcgt gcataggctg ggagacaaca gaagatgtgt tgagaaagct tgctgcggct 1080
gttagacaaa ggagggaagt aaataaaaag 1110
<210> 62
<211> 1593
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 62
atgggctcgc tcaacaccga ggatgtgctg gagaactcgt ctgcctttgg cgttaccaac 60
cctctggacc ctgaggagtt tcggagacaa ggccacatga ttatcgactt tctggctgac 120
tattacagag acgtggagaa gtaccctgtt cggtctcaag tggagccagg ataccttcgg 180
aagcgactgc ccgaaactgc tccctacaat cccgaatcca ttgagaccat tctgcaggac 240
gtgactacgg agatcattcc tggactgacc cactggcaaa gccctaacta ctacgcctac 300
ttcccttcta gcggctcggt cgcaggattt cttggtgaga tgctgtcgac cggttttaac 360
gttgttggct tcaactggat gtcctcccct gctgctacag aactggaatc ggtggttatg 420
gactggttcg gtaagatgct gaacctccct gagtcttttc tgttctccgg tagcggcggc 480
ggagtgctgc agggcacgtc ctgtgaagcc atcctgtgta ctctgaccgc tgcccgtgac 540
cgaaaactta acaaaattgg ccgagagcac attggccggc tggtcgtcta cggatctgac 600
cagacccact gcgctctcca gaaggcagct caggtggccg gcatcaaccc taaaaacttt 660
cgagcaatca agacctttaa ggagaactcg ttcggcctga gcgctgctac tcttagagag 720
gttattctcg aagacattga ggccggtctt attcccctct tcgtctgtcc caccgtcggc 780
actacgtctt ccacggctgt ggatccaatc tcccccatct gtgaggtcgc aaaggagtac 840
gagatgtggg tgcacgtcga cgcagcttac gccggctctg catgcatttg cccagagttc 900
cgtcacttca ttgacggagt tgaggaagcc gactccttca gcctcaacgc ccataaatgg 960
ttcttcacca ccctcgactg ttgttgtctc tgggtcaagg acccctctgc cctggtcaag 1020
gccctgtcga ccaaccccga gtacctgcgg aacaaggcta ccgagtctcg acaagttgtc 1080
gactacaagg actggcaaat cgccctgtcc cgacgattcc ggtctctgaa gctgtggatg 1140
gtgctgcgat cgtatggtgt taccaatctc cgaaatttcc tgcgatctca tgtcaagatg 1200
gcaaaaactt tcgagggtct gatctgtatg gacggaagat ttgagatcac tgttccccga 1260
acattcgcaa tggtttgttt ccgactgctg cctcccaaga ctattaaggt ttacgacaac 1320
ggagtgcatc aaaacggtaa cggtgtggtt cccctccggg acgagaacga aaacctggtc 1380
ctcgccaaca agcttaacca agtctacctc gagaccgtca acgctacagg ctctgtgtac 1440
atgactcatg ccgttgttgg tggagtgtac atgattagat ttgctgtcgg ctctaccctt 1500
actgaggaac gacatgtgat ttacgcctgg aaaattctgc aagagcacgc cgatctgatc 1560
ctgggtaagt tttccgaagc cgacttctcc tcg 1593
<210> 63
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 63
atgtctgagt cccccatgtt cgccgcaaac ggcatgccta aggtcaacca gggtgccgag 60
gaggatgtcc gtatcctcgg ctatgaccct cttgcatccc ccgctcttct ccaggtccag 120
attccagcta ctcccaccag cctcgaaact gccaagagag gacgaagaga agctattgac 180
atcattactg gcaaggacga tcgagtcctt gtcattgttg gcccctgcag cattcacgac 240
ctggaggccg ctcaggaata cgctctgaga cttaagaagc tctctgatga actgaaggga 300
gacctttcca tcatcatgcg tgcctacctg gagaagcccc gaactaccgt cggttggaag 360
ggcctgatca acgacccaga tgtcaacaac acctttaaca tcaataaggg acttcagtcc 420
gctcgacagc tcttcgtcaa cctcacgaac attggtctgc caatcggctc cgaaatgctg 480
gacaccattt cgccccagta cctggctgac cttgtttcgt ttggtgctat cggagctcgg 540
accaccgagt cccagctgca tagagagctt gcttccggcc tgtccttccc tgtgggtttc 600
aagaatggta ccgatggaac cctgaacgtt gccgtcgatg cttgccaagc tgctgcccac 660
tcgcatcact tcatgggagt gaccctgcac ggtgtcgccg ctattactac cacaaagggc 720
aacgagcact gttttgtgat tctgcgaggt ggaaagaagg gcaccaacta cgacgccaag 780
tccgttgccg aggctaaggc tcagctgccc gctggttcca acggtctcat gattgactac 840
tcccatggaa acagcaacaa ggattttcga aaccagccta aagttaacga cgtggtttgc 900
gagcagatcg ccaacggaga aaatgctatt acgggagtga tgatcgagag caacattaac 960
gagggcaacc agggtatccc cgctgaaggt aaggccggac tgaagtacgg tgtttcgatc 1020
accgatgctt gcatcggctg ggaaaccact gaggacgtgc tgcgtaaact cgccgctgcc 1080
gttcgacagc gacgagaggt gaataagaag 1110
<210> 64
<211> 1875
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 64
atgtcagaat ctttaagcaa ggaccttaat ctgaatgcat tattcattgg agataaagcc 60
gagaatggac agatctataa agcattactc aacgaacttg tggatgaaca cttgggttgg 120
agacagaatt acatgcctca ggatatgcct attataaccc cggaagagaa aagctccgct 180
tcatttgagc atacagtcaa taaaacgaaa gacgtcttat cagaaattag cgcccggatg 240
cgaacacact cagtcccttg gcacaatgcg ggccggtact ggggacatat gaactctgaa 300
actctgatgc cgtcattgct ggcatacaat tttgcgatgt tgtggaacgg caataatgtt 360
gcatatgaat cgagcccggc cacctcgcaa atggaagaag aagtcggtat ggaatttgca 420
aaactgatga gttataaaga tggatggggc catattgtag ctgatggaag cttagctaat 480
ctggaagggt tatggtatgc tcgcaatatc aagtctcttc ctcttgcgat gaaggaggtc 540
actccggagc ttgtcgctgg caaatccgat tgggaactga tgaatctctc aacggaagag 600
atcatgaacc ttttagattc agtgccggag aaaatcgatg agattaaggc acactcagca 660
cgctccggaa aacatcttga gaagttggga aaatggcttg tgccacagac aaagcattat 720
tcatggctta aagcagctga tatcattgga attggcttag atcaggtcat tccagtaccg 780
gtggaccaca attatcgaat ggacattaat gagctcgaga aaattgtcag aggcttggca 840
gctgagaaaa caccgatcct cggagtagtg ggtgttgttg gaagtactga ggaaggggct 900
attgacggca ttgataaaat tgtagcgctt cgccgagtgc tggagaaaga cggtatttac 960
ttttacctgc acgtcgacgc ggcgtatgga ggctatggcc gcgcgatttt tcttgatgaa 1020
gataataatt ttattccgtt cgaggatctg aaggatgtcc attacaaata caatgtgttc 1080
actgaaaata aagactacat cctggaggag gtacattctg cttataaggc cattgaagaa 1140
gcagaatccg taaccataga tcctcataaa atgggctacg tgccgtatag cgcggggggc 1200
attgttatta aagacattag aatgcgggat gtgatctctt actttgctac gtatgttttt 1260
gaaaaagggg cggatattcc tgcgctcttg ggagcgtata ttctcgaagg gtcaaaggcg 1320
ggggccacag ctgcctcagt ctgggccgca catcacgttc ttccgttgaa cgttacaggg 1380
tacgggaagc ttatgggagc tagcattgaa ggggcccatc ggttttataa cttcttgaat 1440
gacctgtctt ttaaagtggg cgataaagag attgaagttc atccgttgac ctatccggat 1500
ttcaacatgg ttgattacgt cttcaaagaa aaaggcaatg atgacttagt tgctatgaac 1560
aagttaaacc atgacgttta cgactattcg agctacgtta aaggaagcat ttatggcaat 1620
gaatttctca catcgcacac agactttgcc ataccggatt atgggaatag tccattacag 1680
tttgtaaatc aactgggctt tagcgacgaa gagtggaaca gagcaggaaa agttacggta 1740
cttagagcgt cagtcatgac accgtacatg aacaaggagg aacattttga ggagtacgct 1800
gaaaaaatta aagctgccct ccaggagaaa ctggaaaaga tctatgcgga ccaattattg 1860
gcgtctgaag caaaa 1875
<210> 65
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 65
atgtcggaga gccctatgtt tgctgctaat ggaatgccga aggtgaatca gggagcagag 60
gaggatgtta gaattttagg ttatgaccct ttggcctcac ctgccctgtt gcaggtccag 120
attccagcca cgccaacatc attagaaaca gcgaaaagag gaagacggga ggctattgat 180
atcatcacag ggaaagatga tcgagtgtta gtgattgttg ggccatgctc aatccacgat 240
ctggaagcgg cacaagagta cgctctgcgc ttaaagaaac tgtcggatga attgaagggc 300
gatctgtcaa ttattatgcg tgcgtatctt gaaaaacctc gcactacagt cggctggaaa 360
gggctgatca acgacccgga cgtcaataat acgtttaata ttaataaagg actccaaagc 420
gcacgccagc tgttcgtgaa cttaacgaac atcggactgc ctattggatc ggaaatgctc 480
gatactatta gtccgcaata cctggctgat ctcgtatcct tcggagcgat aggcgcaaga 540
accactgaga gccaattaca tagagaactg gcctctggcc tttctttccc tgttggattc 600
aaaaatggca ctgacggtac tctgaatgta gccgtggacg cttgccaagc cgcagcgcac 660
tctcatcatt ttatgggagt aacaaagcac ggtgtggctg ctatcacgac aacgaaaggc 720
aatgagcatt gctttgtaat cctgagagga ggaaaaaagg gaaccaatta cgacgcaaaa 780
agcgtagcgg aagcgaaagc gcaacttccg gccgggagca atggacttat gattgattac 840
tctcatggaa acagtaataa agattttcgc aatcagccta aagttaatga tgtcgtgtgc 900
gaacaaattg ccaacgggga aaacgcaata acgggagtca tgattgagtc taacattaat 960
gaagggaatc agggaatccc ggctgagggc aaagctggtc ttaagtacgg cgtgagcatt 1020
actgatgcat gcattggctg ggaaacaaca gaagatgtgc ttcggaaact ggctgcggcc 1080
gtaagacaaa gacgtgaagt caacaagaaa 1110
<210> 66
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 66
atgagcgaat ctccaatgtt cgcagctaac ggtatgccga aggtgaacca gggagccgag 60
gaagatgttc gcatccttgg ctacgatcca ctggcatccc ccgctcttct gcaggtccag 120
atcccagcga cccctactag ccttgaaact gctaagcgcg gccgccgcga ggcgattgac 180
attatcaccg gaaaggatga tcgtgttctg gtaatcgttg gcccatgctc catccacgac 240
ttggaagccg cccaggagta tgccctccgt ttgaagaagc tgtcagatga acttaagggc 300
gatttgtcca tcatcatgcg tgcttacctt gaaaagcccc gcacgacggt gggctggaaa 360
ggattgatca acgatccaga cgtaaataac accttcaaca ttaacaaggg actgcaatct 420
gctcgccaac tgttcgtcaa cctcaccaac atcggcttgc ctatcggaag cgagatgctg 480
gatacaatct cccctcaata cctggctgat ctggtgagct tcggtgcaat tggtgcgcgt 540
accaccgagt cccagctcca ccgtgaactg gcgtccggcc ttagcttccc tgtgggattc 600
aagaacggta ccgacggcac cctcaacgtg gctgtggacg cctgccaggc cgctgcgcat 660
tcccatcact tcatgggcgt taccaagcat ggtgtggcgg ctatcaccac aaccaaaggc 720
aatgagcact gtttcgtgat cttgcgcggc ggtaagaagg gcaccaacta cgacgcaaaa 780
tctgttgccg aagcaaaggc ccaactcccc gctggttcca acggattgat gatcgattac 840
agccacggaa atagcaacaa ggattttcgt aaccaaccta aggttaatga cgtcgtgtgc 900
gaacagatcg ctaacggaga aaacgctatt accggcgtta tgatcgaaag caatattaac 960
gagggtaacc aaggcattcc tgccgaaggt aaggcgggcc tgaagtacgg agtgtcaatc 1020
accgatgcat gtatcggctg ggagaccacc gaagatgtcc tgcgcaagtt ggcagccgcg 1080
gtgcgtcagc gacgcgaagt taataagaag 1110
<210> 67
<211> 522
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 67
atgacccaac ccctgtttct tattggaccc cgaggttgcg gcaaaaccac cgtgggcatg 60
gccctggcag actcgctgaa tagacgattt gttgataccg atcagtggct gcagtcccag 120
ctgaacatga ctgtcgctga gatcgtcgaa cgagaggagt gggctggctt ccgggcccgt 180
gagaccgctg cccttgaggc agtgactgct ccctcgactg ttatcgccac cggtggaggt 240
atcattctta ctgagtttaa ccggcacttt atgcagaaca acggtatcgt ggtctacctc 300
tgtgcccctg tgtccgttct tgtgaaccga ctgcaagctg cccccgagga ggacctgcga 360
cccacgctga ctggtaagcc tctgtccgaa gaggtgcagg aggtgctgga ggagagagac 420
gccctctacc gagaggtcgc ccatatcatt atcgacgcca ccaacgaacc ctctcaggtc 480
atctccgaga tccgatctgc ccttgcccaa acaatcaact gc 522
<210> 68
<211> 522
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 68
atgacccagc cactgtttct cattggcccg cgcggatgcg gtaaaaccac tgtaggaatg 60
gcacttgcag actcccttaa ccgtcgcttt gtcgatacag accagtggct tcagtcccaa 120
ctgaacatga ctgtcgccga gatcgtagag cgcgaggaat gggcgggttt ccgcgcacgt 180
gaaacagcgg cacttgaggc agtcaccgct ccttccacag tcatcgcaac gggtggaggc 240
atcatcctga ccgaattcaa tcgccacttt atgcaaaaca acggaattgt cgtctatttg 300
tgcgccccag tgtcagtgct ggtcaatcgc cttcaggccg ccccagaaga agacctccgc 360
ccgacactga ccggtaaacc tctttccgag gaagttcagg aggtcttgga ggaacgcgat 420
gccctttacc gcgaagtcgc acacattatc attgacgcca ccaacgaacc gagccaggtt 480
atttccgaaa tccgttccgc tctggcgcaa accatcaact gc 522
<210> 69
<211> 1593
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 69
atgggttctc ttaatacaga agatgttttg gagaatagtt cagcatttgg tgtaactaat 60
ccccttgatc ctgaagaatt cagaagacaa ggacatatga tcatagattt tcttgctgac 120
tattatagag atgtggagaa atatccggtg agaagtcaag tggagcccgg ttatttaaga 180
aaaagactgc cagaaaccgc cccgtacaat ccagagtcca tcgagaccat attacaagat 240
gtaacaactg agattattcc aggtctaacc cattggcaaa gtcctaacta ttacgcctac 300
tttcctagct ccggtagcgt cgccggcttt cttggtgaaa tgttatccac cggtttcaat 360
gttgttggat tcaattggat gagttcacca gccgctactg aattagaatc cgtggttatg 420
gactggtttg gaaaaatgtt gaacctgccg gagtcatttc ttttctctgg aagtggtggt 480
ggcgtgttgc agggtactag ttgtgaagca attttatgca ctttgacggc agcaagagat 540
agaaagctta ataaaattgg tagagagcat atcggtagat tagtagtcta cggatcagac 600
cagactcatt gtgctttaca aaaggctgca caagtcgctg gcatcaatcc taagaatttc 660
agagcgatta agacgtttaa agaaaactcc tttggtttga gcgcagcaac tctaagagaa 720
gtgatcctag aggacatcga ggcagggttg ataccactgt ttgtttgccc tacagtgggg 780
accacttcta gcaccgccgt tgatcctata tctccgatct gtgaagtagc taaagaatac 840
gaaatgtggg tacacgtaga tgcagcttac gctgggtcag cctgtatttg cccagagttt 900
agacatttta ttgatggtgt cgaagaagcg gacagttttt ctcttaatgc tcataagtgg 960
tttttcacta ctttggactg ttgttgtttg tgggttaagg atccatctgc tctagttaaa 1020
gccctatcca ccaatccgga gtatttgaga aataaggcaa cagaatcaag acaagtcgta 1080
gattataaag actggcaaat agccctgtcc agaaggttca gatcattaaa gttatggatg 1140
gttctgagga gctatggcgt caccaatttg agaaattttt tgagaagcca cgtcaagatg 1200
gcaaagactt ttgaaggact gatctgtatg gatggtaggt ttgaaataac tgttcccagg 1260
acttttgcaa tggtttgttt tagattgctg cccccaaaaa caataaaagt atatgataac 1320
ggcgtgcatc aaaacggtaa cggggtagtt cctttgagag acgagaacga gaacctggtt 1380
ttagcgaata aactaaatca ggtttacctt gagactgtta acgctacggg atctgtatat 1440
atgacacatg ccgttgtagg tggcgtgtac atgatccgtt ttgctgtggg atccacccta 1500
acggaagaaa ggcatgtgat ctacgcttgg aaaatattac aagaacacgc cgacttgatt 1560
ttaggtaaat ttagtgaagc agacttttct tca 1593
<210> 70
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 70
atgtccgaat ctccaatgtt cgctgccaac ggcatgccga aggtgaacca gggagccgaa 60
gaagacgtgc gcatcctcgg ttatgatccg ctcgccagcc cggcactctt gcaagtgcag 120
attcccgcta cgccaacctc actcgagacc gcgaagcgcg gtcgccgcga agcaatcgac 180
atcattactg gtaaggacga tcgcgtgctc gtgatcgttg gcccgtgctc gattcacgac 240
ttggaagcgg ctcaagagta cgcgcttcgc ctcaagaaat tgagcgatga actgaaaggt 300
gatttgtcca tcattatgcg cgcgtacctt gaaaagccac gtacgactgt tggttggaag 360
ggtctgatca acgatcctga tgtcaacaac acctttaata ttaataaggg cctccagtcc 420
gcccgccaac ttttcgtgaa cctgaccaac attggccttc caattggctc agagatgctt 480
gacacgatct ctccacaata cctcgcagat ttggtcagct tcggcgcaat cggcgcgcgc 540
accaccgagt cccagctcca ccgcgaactg gcgagcggac tgagctttcc cgtcggcttc 600
aagaatggca cagatggcac cttgaacgtc gcggtggacg cgtgtcaagc cgccgcgcat 660
tcacaccact tcatgggagt gaccttgcac ggtgtagcgg ccatcactac cacgaagggt 720
aacgagcact gcttcgtgat cttgcgtgga ggtaagaagg gaactaatta cgacgccaag 780
tctgtggcgg aggctaaggc tcagttgcca gcgggatcca acggtttgat gatcgattat 840
agccacggca actccaacaa agactttcgt aatcaaccta aggtgaacga tgtagtctgc 900
gaacaaatcg cgaacggcga aaacgcgatc accggtgtga tgatcgaatc taatattaac 960
gaaggtaacc agggtattcc cgcggagggc aaggcaggtc tgaaatacgg agtcagcatt 1020
acggatgctt gcatcggatg ggagaccacc gaagatgttc tccgaaagtt ggcggcagcg 1080
gtgcgccagc gccgcgaagt gaataagaaa 1110
<210> 71
<211> 771
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 71
atggatttca caaaaccaga aactgtttta aatctacaaa atattagaga tgaattagtt 60
agaatggagg attcgatcat cttcaaattt attgagaggt cgcatttcgc cacatgtcct 120
tcagtttatg aggcaaacca tccaggttta gaaattccga attttaaagg atctttcttg 180
gattgggctc tttcaaatct tgaaattgcg cattctcgca tcagaagatt cgaatcacct 240
gatgaaactc ccttctttcc tgacaagatt cagaaatcat tcttaccgag cattaactac 300
ccacaaattt tggcgcctta tgccccagaa gttaattaca atgataaaat aaaaaaagtt 360
tatattgaaa agattatacc attaatttcg aaaagagatg gtgatgataa gaataacttc 420
ggttctgttg ccactagaga tatagaatgt ttgcaaagct tgagtaggag aatccacttt 480
ggcaagtttg ttgctgaagc caagttccaa tcggatatcc cgctatacac aaagctgatc 540
aaaagtaaag atgtcgaggg gataatgaag aatatcacca attctgccgt tgaagaaaag 600
attctagaaa gattaactaa gaaggctgaa gtctatggtg tggaccctac caacgagtca 660
ggtgaaagaa ggattactcc agaatatttg gtaaaaattt ttaaggaaat tgttatacct 720
atcactaagg aagttgaggt ggaatacttg ctaagaaggt tggaagagta a 771
<210> 72
<211> 786
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 72
atgaagtatt caaaggaata taaggaaaag acggtggtga agatcaacga cgtgaaattc 60
ggagaaggct tcaccatcat cgccggccca tgctcgatcg agtctcgcga ccagatcatg 120
aaggttgcgg agtttctggc tgaagtaggc atcaaggtgc ttcgcggcgg cgcttttaag 180
cctcgaacct ccccttactc cttccaggga tacggtgaga aggcgttgcg ctggatgcgt 240
gaagcagcgg atgagtatgg cctggtgacc gtcactgagg tcatggatac acgccatgtt 300
gagcttgtcg ccaaatatag cgatatcttg caaatcggcg cccgcaacag ccaaaacttt 360
gagctcctga aagaagtcgg taaagtggaa aatccagttc ttctgaaacg tggtatgggc 420
aacaccattc aagaacttct ctactctgcg gaatacatca tggcacaagg caatgaaaac 480
gttatcctgt gcgagcgagg catccgtaca ttcgaaactg caacgcgctt cactttggac 540
atctcggctg taccagtagt taaagaactt tcacacctcc caatcattgt ggacccaagc 600
cacccagccg gccgccgctc gctggtgatc ccactcgcca aagcagcgta tgcaattggt 660
gctgatggaa tcatggtgga agttcatccg gagcctgaaa aagctctttc cgactcgcaa 720
cagcaactca ccttcgacga ctttttgcag ctgctgaaag aactcgaagc actcggttgg 780
aaggga 786
<210> 73
<211> 2376
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 73
atgtctaata atggctcatc acctctcgtc ttgtggtaca atcagctcgg tatgaacgat 60
gtcgaccgtg tgggaggaaa gaacgcctct ctgggtgaga tgattactaa tttgagcggt 120
atgggagttt ccgtgccaaa tggttttgct accacagccg acgcgttcaa ccaatttctc 180
gaccagagcg gcgttaacca gcgaatttac gagttgctgg acaaaactga catcgatgac 240
gtcacccagc tggccaaggc aggcgcacag attcgccagt ggatcatcga taccccattt 300
cagcccgagc tcgagaacgc catccgcgag gcgtacgcac agctcagcgc ggacgacgaa 360
aacgcatcgt tcgctgtacg ttcgtcagca accgcggaag atatgccgga tgcgtctttt 420
gcaggtcagc aagagacgtt cctcaacgtg cagggcttcg atgccgttct tgtggcggta 480
aagcacgtgt tcgcgtccct tttcaacgac cgcgctatca gctaccgtgt tcaccagggc 540
tacgatcatc gtggagtggc tctgtcggca ggcgtacaac gcatggtccg cagcgacttg 600
gcttcttccg gcgttatgtt ctcaatcgac acggaatctg gctttgacca agttgttttc 660
attacctctg catggggtct tggcgaaatg gtcgtgcaag gcgcagtgaa ccccgatgaa 720
ttttatgtgc acaagccaac gctcgccgca aaccgtcccg ccattgtccg ccgtaccatg 780
ggctccaaaa agatccgtat ggtctatgcc ccaacgcaag aacatggcaa gcaggttaaa 840
atcgaagacg tgccacaaga acagcgtgat atcttctccc tgaccaacga ggaggtacag 900
gaactggcta agcaagctgt tcagatcgaa aagcactatg gtcgcccaat ggatatcgag 960
tgggctaagg atggccacac aggcaaattg ttcattgtcc aggcacgccc tgagactgtt 1020
cgctcccgtg gacaagtcat ggagcgctac accctgcaca gccagggaaa gattatcgct 1080
gaaggacgcg ccattggcca tcgcatcggc gccggccccg tgaaggttat tcacgacatc 1140
tccgagatga accgcatcga acctggcgac gtcctggtga ccgatatgac cgacccagat 1200
tgggagccta ttatgaagaa ggcttctgca atcgtaacca accgtggagg tcgcacctgt 1260
cacgctgcta ttatcgcacg cgagctgggt atccctgcag ttgtcggatg cggcgatgcc 1320
actgaacgaa tgaaagacgg agagaacgtg accgtgtctt gtgcagaagg agacactggc 1380
tacgtctacg cagagttgtt ggagttctcc gtgaaatctt cttcagtaga aaccatgcct 1440
gacttgcctc tgaaggtgat gatgaacgtg ggtaacccgg accgcgcgtt cgattttgcg 1500
tgcttgccga acgaaggtgt tggcttggct cgtctcgagt tcatcatcaa tcgcatgatc 1560
ggtgtgcacc cgcgcgcctt gctcgaattc gatgatcagg aacctcagtt gcagaacgaa 1620
atccgcgaaa tgatgaaggg tttcgactcc cctcgtgaat tttatgtcgg tcgtctcacc 1680
gaaggaatcg caacactcgg cgcggcgttc tatcccaagc gcgtcatcgt tcgactttcc 1740
gatttcaagt ccaacgagta cgccaatctg gtcggcggag agcgttacga gcccgacgaa 1800
gagaacccca tgcttggttt ccgcggtgca ggccgctatg tgtcggacag cttccgcgat 1860
tgtttcgctc tcgaatgtga agctgtcaag cgcgtgcgca acgacatggg ccttaccaac 1920
gtagaaatta tgatcccctt tgttcgcaca gtggatcagg ccaaagcggt tgtggaggaa 1980
ctcgctcgtc agggcctgaa acgcggtgaa aacggcctga agatcatcat gatgtgcgaa 2040
attccgtcca acgctctcct tgccgaacaa tttttggagt acttcgacgg cttctcgatt 2100
ggctccaacg acatgaccca actggccctg ggcctcgatc gcgattcggg cgtcgtcagc 2160
gaactcttcg acgaacgtaa tgacgccgtc aaggcattgt tgagcatggc cattcgcgcg 2220
gccaagaagc agggaaagta cgtgggcatt tgcggacagg gtccctcaga ccatgaggac 2280
tttgctgctt ggttgatgga agaaggtatt gattccttgt ctttgaaccc ggacaccgta 2340
gttcagacct ggctgtctct ggccgaactt aagaaa 2376
<210> 74
<211> 801
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 74
atggatttta ccaagccaga aacagtgttg gaccttggca acattcgcca ggcacttatc 60
cgcatggagg acaccattgt ttttttcctg attgagcgtt cccagtttta cagcagccca 120
tccgtctaca ttaagaacaa gttccctatc ccgaacttcg acggctcatt ccttgattgg 180
agcctccaac agatggagcg tacccattct caaatccgcc gctacgaagc accagatgag 240
attccattct tcccagaggt gcttctggag agcttcctgc cccccatcaa ctatcctaat 300
atcttggcgt cctaccacaa agaggttaat cataatcaaa ccgtcctgaa cttctacgta 360
gaaaacatcg tccctcaagt cgcctgcgag attggtgagc aagaagaaaa catcggcagc 420
gtatcggtct gcgacatcga ttgtctccag tccctctccc gccgaattca cttcggaaag 480
ttcgtggcgg aggcaaaata ccaatctgac aagccaaagt acattaagtt gatcctggcc 540
aaggacgtta agggcatcga agattccatt actaactctg ctgtggaaga aaaaattctt 600
gaacgcttgc agaagaaggg acaatcctac ggaaccgacc caaccctgat gtattcccaa 660
aacccgcagt cgaaggttcg cccggaggtg attgcgcagc tctataaaga tcacgtcatt 720
ccgctgacga aaaaagttga ggtggactac ctcctgcgcc gattggaaga tgaagatgag 780
gctgttgtag caaaatacaa a 801
<210> 75
<211> 1620
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 75
atgcgtgtca acaacggttt gacccctcaa gaattggagg cgtacggtat ctctgatgtc 60
cacgacattg tgtacaatcc ctcttacgat cttctctacc aagaagaatt ggatccatcc 120
ctcaccggct acgagcgtgg cgtgcttact aatctgggcg ctgtcgccgt agataccggt 180
atctttactg gccgttctcc gaaagacaag tacattgtgc gagacgatac tacccgcgac 240
accttctggt gggctgataa gggtaaaggc aaaaacgaca acaaaccttt gtccccggaa 300
acctggcagc acctgaaagg actggtcacc cgtcagttgt caggtaagcg tcttttcgtc 360
gtggatgcct tctgcggcgc gaatccagac acccgcttgt ctgtacgctt cattaccgaa 420
gtcgcttggc aggcgcattt cgtgaagaat atgtttatcc gaccttccga cgaggaactg 480
gcgggcttca agccggactt catcgttatg aacggtgcca aatgtaccaa cccacaatgg 540
aaggaacagg gcctcaatag cgaaaacttt gtggctttca acttgaccga gcgcatgcaa 600
ctgatcggag gtacctggta cggtggagag atgaagaagg gtatgtttag catgatgaac 660
taccttctcc ctctcaaagg cattgcgtcc atgcattgct ctgcgaatgt cggcgaaaaa 720
ggagacgttg cggtgttttt tggattgtcg ggcaccggta agacgaccct cagcaccgat 780
ccaaaacgcc gtttgatcgg tgatgacgaa cacggatggg acgacgacgg tgtgttcaac 840
tttgagggcg gatgttacgc aaaaaccatt aagctttcca aagaagcaga gcctgagatc 900
tacaacgcaa ttcgccgcga cgctttgttg gaaaatgtga cagtacgcga agacggtacc 960
atcgactttg atgacggttc caagactgag aacactcgtg tgtcataccc tatttaccac 1020
attgataata tcgttaaacc agtgagcaag gcgggtcacg cgacaaaagt cattttcctg 1080
accgcagatg cgtttggtgt gttgccacca gtctcgcgct tgaccgctga ccaaacccaa 1140
tatcacttct tgtctggttt caccgctaag ctggcgggaa ctgagcgtgg catcaccgag 1200
ccgacgccaa cgttttcggc ctgcttcggc gccgcattcc tctcactcca cccaacccaa 1260
tatgccgaag tcttggttaa gcgcatgcaa gcggcgggtg cacaagctta cctggtaaac 1320
acgggctgga atggtaccgg caagcgtatt tcaattaagg acactcgagc gatcattgac 1380
gcgatcctta atggctcgct tgacaacgcc gagaccttca ccctcccgat gtttaacctc 1440
gcaatcccaa ccgaactgcc tggcgttgat actaaaatct tggacccccg aaacacgtac 1500
gcttcacctg agcaatggca ggagaaagcc gaaacacttg ccaagctgtt tatcgacaac 1560
ttcgacaaat ataccgatac ccctgctggc gccgcactgg tagcggcagg tcccaagctc 1620
<210> 76
<211> 1119
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 76
atggtagctg aactcaccgc tttgcgtgac cagatcgatg aagtggataa ggcactcttg 60
aacctgctcg cgaagcgcct cgagctcgtg gcagaggtgg gcgaggttaa atctcgtttt 120
ggcctcccga tctatgttcc tgaacgagag gcctccatcc tggccagccg tcgcgcagaa 180
gcggaggcac tcggagtgcc gcctgatctg atcgaggatg ttctgcgacg cgtaatgcga 240
gaaagctatt catccgagaa tgataaaggc tttaaaaccc tgtgtccttc cctgcgtcca 300
gtcgtgatcg tgggcggtgg cggccaaatg ggtcgtctct ttgaaaagat gttgacgctt 360
agcggctacc aagtgcgcat tctcgagcaa catgattggg accgtgccgc agacatcgtg 420
gccgatgcgg gtatggtcat tgtttcggtc cctatccatg tcaccgagca agtgattggc 480
aaactgccac cccttccaaa agactgtatt ctcgtggact tggcctcggt taaaaacggt 540
cctctccagg caatgctggt tgcacatgat ggcccagtct tgggcttgca cccaatgttc 600
ggcccagata gcggctcatt ggcaaagcag gtggttgttt ggtgcgatgg ccgaaaacca 660
gaggcatatc agtggttcct ggagcagatt caggtatggg gcgcccgtct gcatcgcatc 720
tcggctgttg aacatgatca gaacatggct ttcattcagg ctctccgaca cttcgcaacc 780
ttcgcttatg gtctgcacct ggcggaagag aacgttcagt tggagcagct gctggccttg 840
tccagcccca tttatcgctt ggagctggcc atggtgggcc gtctcttcgc acaggacccg 900
caactttacg ccgacatcat catgtcctca gagcgcaatc ttgcccttat caaacgctac 960
tacaaacgat tcggagaggc gatcgaactc ttggaacagg gcgacaaaca agccttcatc 1020
gattcttttc gcaaggtgga gcattggttt ggtgattatg ttcagcgttt tcagtccgaa 1080
tcgcgtgtac tcttgcgcca agccaacgac aaccgtcaa 1119
<210> 77
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 77
atgtccgaat cacccatgtt cgcagccaac ggcatgccga aggtcaatca aggcgcggaa 60
gaagatgtcc gcattctcgg ctatgatcca cttgcatccc ctgcgctgct gcaagtacaa 120
attcctgcca ccccgacctc gctggaaact gccaagcgcg gtcgtcgcga ggcgatcgac 180
attattacag gtaaggatga ccgcgttctc gttattgtag gtccatgctc catccacgat 240
ctggaagccg cgcaggaata cgcactgcgt ctgaaaaaac tgtccgatga gctcaagggc 300
gacctttcga tcatcatgcg cgcatacctt gagaagcctc gcaccacggt cggctggaaa 360
ggcctgatca atgaccctga tgtgaataac acgttcaaca tcaacaaagg cttgcagtcc 420
gcgcgacaat tgttcgtgaa cctgaccaac atcggcctcc caattggtag cgaaatgttg 480
gacaccatca gccctcaata cttggcagat cttgtgtctt tcggagctat tggcgcacgc 540
accaccgagt cccaattgca ccgtgagctg gcatcaggtc tgagcttccc tgtgggtttc 600
aagaacggca ccgacggtac tctcaatgtg gcggtcgatg cttgtcaagc ggcggcccac 660
agccatcact ttatgggtgt tacattgcac ggtgtggctg ctattactac gacaaaagga 720
aacgaacact gcttcgtcat cctccgtggt ggtaagaagg gcaccaacta cgatgccaaa 780
tctgtggcag aagcaaaggc acaacttcct gcaggtagca acggcctcat gattgattac 840
tctcatggca actcgaacaa agactttcgc aaccaaccga aggtgaacga tgttgtttgc 900
gaacagattg caaacggcga gaatgccatc acgggtgtga tgatcgaatc taacattaat 960
gaaggaaacc aaggtattcc tgcagagggc aaggcgggct tgaaatacgg cgtatcaatc 1020
accgatgcct gtatcggctg ggaaaccacc gaagacgtgc ttcgaaagct tgccgcagcg 1080
gtgcgccagc gccgcgaagt taacaagaag 1110
<210> 78
<211> 522
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 78
atgacccagc cactgttcct gatcggccct cgcggttgcg gaaagaccac tgttggtatg 60
gcccttgcgg actcacttaa tcgccgtttc gtagacacag atcagtggct tcagagccag 120
cttaacatga cagtggcgga aatcgtggaa cgcgaagagt gggcaggttt tcgcgcccgc 180
gaaactgctg ccttggaagc agtgaccgca ccttcaactg tcattgccac tggcggcggc 240
atcatcctga cggagttcaa ccgccacttc atgcaaaata acggaatcgt agtatatctg 300
tgcgcccctg ttagcgtgct ggtcaaccgc ctgcaggcgg cgcctgagga agacctgcgt 360
cctaccctta ccggaaaacc actctccgag gaagtgcagg aagtgctcga ggaacgcgac 420
gcactctacc gcgaagtcgc ccatatcatt atcgatgcga ccaatgaacc atcacaggtg 480
atctccgaga ttcgctcagc tctggcccag acaattaact gc 522
<210> 79
<211> 519
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 79
atggcggaaa agcgtaacat ttttctggtg ggtccaatgg gagccggcaa gtctaccatt 60
ggtcgacagc tggctcaaca actgaacatg gagttctacg acagcgatca ggaaatcgaa 120
aaacgaaccg gagctgacgt tggctgggtg ttcgatttgg aaggcgagga gggttttcgt 180
gaccgcgagg agaaagtgat caacgagctg acagaaaagc aaggcatcgt cctcgccacc 240
ggcggcggtt ccgtgaagag ccgcgagact cgtaaccgac tgagcgcgcg aggcgttgtg 300
gtatatctcg aaaccaccat cgaaaagcag ctggcacgca cgcaacgcga caagaagcgc 360
cctctcctgc acgtcgaaac cccaccgcgt gaggtcctgg aagcactggc gaacgagcgt 420
aacccgcttt acgaggagat cgccgacgta accatccgta ccgatgacca gagcgctaag 480
gttgtggcga accaaattat ccatatgttg gaatccaac 519
<210> 80
<211> 519
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 80
atgactgagc ccatctttat ggtcggtgct cgcggctgcg gaaaaacaac cgtaggccgc 60
gagctcgcac gtgcactggg ctacgaattt gtcgataccg atatctttat gcagcacacc 120
tcgggcatga ccgtggcaga tgtcgtggcc gccgaaggct ggccgggctt ccgccgtcgc 180
gagtccgagg cgctccaggc cgttgcaacc cccaaccgcg tagtggcgac cggcggaggt 240
atggtgctgc tcgagcagaa ccgccaattc atgcgtgctc acggcacggt ggtatatctg 300
ttcgcgcctg ctgaggaact cgcactgcgc ttgcaggcat ctccgcaggc acaccagcgc 360
ccgaccctga ccggccgccc catcgcggag gaaatggaag cggtcctgcg cgaacgcgaa 420
gctctctacc aggatgttgc ccactacgtt gtcgatgcaa cgcagccacc agcggccatc 480
gtgtcagaac tcatgcagac catgcgtctc cccgcggct 519
<210> 81
<211> 4764
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 81
atggtgcagc tggcaaaggt gccaatcctg ggcaacgata tcatccacgt gggctacaac 60
atccacgatc acctggtgga aaccatcatc aagcactgcc catcctccac ctacgtgatc 120
tgcaacgata ccaacctgtc caaggtgcca tactaccagc agctggtgct ggaattcaag 180
gcatccctgc cagaaggctc ccgtctgctg acctacgtgg tgaagccagg cgaaacctcc 240
aagtctcgtg aaaccaaggc acagctggaa gattacctgt tggtggaagg ctgcacccgt 300
gataccgtga tggtggcaat cggtggcggt gtgatcggcg atatgatcgg cttcgtggca 360
tccaccttca tgcgtggcgt gcgtgtggtg caggtcccaa cctccttgct ggcaatggtg 420
gattcctcca tcggtggcaa gaccgcaatc gataccccac tgggcaagaa cttcatcggt 480
gcattctggc agccaaagtt cgtgctggtc gatatcaagt ggctggaaac cctggcaaag 540
cgtgaattca tcaacggcat ggccgaagtg atcaagaccg cctgcatctg gaacgcagat 600
gagttcaccc gtctggaatc caacgcctcc ttgttcctga acgtggtcaa cggtgcaaag 660
aacgtgaagg tgaccaacca gctgaccaac gaaatcgatg aaatctccaa caccgatatc 720
gaagcaatgc tggatcacac ctacaagttg gtgttggaat ccatcaaggt gaaggctgaa 780
gtggtgtcct ccgatgaacg tgaatcctcc ttgcgtaacc tgctgaactt cggtcactcc 840
atcggccacg catacgaagc aatcttgacc ccacaggcac tgcacggcga atgcgtgtcc 900
atcggcatgg tgaaagaagc agaactgtcc cgttacttcg gcatcttgtc cccaactcag 960
gtggcacgtc tgtccaagat cctggtggca tacggcctgc cagtgtctcc agatgaaaag 1020
tggttcaaag aactgaccct gcacaagaaa accccattgg atatcctgct gaagaagatg 1080
tccatcgata agaagaacga aggctccaag aaaaaggtgg tgatccttga atccatcggt 1140
aagtgctacg gcgattccgc acagttcgtg tccgatgaag atctgcgttt catcctgacc 1200
gatgaaacct tggtgtaccc attcaaagat atcccagcag atcagcagaa ggtggtcatc 1260
ccaccaggtt ccaagtccat ctccaaccgt gcactgatcc tggcagcact tggcgaaggc 1320
cagtgcaaga tcaagaacct gctgcactcc gatgacacca agcacatgct gaccgcagtg 1380
cacgaactga agggtgcaac catctcctgg gaagataacg gcgaaaccgt ggtggtcgaa 1440
ggccacggtg gttccacctt gtccgcatgc gcagatccac tgtacttggg caacgcaggt 1500
actgcatccc gtttcttgac cagcttggca gccctggtga actccacctc ctctcagaag 1560
tacatcgtcc tgaccggcaa cgctcgtatg cagcagcgtc caatcgcacc actggtggac 1620
tccctgcgtg caaacggcac caagatcgaa tacctgaaca acgagggctc cctgccaatc 1680
aaggtctaca ccgattccgt gttcaaaggc ggtcgtatcg aactggcagc aaccgtgtcc 1740
tctcagtacg tgtcctccat cctgatgtgc gcaccatacg ccgaagaacc agtgaccttg 1800
gcactggttg gcggtaagcc aatctccaag ctgtacgtgg atatgaccat caagatgatg 1860
gaaaagttcg gcatcaacgt ggaaacctct accaccgaac catacaccta ctacatccca 1920
aagggccact acatcaaccc atccgaatac gtgatcgaat ccgatgcatc ctccgcaacc 1980
tatccactgg cattcgcagc aatgaccggc accaccgtga ccgtgccaaa catcggtttc 2040
gaatccttgc agggcgacgc acgtttcgca cgtgatgtgc tgaagccaat gggctgcaaa 2100
atcacccaga ccgcaacctc caccactgtg tctggcccac cagtcggcac cctgaagcca 2160
ctgaagcacg tggacatgga accaatgacc gatgcattcc tgaccgcatg cgtggtggca 2220
gcaatctccc acgattccga tccaaactcc gcaaacacca ccaccatcga aggtatcgca 2280
aaccagcgtg tgaaagaatg caaccgtatc ttggcaatgg caaccgaact ggctaagttc 2340
ggcgttaaga ccaccgagct gccagatggc atccaggtgc acggcctgaa ctccatcaaa 2400
gatctgaagg tcccatccga ttcctccggt ccagtgggcg tgtgcaccta cgacgatcac 2460
cgtgtggcaa tgtccttctc cttgttggct ggcatggtca actcccagaa cgaacgtgat 2520
gaagtggcaa acccagtgcg tatcctggaa cgtcactgca ccggcaagac ctggcctgga 2580
tggtgggacg tgttgcactc tgaactgggt gcaaagctgg atggcgcaga accattggaa 2640
tgcacctcca agaagaactc caaaaagtcc gtggtgatca tcggtatgcg tgccgcaggc 2700
aagaccacca tttccaagtg gtgcgcatcc gcattgggct ataagttggt ggatctggat 2760
gaactgttcg agcagcagca caacaaccag tccgtgaagc agttcgtggt ggaaaacggc 2820
tgggagaagt tccgtgaaga agaaacccgt atcttcaaag aagtgatcca gaactacggc 2880
gacgatggct acgtgttctc cactggcggt ggcatcgtgg aatccgcaga atcccgtaag 2940
gcactgaagg atttcgcgtc ctccggtggc tacgtcctgc acttgcaccg tgacatcgaa 3000
gaaaccatcg tgttcttgca gtccgatcca tctcgtccag catacgtgga agaaatccgt 3060
gaagtgtgga accgtcgtga aggttggtac aaagaatgct ccaacttctc cttcttcgca 3120
ccacactgct ccgcagaagc cgaattccag gcattgcgtc gttccttctc caagtacatt 3180
gcaaccatta ccggtgtgcg tgaaatcgaa atcccatccg gtcgttccgc attcgtgtgc 3240
ctgaccttcg acgatctgac cgaacagacc gaaaacttga cccctatctg ctacggctgc 3300
gaagctgtgg aagtgcgtgt cgatcacttg gcaaactact ccgctgattt cgtgtccaag 3360
cagctgtcca tcttgcgtaa ggcaaccgat tccattccaa tcatcttcac cgtgcgtacc 3420
atgaagcaag gcggtaactt cccagatgaa gaattcaaga ccctgcgtga actgtacgat 3480
atcgcactga agaacggcgt ggaattcctg gatttggaac tgaccttgcc aaccgatatc 3540
cagtacgagg tgatcaacaa gcgtggcaac accaaaatca tcggctccca ccacgatttc 3600
cagggcctgt actcctggga tgatgcagaa tgggaaaacc gtttcaacca ggccttgacc 3660
ttggatgtgg atgtggtgaa gttcgtgggc accgcagtga acttcgaaga taacctgcgt 3720
ttggaacact tccgtgacac ccacaagaac aagccattga tcgccgtgaa catgacctcc 3780
aagggctcca tctctcgtgt gttgaacaac gtgttgaccc cagtcacctc cgatctgctg 3840
cctaactccg cagcaccagg ccagttgacc gtggcacaga tcaacaaaat gtacacctcc 3900
atgggtggta tcgaaccaaa agaattgttc gtggtcggca agccaatcgg ccactctcgt 3960
tccccaatcc tgcacaacac cggctacgaa atcttgggcc tgccacacaa gttcgataag 4020
tttgaaaccg aatccgctca gctcgtgaaa gaaaagctgt tggatggcaa caaaaacttc 4080
ggtggcgcag cagtgaccat tccactgaag ttggatatca tgcagtacat ggatgaattg 4140
accgacgcag caaaggtgat cggtgctgtg aacaccgtga ttccattggg caacaagaag 4200
ttcaagggcg ataacaccga ttggttgggc atccgtaacg cattgattaa caacggcgtg 4260
ccagaatacg tgggccacac cgcaggcctg gtgattggcg ctggcggaac ctctcgtgca 4320
gcactgtacg cactgcactc cctgggttgc aagaaaatct tcatcatcaa ccgtaccacc 4380
tccaaactga aaccactgat cgagtccctg ccatccgagt tcaacatcat cggcatcgaa 4440
tccactaagt ccatcgaaga gatcaaagaa cacgtgggcg tcgcagtgtc ctgcgtgcca 4500
gcagataagc cactggatga tgaactgctg tccaagttgg aacgtttcct ggtgaaaggc 4560
gcacacgcag cattcgtgcc aaccttgctg gaagcagcat acaagccatc tgtcacccca 4620
gtgatgacca tctctcagga taagtaccag tggcacgtgg tgccaggctc tcagatgctg 4680
gtccaccagg gcgtcgccca gttcgaaaag tggaccggct tcaagggtcc attcaaggcc 4740
atcttcgatg ctgtgaccaa agag 4764
<210> 82
<211> 1356
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 82
atggtctccg aagacaaaat cgaacaatgg aaggctacca aagtaattgg cattattggt 60
ctgggagata tgggcctgtt gtatgcgaat aagttcaccg acgcaggttg gggcgtgatc 120
tgctgcgacc gtgaggaata ctacgatgaa cttaaggaaa aatacgcatc ggctaagttc 180
gagctcgtga aaaatggtca cctcgtctcg cgtcagtccg attacattat ctattcggtt 240
gaagcatcga acatctcgaa gatcgtggcc acttacggcc cctcgtccaa ggtcggtacc 300
atcgtgggtg gtcagacctc ctgcaaactg ccagagatcg aggcattcga aaagtacttg 360
cctaaggatt gcgatattat tacagttcac tctcttcatg gtccgaaggt taatacggag 420
ggtcagccac tggtcattat caaccaccgt tcgcaatacc ccgaatcctt tgagtttgtt 480
aacagcgtta tggcgtgcct taagtccaaa caggtctact tgacctacga ggaacacgac 540
aaaatcacag ctgacacaca ggccgtgact catgctgcat tcctctcgat gggcagcgct 600
tgggccaaga tcaaaattta cccttggacc ttgggcgtga acaaatggta tggtggcctc 660
gagaacgtga aagtcaacat ttccttgcgc atttattcta ataagtggca cgtttacgcg 720
ggcctcgcaa tcaccaaccc gtctgctcac caacaaattc tgcagtatgc cacatcagcc 780
accgaactct tttccctgat gatcgataat aaggagcaag agctgaccga ccgcctgctg 840
aaagcaaagc agttcgtatt tggaaaacat accggtctgc ttttgttgga cgatactatc 900
cttgagaagt actccctttc gaagtcctcc atcggcaact ctaataactg caagccagtg 960
ccaaactctc acctttcctt gctcgcaatc gtcgattcgt ggttccagct gggtatcgat 1020
ccatacgacc acatgatctg ctccactcca ctttttcgca tctttctcgg cgtgagcgag 1080
tacctctttc tcaagcccgg cttgctggag cagacgatcg acgcagcaat tcacgataaa 1140
tccttcatta aggatgattt ggagttcgtg atcagcgctc gtgagtggtc ctcggtggtg 1200
tcttttgcaa acttcgatat ctacaagaaa cagttccagt ccgtccaaaa gttctttgag 1260
ccgatgctcc ctgaagccaa ccttatcggc aacgagatga tcaaaaccat tttgtcccat 1320
tccagcgatc gatcggcggc tgaaaagcgc aacacg 1356
<210> 83
<211> 4458
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 83
atgctgtacg acaagtccct ggagcgtgat aactgcggct ttggcctcat tgcccatatc 60
gaaggcgaac catcgcacaa ggtagtacga accgctatcc acgccttggc tcgaatgcag 120
caccgtggtg ctatcctcgc agacggaaag acgggtgacg gctgtggtct gttgctgcaa 180
aagccggatc gattcttccg cattgtggct caggaacgcg gctggcgcct ggcgaagaat 240
tacgccgttg gtatgctctt cttgaataag gacccagagc tggctgctgc tgcgcgtcgt 300
attgttgagg aggaactgca gcgcgagacc ctgtctatcg tgggctggcg cgatgtcccc 360
accaatgagg gcgttctcgg cgaaatcgca ctcagctcct tgccacgcat tgagcagatc 420
ttcgttaacg caccggcagg ttggcgtcct cgcgacatgg aacgccgttt gttcatcgca 480
cgtcgacgta ttgaaaaacg tctcgaagct gacaaagatt tctacgtgtg ctccctctcg 540
aacttggtaa acatttacaa gggcctgtgc atgcctacag atctgcctcg cttctacctg 600
gacctggctg acttgcgatt ggagtccgcg atctgccttt tccatcagcg tttttccacc 660
aataccgtcc cacgctggcc cctggcccag cctttccgct acctcgcgca taatggtgaa 720
atcaacacca tcacaggtaa ccgtcagtgg gcccgtgcgc gtacctacaa attccagact 780
ccactcatcc ctgacttgca cgacgcggca ccatttgtta atgaaacagg cagcgattcc 840
tcgtccatgg ataacatgct cgagctgctg ttggctggtg gcatggacat catccgcgca 900
atgcgccttc ttgtaccccc tgcttggcag aacaatcctg atatggatcc agaattgcgc 960
gccttcttcg atttcaattc aatgcatatg gagccttggg atggccctgc aggcattgtt 1020
atgagcgacg gtcgatttgc ggcatgcaat ctggatcgca atggtctccg cccagcgcgt 1080
tatgtcatta ctaaagataa gctgattact tgcgcctccg aagtcggaat ctgggactac 1140
cagccggatg aagtcgtaga aaaaggtcga gtgggaccag gtgaactcat ggttatcgac 1200
actcgttctg gacgaatcct gcactctgcc gaaacagatg atgacctgaa atcccgtcac 1260
ccctacaagg agtggatgga aaagaacgta cgccgtttgg tcccttttga agatctcccg 1320
gacgaggagg tgggcagccg cgagctcgat gatgatacgc tcgcttccta ccaaaaacag 1380
ttcaactact ccgcagaaga actcgatagc gtcatccgag ttctgggaga aaatggtcag 1440
gaagcggtcg gttccatggg agatgatacc cccttcgcag tacttagctc ccagccccgt 1500
atcatctatg actattttcg ccagcaattc gcacaggtga caaacccacc aattgatcca 1560
ctgcgcgagg ctcacgtaat gtctctcgcg accagcatcg gtcgcgagat gaacgtcttt 1620
tgtgaggcag aaggccaggc tcaccgtctt tccttcaaga gcccaatcct cctgtactcg 1680
gattttaaac agttgactac catgaaggag gaacactacc gtgcggacac cttggatatc 1740
actttcgacg tgaccaagac cacactggaa gccaccgtga aagaactctg cgataaggct 1800
gaaaagatgg tccgctccgg caccgtgctt cttgttttgt cggaccgaaa cattgcaaag 1860
gatcgcctgc ctgtcccggc acctatggca gtcggagcca tccagacccg tcttgtggac 1920
caatcgctcc gctgcgacgc aaacatcatt gttgaaacag catcggcgcg cgacccacac 1980
cacttcgccg ttttgctggg attcggcgcc acggctattt acccgtattt ggcatatgaa 2040
accctgggcc gtctcgttga tacgcacgcc attgcgaagg attaccgcac tgtcatgctc 2100
aactaccgta atggtattaa caagggtctg tacaagatca tgtctaaaat gggaatcagc 2160
accatcgcga gctatcgatg ttccaagctc ttcgaagctg tgggcctgca tgatgatgtc 2220
gtcggactct gctttcaagg agcagttagc cgtatcggcg gagcatcttt tgaagatttc 2280
cagcaggacc tcctgaacct ctcaaagcgt gcttggctgg cacgcaaacc tatttcgcaa 2340
ggtggcctcc ttaaatacgt ccacggtggt gaataccatg cgtataatcc ggacgtggtt 2400
cgcacgctgc aacaagccgt ccagtccggc gaatactctg attatcaaga gtacgctaag 2460
cttgttaacg aacgtccagc caccaccttg cgcgacctgt tggcaattac gcccggagaa 2520
aacgctgtca acatcgccga tgttgaacca gcatcagaac tgtttaaacg attcgatact 2580
gcagcgatgt caattggtgc actgtcccca gaagcgcatg aagccttggc cgaggccatg 2640
aacagcatcg gaggtaatag caactcaggt gagggaggag aggacccagc acgctacggt 2700
accaacaagg tctcccgcat caagcaagtt gcatcgggcc gcttcggcgt gactccggca 2760
tatctggtga acgctgacgt gattcaaatc aaagtcgcac agggagccaa gccgggcgaa 2820
ggcggtcaac tgccaggcga taaggtaact ccctacatcg cgaaattgcg ctattcggtt 2880
cctggagtca ccctcatttc tccgccaccc caccacgata tctacagcat cgaggatttg 2940
gcccaattga tcttcgactt gaaacaggtc aacccgaagg ctatgatctc tgtaaaactg 3000
gtgtccgaac ctggtgtggg aaccatcgca accggtgtag caaaggccta cgccgacctg 3060
attaccattg ctggctacga tggcggcaca ggtgcttccc cgctctcgtc cgttaagtac 3120
gcgggttgtc catgggagct gggcttggta gaaacccaac aagcactggt tgcgaacggc 3180
ctccgtcaca agattcgctt gcaggttgat ggcggtctca agacgggtgt ggatatcatc 3240
aaagctgcca ttctgggagc cgaatccttc ggatttggaa ccggcccaat ggtggcgttg 3300
ggttgcaagt acctccgcat ctgtcacctt aataattgcg ctaccggtgt ggctacccag 3360
gatgacaagc tccgaaagaa ccactaccat ggcctcccct ttaaagtgac gaactacttc 3420
gagtttatcg cacgagagac acgcgagttg atggcccagc tcggcgtcac ccgcctggtg 3480
gatttgatcg gacgtaccga cttgctgaaa gagctggatg gcttcaccgc aaagcagcaa 3540
aagctggccc tgtcgaagct cctcgagacg gcagagcctc acccaggaaa agcgctctac 3600
tgtaccgaaa ataaccctcc tttcgataat ggcctgctta acgcacaatt gctgcagcag 3660
gccaaacctt tcgttgatga gcgccagtcg aagacgttct ggttcgatat ccgtaacacg 3720
gatcgctccg ttggcgcctc cttgtccgga tatattgccc aaacccacgg cgatcagggc 3780
ttggccgctg acccgatcaa ggcctatttc aacggtaccg ccggacagag cttcggcgtc 3840
tggaatgccg gaggtgttga gctctacttg actggagatg ctaacgatta cgtaggcaag 3900
ggtatggcgg gcggcttgat tgcgatccga ccccctgtcg gctccgcctt ccgaagccat 3960
gaagcatcta tcattggtaa cacctgtctt tatggcgcaa cgggaggtcg tctctacgct 4020
gccggtcgtg ccggagaacg cttcggagtc cgaaactccg gcgcgattac agttgttgag 4080
ggaatcggtg ataatggctg tgaatatatg accggcggca tcgtttgcat cttgggcaag 4140
accggagtga atttcggtgc tggcatgacc ggtggcttcg cctacgtctt ggacgagtcg 4200
ggcgatttcc gaaaacgtgt taacccagag ctcgtcgaag ttctgtctgt agatgcgctc 4260
gctatccatg aggaacactt gcgcggactc atcactgaac atgtccaaca taccggcagc 4320
cagcgcggcg aagagatctt ggccaactgg tcgaccttcg cgactaaatt tgcactcgtg 4380
aaacccaaat cttccgatgt gaaggctctc ttgggtcacc gtagccgttc tgcagctgaa 4440
ctgcgcgttc aagcgcag 4458
<210> 84
<211> 1539
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 84
atgactgcgg gctccgcccc acctgttgat tacacctccc tcaagaagaa cttccagcct 60
ttcctgtcgc gccgagtcga gaatcgctca ctcaagtcgt tttgggacgc gtcggatatc 120
tccgacgatg tgatcgagtt ggcgggcggt atgcctaatg aacgtttctt ccctattgag 180
tcaatggacc ttaaaatttc caaagtgccg ttcaacgata accctaagtg gcacaattca 240
ttcactaccg cccacctgga cttgggctca ccgtcggaat tgcccattgc ccgctctttc 300
cagtacgcag agacgaaagg ccttcctcca ctgttgcact ttgtaaagga tttcgtttca 360
cgcattaacc gtccagcttt ttccgatgag accgaatcca actgggatgt tattctgtct 420
ggcggtagca acgactctat gttcaaggtt ttcgagacca tctgtgacga gtccacgact 480
gtcatgattg aagagttcac ttttactcct gccatgtcca acgtagaagc gaccggtgcg 540
aaggtgatcc cgattaaaat gaaccttact tttgatcgcg aaagccaggg cattgatgtt 600
gagtacctca cccaactgct ggacaattgg tccaccggcc cgtacaagga tctgaacaaa 660
ccacgcgtcc tttataccat cgccactgga cagaacccga ctggtatgtc tgtgccacaa 720
tggaaacgcg aaaaaatcta ccaacttgcc caacgccacg acttcttgat tgtcgaagac 780
gatccatatg gctacctgta ctttccatcg tacaaccccc aagagccatt ggagaatccc 840
tatcattcat ccgatctcac cacggagcgc tacctgaacg acttcttgat gaaatcattc 900
ttgaccctcg ataccgacgc acgtgtgatc cgtttggaaa ccttttctaa aatttttgcc 960
cccggcctcc gcctgtcttt cattgtagcc aacaaattct tgctgcaaaa gattttggat 1020
ttggcggaca tcaccacccg cgcgcctagc ggtacttccc aagcaattgt gtactccacc 1080
attaaagcca tggccgaatc caatttgtcc tcaagccttt ctatgaaaga agcaatgttc 1140
gagggctgga ttcgctggat catgcaaatc gcatctaagt ataaccaccg caagaacttg 1200
actctgaaag cactctacga gacggaatct tatcaggccg gccaattcac cgttatggaa 1260
ccgtccgccg gtatgttcat cattatcaaa attaattggg gcaattttga tcgccctgat 1320
gatctcccgc aacaaatgga tatcttggac aagttcttgc ttaagaacgg agtgaaggtg 1380
gtcttgggct acaagatggc cgtctgcccc aattactcta agcagaactc cgactttttg 1440
cgcctcacca ttgcctatgc tcgcgatgat gatcagctga tcgaagcaag caagcgtatc 1500
ggctccggaa ttaaggagtt tttcgacaac tataagtcc 1539
<210> 85
<211> 1362
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 85
atggacccat acatgatcca gatgtcctcg aaaggcaatc tgccatcaat ccttgatgtc 60
cacgttaacg taggtggtcg ctcatctgtc cccggcaaga tgaagggccg taaggcacgc 120
tggtccgtac gcccgagcga tatggcaaag aaaaccttta acccaatccg tgctatcgtt 180
gacaacatga aagtgaagcc taacccgaat aaaaccatga tttccctgtc gatcggagat 240
ccaactgtgt tcggcaacct cccaaccgat cccgaggtta ctcaggccat gaaagacgcg 300
ttggactcag gcaagtacaa tggatatgct ccttccatcg gatttttgtc tagccgcgaa 360
gagattgcat cttattacca ttgtccggaa gcccctcttg aggcaaagga tgtgattttg 420
acatccggtt gttctcaggc tatcgatctt tgtctcgcag tgctcgcgaa tcctggccaa 480
aacatccttg ttccacgtcc aggcttctcc ttgtataaaa cccttgccga atcaatggga 540
atcgaagtaa agctgtacaa cttgttgcca gagaaaagct gggaaatcga cctgaaacag 600
ctggaatacc ttattgatga aaagacagcc tgcctgatcg tgaataaccc atccaaccca 660
tgtggtagcg tgttctccaa gcgccatctc cagaagatcc tcgccgtggc tgcccgtcaa 720
tgcgttccaa tcctcgcaga cgagatctac ggcgacatgg ttttcagcga ttgtaagtac 780
gagccactgg cgacgttgtc aaccgatgtc ccgatcctga gctgtggagg tctggctaag 840
cgctggctgg taccaggttg gcgccttggc tggattctca ttcatgatcg ccgagacatt 900
ttcggaaatg agatccgcga cggtcttgtt aagctgtccc agcgcatctt gggtccttgt 960
acgattgtgc aaggtgcgct caaatctatc ctttgccgca ccccaggtga attctaccac 1020
aacactctct ctttcctgaa gtccaacgcg gatctttgct acggcgcgtt ggccgcaatc 1080
ccaggtttgc gccctgtccg accatccggc gccatgtacc tgatggtcgg tatcgaaatg 1140
gagcacttcc cagagttcga gaacgacgtt gaattcaccg agcgattggt ggctgaacag 1200
tccgttcact gcctcccagc aacctgcttt gaatacccaa acttcatccg tgtcgttatc 1260
accgtgccag aagtcatgat gctcgaagcg tgctcccgca tccaagagtt ctgtgagcag 1320
cactatcact gcgcagaggg ctcccaggaa gaatgtgata aa 1362
<210> 86
<211> 2040
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 86
atgactcagt ttactgatat cgacaagctg gcagtttcta ccatccgcat cctggcggtc 60
gacaccgtct caaaggcaaa ctccggccac cctggtgcgc ctctgggtat ggctccagcg 120
gcccacgtcc tttggtcaca gatgcgaatg aatccaacga atcctgattg gatcaaccgc 180
gaccgcttcg ttctctccaa tggacacgca gttgctttgc tgtactcaat gcttcatctc 240
accggttacg atctgagcat tgaagatttg aagcaattcc gccagctggg ttcccgcacc 300
cccggtcacc ctgagttcga attgcccggc gttgaagtta cgaccggccc acttggacaa 360
ggtatttcca acgcagtcgg aatggctatg gcgcaggcga atctggcagc gacctacaac 420
aaaccgggtt ttacactctc cgacaattac acttacgttt tcctgggcga cggatgcctg 480
caagaaggca tctccagcga ggcgtcctcc ttggcgggcc acctcaaact gggtaacctg 540
attgcaatct atgacgataa caaaatcact attgacggcg ccacttccat ctctttcgac 600
gaggatgttg caaagcgcta cgaggcatac ggttgggaag tactgtacgt cgagaatgga 660
aacgaagatc tcgcaggcat cgcgaaagct atcgcccaag ccaagctgtc caaggataag 720
cccactctga ttaaaatgac gaccaccatt ggatacggct ccttgcacgc gggttcacac 780
tctgttcatg gtgctccttt gaaagccgat gatgttaagc aactcaaatc taagtttggc 840
ttcaatcctg ataagtcatt cgttgttcca caggaagtgt acgaccacta tcagaagacc 900
atcctcaaac ccggagttga agccaacaac aagtggaata agctcttcag cgaataccag 960
aagaagtttc ccgagctggg agcggaactt gcccgtcgtc tcagcggtca actgcctgcc 1020
aattgggaat ccaagctgcc cacgtacact gccaaggaca gcgccgttgc gacccgtaaa 1080
ctgtccgaaa ccgtcttgga ggacgtctac aaccaattgc ctgagctgat cggtggctcc 1140
gcggatctta caccgagcaa tttgacccgc tggaaggaag cgctcgattt tcagcctccc 1200
tcgtctggca gcggcaacta ctccggccgc tacatccgtt acggtatccg cgagcacgcc 1260
atgggcgcca tcatgaacgg aatcagcgca ttcggtgcca attacaagcc ttacggtggc 1320
acgttcctga atttcgtgag ctatgccgct ggtgcagttc gtttgtctgc actgtccggt 1380
cacccggtca tctgggtggc aactcacgac tctattggcg ttggagagga cggtccgacc 1440
catcaaccga tcgagactct ggcccacttc cgaagcctcc ccaacattca ggtctggcgc 1500
ccagccgacg gaaacgaggt ctctgcagcc tacaagaaca gccttgagtc caagcacacc 1560
cctagcatca tcgcgctctc tcgccagaat ctgccacagc tcgagggctc ctctatcgaa 1620
tccgcgtcca agggcggtta cgttttgcag gatgtggcaa atccggacat cattttggta 1680
gcaaccggct ccgaagtctc cctgtcagtg gaggccgcaa aaacactcgc ggcaaagaac 1740
atcaaggctc gagtggtctc gcttcccgat ttctttacct tcgataaaca gcccctggag 1800
taccgtttgt ctgtgttgcc agacaacgtg cccatcatgt cagtcgaggt actcgcaacc 1860
acgtgttggg gtaaatacgc gcaccagtcc ttcggcatcg atcgcttcgg agcgagcggc 1920
aaggcacccg aggtctttaa gttttttgga tttaccccag aaggagttgc agagcgtgcg 1980
caaaaaacca ttgcattcta taagggtgac aagctgatct cgccgctcaa gaaggcgttc 2040
<210> 87
<211> 1005
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 87
atgtccgaac cagcccaaaa aaagcaaaag gttgctaaca attccctgga gcaactgaag 60
gcctctggta ctgttgtagt ggctgatact ggtgatttcg gttccatcgc caagtttcag 120
cctcaggatt ccactacaaa cccctccttg atccttgccg ccgctaagca accaacctac 180
gccaagctca tcgacgtcgc agttgaatac ggcaagaaac acggtaagac tacggaggag 240
caagtcgaga acgcggtcga ccgcctgttg gtggagttcg gcaaggagat ccttaaaatc 300
gttcccggcc gcgtctccac cgaagtcgat gcccgattgt cctttgatac ccaagccacg 360
atcgaaaagg cccgtcacat cattaagctc tttgagcagg aaggcgtttc caaagaacga 420
gtcctcatta agattgcgtc aacctgggaa ggcatccaag cagccaaaga gcttgaggag 480
aaggacggta ttcattgtaa tctgacgctg ctcttttctt tcgttcaggc tgtagcttgt 540
gcagaggcgc aggttactct catctcccca ttcgtaggtc gaatcctgga ttggtacaaa 600
tcttcaaccg gcaaggatta caagggcgag gctgaccctg gcgtcatctc cgtcaaaaag 660
atctataact actacaagaa gtatggctat aagaccatcg tcatgggcgc ctctttccgt 720
tccaccgatg aaattaaaaa ccttgctggc gttgactatc tgacgatttc ccccgcactc 780
ctggacaaac tgatgaattc aaccgaaccc tttccccgtg tcttggatcc tgtctcggcg 840
aaaaaggaag ccggcgataa aatttcatac atctctgacg agtctaagtt ccgttttgat 900
ctgaatgaag acgctatggc aaccgaaaaa ctgtcagaag gcatccgtaa gttctccgcc 960
gacatcgtta ccctttttga cctcattgaa aagaaagtga cagcc 1005
<210> 88
<211> 1002
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 88
atggcgaaaa tcgcaatcaa cggtttcggc cgaattggtc gcctggctct gcgccgcatc 60
ctcgaagttc cgggtttgga agttgtggca attaacgatc tgacggatgc taaaatgctt 120
gcgcatttgt ttaaatacga ctctagccag ggccgcttca atggagagat cgaagtgaaa 180
gaaggtgcct tcgtggttaa cggtaaagag gtgaaagtat tcgcagaagc cgacccggaa 240
aagttgcctt ggggcgattt gggcatcgac gtcgttctgg agtgcacggg tttctttacc 300
aagaaagaaa aggcagaagc ccacgtgcgt gcgggtgcta agaaggtcgt tatttcagcc 360
ccagcaggca acgacctcaa aaccatcgtg ttcaacgtaa ataacgaaga tctcgatggt 420
accgaaaccg tcatttcggg tgcctcttgc actactaact gtcttgctcc gatggcaaag 480
gttctcaacg acaaattcgg catcgagaag ggattcatga ctacgatcca cgccttcacg 540
aacgatcaga acactcttga cggacctcac cgtaagggtg atctccgtcg tgctcgtgcg 600
gcggcggttt cgatcattcc taatagcact ggcgccgcaa aggcaatttc gcaagtgatt 660
ccagacttgg ccggcaaact cgatggcaac gcgcagcgcg taccggtgcc caccggctcg 720
atcaccgaac tcgtgtccgt gctcaagaag aaggttacgg tggaagagat caatgcggct 780
atgaaggaag cagcagatga gtcgttcggc tatacagaag atcctatcgt tagcgcagac 840
gtggtgggca tcaactacgg atccttgttt gatgcaacct tgacgaagat tgttgatgta 900
aacggatccc agcttgtgaa aacggccgcg tggtacgata acgagatgag ctacacgtcg 960
caactcgtgc gtactctggc ctacttcgct aagatcgcga ag 1002
<210> 89
<211> 1188
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 89
atggcatccg tgacgttctc tgtgcccaaa ggcttcaccg agttctcagg ccttcgaagc 60
tcctccgcat cgctgccctt tggtaaaaaa cttagctccg acgagttcgt atccattgtt 120
tcctttcaaa cgtccgcaat gggctcctct ggcggctatc gaaagggcgt gaccgaagct 180
aaactcaagg tcgcaattaa cggtttcggc cgtattggac gcaactttct tcgctgttgg 240
cacggccgca aggactctcc attggatatc atcgctatca acgacaccgg aggcgtgaag 300
caggcgtcac accttttgaa gtatgattcc acgctcggta ttttcgatgc agatgttaaa 360
ccttccggcg aaacggctat ttctgtggat ggaaagatca tccaggtcgt ctcaaatcgc 420
aacccgtccc tgcttccctg gaaggaactc ggaattgaca tcgtgatcga gggcaccggc 480
gtttttgtcg atcgtgaagg cgccggtaag cacattgagg caggcgccaa aaaggttatt 540
atcaccgcac ccggtaaggg cgacatccca acctacgtgg ttggtgttaa cgcagatgct 600
tatagccacg atgaaccaat catttcaaac gcatcatgca ctaccaactg tctcgctcca 660
ttcgttaaag ttcttgacca gaagttcggt atcatcaagg gtactatgac aacgacccac 720
tcctatacgg gtgatcagcg cctgctcgat gcctcccacc gcgaccttcg ccgcgcacgc 780
gcagctgccc tcaacattgt accgacctcc acgggagcgg caaaggcagt cgcattggtt 840
ctgccaaact tgaaaggtaa actcaacggt atcgctctgc gtgttcccac tccaaacgtc 900
tctgttgtgg acctggttgt acaggtttcc aagaagactt tcgccgaaga agtcaacgcc 960
gcttttcgcg attccgctga gaaagaattg aagggcattc tggacgtgtg tgacgaaccc 1020
ctggtgagcg tcgatttccg ctgttccgac ttctccacta ctattgattc ctcgctcact 1080
atggtgatgg gagatgacat ggttaaggtc atcgcgtggt atgacaacga gtggggttac 1140
tctcaacgcg ttgtcgatct cgcagatatc gttgccaata actggaaa 1188
<210> 90
<211> 1122
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 90
atggccgcca tgatgcagaa gtccgccttc actggctccg cagtttcatc caagtcagga 60
gtccgcgcaa aggccgcacg cgctgtggtc gacgtccgtg cggaaaaaaa gattcgtgtc 120
gccatcaatg gtttcggacg tatcggtcgc aacttcttgc gctgctggca cggccgccaa 180
aacaccctcc tggatgtagt cgctattaac gattccggtg gtgtcaagca ggcgtcccat 240
ctgcttaagt acgatagcac ccttggtacg ttcgccgcgg atgtcaagat cgtggatgat 300
tcccacattt ccgttgacgg caaacagatc aaaatcgtgt cctcgcgcga cccactccaa 360
ctgccgtgga aggagatgaa cattgacctg gttatcgagg gtaccggagt attcattgac 420
aaggttggag ccggtaaaca catccaggct ggcgcgagca aggtgctgat cactgcccca 480
gccaaggata aagacatccc aaccttcgtt gtgggcgtaa acgaaggaga ttataagcac 540
gaatacccta ttatcagcaa tgcttcctgc accactaact gtctggcgcc atttgtcaag 600
gtgcttgagc agaaattcgg catcgtgaag ggaactatga ctaccaccca tagctacacc 660
ggcgatcaac gcctcttgga cgcatcccac cgagatctgc gtcgcgcacg cgctgcggcc 720
cttaacatcg tccctaccac caccggcgct gcgaaggccg tgagccttgt gctgccgtcc 780
cttaaaggca aactgaatgg cattgcgctg cgcgttccaa ctcccaccgt ctccgtcgtg 840
gatttggtgg tgcaggtgga gaaaaagaca ttcgccgagg aggtcaatgc tgcgttccgc 900
gaagccgcaa acggccccat gaaaggcgta ctccatgttg aagacgctcc gcttgtatcc 960
attgacttca aatgcactga ccagagcacc tccattgatg cgtccctgac catggtcatg 1020
ggagacgaca tggtcaaagt ggttgcgtgg tacgataacg agtggggata ttcccaacgc 1080
gttgttgatc tggcagaggt cacggctaag aaatgggtcg ca 1122
<210> 91
<211> 1008
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 91
atggccatta aggtggcgat caacggtttc ggtcgcattg gccgtcttgc gtttcgccgt 60
atccaggatg tggagggctt ggaggttgtg gccgtgaacg acctgaccga tgacgatatg 120
ctggcccacc ttctcaagta cgataccatg cagggacgct tcaccggaga agtggaggta 180
attgaaggtg gtttccgcgt gaatggaaag gagatcaaat cattcgatga accagatgca 240
ggaaagcttc catggggaga ccttgatatt gacgtggtgc tcgagtgcac cggtttctac 300
accgataagg agaaggcgca ggctcatatc gatgctggtg cgaagaaggt gctgatctca 360
gcaccagcaa agggtgacgt taagactatt gtcttcaaca ccaaccatga caccctggac 420
ggctcagaaa ccgtcgtcag cggagcatct tgtaccacaa acagcctggc gccggtggca 480
aaggttctct ccgatgaatt cggtctcgtc gagggcttca tgaccactat tcatgcatac 540
actggcgacc agaatacaca ggacgcgcca caccgaaagg gcgacaagcg acgagcacgc 600
gcagcagccg agaacatcat tcccaattcg acgggtgctg ccaaagctat cggcaaagtt 660
atcccagaga ttgatggcaa gctggatggc ggagcacaac gtgttccagt agcgacggga 720
tcacttacag aattgactgt ggttttggat aaacaagacg tgacggtgga ccaggtgaat 780
tctgctatga agcaggcgag cgacgaaagc ttcggctata ccgaagatga aatcgtctcc 840
tccgatatcg taggcatgac ctacggaagc ctgttcgacg cgacccagac ccgtgtcatg 900
acggtgggcg atcgccaact tgtgaaggtg gctgcctggt atgacaacga gatgtcctat 960
acggctcagt tggtccgcac cttggcacac ttggcggagc ttagcaag 1008
<210> 92
<211> 1248
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 92
atggctttcg ttgctccggt ttcttccgta ttctctacaa gctccaaatc cgctgtctgt 60
tccggccgct cttcgttcgc ccaattttcc ggcctgaaga aagtaaacaa taccgcacga 120
ctccagacgg cggagcaagg ctcggcattt ggaggcgtgt ctgatgcaaa cgatgcgttt 180
ttcaacgcag tgaacacaat gggagctcct gcacgaacaa gcaatgctcc gtccatgaag 240
gtccgagtgg ccatcaacgg cttcggccgc atcggccgca atttcatccg ctgttgggca 300
ggacgtaccg actcgaatat ggatgtcgtc tgcatcaatg atacctccgg cgtcaagacg 360
gccagccact tgctcaagta tgattcaatt ctcggcactt ttgacagcga cgtggtcgcc 420
ggagaggact ccattaccgt tgatggaaag accattaaag tcgtctcaaa ccgtaaccct 480
cttgaactgc cttggaaaga gatggaaatt gatatcgtgg ttgaggccac cggcgtgttc 540
gtcgatgccg tgggtgcagg aaagcacatc caggcgggtg ccaaaaaggt cttgattacc 600
gcacctggta aaggagaagg tgttggtacc ttcgttgtcg gcgttaatga tcatctctat 660
tcccacgata aattcgacat tgtcagcaac gcatcctgta caaccaattg catggcccca 720
tttatgaaag tgctggatga tgaattcggc gtggtgcgtg gcatgatgac tactactcat 780
tcgtacaccg gtgatcagcg tctgctcgat gcaggacacc gtgatctgcg tcgcgcgcgt 840
tctgccgccc tcaacatcgt tcccactacc accggtgctg cgaaagccgt cgcattggtt 900
gttccaactt tggctggtaa gcttaacggc atcgcgctcc gcgttcctac tccgaacgtt 960
tctgtgtgtg atgtggttat gcaggtcagc aagaaaactt tcaaggagga ggtcaatgga 1020
gctctcttga aagctgcgaa cggctcgatg aagggcatta tcaaatattc cgatgagccc 1080
cttgtgagct gtgattaccg tggaaccgac gaatcaacca tcatcgattc cagcctcact 1140
atggtgatgg gcgacgatat gcttaaggtg gtggcttggt acgacaacga atggggatac 1200
tcacaacgcg ttgtggatct cggcgaggtc atggcgagcc aatggaag 1248
<210> 93
<211> 1416
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 93
atgtcccaga acgtgtacca attcatcgac cttcagcgcg tcgatccacc gaagaaacct 60
ctcaagattc gcaagattga atttgtcgag atctacgagc ccttttccga gggtcaggcg 120
aaggcacagg ccgaccgctg cctctcctgc ggcaatccat actgcgaatg gaagtgtcca 180
gttcacaact acatcccaaa ttggcttaaa ctggcaaatg aaggacgcat cttcgaggct 240
gcggagctct cccaccagac caacacgctt ccagaagtat gcggacgtgt ttgccctcaa 300
gaccgtctct gcgaaggtag ctgcacgctt aacgatgaat tcggagccgt caccattggt 360
aatatcgagc gttacattaa cgacaaggcc ttcgaaatgg gatggcgccc ggacatgtcc 420
ggcgtgaagc aaaccggtaa gaaggtcgcg atcatcggcg cgggtccagc tggccttgct 480
tgcgccgatg tcctgacccg caacggtgtg aaagcagttg tattcgatcg ccatcccgaa 540
attggaggcc tgctcacttt tggcatcccc gcattcaaac tcgaaaaaga agtgatgacc 600
cgtcgtcgag agatttttac cggtatggga attgagttca agcttaacac tgaagtcgga 660
cgcgatgttc agctcgacga cctcctgtcc gactacgacg cagttttcct tggtgtcggt 720
acttaccagt caatgcgcgg tggtctggaa aatgaggatg cggacggtgt ttacgcagcg 780
cttccctttc ttattgctaa caccaagcag ctgatgggat ttggtgaaac tcgagatgaa 840
cctttcgttt caatggaagg aaagcgcgtt gtggttcttg gaggtggcga taccgccatg 900
gactgcgtgc gtacctccgt tcgacagggc gccaaacatg tcacctgtgc ataccgccgt 960
gacgaggaaa acatgcccgg ttcacgacgt gaggtgaaaa acgcccgcga agaaggtgtt 1020
gagttcaagt tcaacgtgca gccacttggt attgaggtga acggtaacgg aaaggtctcc 1080
ggagttaaga tggtgcgtac cgagatgggt gaaccagacg caaagggtcg tcgccgcgcc 1140
gagatcgtcg cgggatcgga gcatatcgtg ccagctgacg ctgtaatcat ggcatttggt 1200
ttccgcccac acaatatgga gtggctggcg aagcattccg tggagctcga tagccagggc 1260
cgtatcattg cacctgaggg ttcggacaat gcctttcaga cctccaaccc aaaaatcttc 1320
gctggcggcg acattgtgcg tggctcagat cttgttgtga ccgcaatcgc tgagggtcgt 1380
aaggcagctg acggtatcat gaattggctc gaagtc 1416
<210> 94
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 94
atggcagaag cctctattga gaaaacacag attctgcaga aatatcttga attggatcaa 60
cgtggtcgaa tcattgctga gtatgtttgg attgatggca ccggtaacct gcgctccaag 120
ggccgcaccc tcaagaagcg cattacatcc attgaccagt tgcccgaatg gaactttgat 180
ggctcaagca ccaaccaggc cccaggtcac gactctgata tctatctcaa gccagttgct 240
tattacccgg acccattccg ccgcggtgat aacatcgtcg tgttggctgc ttgctacaac 300
aacgatggaa ctcccaacaa attcaaccac cgacatgaag cagcgaagct gttcgccgcc 360
cacaaagacg aagaaatttg gttcggactt gaacaggaat acacgctgtt tgatatgtat 420
gatgatgtgt acggttggcc taagggaggc tacccagctc cacaaggtcc atactattgc 480
ggcgtcggcg cgggaaaggt gtacgctcgc gatatgatcg aagcacatta ccgcgcctgt 540
ttgtacgctg gccttgaaat ctccggtatc aacgcagaag tgatgccatc ccagtgggag 600
ttccaggtgg gtccgtgtac cggcattgac atgggagatc agctgtggat ggcccgctac 660
ttccttcatc gcgtcgcaga agaattcggt atcaaaatct ctttccatcc aaaacccttg 720
aaaggcgact ggaacggtgc gggttgtcat actaatgtat ccaccaagga gatgcgtcaa 780
ccgggaggca tgaagtacat cgagcaagct atcgaaaagc tcagcaaacg ccacgcggaa 840
cacattaaac tgtatggctc cgataacgac atgcgcctga ctggtcgcca tgagacggct 900
tccatgactg catttagctc cggtgtggcc aaccgtggct ccagcatccg aattcctcgt 960
agcgtggcaa aggaaggata tggttacttt gaggatcgac gcccagcatc caacatcgat 1020
ccttacctcg tcacaggcat tatgtgtgag accgtctgtg gagcaatcga caacgcagac 1080
atgaccaagg aatttgagcg tgagtcgtcg 1110
<210> 95
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 95
atgtctgaaa gcccgatgtt tgccgcgaat ggcatgccaa aggttaatca aggcgcagag 60
gaagatgttc gtatcctcgg ttacgatcca ctggcatcac ctgctctgct ccaagttcaa 120
attccggcga cccctacctc cttggagacc gcgaaacgcg gtcgccgcga ggcaatcgat 180
atcatcaccg gtaaagatga ccgcgtcctg gttattgtcg gcccatgctc catccacgac 240
ctggaagctg cgcaagaata tgccctccgt ctcaagaagc tgagcgacga actgaaagga 300
gacttgtcga ttatcatgcg cgcatacctg gagaagccac gtaccaccgt cggttggaaa 360
ggactgatca acgacccaga tgtcaataat acgttcaaca tcaataaagg actccagtcg 420
gctcgtcagt tgttcgtcaa cctcaccaac atcggtttgc caattggtag cgaaatgttg 480
gatactatca gcccaaagta ccttgccgac ctggtgtcgt tcggcgctat tggcgcccgt 540
actaccgaat cccaactcca ccgcgaactg gcctcaggcc tttctttccc tgttggcttc 600
aagaacggca ctgatggcac gttgaacgtt gcagtcgacg catgtcaggc agctgcccat 660
agccaccact ttatgggcgt tacaaaacac ggtgttgcgg ccatcaccac aacaaagggc 720
aacgaacact gctttgttat tttgcgcggc ggcaagaagg gtacaaacta cgatgcgaaa 780
tctgtggcag aagcaaaggc ccaactccct gcaggctcaa acggtctcat gatcgactac 840
tcccatggta actcgaataa agactttcgt aatcaaccca aagtcaacga cgtggtctgc 900
gagcagatcg ccaatggaga gaatgcaatc acaggtgtga tgatcgaatc aaatatcaat 960
gagggtaacc aaggaatccc agctgaaggt aaggcaggcc tcaaatacgg tgtgtccatt 1020
accgatgcat gtattggatg ggaaactacc gaggatgtgc tgcgcaagct cgcggccgca 1080
gttcgccagc gccgcgaggt gaacaaaaaa 1110
<210> 96
<211> 1050
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 96
atgaattatc aaaatgatga ccttcgtatc aaagaaatca aggagttgtt gcccccggta 60
gctttgcttg agaagtttcc cgcaaccgaa aatgctgcta ataccgttgc acacgcacgc 120
aaggctatcc ataagatttt gaagggcaac gacgatcgtc tgctcgtcgt catcggtcct 180
tgctcaattc acgacccggt tgctgccaaa gaatatgcca cccgtttgct ggcgctgcgc 240
gaggaactca aggacgaact ggagatcgtg atgcgagttt attttgaaaa accccgcact 300
accgtgggct ggaagggcct cattaatgac ccccacatgg ataactcgtt tcaaatcaac 360
gatggtcttc gcatcgcgcg caagctgctc ctggacatca atgattctgg tctgccagca 420
gccggcgaat tcctcaatat gatcaccccg caatacctgg ccgatctgat gtcgtggggt 480
gccatcggag cacgcacgac ggagtcacag gtacatcgcg agctggcatc cggtctgagc 540
tgcccagtcg gttttaaaaa cggcacggat ggcactatca aagtggcaat cgacgcaatc 600
aacgccgccg gagcacctca ctgttttttg agcgtaacta agtggggaca cagcgcgatt 660
gttaacacct ccggtaacgg cgactgtcac atcatcttgc gaggtggtaa agaaccaaac 720
tactcggcga aacacgtcgc agaagtcaag gagggtttga acaaagctgg cttgccggcc 780
caggtgatga ttgacttctc tcacgccaac agctcgaaac aatttaagaa gcaaatggat 840
gtctgcgcgg atgtctgcca acaaatcgca ggaggtgaaa aggcgattat tggtgtgatg 900
gttgagagcc acctggtgga aggcaaccaa tccctcgaga gcggtgagcc tctcgcctac 960
ggtaagtcca tcacggatgc gtgtattggc tgggaggaca cggatgcact cctccgtcag 1020
ctggcaaatg ccgttaaggc gcgtcgcggc 1050
<210> 97
<211> 1050
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 97
atgaactatc agaacgatga cctccgcatc aaggagatta aagagctgct ccctcctgtt 60
gcgctgttgg aaaagttccc agcgacggag aacgccgcga acaccgtcgc ccacgctcgc 120
aaagctattc acaagatttt gaagggcaac gatgaccgtc tcctggttgt cattggccca 180
tgttcgattc atgatcctgt ggcggccaag gaatacgcga cgcgtctgct tgccctgcgt 240
gaagagctta aggacgaact cgaaatcgtg atgcgcgtat atttcgagaa accacgcact 300
accgttggat ggaagggcct catcaatgat ccgcatatgg ataatagctt tcaaatcaat 360
gatggcttgc gcatcgctcg caagctcctc cttgatatta acgattccgg cctgccagct 420
gcgggtgaat tcttggatat gatcactctg caatacctgg cggacctgat gtcttggggc 480
gccatcggag cccgtaccac cgagtcccaa gtccatcgcg agctggcatc cggtctgtcc 540
tgcccggtcg gtttcaagaa cggaactgat ggtactatca aggtggccat cgacgctatt 600
aacgccgcag gagcgccgca ttgctttctc tcagtgacca agtggggtca ctccgccatc 660
gtcaatacat ctggcaatgg cgactgtcat atcatccttc gcggaggcaa agagcctaac 720
tattcggcta aacacgtggc agaagttaaa gaaggcctca acaaggccgg actgccagcc 780
caagttatga ttgatttttc acacgctaac tcctcaaaac agtttaagaa gcagatggac 840
gtttgcgcag atgtttgtca acaaatcgcg ggtggcgaaa aggcgatcat tggagttatg 900
gtggaaagcc acctggtgga aggcaaccaa tctctggagt ctggagaacc gcttgcatac 960
ggtaagagca ttaccgacgc atgcattggc tgggaagata cggacgcgct gctgcgacag 1020
ctcgcgaatg ctgttaaggc ccgacgcggt 1050
<210> 98
<211> 1068
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 98
atgcagaaag atgccctgaa caaagtgcac atcaccgatg agcaggtact tatgaccccg 60
gaacagctca aagcagcatt ccccttgagc cttcaacaag aagctcagat tgcagattcc 120
cgcaagtcga tttccgacat tattgccggt cgtgatccgc gactgctcgt ggtgtgcggc 180
ccatgctcca ttcacgatcc cgagaccgcc ctcgagtacg ctcgacgctt taaggccctt 240
gcggcagagg tatccgattc attgtatctg gtgatgcgcg tgtactttga aaagccgcgt 300
accaccgtgg gctggaaagg cttgatcaac gatccacaca tggatggctc attcgatgtt 360
gaagctggcc tgcaaatcgc ccgcaagctc ctgctggaat tggtgaacat gggtctgccc 420
ctcgcgactg aggccttgga tccaaactca ccacaatacc tgggtgacct cttttcctgg 480
tctgcgatcg gtgcacgcac caccgaatcc cagacccacc gcgagatggc gtctggactt 540
tctatgccag tgggcttcaa gaacggaact gacggttccc tggcaacagc gattaacgcg 600
atgcgcgcgg cggcacaacc gcatcgtttt gtgggcatca accaggcagg ccaggtagcc 660
ctgctgcaaa cccagggaaa tccggatggc cacgtcatcc tccgcggagg caaggctccg 720
aattactctc cagccgatgt tgcccaatgc gaaaaagaaa tggaacaagc cggtctgcgc 780
ccttcgttga tggtcgattg ctcccacggc aattccaaca aagactatcg tcgccagcca 840
gctgtcgcag aatccgttgt cgcacagatc aaagatggca atcgctccat cattggcctt 900
atgatcgaat ctaatatcca cgagggcaat caatcgtctg aacagccgcg ctccgaaatg 960
aaatatggcg tctccgtgac cgacgcgtgc atttcctggg agatgaccga tgcgctcctc 1020
cgcgaaatcc accaagatct taacggccaa cttactgctc gagtggcc 1068
<210> 99
<211> 1347
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 99
atgtccaata ccacatggtc tcctacctca tggcactcct ttaaaattga acagcaccca 60
acctacaagg acgaacagga acttgaacgc gtgaagaaag aacttcgctc ctatcctcca 120
cttgtattcg ccggtgaggc gcgcaacctc caagaacgtc tcgcacaagt gattgacaac 180
aaggcattcc tcctccaggg tggcgattgt gccgagtcat tttcccagtt cagcgcgaat 240
cgcattcgcg atatgttcaa ggtcatgatg caaatggcga tcgttctgac cttcgctggt 300
tctatcccca tcgttaaggt gggccgaatc gcgggccaat ttgctaaacc tcgatcgaat 360
gccaccgaga ttctggacga cgaggaagtt ttgtcgtacc gcggcgatat tatcaatggc 420
atctcaaaga aggagcgcga accgaaacca gagcgcatgc tcaaggcgta ccatcaaagc 480
gtggcaacgc tgaacctgat ccgcgcattt gcacaaggtg gtctggccga ccttgaacag 540
gttcaccgct tcaacctgga tttcgtgaaa aacaacgatt tcggtcaaaa ataccaacaa 600
attgctgatc gcattactca ggcgctgggc ttcatgcgcg cttgcggcgt ggaaatcgaa 660
cgcactccta ttttgcgtga agtcgaattt tacacctctc acgaggcatt gcttctccac 720
tacgaagaac ctctggtacg caaggactcc ctcactaacc aattctacga ttgttccgcc 780
catatgcttt ggattggtga acgaacacgc gacccaaaag gcgctcacgt ggaattcttg 840
cgcggtgtat gtaaccctat tggtgtgaaa attggcccta atgcgagcgt gtccgaggtt 900
cttgagctgt gtgatgtgct caacccgcac aacttgaaag gccgtttgaa tctcatcgta 960
cgcatgggat ccaaaatcat caaagagcga cttccgaagc tgctgcaggg tgtactcaaa 1020
gagaaacgcc acattctgtg gtctattgat ccaatgcacg gaaacaccgt gaaaaccaac 1080
ctgggtgtga agacccgtgc tttcgactcc gtgcttgatg aagttaaatc attcttcgaa 1140
atccaccgtg cggagggttc cctggcatcc ggcgtccacc tcgagatgac gggtgaaaac 1200
gttacggaat gcattggcgg ctcgcaggcg atcaccgaag agggcctgag ctgccattac 1260
tatacgcagt gcgatccccg cctcaacgcg acccaagcat tggaacttgc ctttcttatc 1320
gctgacatgc tcaaaaaaca acgtacc 1347
<210> 100
<211> 828
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 100
atgtggcgtt ggctcccagt tgcgggattt aaaggtgtta aactcgccct gaagtcagag 60
gagcgtcgcg agaccgtcgt ggaggttgaa ggtgtgcgta ttggaggtgg ttctaaggca 120
gtaattgcag gtccttgttc tgttgaatcc tgggaacagg tgcgcgaagc cgcattggcg 180
gtcaaggaag ccggcgctca catgctgcgt ggcggcgcat tcaaaccacg tacctcgccc 240
tactccttcc agggtttggg tttggagggc ctgaagcttt tgcgccgcgc aggagatgag 300
gccggcctgc ccgttgtaac tgaggtattg gacccgcgcc acgtggagac agtttcccgt 360
tatgcggaca tgctgcagat cggtgcacgc aacatgcaga atttcccctt gctgcgtgaa 420
gttggtcgct ccggtaaacc agttcttttg aaacgcggct tcggcaatac tgtggaagaa 480
ctcctcgctg ctgctgaata tatcttgctc gaaggcaatt ggcaggttgt gctggtcgaa 540
cgaggaatcc gcaccttcga gccgtcaacc cgctttaccc tcgacgtagc tgcggtggcg 600
gtgttgaagg aagcaaccca tttgccagtg attgttgatc cctcgcaccc cgcgggacga 660
cgctctttgg ttcctgcgct ggctaaagcc ggcttggccg ctggcgccga tggtcttatc 720
gtcgaagtgc accctaatcc agaggaagct ttgagcgatg caaaacagca gttgaccccc 780
ggcgaattcg cgcgcttgat gggagaactg cgttggcatc gtttgctc 828
<210> 101
<211> 1875
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 101
atgagcgagt ccctctccaa ggatcttaac ttgaatgcgc tgttcattgg cgataaagcc 60
gaaaacggtc agatctataa ggcgctgctt aacgaactcg tggatgagca cttgggatgg 120
cgccagaatt acatgcctca agacatgcca attattacac cggaggaaaa gtcttcagca 180
tccttcgaac acacggtgaa caagacaaag gacgtattga gcgagatctc cgcacgtatg 240
cgaactcatt ccgtcccttg gcacaatgcc ggtcgatatt ggggccacat gaactcggag 300
accctgatgc cttcccttct ggcctacaac ttcgccatgc tttggaacgg taataacgtg 360
gcttatgaat catcacctgc aacctcacag atggaggaag aggttggcat ggaattcgca 420
aagctcatga gctacaaaga tggctgggga cacatcgtgg cagacggttc cctggcaaac 480
cttgaaggct tgtggtacgc gcgtaacatc aaaagccttc ctttggccat gaaggaggtg 540
accccagaac tcgtggctgg caaatccgac tgggaactta tgaacctctc taccgaggag 600
atcatgaatc tgctggattc tgtcccagag aaaatcgatg aaattaaagc gcactcagcc 660
cgttcgggta agcacttgga gaaattgggt aagtggctgg ttcctcagac taagcactac 720
tcctggttga aggcagctga tatcatcggc atcggtcttg atcaagttat ccccgttccg 780
gtcgatcaca actatcgcat ggatattaat gagctcgaaa aaattgttcg tggccttgct 840
gctgaaaaga ctcctattct gggtgtggtc ggcgttgttg gttctaccga agaaggcgca 900
attgacggaa ttgacaagat cgtggctctt cgccgtgtgc tggaaaagga tggtatttac 960
ttctacctgc atgtcgacgc cgcttacggc ggatacggtc gcgccatttt tctcgatgag 1020
gacaacaatt ttatcccctt tgaagacctc aaagacgtcc actataagta caatgttttt 1080
accgagaaca aggactacat tcttgaggaa gtgcactcgg cgtacaaggc gattgaggaa 1140
gcagagtccg taactatcga ccctcacaag atgggctacg tcccttattc cgcaggaggc 1200
atcgttatca aagacattcg catgcgtgat gtaatctctt actttgcaac ctacgtattt 1260
gaaaagggcg ccgacatccc ggctctgctt ggtgcgtata tcctggaggg ttctaaggca 1320
ggcgcaactg ccgcgtccgt gtgggctgct catcatgtat tgccactgaa cgtcacgggt 1380
tacggtaaat tgatgggcgc ttccatcgaa ggcgcgcacc gcttctataa cttcctgaac 1440
gacttgtcct ttaaagtagg cgataaagag attgaagttc accccttgac ctacccggat 1500
tttaatatgg tcgactacgt cttcaaagaa aagggaaatg atgacctggt ggctatgaat 1560
aaactcaatc acgatgtcta cgattactct tcgtacgtaa aaggctccat ctacggcaat 1620
gaattcctca cctctcatac cgatttcgcc attccggatt acggaaattc ccctcttcag 1680
ttcgttaatc agttgggctt ctcggatgag gaatggaacc gagctggcaa ggtgaccgtt 1740
ctccgcgcat ccgtcatgac cccatacatg aataaggaag aacacttcga agaatacgct 1800
gagaaaatca aagcagccct ccaagaaaaa cttgaaaaga tctacgctga tcagctcctt 1860
gctagcgagg ctaaa 1875
<210> 102
<211> 1530
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 102
atggacgcca ctaacatctc ggcctctgaa caagagaaaa ttctgggcaa tctctggaaa 60
gccgcgcaag gcccgggtga aggccacgtc ctgccgactg tggatcagct caaccgcgcc 120
cgcgcaagcc tttataattc cttgcctgag gagggcgtcg gctatcagtc ggttcagcgc 180
cacattctgg acgatatcgt cccagccttc aatggcggct ccatcaatcc aaactattac 240
ggctttgtga caggcggtgt aaccccagcg gctctgttcg cagatgcggt tgtgtccgca 300
tacgatcaga acgtccaagt tcatctgcag tcccactcaa tcgtcactga cgtcgagttc 360
aagaccttgg gcctcctgct ccagcttctc aagcttgacg tcccatcgtg gttgaacggc 420
acctttacta cgggcgccac cgcgtctaac atcattggct tggcatgtgg ccgagaattc 480
gtcatccaga aggcggctca gcgtaagggc tctccgatca aatccaccgc agatgctggt 540
cttcacgaag tcctgcaatc gattggagct tccggcatcc aggtcctgtc caccctcccg 600
cactcgtcac tggtcaaggc agccggagtc ctgggcatcg gtcgtatgaa cgttcgcgat 660
atctctactg aagctaaccc attggatatc gaccttaaga agctccagac ggagctctca 720
cgtgtcgatg tcgtgtcgat tgttgccatt agctgtggcg aggtcaactc cggacgtttc 780
gcatccgcgg gactgcatga attgcgtaag atccgccaac tctgcgaccg ccatggcgcc 840
tggctccacg ttgacggcgc tttcggaatc tttggccgct tggttggtga tgacacggaa 900
tttatggcta ttaaggaggg atgtgatggt attgagctgg cagactctat caccggagac 960
gcccacaaat tgctgaatgt tccgtacgac tgcggcttct tcttctgccg ccacgcctct 1020
attgcacgag aagtgtttca aaacgccaac gcagcttatt tggcttcagt tgacggccgc 1080
gattccttta ttccgtcccc actgaacatc ggaattgaga actctcgccg ctttcgcgct 1140
cttcctgtgt atgcgtcgtt gctggcctac ggtgaagtgg aataccgaaa gatgcttcat 1200
cgccagattc gcttggcccg tatgatctac ggctggatct tcgaccatcc gggatacacc 1260
gcactcccag aaaccacctc tcgtgaggaa ctgcttgatt tgacttacat ggttgtgctc 1320
ttccgtgcca aagatggcgg attgaaccga acgctcgaag ccaaaattaa cgcgacgtca 1380
cgaatgtttg tttctggcac ctcctgggcc gacgcaccgg cctgccgcat tgcaatctca 1440
aactggcgcg ttgatgaaaa gcgtgacttt gccctcgtca ccggtgtgtt ggagtccgcc 1500
ttgcgctcaa gcggtagcgc agtctcttgt 1530
<210> 103
<211> 1089
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 103
atgctgaata agggcttggc ggaagaagaa ttgttttcct ttctctctaa aaagcgtgag 60
gaagacctct gccactcaca cattctctcg tccatgtgta ccgtgcccca cccgattgcg 120
gttaaagcac acctcatgtt catggaaacc aacttgggcg acccaggcct tttcccgggc 180
accgcgtcac tggagcgcct gttgattgaa cgccttggtg acctgttcca ccaccgcgag 240
gcaggtggct acgctacctc cggtggaaca gaatctaata tccaagctct gcgaattgca 300
aaagcacaga aaaaagtgga caagcccaat gtggtgatcc ccgagacttc ccatttctcg 360
ttcaagaaag cttgtgatat tctgggtatt caaatgaaaa ctgtgcccgc tgatcgctct 420
atgcgcacgg atatctctga ggtctcagat gctatcgaca agaatactat cgccctcgtg 480
ggaattgccg gctccaccga gtatggtatg gtcgacgata tcggtgcact ggcgacaatc 540
gcagaagagg aggacctcta cctgcatgtc gatgccgcgt tcggaggcct ggtgatcccg 600
tttcttccaa atcctcccgc gtttgatttc gcgcttccag gcgtgtcgag cattgcggtg 660
gatcctcaca agatgggcat gtctactttg cctgctggcg ctctgctggt ccgcgagccg 720
cagatgctgg gcctgttgaa tatcgatacc ccgtacttga cggtgaagca ggagtataca 780
ctggcaggca cgcgcccggg tgcatccgtg gccggcgcac tggcagtctt ggactacatg 840
ggccgcgatg gaatggaggc ggtggtcgcg ggttgcatga aaaacacttc ccgcctcatc 900
cgaggtatgg agacacttgg atttcctcgt gcggtgacac cagatgtaaa tgtcgccacg 960
ttcatcacta accacccggc cccaaagaac tgggtcgtgt cccagactcg ccgcggacat 1020
atgcgaatta tttgcatgcc acatgtcaca gctgacatga ttgagcaatt cctgatcgac 1080
attggtgaa 1089
<210> 104
<211> 1152
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 104
atgggaatgg atatttcatc acgcccagtg gagtgggcgt ctctctctga gattaccgct 60
agcgacgtct cattcgaggg cggcgctatc tttaattcga tctgcacgcg cccgcacccc 120
ctcgcagccc aggttatggc cgataacctt caccttaacg cgggagatgg ccgtttgttc 180
ccgtctgtcg cccgttgcga atccgaaatt acgaacttcc tgggcggcct gatgggcttg 240
ccccgcgccg tcggcatgtg cacatctggc gcaaccgaag caaacctcat tgctgtccac 300
tccgcgattg agaattggcg ccgcaaaggc ggacagggtc gcccacaagt tatcctgggt 360
cgtggtggtc acttctcctt cgacaaaatc tctgttctgt tgggcgtcga gttggtcctg 420
gcatggtcag atatcgacac tcttaaggtc gatccagaat ctgtgtcaga actgattagc 480
ccacgtactg cgctcatcgt tgccacagcg ggctcgagcg aaaccggtgc agtcgatgac 540
gtggagtggc tgagccgcgt ggcactgtct aagggtgtcc ccctgcacgt ggatgccgca 600
tccggtggct tgctgatccc cttcctccgc gatttgggtg gagctctccc tgatatcggt 660
tttcgtaatg acggtgtaac caccatcgcc atcgatccac ataagtttgg ctccgctcca 720
attccgtcag gccacctggt cgcacgcgaa tggacttgga tcgagggcct gcgcaccgag 780
tctcattatc agggaacggc ccgccacttg accttcctcg gtactcgctc cggaggctca 840
attctcgcaa cctatgcact gttcggccac cttggtgaaa aaggattgcg cggcatggct 900
gaacagctca aggcgctccg ctcccacctg gtcgaccgtc tccgcaaggc tggagctacc 960
ttggcctacg tccctgaatt gatggtggtg gctctcaagg cggattctga tgcggtcaaa 1020
gtactggaac gccgcggcat ctttacctca tacgcgaaac gcttgggtta tctccgcatt 1080
gttgttcagc tgcatatgtc tgaaggccaa gtggacggct tggtcgatgc tctcctcatg 1140
gaaggaattg tt 1152
<210> 105
<211> 1542
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 105
atgggatcta tcgacaacct taccgagaaa ttggcctccc aattccctat gaatacactt 60
gaaccagagg agtttcgccg ccaaggacac atgatgatcg acttcttggc cgattattac 120
cgtaaggttg aaaattaccc cgttcgctcg caagtttcgc ctggatatct gcgcgaaatc 180
cttcctgaat ccgcacccta caaccctgaa tcacttgaaa ccatcctgca ggacgtccaa 240
acaaaaatca ttccgggcat tacgcactgg cagtctccaa acttcttcgc ttattttcct 300
tcctctggca gcaccgcagg attcctgggc gagatgctgt caaccggctt caacgtagtg 360
ggatttaatt ggatggtatc tccagcggct acggaactgg aaaacgttgt caccgattgg 420
tttggaaaaa tgctccaact tccaaaatcc tttcttttct caggcggtgg aggcggtgtg 480
ctgcagggca ctacctgtga agcaattctg tgtactctgg ttgccgcccg cgacaagaac 540
ctccgccaac atggcatgga taacattgga aaacttgtcg tgtactgttc cgatcaaacg 600
cactccgccc tgcagaaggc tgccaaaatt gcgggtatcg atccgaaaaa ttttcgcgcg 660
attgaaacaa ccaagtcttc aaacttccag ttgtgcccaa aacgcctcga atccgcgatc 720
ctccatgatc tgcagaacgg tttgattcct ttgtacctgt gcgccaccgt gggaaccacc 780
agcagcacaa ccgttgaccc tctcccagca ctgaccgaag tggcgaaaaa gtatgatctg 840
tgggtgcacg ttgacgcggc atacgcgggt tcagcgtgca tctgccctga attccgacag 900
tacttggacg gtgtggagaa cgctgattcg ttcagcctga acgcccacaa gtggttcctg 960
accaccttgg actgctgttg cctctgggtc cgcaatcctt ccgcccttat caagtcgttg 1020
tccacttacc cggaattcct gaagaacaat gcatccgaga ccaataaggt cgtggattat 1080
aaagactggc agattatgct gtctcgccgt ttccgcgcac ttaagctttg gttcgtactg 1140
cgttcctacg gcgttggcca actgcgcgag tttatccgcg gtcacgttgg aatggcaaag 1200
tactttgaag gtctggtcaa catggacaag cgctttgagg tcgtagctcc tcgcctcttc 1260
agcatggtgt gtttccgcat taagccatcc gcaatgatcg gtaagaatga cgaagatgag 1320
gtgaacgaga tcaatcgcaa gcttctcgaa agcgtgaacg actcaggccg tatctacgtg 1380
tctcacactg tgctgggtgg tatctacgtg attcgctttg cgattggcgg tacccttacc 1440
gatatcaatc acgtgtctgc agcttggaaa gtactgcaag accacgcggg cgctctgctt 1500
gatgatacct tcacatccaa caaactcgtg gaggttctgt cc 1542
<210> 106
<211> 1551
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 106
atggaacgaa accacctcaa agattctgtc ggcgtacagg tggacgatgg tcactcgaag 60
gagctctggg aaaccgcgct caatccacca cgtcgatctg tactgccacc ggccgcatcc 120
ctggctcaca gccgctcatc aattatcacg gaactgccac atgctggaca aggttacaca 180
caaaccaaag tgcatctgtt taatgatatc atcccaggct tgaacgattg tgccatcaac 240
gctaactatt acggtttcgt caccggtgga gtcaccccgg cagcactgtt ggcagacaat 300
gtcgtaagcg tttacgatca aaacgtttgc gttcacctgg ttgaccactc cgtagcaacg 360
gacgtcgatt acgcggccct gtgcctgttg aaagatctct tcggtcttaa gcgcgatgaa 420
tggccacacg gcatcttcac caccggcgct accgcgtcta accttgttgg actcgcgtgt 480
ggtcgagagt atgtgctccg caaagcggcc cagaagcgcg gcctgtcagg caatatcgca 540
tccggcaaca ttaccgactc ggtcggagaa tacggtatgc cagcagttct ggaggcagct 600
ggtttgaaag gtctccaagt tttgagcacc atgccacact cttccgtagg caaagtcgca 660
ggcatcctcg gcatcggtcg cgccaacgtt aaatctattg tttccaagac cggagaatcc 720
cacggccagc cactcgagtt cgacttcgaa ttgttcgaaa aagaattggc acgcgccggc 780
tttgcttcaa ttgtttccat cagctgcggt gaagtcaata ctggccgctt tgcaacaaag 840
ggtgtggatg agttccgccg tgtacgcgca ctgtgtgata aatataatgc gtggctccac 900
gtcgatgctg cgttcggcat gttcggtcgc gttttggacg attcccccga gtttgagact 960
attaagaaag gttccgaagg catcgaattg gctgattcga tcaccggtga tggtcacaaa 1020
ttgctgaacg tcccttacga ttgcggcttc ttcttctcac gccatggcga catcgctgaa 1080
gaggttttcc gcaatcccaa cgcggtttat ttgagctctt ccgcgggcga gcacatcccg 1140
actccgctga atattggcgt ggagaattct cgccgctttc gtgctctccc agtttattca 1200
accctcgtgg cttatggcaa ggatggctac cgcgctatgg tggaacgcca gattcgcctc 1260
gcacgcctga tcactggttg gttgcacgag catcctaagt acaccgtgct gggcggcggt 1320
gcatctaaag aagatttgat cgctgctact tatgtaatcg tgctttttcg tgcgaaggat 1380
gaagctctca atgcacgcct cgcatctgct attaatggta ccggaaagat gtttgtctct 1440
ggcaccaagt gggctggtga accagcctgc cgcgtagcta tcagcaactg gaaggtccaa 1500
gtggaacgtg acttcacctt ggtaaaggag gtcttggatg aggtctcgcg c 1551
<210> 107
<211> 1443
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 107
atgcccgact tggaaccgga tgaattccgc cgccaaggtc accagctggt ggattgggtt 60
gctcgatacc gaacctcact gccgtccctg cacgtccgcc cgaaggtggt gccaggaagc 120
gtaaaggccc aactgcctcg agagctgcca gaacagccat ctcaagcgct cggagatgat 180
ttgatcgctc tgttgaacga cgtagtcgtg ccatcctcac tccactggca gcatcccggc 240
ttcttcggct acttcccagc gaacgctagc cttctctccc tgctcggcga tattgcgtcc 300
ggcggcattg gcgcgcaggg aatgctgtgg tccactagcc ctgcaggtac cgagattgaa 360
caggtgctcc ttgacggctt ggccgatgca ctgggtctgg gtcgtgagtt caccttcgcg 420
ggtggtggag gcggctcgtt gcaggactct gcctccagcg cttcattggc ggcactcctc 480
gcggctctgc aacgcagcaa tcccgactgg cgcgaacacg gcgtcgatgg aacagaaact 540
gtttacgtga ctgctgagac tcattcgagc ctggctaagg ccgtgcgcgt tgcaggtctc 600
ggcgcgcgcg ctttgcgaat tgtgcccttt acacaaggaa ctttgtcgat gtcggccgat 660
gcgctcgcag atatgctggc aaaggatact gctgctggca aacgccctgt gatggtttgt 720
ccgaccgtag gcaccactgg caccggtgcc atcgatccgg ttcgagaagt agcactcgcc 780
gcgcgcacct atgaagcgtg ggttcacgtg gatgcggctt gggctggcgt cgcagccctt 840
tgcccggaat ttcgctggct tcttgacggt gtcaatctcg tggactcatt ttgcaccgac 900
gcgcacaagt ggttctacac cgcatttgac gccagcttca tgtgggttcg tgatgcacgc 960
gcgttgccaa ccgctctctc aattaccccg gagtacctgc gtaacgccgc gaccgaatcc 1020
ggagaagtca ttgattaccg tgactggcag gtccctcttg gccgccgcat gcgcgctctc 1080
aagatctggt ccgttgtaca tggcgcaggc ctcgaaggct tgcgtgagtc gattcgcggc 1140
cacgtggcca tggccaatag cctggcggga cgcattgaat ccgaaagcgg cttcgctctc 1200
gcaacccctc cgtcccttgc tctggtctgt ctgtacttgg tggaccaaga gggacgccct 1260
gacgatgctg ccaccaaggc ggcaatggaa gccgtcaacg cggaaggtca ctcattcttg 1320
actcatacca gcgtcaatgg acatttcgcc attcgcgtgg caatcggcgc taccaccacg 1380
ctccccgatc acatcgatac tctgtgggac tctttgtgta aagcggcgcg ccagtcaggc 1440
ggt 1443
<210> 108
<211> 1410
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 108
atgacgccgg aacagttccg ccagtatggt caccaactta tcgacttgat tgcggattac 60
cgccaaaccg tgggcgaacg accagtgatg gctcaggtgg aaccgggcta cctcaaagcc 120
gcgcttccgg cgaccgctcc gcagcagggc gaaccattcg ccgcgattct tgatgatgtc 180
aacaatcttg ttatgcctgg cctgagccac tggcaacacc ctgacttcta cggctacttc 240
ccatctaatg gtactctgtc atctgtgttg ggcgacttcc tgtccaccgg cctgggcgtg 300
cttggcttgt cgtggcaaag ctccccggca cttagcgaac tggaggaaac aaccctggat 360
tggttgcgac aactcctggg tctgtcagga cagtggtctg gtgtgattca ggacacagca 420
tctacatcca cgctcgtggc cctgatttct gcacgagagc gtgccaccga ctacgctctg 480
gtgcgcggcg gcctgcaggc tgagccaaag ccattgatcg tttatgtttc cgcgcatgct 540
cactccagcg tggataaagc ggcactcctg gcaggattcg gccgcgataa catccgcctg 600
atcccgacgg acgaacgcta cgccctccgt cccgaggctc tgcaagcggc aatcgagcag 660
gatctcgcgg cgggtaacca gccatgtgca gtggtcgcta ccaccggaac aaccactacg 720
accgccctgg atcccctccg ccctgttggc gaaatcgctc aggccaatgg actctggctc 780
cacgtcgata gcgccatggc aggatccgca atgatcctgc cggaatgtcg ctggatgtgg 840
gatggcatcg aactggctga ttctgttgta gttaacgccc acaagtggct gggagtcgcg 900
tttgactgct ccatttatta cgtgcgcgac ccacagcacc tgattcgagt gatgagcacc 960
aacccctctt acctccagtc cgccgtggat ggtgaggtga aaaacctgcg tgattggggc 1020
atcccgttgg gacgtcgctt ccgcgcgctg aaactttggt ttatgctccg ctcagaagga 1080
gtggacgctc ttcaggctcg cttgcgtcgt gacttggata acgcgcagtg gctcgcagga 1140
caggtggaag cagcggctga atgggaggtt ctggctccag tacagttgca gaccttgtgt 1200
attcgccacc gacctgccgg tcttgaagga gaagcgttgg acgcccacac aaaaggctgg 1260
gccgagcgtt tgaacgcatc tggtgcggca tacgtcacac cagccaccct tgacggacgt 1320
tggatggtgc gcgtgtctat cggagccctg cctactgaac gtggtgatgt gcagcgcctg 1380
tgggcacgac ttcaggacgt tatcaaagga 1410
<210> 109
<211> 1725
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 109
atgactggcc acatgacacc tgaacagttc cgccagcatg gtcatgaagt ggtcgattgg 60
attgcagatt actgggaacg aatcggttcg tttcccgtgc gtagccaggt ctctcccggc 120
gacgtgcgcg cttcactgcc acccaccgcg cccgagcaag gcgaaccatt ctctgcagtt 180
cttgccgacc tggaccgcgt ggtgctgccg ggcgttaccc actggcaaca tccaggtttt 240
ttcggttact tccccgcaaa cacatccggc ccctccgttt tgggagattt ggtatctgca 300
ggcctgggag ttcagggtat gtcgtgggtc acctcccctg cagcgactga actggagcaa 360
cacgtgatgg attggtttgc ggaccttctc ggccttccag aaagctttcg ctcgacgggt 420
tccggaggcg gagtggtgca agattcctct tctggtgcaa acttggtggc cctgttggcg 480
gcactccacc gcgcttccaa aggcgctact ctccgccatg gtgtccgccc cgaagatcat 540
acagtgtatg tctcggcaga gacacacagc tcgatggaga aggccgctcg catcgcagga 600
cttggaaccg acgctattcg cattgtggaa gtgggtcccg atctggcaat gaatccacgt 660
gcgcttgccc agcgcctcga gcgcgatgtg gctcgtggtt acacgcccgt gctggtttgt 720
gcaaccgtgg gcaccacgag caccactgca attgaccctc tggcggaact cggtcctatt 780
tgtcagcagc acggcgtttg gctgcatgtg gacgccgcgt atgcgggcgt gtccgcggtg 840
gcccctgaac ttcgcgcctt gcaagcagga gttgagtggg cagattccta tacgacagat 900
gcccacaagt ggctgctgac cggcttcgac gcaacgttgt tctgggtggc agaccgcgca 960
gctctcaccg gcgcgttgtc catccttcct gaatatctcc gcaacgccgc gaccgatact 1020
ggcgccgttg ttgattaccg cgattggcag attgaattgg gccgtcgatt ccgtgcgctt 1080
aaactctggt ttgttgtgcg ttggtacggt gcagagggct tgcgcgagca tgtccgctca 1140
cacgtcgccc tcgctcaaga actggctggc tgggcagatg ctgatgagcg ttttgatgtc 1200
gcggcccctc atcctttttc gctggtatgc ctgcgtcccc gttgggcccc cggcattgat 1260
gcagacgtcg caacgatgac gctcctggac cgcttgaacg acggtggcga ggtgtttctg 1320
actcatacaa ccgtggatgg cgcggctgtt ttgcgtgtcg cgattggcgc cccggccact 1380
acacgcgaac acgtcgagcg tgtgtgggcc ctcctcggag aggcacacga ttggttggct 1440
cgcgacttcg aggagcaggc ggccgaacgc cgcgctgcgg aactgcgcga acgagaagca 1500
gctgaggagc agctgcgcgc tcgacgcgag gcagaagctg ccgcggctgc cgctaccgaa 1560
gctccagtcg aaccagcggc ggaagagccg gaacagctcg tcgtgccacc tgtggaggtc 1620
ccagctgtcg aaaccccagc agcttgggat gaatcggcga ctcaggtggc cgcacagact 1680
gatctccacg cggatccagc accccaacca gctgatggac aaggc 1725
<210> 110
<211> 1554
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 110
atgggttcac tgccagccaa caatttcgaa tccatgtcgc tgtgttccca aaatcccctt 60
gatccagatg agttccgacg ccagggtcac atgattatcg atttcttggc tgactattat 120
aagaacgttg aaaagtatcc agtccgtacc caagtcgacc ccggttactt gaaaaaacgc 180
cttccagaat cggctccata caatcccgag tctatcgaaa ccattcttga ggatgtgact 240
aatgatatca tcccaggact gactcactgg cagtccccca actatttcgc gtattttccg 300
tcgagcggct ccattgccgg atttcttgga gaaatgctgt caaccggctt caacgtggtt 360
ggtttcaact ggatgtcctc accagcagcc accgagcttg agagcatcgt catgaactgg 420
cttggccaga tgctcacctt gccaaagtcc tttctcttct cctccgatgg ttcctctggt 480
ggaggcggtg tcctccaggg cacgacctgc gaagcaatcc tttgtaccct gaccgccgcg 540
cgagataaga tgctcaacaa gattggacgt gaaaacatta acaagttggt agtctatgct 600
tcagatcaga cccttagcgc gcttcaaaaa gctgcgcaga ttgctggcat caaccccaag 660
aacttcttgg ccatcgcaac ctcaaaagct accaacttcg gactctctcc taactcgctt 720
cagagcacca tcctggctga tatcgagtca ggcttggttc ctttgttcct gtgtgccaca 780
gtgggtacta ccagctccac cgcagtggac ccaatcggcc cactgtgcgc cgttgctaag 840
ctccacggca tttgggtgca tatcgatgct gcgtacgccg gtagcgcatg catttgccct 900
gaatttcgcc atttcatcga tggagtggag gatgccgatt ctttctcact taacgcacac 960
aaatggttct ttaccactct cgattgttgt tgtctgtggg taaaggatag cgacagcttg 1020
gttaaggctc tctccacatc gcccgagtat ctgaagaata aggccacgga ttccaaacag 1080
gtcattgatt acaaggattg gcaaatcgct ctttcccgtc gcttccgcag catgaagctg 1140
tggctggtgc tgcgctccta cggaatcgcc aatctccgta cctttctgcg tagccacgtt 1200
aaaatggcca agcacttcca aggcctcatt ggaatggaca atcgctttga aattgttgta 1260
ccacgtactt ttgcaatggt atgcttccgc ctgaagcccg cagcaatctt tcgcaagaaa 1320
attgttgaag acgatcacat cgaagcgcag accaacgagg tgaatgcaaa gcttcttgag 1380
tccgtgaacg cctcaggaaa gatttacatg actcacgcgg tggtaggagg agtatatatg 1440
attcgcttcg ccgtgggtgc cactctgacc gaagaacgcc acgtgaccgg cgcatggaag 1500
gtggttcagg aacacacgga cgcaatcctg ggcgcgttgg gcgaggacgt ttgc 1554
<210> 111
<211> 1254
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 111
atgaagcaga ttcctgctaa gggtttggaa cgtgacgtca tcatgcagga gctgcgccaa 60
atgaagtctt tggactttga ttggcgcgcc ggtcgtgtgc cttcctacac ctatttcgtt 120
gatgacgaaa cccttgatgt gcaacgtgaa gcttacggag aatacattgc agagaacggc 180
ctgggtgccg gccgcgcgtt caaatcgctc gaactgatga cggacgatat taaaagcatg 240
gctatttccc tgtttaatgc cccggcagct gccggtgcat cgttcacctc tggcggcact 300
gaatccattt ttatggccgt aaagacagca cgagacctta cacgccaccg acgcggcgaa 360
cctgacggac gctataacat tgtggcctgc gaaaccgcac acccttgtct ggataaagcc 420
ggtcaattgc tgggagttga tattcgccgc accccgcaca ctgctgagtt ccgagcagat 480
ccagcactct tgcgaacttc gatcgatcaa aagaccatga tgctgtttgc atctgcacca 540
aactacccat tcggtacttt cgatcctatc tccaagattg gccgcttggc ccaggagcgc 600
gatttgcgtc tccacgttga tggctgctgg ggaggcttcc tgagcccatt cgctgagcgc 660
ctgggctacc ccatcccgga atgggatttt cgtgtaccag gagtttctag cctgtccgct 720
gatattcata aattcggtta cgccgctaag ggagcatctg ttgtcttgta ccgcgatgtc 780
gaagatcagg aacacgaacg cttttctttc tccggctggc ctcgtggcac ctacagcacc 840
ccgaccttcc tcggaaccaa ggccggcggc gcaatcgcct cggcatgggc tgtaatgcat 900
ttcctcggag ttgaaggcta cctgcgtgca gccaagctga ccatggatgc caccatgcaa 960
ttgattgaag gcctcaatgc cattccagat atctactgtc ttacgccaaa cggtgagtct 1020
aacctcatct ccttcgctac ttccgatccg aaacttgata tttacgcagt agcagaccgc 1080
ctcgaggagt gtggttggct gcgaggacgt atgcgcgaac ccaaggccat ccagcaggga 1140
gtgaatcctg cacacttggc tacagttacc gagtacctgg ccgaagtgcg caaggcaatc 1200
gatcatgtcc gcggtaacgt cgctgccccc gtggcctacg atgagcactc ctac 1254
<210> 112
<211> 1593
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 112
atgggttctc ttaatacaga agatgttttg gagaatagtt cagcatttgg tgtaactaat 60
ccccttgatc ctgaagaatt cagaagacaa ggacatatga tcatagattt tcttgctgac 120
tattatagag atgtggagaa atatccggtg agaagtcaag tggagcccgg ttatttaaga 180
aaaagactgc cagaaaccgc cccgtacaat ccagagtcca tcgagaccat attacaagat 240
gtaacaactg agattattcc aggtctaacc cattggcaaa gtcctaacta ttacgcctac 300
tttcctagct ccggtagcgt cgccggcttt cttggtgaaa tgttatccac cggtttcaat 360
gttgttggat tcaattggat gagttcacca gccgctactg aattagaatc cgtggttatg 420
gactggtttg gaaaaatgtt gaacctgccg gagtcatttc ttttctctgg aagtggtggt 480
ggcgtgttgc agggtactag ttgtgaagca attttatgca ctttgacggc agcaagagat 540
agaaagctta ataaaattgg tagagagcat atcggtagat tagtagtcta cggatcagac 600
cagactcatt gtgctttaca aaaggctgca caagtcgctg gcatcaatcc taagaatttc 660
agagcgatta agacgtttaa agaaaactcc tttggtttga gcgcagcaac tctaagagaa 720
gtgatcctag aggacatcga ggcagggttg ataccactgt ttgtttgccc tacagtgggg 780
accacttcta gcaccgccgt tgatcctata tctccgatct gtgaagtagc taaagaatac 840
gaaatgtggg tacacgtaga tgcagcttac gctgggtcag cctgtatttg cccagagttt 900
agacatttta ttgatggtgt cgaagaagcg gacagttttt ctcttaatgc tcataagtgg 960
tttttcacta ctttggactg ttgttgtttg tgggttaagg atccatctgc tctagttaaa 1020
gccctatcca ccaatccgga gtatttgaga aataaggcaa cagaatcaag acaagtcgta 1080
gattataaag actggcaaat agccctgtcc agaaggttca gatcattaaa gttatggatg 1140
gttctgagga gctatggcgt caccaatttg agaaattttt tgagaagcca cgtcaagatg 1200
gcaaagactt ttgaaggact gatctgtatg gatggtaggt ttgaaataac tgttcccagg 1260
acttttgcaa tggtttgttt tagattgctg cccccaaaaa caataaaagt atatgataac 1320
ggcgtgcatc aaaacggtaa cggggtagtt cctttgagag acgagaacga gaacctggtt 1380
ttagcgaata aactaaatca ggtttacctt gagactgtta acgctacggg atctgtatat 1440
atgacacatg ccgttgtagg tggcgtgtac atgatccgtt ttgctgtggg atccacccta 1500
acggaagaaa ggcatgtgat ctacgcttgg aaaatattac aagaacacgc cgacttgatt 1560
ttaggtaaat ttagtgaagc agacttttct tca 1593
<210> 113
<211> 1491
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 113
atggaaggag tgggaggtgg tggaggcggc gaggagtggc tgcgccccat ggatgccgag 60
cagctgcgtg agtgcggaca ccgaatggtt gacttcgttg ctgattacta caaatccatc 120
gaagcattcc cagtgctgag ccaggtccag cccggatacc ttaaggaagt tctcccggac 180
tcagcccctc gtcaacccga taccttggac agcctcttcg atgatattca gcagaagatc 240
atccccggtg tgacccattg gcaaagcccg aactacttcg cttattatcc cagcaactcg 300
tcgactgcag gttttctggg cgaaatgctg tccgcagcat tcaacatcgt cggcttttct 360
tggatcacga gcccggccgc aaccgaattg gaagttattg tcttggattg gttcgctaag 420
atgttgcagc ttccatccca gtttttgagc accgctctcg gcggcggcgt catccagggc 480
acggcatccg aagccgttct cgtggccctc ttggctgccc gtgatcgcgc gcttaaaaaa 540
cacggcaaac attccctgga aaagctcgtc gtgtatgcat ccgaccagac gcattccgcc 600
ctccagaagg cttgccaaat tgcaggtatt ttctccgaaa atgtccgtgt ggtcatcgcc 660
gattgtaaca agaactacgc ggtggccccc gaagctgtct ctgaggcact tagcatcgac 720
ttgtcgtccg gacttatccc ctttttcatt tgtgcaactg tgggcacaac ctcttcctcc 780
gccgttgatc cattgccaga gctcggtcag attgccaaga gcaatgacat gtggttccac 840
atcgacgcag cgtacgctgg ctccgcatgt atctgtccag aatatcgtca ccacctgaat 900
ggcgtggaag aggctgattc gttcaatatg aatgcccaca agtggtttct gactaacttt 960
gattgttccc tcttgtgggt taaagaccgt tcatttctga tccaatctct gtccaccaac 1020
cctgagttcc tgaaaaacaa ggccagccag gccaactccg tcgtggactt caaagactgg 1080
cagattcctc tgggtcgccg cttccgctct ttgaagttgt ggatggttct tcgactctat 1140
ggagtggata accttcaatc gtatatccgc aagcacatcc acctcgccga gcattttgaa 1200
cagctccttc tgtcagactc ccgctttgaa gttgtcaccc cacgaacctt cagccttgtc 1260
tgctttcgtc ttgtgccacc aacgtccgat cacgaaaatg gtcgcaagct taactacgat 1320
atgatggatg gcgttaacag ctccggtaag atctttttga gccacactgt attgtcgggc 1380
aaatttgtac tccgcttcgc agttggcgct ccattgactg aggaacgcca cgttgatgcg 1440
gcatggaagc tgctccgcga cgaagcgacc aaagttttgg gaaaaatggt c 1491
<210> 114
<211> 1188
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 114
atgagaaata tgcaagagaa aggtgtctcc gaaaaggaaa ttttagagga gttgaagaaa 60
tataggtcat tggacttaaa gtacgaggac ggtaacattt ttggtagtat gtgttctaac 120
gtattaccaa tcaccaggaa aattgtagat atctttcttg aaactaattt gggtgaccca 180
ggtttattca aaggtactaa gttattggaa gaaaaggctg ttgctttgtt gggttcttta 240
ttaaataaca aagatgccta tggccatatc gtttccggtg gtacagaagc taatttgatg 300
gcccttaggt gtattaaaaa tatctggagg gagaagagac gtaagggtct gtctaagaac 360
gagcacccca aaattatcgt tcctattaca gctcatttta gtttcgaaaa aggtagagaa 420
atgatggatc ttgaatacat ctatgctccc ataaaagaag actataccat tgacgaaaag 480
tttgttaagg atgctgtcga agattatgac gtcgacggca ttatcggtat tgcagggact 540
acagaattgg gtactattga taatatcgaa gagctatcta aaattgctaa agaaaataac 600
atatacatcc atgttgatgc ggcatttggt ggactggtta tccctttttt ggatgataaa 660
tacaaaaaaa aaggagtgaa ttataaattt gatttctcat taggtgtaga ttctataaca 720
atcgacccac ataagatggg ccattgtcct ataccttctg gtggcatcct atttaaggat 780
attggttata aacgttattt ggacgtcgat gccccatatt taactgagac cagacaagcc 840
accattttgg gtacgagagt tggattcgga ggcgcgtgta cttacgctgt tttaagatac 900
ttagggagag aaggtcagcg taaaatagtt aacgaatgta tggaaaatac cctatacctg 960
tacaaaaaat taaaagagaa taattttaaa ccagtgatcg aaccaattct taatatcgtc 1020
gctattgaag atgaggacta caaagaagtt tgtaaaaagt taagggacag gggcatatat 1080
gtcagcgtat gtaattgtgt aaaagcttta aggatagtag ttatgccaca catcaaaagg 1140
gagcatattg ataattttat tgagattttg aattccatca agagagat 1188
<210> 115
<211> 1110
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 115
atgtcggaaa gcccaatgtt cgccgccaac ggcatgccaa aagttaatca gggcgccgaa 60
gaggacgtcc gcattttggg ctatgatccc ctcgcctccc ccgcactcct gcaagtacag 120
attcccgcca ccccgacctc tttggaaacc gcgaagcgcg gccgccgaga agcgattgat 180
attatcaccg gcaaggatga ccgagtactc gttatcgtcg gtccctgctc gatccacgac 240
ctcgaagccg cgcaggagta tgcattgcga ttgaagaagc tgtctgatga gttgaagggt 300
gatctttcga ttattatgcg tgcgtacctg gaaaagcctc gcaccaccgt gggttggaag 360
ggattgatca atgatcctga cgtaaacaac accttcaaca tcaataaggg cctccaatct 420
gcccgccagc ttttcgttaa cctcactaac attggccttc ccatcggctc cgaaatgctc 480
gatacgatct cgccgaaata cctggccgat ttggtgtcct ttggtgcaat tggtgcccgt 540
accaccgaat cacaactgca ccgcgaattg gcaagcggat tgagcttccc cgtgggtttc 600
aaaaacggta ctgatggcac tcttaacgtg gccgtcgatg catgtcaagc cgccgcacac 660
tcccaccatt tcatgggtgt gactaaacac ggagtggcgg cgattactac caccaagggt 720
aatgagcact gcttcgtcat cctgcgtggc ggaaagaagg gtaccaacta cgacgcaaag 780
agcgtcgctg aggccaaggc ccaattgcca gcaggttcca atggccttat gatcgattat 840
tcccacggca attctaataa ggactttcgc aaccaaccga aggtgaatga tgtggtatgt 900
gagcagatcg cgaatggtga aaatgcgatc actggcgtga tgatcgaatc gaatattaat 960
gagggcaacc agggaattcc tgcggaggga aaggcgggtt tgaagtacgg cgtatctatt 1020
actgacgctt gcattggctg ggagaccacc gaggacgtgc tgcgcaagct tgcagcggcg 1080
gtccgccagc gtcgtgaagt taataaaaaa 1110
<210> 116
<211> 1050
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 116
atgaattacc agaacgacga ccttagaatt aaggaaataa aagagttgct acctcccgtc 60
gcgctgttgg aaaaattccc cgccacagaa aatgctgcta atacggtcgc acatgctaga 120
aaggctattc ataaaattct gaaaggtaat gatgatagat tattggttgt tattggtcca 180
tgttctatac acgaccccgt agccgcaaaa gaatatgcta ccagactttt agctttacgt 240
gaagagttga aagatgaact tgaaattgtc atgcgtgtgt acttcgaaaa accgagaacg 300
accgttggtt ggaagggctt aatcaacgac ccacatatgg acaactcttt ccagatcaat 360
gatggcctaa ggatcgcacg taaacttcta ttagatatta atgattcagg acttcccgct 420
gcaggagaat tccttaatat gattactcct cagtatctag ccgacttaat gtcctggggt 480
gccatcggtg cgagaacgac agaaagtcaa gttcacaggg aactggcctc cggtttgtcc 540
tgtccagttg gtttcaagaa cggtacagat ggtaccatca aagtcgcaat tgacgccata 600
aacgccgccg gagctccaca ctgctttttg agcgtcacta aatggggaca ctcagccata 660
gtcaacactt caggtaacgg tgattgtcat attattctta gaggtggcaa ggaacctaac 720
tactccgcca aacatgttgc tgaagttaaa gaaggtctta acaaggcggg tcttccggcc 780
caagtgatga tagattttag ccatgccaac agctctaagc aatttaaaaa acaaatggat 840
gtttgtgctg atgtttgtca acaaatcgcg ggtggggaga aagcgatcat tggtgtaatg 900
gtcgaaagcc acttggttga aggcaaccaa agtttagaat ctggagagcc cttagcgtat 960
ggaaaaagca tcacagatgc gtgtataggt tgggaagaca ctgacgcctt actaagacaa 1020
ctagctaatg cagttaaggc ccgtagaggg 1050
<210> 117
<211> 1050
<212> DNA
<213> Artificial
<220>
<223> Codon-optimized and/or mutated sequence
<400> 117
atgaattacc agaacgatga tctccgcatc aaggaaatca aggagttgct cccaccggtg 60
gctctgttgg agaagtttcc agctactgag aatgctgcca acactgttgc tcacgctcgc 120
aaagcaatcc acaaaatcct caaaggcaat gatgaccgtc tgttggtcgt tatcggacca 180
tgctccattc atgaccccgt ggctgctaaa gaatacgcga cccgactctt ggctctgcgc 240
gaggagctca aggacgaact ggagattgtg atgcgcgtgt acttcgaaaa gccacgcacg 300
actgtgggat ggaaaggact gatcaacgac ccgcacatgg acaactcctt ccaaatcaac 360
gatggtcttc gcattgctcg caaacttctg ttggacatca acgattcagg actgcccgca 420
gcaggcgaat tccttaacat gatcacccct cagtacctgg ctgacctgat gtcctggggt 480
gcaatcggtg cgcgtacgac cgaatcccaa gttcatcgcg aactggcgtc aggtctctcc 540
tgcccggttg gcttcaaaaa cggaaccgac ggaacaatca aggtcgcaat tgacgccatc 600
aatgcggcag gcgccccgca ctgtttcttg tcggtcacca aatggggcca cagcgcgatc 660
gtcaatactt caggtaatgg tgattgccac atcatccttc gaggaggtaa ggagccgaac 720
tactccgcaa agcatgtcgc agaggtcaag gagggtctga acaaagctgg cctgcctgcg 780
caggttatga ttgatttctc tcacgcaaac agctcaaagc agttcaagaa gcagatggat 840
gtttgcgccg atgtgtgcca gcagattgcc ggaggcgaaa aggcaattat tggtgtaatg 900
gttgaatccc acctcgttga gggcaaccaa tccctcgaat ccggtgagcc gctggcctat 960
ggcaagtcca tcaccgatgc ctgtatcggt tgggaggaca ccgatgcact gcttcgccaa 1020
cttgctaacg ccgtgaaagc tcgtcgcggt 1050
<210> 118
<211> 1113
<212> DNA
<213> Saccharomyces cerevisiae CEN.PK2
<400> 118
atgagtgaat ctccaatgtt cgctgccaac ggcatgccaa aggtaaatca aggtgctgaa 60
gaagatgtca gaattttagg ttacgaccca ttagcttctc cagctctcct tcaagtgcaa 120
atcccagcca caccaacttc tttggaaact gccaagagag gtagaagaga agctatagat 180
attattaccg gtaaagacga cagagttctt gtcattgtcg gtccttgttc catccatgat 240
ctagaagccg ctcaagaata cgctttgaga ttaaagaaat tgtcagatga attaaaaggt 300
gatttatcca tcattatgag agcatacttg gagaagccaa gaacaaccgt cggctggaaa 360
ggtctaatta atgaccctga tgttaacaac actttcaaca tcaacaaggg tttgcaatcc 420
gctagacaat tgtttgtcaa cttgacaaat atcggtttgc caattggttc tgaaatgctt 480
gataccattt ctcctcaata cttggctgat ttggtctcct tcggtgccat tggtgccaga 540
accaccgaat ctcaactgca cagagaattg gcctccggtt tgtctttccc agttggtttc 600
aagaacggta ccgatggtac cttaaatgtt gctgtggatg cttgtcaagc cgctgctcat 660
tctcaccatt tcatgggtgt tactttgcat ggtgttgctg ctatcaccac tactaagggt 720
aacgaacact gcttcgttat tctaagaggt ggtaaaaagg gtaccaacta cgacgctaag 780
tccgttgcag aagctaaggc tcaattgcct gccggttcca acggtctaat gattgactac 840
tctcacggta actccaataa ggatttcaga aaccaaccaa aggtcaatga cgttgtttgt 900
gagcaaatcg ctaacggtga aaacgccatt accggtgtca tgattgaatc aaacatcaac 960
gaaggtaacc aaggcatccc agccgaaggt aaagccggct tgaaatatgg tgtttccatc 1020
actgatgctt gtataggttg ggaaactact gaagacgtct tgaggaaatt ggctgctgct 1080
gtcagacaaa gaagagaagt taacaagaaa tag 1113
<210> 119
<211> 1110
<212> DNA
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 119
atgttcatta aaaacgatca cgccggtgac aggaaacgct tggaagactg gagaatcaaa 60
ggttatgatc cattaacccc tccagatctg cttcaacatg aatttccaat ttcagccaaa 120
ggtgaggaaa acattatcaa ggcaagagac tccgtctgtg atattttgaa tggtaaagat 180
gatcgtttag ttatcgtgat cgggccatgt tccctacatg accccaaagc cgcttacgat 240
tacgctgaca gattggctaa aatttcagaa aagttgtcaa aagacttatt gattattatg 300
agagcgtatt tagaaaaacc aaggactacc gttggctgga aagggttgat taacgaccct 360
gatatgaata actcttttca aatcaataaa ggtctacgga tttcgagaga aatgttcata 420
agactggttg aaaaattacc cattgctggt gagatgttgg ataccatttc tccgcagttt 480
ttgagtgatt gtttctcctt gggtgccatc ggtgctagaa ctactgaatc ccaactgcac 540
agagaattag catccggtct atctttccct attggattta agaacggtac tgatggtggt 600
ttgcaagtcg ccatcgacgc tatgagagcc gctgcacatg atcattactt cctttctgtc 660
acaaagccag gtgtcactgc tatcgtgggc actgaaggta acaaggatac cttcctgatc 720
ttgagaggtg gtaagaacgg tactaacttt gacaaagaaa gtgttcaaaa tactaagaaa 780
caattagaaa aggccggttt gactgacgat tcacagaaaa gaatcatgat cgattgttca 840
cacgggaaca gtaataaaga tttcaagaac caaccgaagg ttgccaaatg catttatgac 900
caactgacgg aaggtgaaaa tagtctttgt ggtgttatga ttgagtccaa cataaatgaa 960
ggtagacaag atattcctaa agaaggtggc agagagggat tgaagtatgg ttgttctgta 1020
acggatgctt gtattggttg ggagaccacc gaacaggtat tggagctatt ggccgaaggt 1080
gttagaaaca gaagaaaagc cttgaagaaa 1110
<210> 120
<211> 1110
<212> DNA
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 120
atgagtgaat ctccaatgtt cgctgccaac ggcatgccaa aggtaaatca aggtgctgaa 60
gaagatgtca gaattttagg ttacgaccca ttagcttctc cagctctcct tcaagtgcaa 120
atcccagcca caccaacttc tttggaaact gccaagagag gtagaagaga agctatagat 180
attattaccg gtaaagacga cagagttctt gtcattgtcg gtccttgttc catccatgat 240
ctagaagccg ctcaagaata cgctttgaga ttaaagaaat tgtcagatga attaaaaggt 300
gatttatcca tcattatgag agcatacttg gagaagccaa gaacaaccgt cggctggaaa 360
ggtctaatta atgaccctga tgttaacaac actttcaaca tcaacaaggg tttgcaatcc 420
gctagacaat tgtttgtcaa cttgacaaat atcggtttgc caattggttc tgaaatgctt 480
gataccattt ctcctcaata cttggctgat ttggtctcct tcggtgccat tggtgccaga 540
accaccgaat ctcaactgca cagagaattg gcctccggtt tgtctttccc agttggtttc 600
aagaacggta ccgatggtac cttaaatgtt gctgtggatg cttgtcaagc cgctgctcat 660
tctcaccatt tcatgggtgt tactaagcat ggtgttgctg ctatcaccac tactaagggt 720
aacgaacact gcttcgttat tctaagaggt ggtaaaaagg gtaccaacta cgacgctaag 780
tccgttgcag aagctaaggc tcaattgcct gccggttcca acggtctaat gattgactac 840
tctcacggta actccaataa ggatttcaga aaccaaccaa aggtcaatga cgttgtttgt 900
gagcaaatcg ctaacggtga aaacgccatt accggtgtca tgattgaatc aaacatcaac 960
gaaggtaacc aaggcatccc agccgaaggt aaagccggct tgaaatatgg tgtttccatc 1020
actgatgctt gtataggttg ggaaactact gaagacgtct tgaggaaatt ggctgctgct 1080
gtcagacaaa gaagagaagt taacaagaaa 1110
<210> 121
<211> 1500
<212> DNA
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 121
atgactttac ctgaatcaag agacttttct tacttgtttt cggatgaaac caatgctcgt 60
aaaccatccc cattgaaaac ctgcatccat cttttccaag atcctaacat tatctttttg 120
ggtggtggcc tgccattaaa agattatttc ccatgggata atctatctgt agattcaccc 180
aagcctcctt ttccccaggg tattggagct ccaattgacg agcagaattg cataaaatac 240
accgtcaaca aagattacgc tgataaaagt gccaatcctt ccaacgatat tcctttgtca 300
agagctttgc aatacgggtt cagcgctggt caacctgaac tgttaaactt cattagagat 360
cataccaaga ttatccacga tttgaagtat aaggattggg acgttttagc cactgcaggt 420
aacacaaatg cctgggaatc tactttaaga gtcttttgta accgaggtga tgtcatctta 480
gttgaggcac attctttttc ctcttcattg gcttctgcag aggctcaagg tgtcattacc 540
ttccccgtgc caattgacgc tgatggtatc attcctgaaa aattagctaa agtcatggaa 600
aactggacac ctggtgctcc taaaccaaag ttgttataca ctattccaac gggccaaaat 660
ccaactggta cttccattgc agaccataga aaggaggcaa tttacaagat cgctcaaaag 720
tacgacttcc taattgtgga agatgaacct tattatttct tacaaatgaa tccctacatc 780
aaagacttga aggaaagaga gaaggcacaa agttctccaa agcaggacca tgacgaattt 840
ttgaagtctt tggcaaacac tttcctttcc ttggatacag aaggccgtgt tattagaatg 900
gattcctttt caaaagtttt ggccccaggg acaagattgg gttggattac tggttcatcc 960
aaaatcttga agccttactt gagtttgcat gaaatgacga ttcaagcccc agcaggtttt 1020
acacaagttt tggtcaacgc tacgctatcc aggtggggtc aaaagggtta cttggactgg 1080
ttgcttggcc tgcgtcatga atacactttg aaacgtgact gtgccatcga tgccctttac 1140
aagtatctac cacaatctga tgctttcgtg atcaatcctc caattgcagg tatgtttttc 1200
accgtgaaca ttgacgcatc tgtccaccct gagtttaaaa caaaatacaa ctcagaccct 1260
taccagctag aacagagtct ttaccacaaa gtggttgaac gcggtgtttt agtggttccc 1320
ggttcttggt tcaagagtga gggtgagacg gaacctcctc aacccgctga atctaaagaa 1380
gtcagtaatc caaacataat tttcttcaga ggtacctatg cagctgtctc tcctgagaaa 1440
ctgactgaag gtctgaagag attaggtgat actttatacg aagaatttgg tatttccaaa 1500
<210> 122
<211> 1539
<212> DNA
<213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast)
<400> 122
atgactgctg gttctgcccc ccctgttgat tacacttcct taaagaagaa cttccaaccg 60
tttctctcca gaagagtaga aaatagatct ctgaaaagct tttgggatgc ttctgatatc 120
tcagatgacg tcattgagct agctggtgga atgccaaacg agagattttt tcctatcgaa 180
tctatggatt tgaaaatatc aaaagttcct tttaatgata acccaaaatg gcataattcg 240
tttaccacgg cgcatttgga cttgggatcc cccagtgagc tacccattgc acgttctttc 300
caatatgcag aaaccaaggg tttaccccct ctcttacatt ttgttaaaga ttttgtgtcc 360
agaattaatc gcccagcctt ttccgatgag acggagtcta actgggatgt catcctttct 420
ggcgggtcca acgattcaat gtttaaggtt tttgaaacaa tttgcgacga atcgaccact 480
gtgatgattg aagagtttac tttcaccccg gctatgtcca atgtggaggc tacaggagca 540
aaagtcatcc ccatcaagat gaacctgacc ttcgacagag agtcccaggg tattgatgtc 600
gaatatctaa cgcagttgct cgataattgg tcaactggac catacaaaga cttaaacaag 660
ccaagggtcc tatataccat tgcaacgggc caaaatccta ccgggatgtc tgtcccccag 720
tggaaaagag agaaaattta ccagttggcc caaagacacg atttcctcat tgttgaagat 780
gatccctacg gttatctgta ctttccttcc tataatccgc aagagccatt agaaaaccct 840
taccattcta gcgacctgac tactgaacgg tatttgaatg attttttaat gaaatcattc 900
ttgactttgg atacagatgc ccgtgtcatc cgtttggaga ctttttctaa aatttttgct 960
cctggattaa ggttatcctt catcgttgct aataaattcc ttttgcaaaa aatcttggat 1020
ttggccgaca ttactacaag ggcccccagt ggtacctcac aagctattgt ttattctaca 1080
ataaaggcaa tggctgagtc caacttatcg tcctctcttt ctatgaaaga agcaatgttt 1140
gagggttgga taagatggat aatgcagatt gcttctaaat acaatcatag gaaaaatctt 1200
actttgaaag ccttatacga aacagaatct taccaagctg gtcagtttac cgttatggaa 1260
ccctccgcgg gtatgttcat cattattaaa atcaattggg ggaatttcga tagacctgac 1320
gatttgccgc aacagatgga tattttagat aagttcttgc tgaagaatgg tgttaaagta 1380
gtgcttggtt ataaaatggc tgtttgccca aattattcaa agcagaattc agattttcta 1440
agactcacca tcgcctatgc aagggatgat gatcagttga ttgaagcttc caaaagaatc 1500
ggtagtggca taaaagaatt ttttgacaac tataaaagt 1539
Claims (69)
- 조작된 미생물 세포로서, 조작된 미생물 세포는
(a) 이종성 티로신 디카복실라제 (TYDC)를 발현하고;
(b) 조작된 미생물 세포는 티라민 생합성 경로의 하나 이상의 상류 효소(들)의 증가된 활성을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것인 조작된 미생물 세포. - 제1항에 있어서, 하나 이상의 상류 효소(들)는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제를 포함하는 것인 조작된 미생물 세포.
- 조작된 미생물 세포로서, 조작된 미생물 세포는
(a) 이종성 티로신 디카복실라제 (TYDC)를 발현하고;
(b) 조작된 미생물 세포는 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 및 티로신 아미노트랜스퍼라제로 이루어진 군으로부터 선택되는 하나 이상의 효소(들)의 증가된 활성을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이고;
조작된 미생물 세포는 티라민을 생성시키는 것인 조작된 미생물 세포. - 제3항에 있어서, 조작된 미생물 세포는
(c) 피드백-이상조절된 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제 또는 피드백-이상조절된 코리스메이트 뮤타제
를 추가로 발현하는 것인 조작된 미생물 세포. - 조작된 미생물 세포로서, 조작된 미생물 세포는
(a) 이종성 티로신 디카복실라제 (TYDC)를 발현하기 위한 수단; 및
(b) 티라민 생합성 경로의 하나 이상의 상류 효소(들)의 활성을 증가시키기 위한 수단
을 포함하는 것인 조작된 미생물 세포. - 제5항에 있어서, 하나 이상의 상류 효소(들)는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제를 포함하는 것인 조작된 미생물 세포.
- 조작된 미생물 세포로서, 조작된 미생물 세포는
(a) 이종성 티로신 디카복실라제 (TYDC)를 발현하기 위한 수단; 및
(b) 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 및 티로신 아미노트랜스퍼라제로 이루어진 군으로부터 선택되는 하나 이상의 효소(들)의 활성을 증가시키기 위한 수단
을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이고;
조작된 미생물 세포는 티라민을 생성시키는 것인 조작된 미생물 세포. - 제7항에 있어서, 조작된 미생물 세포는
(c) 피드백-이상조절된 DAHP 신타제 또는 피드백-이상조절된 코리스메이트 뮤타제를 발현하기 위한 수단
을 추가로 발현하는 것인 조작된 미생물 세포. - 제1항 내지 제8항 중 어느 한 항에 있어서, 조작된 미생물 세포는 기질의 발효에 의해 티라민을 생성시키고, 기질의 적어도 50%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는 것인 조작된 미생물 세포.
- 제4항, 제8항 또는 제9항 중 어느 한 항에 있어서, 조작된 미생물 세포는
(a) 이종성 TYDC; 및
(b) 피드백-이상조절된 DAHP 신타제
를 포함하는 것인 조작된 미생물 세포. - 제3항 내지 제10항 중 어느 한 항에 있어서, 조작된 미생물 세포는 진균 세포를 포함하는 것인 조작된 미생물 세포.
- 제3항 내지 제11항 중 어느 한 항에 있어서, 조작된 미생물 세포는 효모 세포를 포함하는 것인 조작된 미생물 세포.
- 제8항에 있어서, 효모 세포는 사카로마이세스 (Saccharomyces) 속의 세포를 포함하는 것인 조작된 미생물 세포.
- 제13항에 있어서, 효모 세포는 세레비지아 (cerevisiae) 종의 세포인 조작된 미생물 세포.
- 제4항, 제8항 또는 제9항 내지 제14항 중 어느 한 항에 있어서, DAHP 신타제는 에스. 세레비지아 (S. cerevisiae) DAHP 신타제의 변이체인 조작된 미생물 세포.
- 제3항 내지 제15항 중 어느 한 항에 있어서, 이종성 TYDC는 파파베르 솜니페럼 (Papaver somniferum) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함하는 것인 조작된 미생물 세포.
- 제4항, 제8항 또는 제9항 내지 제16항 중 어느 한 항에 있어서,
(a) 이종성 TYDC는 피. 솜니페럼 (P. somniferum) 티로신/DOPA 디카복실라제 2를 포함하고;
(b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제인
조작된 미생물 세포. - 제3항 내지 제17항 중 어느 한 항에 있어서, 조작된 미생물 세포는 대조군 세포에 비해 프리페네이트 디히드로게나제의 증가된 활성을 포함하는 것인 조작된 미생물 세포.
- 제18항에 있어서, 조작된 미생물 세포는 야생형 에스. 세레비지아 트랜스알돌라제 유전자의 추가 카피를 발현하는 것인 조작된 미생물 세포.
- 제2항 또는 제6항 중 어느 한 항에 있어서, 조작된 미생물 세포는 효모 세포를 포함하는 것인 조작된 미생물 세포.
- 제20항에 있어서, 효모 세포는 야로위아 (Yarrowia) 속의 세포를 포함하는 것인 조작된 미생물 세포.
- 제21항에 있어서, 효모 세포는 리폴리티카 (lipolytica) 종의 세포인 조작된 미생물 세포.
- 제21항 또는 제22항에 있어서, 이종성 TYDC는 엔테로코커스 패시움 (Enterococcus faecium) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함하는 것인 조작된 미생물 세포.
- 제21항 내지 제23항 중 어느 한 항에 있어서, DAHP 신타제는 에스. 세레비지아 유래 DAHP 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 DAHP 신타제를 포함하는 것인 조작된 미생물 세포.
- 제24항에 있어서,
(a) 이종성 TYDC는 이. 패시움 (E. faecium) Com15 유래 피리독살-의존성 디카복실라제 (TYDC)를 포함하고;
(b) DAHP 신타제는 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)를 포함하는 것인 조작된 미생물 세포. - 파파베르 솜니페럼 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 효모 세포인 조작된 미생물 세포로서, 조작된 효모 세포는 티라민을 생성시키는 것인 조작된 미생물 세포.
- 제26항에 있어서, 조작된 효모 세포는 사카로마이세스 속의 세포인 조작된 미생물 세포.
- 제27항에 있어서, 조작된 효모 세포는 세레비지아 종의 세포인 조작된 미생물 세포.
- 제3항 내지 제10항 중 어느 한 항에 있어서, 조작된 미생물 세포는 박테리아 세포인 조작된 미생물 세포.
- 제29항에 있어서, 박테리아 세포는 코리네박테리아 (Corynebacteria) 속의 세포인 조작된 미생물 세포.
- 제30항에 있어서, 박테리아 세포는 글루타미컴 (glutamicum) 종의 세포인 조작된 미생물 세포.
- 제29항 내지 제31항 중 어느 한 항에 있어서, 박테리아 세포는 에스. 세레비지아 DAHP 신타제의 변이체인 피드백-이상조절된 DAHP 신타제를 포함하는 것인 조작된 미생물 세포.
- 제29항 내지 제32항 중 어느 한 항에 있어서, 이종성 TYDC는 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖거나 또는 자이고사카로마이세스 바일리 (Zygosaccharomyces bailii) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함하는 것인 조작된 미생물 세포.
- 제32항 또는 제33항에 있어서,
(a) 이종성 TYDC는 이. 패시움 TYDC를 포함하고;
(b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제인
조작된 미생물 세포. - 제32항 또는 제33항에 있어서,
(a) 이종성 TYDC는 지. 바일리 (Z. bailii) TYDC를 포함하고;
(b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제인
조작된 미생물 세포. - 제33항에 있어서, 대조군 세포에 비해, 코리스메이트 신타제 또는 프리프레네이트 디히드로게나제의 증가된 활성을 추가로 포함하는 것인 조작된 미생물 세포.
- 제36항에 있어서, 조작된 미생물 세포는 코리스메이트 신타제의 증가된 활성을 포함하고 이종성 코리스메이트 신타제를 발현하는 것인 조작된 미생물 세포.
- 제36항에 있어서, 조작된 미생물 세포는 프리페네이트 디히드로게나제의 증가된 활성을 포함하고 프리페네이트 디히드로게나제 유전자의 추가 카피를 발현하는 것인 조작된 미생물 세포.
- 제2항 또는 제6항에 있어서, 조작된 미생물 세포는 박테리아 세포를 포함하는 것인 조작된 미생물 세포.
- 제39항에 있어서, 박테리아 세포는 코리네박테리움 (Corynebacterium) 또는 바실러스 (Bacillus) 속의 세포를 포함하는 것인 조작된 미생물 세포.
- 제40항에 있어서, 박테리아 세포는 각각 글루타미컴 (glutamicum) 또는 서브틸리스 (subtilis) 종의 세포인 조작된 미생물 세포.
- 제40항 또는 제41항에 있어서, 이종성 TYDC는 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함하는 것인 조작된 미생물 세포.
- 제40항 내지 제42항 중 어느 한 항에 있어서, DAHP 신타제는 에스. 세레비지아 유래 DAHP 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 DAHP 신타제를 포함하는 것인 조작된 미생물 세포.
- 제40항 내지 제43항 중 어느 한 항에 있어서, 조작된 미생물 세포는 대조군 세포에 비해 시키메이트 키나제의 증가된 활성을 포함하는 것인 조작된 미생물 세포.
- 제44항에 있어서, 시키메이트 키나제는 에스케리치아 콜라이 (Escherichia coli) 유래 시키메이트 키나제와 적어도 70%의 아미노산 서열 동일성을 갖는 시키메이트 키나제를 포함하는 것인 조작된 미생물 세포.
- 제45항에 있어서,
(a) 이종성 TYDC는 이. 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC)를 포함하고;
(b) DAHP 신타제는 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)를 포함하고;
(c) 시키메이트 키나제는 이. 콜라이 (E. coli) K12 유래 시키메이트 키나제를 포함하는 것인 조작된 미생물 세포. - 제13항 내지 제46항 중 어느 한 항에 있어서, 배양 시, 조작된 미생물 세포는 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 생성시키는 것인 조작된 미생물 세포.
- 제47항에 있어서, 조작된 미생물 세포는 적어도 2.5 g/배양 배지의 L 의 수준으로 티라민을 생성시키는 것인 조작된 미생물 세포.
- 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 박테리아 세포인 조작된 미생물 세포로서, 조작된 박테리아 세포는 티라민을 생성시키는 것인 조작된 미생물 세포.
- 제49항에 있어서, 박테리아 세포는 코리네박테리아 속의 것인 조작된 미생물 세포.
- 제50항에 있어서, 박테리아 세포는 글루타미컴 종의 것인 조작된 미생물 세포.
- 자이고사카로마이세스 바일리 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 박테리아 세포인 조작된 미생물 세포로서, 조작된 박테리아 세포는 티라민을 생성시키는 것인 조작된 미생물 세포.
- 제52항에 있어서, 박테리아 세포는 코리네박테리아 속의 것인 조작된 미생물 세포.
- 제53항에 있어서, 박테리아 세포는 글루타미컴 종의 것인 조작된 미생물 세포.
- 제13항 내지 제54항 중 어느 한 항에 따른 조작된 미생물 세포의 배양물.
- 제55항에 있어서, 티라민은 기질의 발효로부터 생성되고, 기질의 적어도 50%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는 것인 배양물.
- 제56항에 있어서, 기질은 우레아, 암모늄 염, 암모니아, 및 이의 임의 조합으로 이루어진 군으로부터 선택되는 질소원 및 탄소원을 포함하는 것인 배양물.
- 제55항 내지 제57항 중 어느 한 항에 있어서, 조작된 미생물 세포는 배양물이 10 내지 500의 600 nm에서의 광학 밀도를 갖는 농도로 존재하는 것인 배양물.
- 제55항 내지 제58항 중 어느 한 항에 있어서, 배양물은 티라민을 포함하는 것인 배양물.
- 제55항 내지 제59항 중 어느 한 항에 있어서, 배양물은 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 포함하는 것인 배양물.
- 제55항 내지 제60항 중 어느 한 항에 있어서, 배양물은 적어도 2.5 g/배양 배지의 L 의 수준으로 티라민을 포함하는 것인 배양물.
- 제1항 내지 제54항 중 어느 한 항에 따른 조작된 미생물 세포를 배양하는 방법으로서, 방법은 비단백질 탄소 및 비단백질 질소 공급원을 포함하는 발효 기질의 존재 하에서 세포를 배양하는 단계를 포함하고, 조작된 미생물 세포는 티라민을 생성시키는 것인 배양 방법.
- 제62항에 있어서, 방법은 1 내지 100 g/L 범위의 초기 포도당 수준에서 이후 제어된 당류 공급이 후속되는, 유가식 배양을 포함하는 것인 배양 방법.
- 제62항 또는 제63항에 있어서, 발효 기질은 우레아, 암모늄 염, 암모니아, 및 이의 임의 조합으로 이루어진 군으로부터 선택되는 질소원 및 포도당을 포함하는 것인 배양 방법.
- 제62항 내지 제64항 중 어느 한 항에 있어서, 배양물은 배양 단계 동안 pH-제어되는 것인 배양 방법.
- 제62항 내지 제65항 중 어느 한 항에 있어서, 배양물은 배양 단계 동안 통기되는 것인 배양 방법.
- 제62항 내지 제66항 중 어느 한 항에 있어서, 조작된 미생물 세포는 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 생성시키는 것인 배양 방법.
- 제62항 내지 제67항 중 어느 한 항에 있어서, 조작된 미생물 세포는 적어도 2.5 g/배양 배지의 L 의 수준으로 티라민을 생성시키는 것인 배양 방법.
- 제62항 내지 제68항 중 어느 한 항에 있어서, 방법은 배양물로부터 티라민을 회수하는 단계를 더 포함하는 것인 배양 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762455428P | 2017-02-06 | 2017-02-06 | |
US62/455,428 | 2017-02-06 | ||
PCT/US2018/017127 WO2018203947A2 (en) | 2017-02-06 | 2018-02-06 | Engineered biosynthetic pathways for production of tyramine by fermentation |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190120238A true KR20190120238A (ko) | 2019-10-23 |
Family
ID=63294411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197025667A Withdrawn KR20190120238A (ko) | 2017-02-06 | 2018-02-06 | 발효에 의한 티라민의 제조를 위해 조작된 생합성 경로 |
Country Status (7)
Country | Link |
---|---|
US (1) | US11028416B2 (ko) |
EP (1) | EP3577220A2 (ko) |
JP (1) | JP2020513790A (ko) |
KR (1) | KR20190120238A (ko) |
CN (1) | CN110494560A (ko) |
CA (1) | CA3052635A1 (ko) |
WO (1) | WO2018203947A2 (ko) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3770267A1 (en) | 2013-11-04 | 2021-01-27 | The Board of Trustees of the Leland Stanford Junior University | Benzylisoquinoline alkaloid (bia) precursor producing microbes, and methods of making and using the same |
WO2018203947A2 (en) | 2017-02-06 | 2018-11-08 | Zymergen Inc. | Engineered biosynthetic pathways for production of tyramine by fermentation |
RU2022101021A (ru) | 2018-01-10 | 2022-03-18 | Брайтсид, Инк. | Способ модуляции метаболизма |
EP3656857A1 (en) * | 2018-11-21 | 2020-05-27 | Danmarks Tekniske Universitet | Utilization of phosphoketolase for production of aromatic amino acid derived products |
BR112021017659A2 (pt) * | 2019-03-08 | 2021-11-16 | Univ Leland Stanford Junior | Células hospedeiras não vegetais produtoras de alcaloide de tropano (ta), e métodos de preparação e uso das mesmas |
WO2020232027A1 (en) * | 2019-05-13 | 2020-11-19 | Zymergen Inc. | Stabilization of amines with sulfur compounds |
CN114901630A (zh) * | 2019-10-25 | 2022-08-12 | 布莱特西德公司 | 用于生产生物活性植物代谢物的重组细胞、提取物、可消费产品和方法 |
CN113174375B (zh) * | 2021-04-23 | 2022-11-04 | 天津大学 | Aro3蛋白突变体及其应用 |
US20240229046A1 (en) * | 2021-05-18 | 2024-07-11 | Zymergen Inc. | Engineered biosynthetic pathways for production of deoxyhydrochorismic acid by fermentation |
CN113684165B (zh) * | 2021-08-12 | 2023-07-25 | 江南大学 | 一种重组谷氨酸棒杆菌及其在生产l-谷氨酰胺中的应用 |
EP4198123A1 (de) * | 2021-12-17 | 2023-06-21 | Covestro Deutschland AG | Besonders geeignete 3-desoxyarabinoheptulosanat-7-phosphat-synthase zur fermentativen herstellung von ortho-aminobenzoesäure |
CN116042553A (zh) * | 2022-12-29 | 2023-05-02 | 浙江工业大学 | 甘油醛-3-磷酸脱氢酶突变体及在提高o-琥珀酰-l-高丝氨酸产量中的应用 |
CN116083387A (zh) * | 2022-12-29 | 2023-05-09 | 北京华熙荣熙生物技术研究有限公司 | 酶、生产红景天苷的菌株及生产方法 |
CN117736960B (zh) * | 2024-02-21 | 2024-05-07 | 滨州医学院 | 一种小白链霉菌基因工程菌及其应用 |
CN119144595B (zh) * | 2024-11-13 | 2025-02-14 | 中国科学院微生物研究所 | 一种酪氨酸脱羧酶突变体及其在发酵合成3-氨基-1-丙醇中的应用 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57170184A (en) | 1980-07-18 | 1982-10-20 | Unisearch Ltd | Mutant of e. coli and production of phenylalanine |
EP0077196A3 (en) | 1981-10-09 | 1984-06-06 | Genex Corporation | Aromatic amino acid-producing microorganisms |
JPH07108228B2 (ja) | 1990-10-15 | 1995-11-22 | 味の素株式会社 | 温度感受性プラスミド |
CA2199853C (en) | 1994-09-16 | 2009-03-24 | James C. Liao | Microorganisms and methods for overproduction of dahp by cloned pps gene |
US6210937B1 (en) | 1997-04-22 | 2001-04-03 | Bechtel Bwxt Idaho, Llc | Development of genetically engineered bacteria for production of selected aromatic compounds |
US6297055B1 (en) | 1998-09-08 | 2001-10-02 | E. I. Du Pont De Nemours And Company | Amino acid decarboxylases |
US6600077B1 (en) | 1999-01-29 | 2003-07-29 | Board Of Trustees Operating Michigan State University | Biocatalytic synthesis of quinic acid and conversion to hydroquinone |
ATE335087T1 (de) | 1999-05-28 | 2006-08-15 | Univ North Texas | Globaler regulator, verwendet zur erhöhung der synthese von aromatischen substanzen |
US20050089974A1 (en) | 2000-10-27 | 2005-04-28 | Townsend Craig A. | Fermentative production of d-hydroxyphenylglycine and d-phenylglycine |
RU2229514C2 (ru) | 2000-11-13 | 2004-05-27 | Закрытое акционерное общество "Научно-исследовательский институт "Аджиномото-Генетика" | 3-дезокси-d-арабиногептулозонат-7-фосфатсинтаза и фрагмент днк, кодирующий 3-дезокси-d-арабиногептулозонат-7-фосфатсинтазу из methylophilus methylotrophus |
AU2003287028B2 (en) | 2002-10-04 | 2008-09-04 | E.I. Du Pont De Nemours And Company | Process for the biological production of 1,3-propanediol with high yield |
ATE498691T1 (de) | 2003-10-21 | 2011-03-15 | Cargill Inc | Herstellung von monatin und monatinvorstufen |
CN1280417C (zh) * | 2004-11-01 | 2006-10-18 | 清华大学 | 一种人酪氨酸酶表达载体及其应用 |
JP2009533034A (ja) * | 2006-04-13 | 2009-09-17 | ディーエスエム アイピー アセッツ ビー.ブイ. | スレオニンアルドラーゼおよび脱炭酸酵素の存在下においてグリシンおよびアルデヒドから出発して鏡像異性的に濃縮されたβ−アミノアルコールを調製する方法 |
KR20120053088A (ko) | 2006-05-26 | 2012-05-24 | 아미리스 인코퍼레이티드 | 이소프레노이드의 생산 방법 |
US7700328B2 (en) | 2006-06-07 | 2010-04-20 | E.I. Du Pont De Nemours And Company | Method for producing an L-tyrosine over-producing bacterial strain |
WO2008067070A2 (en) | 2006-10-19 | 2008-06-05 | California Institute Of Technology | Compositions and methods for producing benzylisoquinolines alkaloids |
US20080102499A1 (en) | 2006-10-27 | 2008-05-01 | Lori Jean Templeton | Method of enhancing L-tyrosine production in recombinant bacteria |
DE112007002823T5 (de) | 2006-11-27 | 2009-09-10 | Dsm Ip Assets B.V. | Fermentative Herstellung von Hydroxytyrosol |
NZ584162A (en) | 2007-10-04 | 2012-05-25 | Bio Architecture Lab Inc | Biofuel production |
SG162265A1 (en) | 2007-12-13 | 2010-07-29 | Danisco Us Inc | Compositions and methods for producing isoprene |
WO2009100231A2 (en) | 2008-02-06 | 2009-08-13 | The Regents Of The University Of California | Short chain volatile isoprene hydrocarbon production using the mevalonic acid pathway in genetically engineered yeast and fungi |
MX2010011706A (es) | 2008-04-23 | 2011-03-15 | Danisco Us Inc | Variantes de isopreno-sintasa para produccion microbiana mejorada de isopreno. |
US7632995B2 (en) | 2008-05-09 | 2009-12-15 | Monsanto Technology Llc | Plants and seeds of hybrid corn variety CH852179 |
US8420360B2 (en) | 2008-07-02 | 2013-04-16 | Danisco Us Inc. | Compositions and methods for producing isoprene free of C5 hydrocarbons under decoupling conditions and/or safe operating ranges |
DE102008040352A1 (de) | 2008-07-11 | 2010-01-14 | Evonik Degussa Gmbh | Verfahren zur Herstellung von L-Tryptophan unter Verwendung von verbesserten Stämmen der Familie Enterobacteriaceae |
US20100297749A1 (en) | 2009-04-21 | 2010-11-25 | Sapphire Energy, Inc. | Methods and systems for biofuel production |
IN2012DN01694A (ko) | 2009-09-15 | 2015-06-05 | Sapphire Energy Inc | |
US20110097767A1 (en) | 2009-10-23 | 2011-04-28 | Priti Pharkya | Microorganisms for the production of aniline |
WO2012135389A2 (en) | 2011-03-28 | 2012-10-04 | The Regents Of The University Of California | Host cells and methods for oxidizing aromatic amino acids |
JP2015504688A (ja) | 2012-01-30 | 2015-02-16 | ミリアント・コーポレイションMyriant Corporation | 遺伝子操作された微生物からのムコン酸の生成 |
US9234203B2 (en) | 2012-05-21 | 2016-01-12 | Cathay Industrial Biotech Ltd. | Stabilized recombinant expression plasmid vector in hafnia alvei and applications thereof |
LT2800811T (lt) | 2012-05-25 | 2017-09-11 | The Regents Of The University Of California | Būdai ir kompozicijos, skirti tikslinės dnr modifikavimui, panaudojant adresuotą rnr, ir transkripcijos moduliavimui, panaudojant adresuotą rnr |
ES2749624T3 (es) | 2013-03-14 | 2020-03-23 | Caribou Biosciences Inc | Composiciones y métodos de ácidos nucleicos dirigidos a ácido nucleico |
EP3770267A1 (en) | 2013-11-04 | 2021-01-27 | The Board of Trustees of the Leland Stanford Junior University | Benzylisoquinoline alkaloid (bia) precursor producing microbes, and methods of making and using the same |
EP3158073B8 (en) * | 2014-06-19 | 2019-12-11 | Willow Biosciences Inc. | Compositions and methods for making (s)-norcoclaurine and (s)-norlaudanosoline, and synthesis intermediates thereof |
CN106795486B (zh) | 2014-08-21 | 2021-06-08 | 公益财团法人地球环境产业技术研究机构 | 棒状细菌转化体及使用该转化体的有机化合物的制造方法 |
NZ775919A (en) * | 2015-05-08 | 2025-03-28 | Univ Leland Stanford Junior | Methods of producing epimerases and benzylisoquinoline alkaloids |
WO2018203947A2 (en) | 2017-02-06 | 2018-11-08 | Zymergen Inc. | Engineered biosynthetic pathways for production of tyramine by fermentation |
-
2018
- 2018-02-06 WO PCT/US2018/017127 patent/WO2018203947A2/en active Application Filing
- 2018-02-06 CN CN201880024534.4A patent/CN110494560A/zh active Pending
- 2018-02-06 JP JP2019542552A patent/JP2020513790A/ja active Pending
- 2018-02-06 EP EP18758755.5A patent/EP3577220A2/en not_active Withdrawn
- 2018-02-06 CA CA3052635A patent/CA3052635A1/en active Pending
- 2018-02-06 KR KR1020197025667A patent/KR20190120238A/ko not_active Withdrawn
-
2019
- 2019-06-26 US US16/453,648 patent/US11028416B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2018203947A3 (en) | 2019-01-17 |
EP3577220A2 (en) | 2019-12-11 |
US20190390236A1 (en) | 2019-12-26 |
JP2020513790A (ja) | 2020-05-21 |
CN110494560A (zh) | 2019-11-22 |
US11028416B2 (en) | 2021-06-08 |
WO2018203947A2 (en) | 2018-11-08 |
CA3052635A1 (en) | 2018-11-08 |
WO2018203947A9 (en) | 2020-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20190120238A (ko) | 발효에 의한 티라민의 제조를 위해 조작된 생합성 경로 | |
US10696991B2 (en) | Nepetalactol oxidoreductases, nepetalactol synthases, and microbes capable of producing nepetalactone | |
KR20200095534A (ko) | 발효에 의한 (6e)-8-히드록시제라니올의 제조를 위해 조작된 생합성 경로 | |
CN107406818A (zh) | 增强产油酵母中核心脂质的生产 | |
US20240124907A1 (en) | Engineered Biosynthetic Pathways for Production of Histamine by Fermentation | |
US20220033800A1 (en) | Engineered biosynthetic pathways for production of 1,5-diaminopentane by fermentation | |
KR20230078639A (ko) | 발효를 통한 4-아미노페닐에틸아민의 생산을 위해 조작된 생합성 경로 | |
CN114058560A (zh) | 甘氨酸的生产方法 | |
CN113330108A (zh) | 通过发酵产生2-氧代己二酸的经改造的生物合成途径 | |
WO2022173436A1 (en) | Engineered biosynthetic pathways for production of ectoine by fermentation | |
HK40017835A (en) | Engineered biosynthetic pathways for production of tyramine by fermentation | |
US20240229046A1 (en) | Engineered biosynthetic pathways for production of deoxyhydrochorismic acid by fermentation | |
US20230175023A1 (en) | Engineered biosynthetic pathways for production of 3,4-dihydroxybenzoic acid by fermentation | |
HK40046127A (en) | Engineered biosynthetic pathways for production of histamine by fermentation | |
HK40035041A (en) | Engineered biosynthetic pathways for production of (6e)-8-hydroxygeraniol by fermentation | |
JP2023008939A (ja) | メタンからの化学品の製造方法 | |
CN118256407A (zh) | 以l-赖氨酸为底物催化合成1,5-戊二胺的工程菌、构建方法、应用 | |
HK40037127A (en) | Nepetalactol oxidoreductases, nepetalactol synthases, and microbes capable of producing nepetalactone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20190830 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20210203 Comment text: Request for Examination of Application |
|
PC1202 | Submission of document of withdrawal before decision of registration |
Comment text: [Withdrawal of Procedure relating to Patent, etc.] Withdrawal (Abandonment) Patent event code: PC12021R01D Patent event date: 20220224 |
|
WITB | Written withdrawal of application |