KR20190120238A

KR20190120238A - 발효에 의한 티라민의 제조를 위해 조작된 생합성 경로

Info

Publication number: KR20190120238A
Application number: KR1020197025667A
Authority: KR
Inventors: 마이클 에스 시디퀴; 코크 스테판 데; 알렉산더 시어러; 프랭클린 루; 캐라 트레이스웰; 스티븐 에드가
Original assignee: 지머젠 인코포레이티드
Priority date: 2017-02-06
Filing date: 2018-02-06
Publication date: 2019-10-23
Also published as: WO2018203947A3; EP3577220A2; US20190390236A1; JP2020513790A; CN110494560A; US11028416B2; WO2018203947A2; CA3052635A1; WO2018203947A9

Abstract

본 개시 내용은 티라민의 발효적 생성을 위한 미생물 세포의 조작을 기술하고 신규한 조작된 미생물 세포 및 배양물을 비롯하여, 관련된 티라민 제조 방법을 제공한다.

Description

발효에 의한 티라민의 제조를 위해 조작된 생합성 경로

관련 출원에 관한 교차-참조

본 출원은 그 전문을 참조로 본 명세서에 편입시키는, 2017년 2월 6일 출원된 미국 가출원 제62/455,428호의 이득을 청구한다.

연방 정부 지원에 의한 연구 및 개발로 수행된 발명에 관한 진술

본 발명은 DARPA가 수여하는 협약 번호 HR0011-15-9-0014 하의 정부 지원에 의해 수행되었다. 정부는 본 발명의 일정 권리를 갖는다.

서열 목록의 참조 편입

본 출원은 ASCII 형식으로 전자 제출된 서열 목록을 포함하고, 그 전문을 참조로 본 명세서에 편입시킨다. 2018년 2월 6일 생성된 이러한 ASCII 사본은 파일명이 2018-02-05_ZMGNP001WO_seqlist.txt이고 크기는 331,364 바이트이다.

발명의 분야

본 개시 내용은 일반적으로 발효에 의한 티라민의 과생산을 위해 미생물을 조작하는 분야에 관한 것이다.

티라민은 티로신의 디카복실화 생성물로서 자연계에 존재하는 것으로 알려져 있다. 종종 티라민은 단백질이 풍부한 재료가 썩거나 또는 부패하는 과정이나 또는 환경에서 생산된다. 티라민은 단백질-풍부 물질 예컨대 동물의 젖이나 또는 콩과식물의 발효로 생산되는 음식물에 존재한다. 이들 과정은 방향족 아미노산을 함유하는 단백질의 외부 공급원 및 티로신 디카복실라제를 발현하는 미생물에 의존한다.

본 명세서에서 고려되는 다양한 실시형태들은 다음 중 하나 이상을 포함할 수 있으나, 이들에 제한될 필요는 없다:

실시형태 1: 조작된 미생물 세포로서, 조작된 미생물 세포는 (a) 이종성 티로신 디카복실라제 (TYDC)를 발현하고; (b) 조작된 미생물 세포는 티라민 생합성 경로의 하나 이상의 상류 효소(들)의 증가된 활성을 포함하며, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이다.

실시형태 2: 실시형태 1의 조작된 미생물 세포로서, 하나 이상의 상류 효소(들)는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제를 포함한다.

실시형태 3: 조작된 미생물 세포로서, 조작된 미생물 세포는 (a) 이종성 티로신 디카복실라제 (TYDC)를 발현하고; (b) 조작된 미생물 세포는 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소,코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 및 티로신 아미노트랜스퍼라제로 이루어진 군으로부터 선택되는 하나 이상의 효소(들)의 증가된 활성을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이고, 조작된 미생물 세포는 티라민을 생성한다.

실시형태 4: 실시형태 3의 조작된 미생물 세포로서, 조작된 미생물 세포는 추가적으로 (c) 피드백-이상조절된 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제 또는 피드백-이상조절된 코리스메이트 뮤타제를 발현한다.

실시형태 5: 조작된 미생물 세포, 조작된 미생물 세포는 (a) 이종성 티로신 디카복실라제 (TYDC)를 발현하기 위한 수단; 및 (b) 티라민 생합성 경로의 하나 이상의 상류 효소(들)의 활성을 증가시키기 위한 수단을 포함한다.

실시형태 6: 실시형태 5의 조작된 미생물 세포로서, 하나 이상의 상류 효소(들)는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제를 포함한다.

실시형태 7: 조작된 미생물 세포로서, 조작된 미생물 세포는 (a) 이종성 티로신 디카복실라제 (TYDC)를 발현하기 위한 수단; 및 (b) 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 및 티로신 아미노트랜스퍼라제로 이루어진 군으로부터 선택되는 하나 이상의 효소(들)의 활성을 증가시키기 위한 수단을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이고; 조작된 미생물 세포는 티라민을 생성한다.

실시형태 8: 실시형태 7의 조작된 미생물 세포로서, 조작된 미생물 세포는 추가적으로 (c) 피드백-이상조절된 DAHP 신타제 또는 피드백-이상조절된 코리스메이트 뮤타제를 발현하기 위한 수단을 발현한다.

실시형태 9: 실시형태 1 내지 8 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 기질의 발효에 의해 티라민을 생성하고, 기질의 적어도 50%는 단백질 또는 아미노산 공급원으로부터 유래되는 것이 아니다.

실시형태 10: 실시형태 4, 8 또는 9 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 (a) 이종성 TYDC; 및 (b) 피드백-이상조절된 DAHP 신타제를 포함한다.

실시형태 11: 실시형태 3 내지 10 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 진균 세포를 포함한다.

실시형태 12: 실시형태 3 내지 11 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 효모 세포를 포함한다.

실시형태 13: 실시형태 8의 조작된 미생물 세포로서, 효모 세포는 사카로마이세스 (Saccharomyces) 속의 세포를 포함한다.

실시형태 14: 실시형태 13의 조작된 미생물 세포로서, 효모 세포는 세레비지아 (cerevisiae) 종의 세포이다.

실시형태 15: 실시형태 4, 8, 또는 9 내지 14 중 어느 하나의 조작된 미생물 세포로서, DAHP 신타제는 에스. 세레비지아 (S. cerevisiae) DAHP 신타제의 변이체이다.

실시형태 16: 실시형태 3 내지 15 중 어느 하나의 조작된 미생물 세포로서, 이종성 TYDC는 파파베르 솜니페럼 (Papaver somniferum) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함한다.

실시형태 17: 실시형태 4, 8, 또는 9 내지 16 중 어느 하나의 조작된 미생물 세포로서, (a) 이종성 TYDC는 피. 솜니페럼 티로신/DOPA 디카복실라제 2를 포함하고; (b) 피드백-이상조절된 DAHP 신타제는 추가로 K229L 돌연변이를 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제이다.

실시형태 18: 실시형태 3 내지 17 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 대조군 세포에 비해서 프리페네이트 디히드로게나제의 증가된 활성을 포함한다.

실시형태 19: 실시형태 18의 조작된 미생물 세포로서, 조작된 미생물 세포는 야생형 에스. 세레비지아 프리페네이트 디히드로게나제 유전자의 추가 카피를 발현한다.

실시형태 20: 실시형태 18의 조작된 미생물 세포로서, 조작된 미생물 세포는 야생형 에스. 세레비지아 트랜스알돌라제 유전자의 추가 카피를 발현한다.

실시형태 21: 실시형태 2 또는 실시형태 6의 조작된 미생물 세포로서, 조작된 미생물 세포는 효모 세포를 포함한다.

실시형태 22: 실시형태 21의 조작된 미생물 세포로서, 효모 세포는 야로위아 (Yarrowia) 속의 세포를 포함한다.

실시형태 23: 실시형태 22의 조작된 미생물 세포로서, 효모 세포는 리폴리티카 (lipolytica) 종의 세포이다.

실시형태 24: 실시형태 22 또는 실시형태 23의 조작된 미생물 세포로서, 이종성 TYDC는 엔테로코커스 패시움 (Enterococcus faecium) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함한다.

실시형태 25: 실시형태 22 내지 24 중 어느 하나의 조작된 미생물 세포로서, DAHP 신타제는 에스. 세레비지아 유래 DAHP 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 DAHP 신타제를 포함한다.

실시형태 26: 실시형태 25의 조작된 미생물 세포로서, (a) 이종성 TYDC는 이. 패시움 Com15 유래의 피리독살-의존성 디카복실라제 (TYDC)를 포함하고; (b) DAHP 신타제는 에스. 세레비지아 S288c 유래의 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)를 포함한다.

실시형태 27: 파파베르 솜니페럼 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 효모 세포인 조작된 미생물 세포로서, 조작된 효모 세포는 티라민을 생성한다.

실시형태 28: 실시형태 27의 조작된 미생물 세포로서, 조작된 효모 세포는 사카로마이세스 속의 세포이다.

실시형태 29: 실시형태 28의 조작된 미생물 세포로서, 조작된 효모 세포는 세레비지아 종의 세포이다.

실시형태 30: 실시형태 3 내지 10 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 박테리아 세포이다.

실시형태 31: 실시형태 30의 조작된 미생물 세포로서, 박테리아 세포는 코리네박테리아 (Corynebacteria) 속의 세포이다.

실시형태 32: 실시형태 31의 조작된 미생물 세포로서, 박테리아 세포는 글루타미컴 (glutamicum) 종의 세포이다.

실시형태 33: 실시형태 30 내지 32 중 어느 하나의 조작된 미생물 세포로서, 박테리아 세포는 에스. 세레비지아 DAHP 신타제의 변이체인 피드백-이상조절된 DAHP 신타제를 포함한다.

실시형태 34: 실시형태 30 내지 33 중 어느 하나의 조작된 미생물 세포로서, 이종성 TYDC는 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖거나 또는 자이고사카로마이세스 바일리 (Zygosaccharomyces bailii) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함한다.

실시형태 35: 실시형태 33 또는 실시형태 34의 조작된 미생물 세포로서, (a) 이종성 TYDC는 이. 패시움 TYDC를 포함하고; (b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제이다.

실시형태 36: 실시형태 33 또는 실시형태 34의 조작된 미생물 세포로서, (a) 이종성 TYDC는 지. 바일리 (Z. bailii) TYDC를 포함하고; (b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제이다.

실시형태 37: 실시형태 34의 조작된 미생물 세포로서, 대조군 세포에 비해서, 코리스메이트 신타제 또는 프리프레네이트 디히드로게나제의 증가된 활성을 추가로 포함한다.

실시형태 38: 실시형태 37의 조작된 미생물 세포로서, 조작된 미생물 세포는 코리스메이트 신타제의 증가된 활성을 포함하고, 이종성 코리스메이트 신타제를 발현한다.

실시형태 39: 실시형태 38의 조작된 미생물 세포로서, 이종성 코리스메이트 신타제는 에스. 세레비지아 코리스메이트 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 코리스메이트 신타제를 포함한다.

실시형태 40: 실시형태 39의 조작된 미생물 세포로서, 이종성 코리스메이트 신타제는 에스. 세레비지아 코리스메이트 신타제를 포함한다.

실시형태 41: 실시형태 37의 조작된 미생물 세포로서, 조작된 미생물 세포는 프리페네이트 디히드로게나제의 증가된 활성을 포함하고, 프리페네이트 디히드로게나제 유전자의 추가 카피를 발현한다.

실시형태 42: 실시형태 41의 조작된 미생물 세포로서, 프리페네이트 디히드로게나제 유전자의 추가 카피는 에스. 세레비지아 유래 프리페네이트 디히드로게나제와 적어도 70%의 아미노산 서열 동일성을 갖는 프리페네이트 디히드로게나제를 코딩한다.

실시형태 43: 실시형태 42의 조작된 미생물 세포로서, 프리페네이트 디히드로게나제 유전자의 추가 카피는 에스. 세레비지아 유래 프리페네이트 디히드로게나제를 코딩한다.

실시형태 44: 실시형태 2 또는 실시형태 6의 조작된 미생물 세포로서, 조작된 미생물 세포는 박테리아 세포를 포함한다.

실시형태 45: 실시형태 44의 조작된 미생물 세포로서, 박테리아 세포는 코리네박테리움 (Corynebacterium) 또는 바실러스 (Bacillus) 속의 세포를 포함한다.

실시형태 46: 실시형태 45의 조작된 미생물 세포로서, 박테리아 세포는 각각 글루타미컴 (glutamicum) 또는 서브틸리스 (subtilis) 종의 세포이다.

실시형태 47: 실시형태 45 또는 실시형태 46의 조작된 미생물 세포로서, 이종성 TYDC는 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함한다.

실시형태 48: 실시형태 45 내지 47 중 어느 하나의 조작된 미생물 세포로서, DAHP 신타제는 에스. 세레비지아 유래 DAHP 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 DAHP 신타제를 포함한다.

실시형태 49: 실시형태 45 내지 48 중 어느 하나의 조작된 미생물 세포로서, 조작된 미생물 세포는 대조군 세포에 비해 시키메이트 키나제의 증가된 활성을 포함한다.

실시형태 50: 실시형태 49의 조작된 미생물로서, 시키메이트 키나제는 에스케리치아 콜라이 유래 시키메이트 키나제와 적어도 70%의 아미노산 서열 동일성을 갖는 시키메이트 키나제를 포함한다.

실시형태 51: 실시형태 50의 조작된 미생물 세포로서, (a) 이종성 TYDC는 이. 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC)를 포함하고; (b) DAHP 신타제는 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)를 포함하고; (c) 시키메이트 키나제는 이. 콜라이 K12 유래 시키메이트 키나제를 포함한다.

실시형태 52: 실시형태 13 내지 43 중 어느 하나의 조작된 미생물 세포로서, 배양시, 조작된 미생물 세포는 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 생성한다.

실시형태 53: 실시형태 52의 조작된 미생물 세포로서, 조작된 미생물 세포는 적어도 2.5 g/배양 배지의 L의 수준으로 티라민을 생성한다.

실시형태 54: 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 박테리아 세포인 조작된 미생물 세포로서, 조작된 박테리아 세포는 티라민을 생성한다.

실시형태 55: 실시형태 54의 조작된 미생물 세포로서, 박테리아 세포는 코리네박테리아 속의 것이다.

실시형태 56: 실시형태 55의 조작된 미생물 세포로서, 박테리아 세포는 글루타미컴 종의 것이다.

실시형태 57: 자이고사카로마이세스 바일리 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 박테리아 세포인 조작된 미생물 세포로서, 조작된 박테리아 세포는 티라민을 생성한다.

실시형태 58: 실시형태 57의 조작된 미생물 세포로서, 박테리아 세포는 코리네박테리아 속의 것이다.

실시형태 59: 실시형태 58의 조작된 미생물 세포로서, 박테리아 세포는 글루타미컴 종의 것이다.

실시형태 60: 실시형태 13 내지 59 중 어느 하나에 따른 조작된 미생물 세포의 배양물.

실시형태 61: 실시형태 60의 배양물로서, 티라민은 기질의 발효로부터 생성되고, 기질의 적어도 50%는 단백질 또는 아미노산 공급원으로부터 유래하는 것이 아니다.

실시형태 62: 실시형태 61의 배양물로서, 기질은 우레아, 암모늄 염, 암모니아, 및 이의 임의 조합으로 이루어진 군으로부터 선택되는 질소원 및 탄소원을 포함한다.

실시형태 63: 실시형태 60 내지 62 중 어느 하나의 배양물로서, 조작된 미생물 세포는 배양물이 10 내지 600의 600 nm에서의 광학 밀도를 갖는 농도로 존재한다.

실시형태 64: 실시형태 60 내지 63 중 어느 하나의 배양물로서, 배양물은 티라민을 포함한다.

실시형태 65: 실시형태 60 내지 64 중 어느 하나의 배양물로서, 배양물은 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 포함한다.

실시형태 66: 실시형태 60 내지 65 중 어느 하나의 배양물로서, 배양물은 적어도 2.5 g/배양 배지의 L의 수준으로 티라민을 포함한다.

실시형태 67: 실시형태 1 내지 59 중 어느 하나에 따른 조작된 미생물 세포를 배양하는 방법으로서, 방법은 비단백질 탄소 및 비단백질 질소 공급원을 포함하는 발효 기질의 존재 하에서 세포를 배양하는 단계를 포함하고, 조작된 미생물 세포는 티라민을 생성한다.

실시형태 68: 실시형태 67의 방법으로서, 방법은 1 내지 100 g/L 범위의 초기 포도당 수준과, 이후 당류 공급 제어가 후속되는 유가식 배양을 포함한다.

실시형태 69: 실시형태 67 또는 실시형태 68의 방법으로서, 발효 기질은 우레아, 암모늄 염, 암모니아, 및 이의 임의 조합으로 이루어진 군으로부터 선택되는 질소원 및 포도당을 포함한다.

실시형태 70: 실시형태 67 내지 69 중 어느 하나의 방법으로서, 배양물은 배양 단계 동안 pH-제어된다.

실시형태 71: 실시형태 67 내지 70 중 어느 하나의 방법으로서, 배양물은 배양 단계 동안 통기된다.

실시형태 72: 실시형태 67 내지 71 중 어느 하나의 방법으로서, 조작된 미생물 세포는 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 생성한다.

실시형태 73: 실시형태 67 내지 72 중 어느 하나의 방법으로서, 조작된 미생물 세포는 적어도 2.5 g/배양 배지의 L 의 수준으로 티라민을 생성한다.

실시형태 74: 실시형태 67 내지 73 중 어느 하나의 방법으로서, 방법은 배양물로부터 티라민을 회수하는 단계를 추가로 포함한다.

도 1: 발효에 의한 티라민의 생성 경로.
도 2: 에스. 세레비지아 균주를 조작하기 위해 개발된, "분할-마커, 이중-크로스오버" 게놈 통합 전략. 상보성 5' 및 3' 상동성 팔부 및 URA3 선별 마커의 중복된 절반 (해시 막대로 표시된 직접 반복부)을 갖는 2개 플라스미드는 메가뉴클레아제로 분해시켰고 선형 단편으로서 형질전환되었다. 삼중-크로스오버 사건은 바람직한 이종성 유전자를 표적화된 유전자좌에 통합시켰고 전체 URA3 유전자를 재구성시켰다. 이러한 통합 사건으로부터 유래된 콜로니는 5' 및 3' 접합부 둘 모두를 확인하기 위해서 2개 3-프라이머 (UF/IF/wt-R 및 DR/IF/wt-F) 반응을 사용하여 어세이되었다. 실시예 1을 참조한다.
도 3: 씨. 글루타미컴 균주를 조작하기 위해 개발된 "루프-인, 단일-크로스오버" 게놈 통합 전략. 루프-인 단독 구성체 (제목 "루프-인"으로 표시)는 단일 2-kb 상동성 팔부 ("통합 유전자좌"로 표시), 양성 선별 마커 ("마커"로 표시)), 및 관심 유전자(들) ("프로모터-유전자-종결인자"로 표시)를 함유하였다. 단일 크로스오버 사건은 플라스미드를 씨. 글루타미컴 염색체에 통합시켰다. 통합 사건은 항생제 (예를 들어, 25 ㎍/㎖ 카나마이신)의 존재 하에서 성장에 의해 게놈에서 안정하게 유지된다. 루프-인 통합으로부터 유래된 콜로니 중 올바른 게놈 통합은 UF/IR 및 DR/IF PCR 프라이머를 사용한 콜로니 PCR에 의해 확인하였다. 루프-인, 루프-아웃 구성체 (제목 "루프-인, 루프-아웃으로 표시)는 2개 2-kb 상동성 팔부 (5' 및 3' 팔부), 관심 유전자(들) (화살표), 양성 선별 마커 ("마커"로 표시됨), 및 역선별 마커를 함유하였다. "루프-인" 단독 구성체와 유사하게, 단일 크로스오버 사건은 플라스미드를 씨. 글루타미컴의 염색체에 통합시켰다. 주: 2가지 가능한 통합 중 오직 하나만 여기에 도시되어 있다. 올바른 게놈 통합은 콜로니 PCR에 의해 확인되었고 역선별은 플라스미드 골격 및 역선별 마커가 절개될 수 있도록 적용되었다. 이러한 결과로 2가지 가능성 중 하나가 발생된다: 야생형으로의 복귀 또는 바람직한 경로 통합. 역시, 올바른 게놈 루프-아웃은 콜로니 PCR로 확인된다. (약어: 프라이머: UF = 상류 전방향, DR = 하류 역방향, IR = 내부 역방향, IF = 내부 전방향). 실시예 1을 참조한다.
도 4A-4C: 도 4A는 티라민을 생성시키도록 조작된 에스. 세레비지아의 배양을 위한 상이한 공정 조건 하에서 배양 시간의 함수에 따른 생물량의 그래프를 도시한다. 이 데이타는 실시예 2에 기술된 실험에 의한 것이다. 도 4B는 동일한 배양에 대한 티라민 역가를 도시한다. 도 4C는 배양 시간의 함수에 따른 이 배양물 중 포도당 농도를 도시한다.
도 5: 1회차 조작된 숙주 야로위아 리폴리티카에 의한 발효 이후 세포외 액체배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 6: 1회차 조작된 숙주 바실러스 서브틸리스에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 7: 티라민의 생성을 위해 숙주 평가 디자인을 발현하도록 조작된 숙주 에스. 세레비지아에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가.
도 8: 티라민의 생성을 위해 숙주 평가 디자인을 발현하도록 조작된 숙주 씨. 글루타미컴에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가.
도 9: (3회차) 조작된 숙주 에스. 세레비지아에 의한 발효 이후 세포외 액체 배지에서 측정된 티라민 역가. 균주 디자인은 추가의 이종성 효소의 발현을 시험하였다.
도 10: 티라민의 구조.

본 개시 내용은 티라민의 발효적 생성을 위한 미생물 세포의 조작을 기술하고, 신규한 조작된 미생물 세포 및 배양물을 비롯하여, 관련된 티라민 제조 방법을 제공한다.

정의

청구항 및 명세서에서 사용되는 용어는 달리 명시하지 않으면 하기 기재된 바와 같이 정의된다.

용어 "발효"는 임의의 화학적 전환 단계를 필요로 하지 않고, 하나 이상의 생물학적 전환 단계를 통해서 미생물 세포가 하나 이상의 기질(들)을 바람직한 생성물 (예컨대 티라민)로 전환시키는 과정을 의미하고자 본 명세서에서 사용된다.

용어 "조작된"은 세포에 대해서, 그 세포가 천연 발생 세포로부터 조작된 세포를 구별하는 인간에 의해 도입된 적어도 하나의 표적화된 유전자 변경을 함유한다는 것을 의미하기 위해 본 명세서에서 사용된다.

용어 "내생성"은 특정 세포에 천연적으로 존재하는 세포 성분, 예컨대 폴리뉴클레오티드 또는 폴리펩티드를 의미하고자 본 명세서에서 사용된다.

용어 "이종성"은 숙주 세포에 도입된 폴리뉴클레오티드 또는 폴리펩티드에 대해서, 개별적으로, 숙주 세포의 것 이외의 상이한 유기체, 종, 또는 균주로부터 유래된 폴리뉴클레오티드 또는 폴리펩티드를 의미하고자 본 명세서에서 사용된다. 이종성 폴리뉴클레오티드 또는 폴리펩티드는 동일한 숙주 세포에 존재하는 임의의 서열(들)과 상이한 서열을 갖는다.

폴리펩티드와 관련하여 사용시, 용어 "야생형"은 분자의 공급원과 무관하게, 천연 발생 유기체 유래의 폴리펩티드에 존재하는 아미노산 서열을 갖는 임의의 폴리펩티드를 의미하며; 다시 말해서, 용어 "야생형"은 분자가 천연 공급원으로부터 정제되는지, 재조합적으로 발현된 후에 정제되는지, 또는 합성되는지 여부와 무관하게, 서열 특징을 의미한다. 용어 야생형은 또한 천연 발생 세포를 의미하고자 사용된다.

"대조군 세포"는 조작된 세포와 동일한 속 및 종인 것을 포함하여, 시험되는 조작된 세포와 동일하지만, 조작된 세포에서 시험하는 특별한 유전자 변형(들)은 결여된 세포이다.

본 명세서에서 효소는 그들이 촉매하는 반응으로 식별되고, 달리 표시하지 않으면, 식별된 반응을 촉매할 수 있는 임의의 폴리펩티드를 의미한다. 달리 표시하지 않으면, 효소는 임의의 유기체로부터 유래될 수 있고 천연 발생되거나 또는 돌연변이된 아미노산 서열을 가질 수 있다. 충분히 공지된 바와 같이, 효소는 때때로 그들이 유래되는 공급 유기체에 따라서 다수의 기능 및/또는 수의 명칭을 가질 수 있다. 본 명세서에서 사용되는 효소 명칭은 하나 이상의 추가적인 기능을 가질 수 있는 효소를 포함하여, 오르쏘로그 또는 상이한 명칭을 포괄한다.

용어 "피드백-이상조절된"은 특정한 세포에서 효소 경로의 하류 생성물에 의해 정상적으로 음성적으로 조절되는 효소 (즉, 피드백-억제)와 관련하여 본 명세서에서 사용된다. 본 문맥에서, "피드백-이상조절된" 효소는 세포에 내생성인 야생형 효소보다 피드백-억제에 덜 민감한 효소의 형태이다. 피드백-이상조절된 효소는 하나 이상의 돌연변이를 야생형 효소에 도입시켜 생성될 수 있다. 대안적으로, 피드백-이상조절된 효소는 간단히 특정한 미생물 세포에 도입시, 내생성, 야생형 효소만큼 피드백-억제에 민감하지 않은 이종성, 야생형 효소일 수 있다. 일부 실시형태에서, 피드백-이상조절된 효소는 미생물 세포에서 피드백-억제를 보이지 않는다.

용어 "티라민"은 4-(2-아미노에틸)페놀 (CAS#51-67-2)을 의미한다.

둘 이상의 아미노산 또는 뉴클레오티드 서열의 상황에서, 용어 "서열 동일성"은 서열 비교 알고리즘 또는 육안 검사를 사용해 측정시에, 최대 일치도로 비교 및 정렬할 때, 동일한 아미노산 잔기 또는 뉴클레오티드의 명시된 백분율을 갖거나 또는 동일한 둘 이상의 서열을 의미한다.

뉴클레오티드 또는 아미노산 서열 동일성 백분율을 결정하기 위한 서열 비교의 경우에, 전형적으로 한 서열은 "시험" 서열이 비교되는, "기준 서열"로서 작용한다. 서열 비교 알고리즘을 사용할 때, 시험 및 기준 서열이 컴퓨터에 입력되고, 필요하면, 하위서열 좌표가 지정되며, 서열 알고리즘 프로그램 매개변수가 지정된다. 그러고 나면, 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로, 기준 서열에 대한 시험 서열의 서열 동일성 백분율을 계산한다. 비교를 위한 서열의 정렬은 디폴트 매개변수로 설정된 BLAST를 사용해 수행될 수 있다.

본 명세서에서 사용되는 용어 "역가"는 배양 부피로 나눈 미생물 세포의 배양물에 의해 생성된 생성물 (예를 들어, 티라민)의 질량을 의미한다.

세포 배양물로부터 티라민을 회수하는 단계와 관련하여 본 명세서에서 사용시, "회수하는"은 세포 배양 배지의 적어도 하나의 다른 성분으로부터 티라민을 분리시키는 것을 의미한다.

티라민 생성을 위해 조작된 미생물

티라민 생합성 경로

티라민은 전구체 포스포에놀피루베이트 (PEP) 및 에리쓰로스-4-포스페이트 (E4P)를 기반으로, 아미노산 생합성의 방향족 분지로부터 유래된다. 이러한 경로는 도 1에 예시되어 있다. 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제에 의해 촉매되는, 아미노산 생합성 경로의 제1 단계는 방향족 아미노산 티로신, 트립토판 및 페닐알라닌에 의한 피드백 억제를 겪는다. 많은 미생물은 이러한 경로의 최종 단계를 촉매하는 효소, 즉 티로신 디카복실라제 (TYDC)가 결여되어 있다. 이러한 미생물 숙주에서 티라민의 생성은 적어도 하나의 이종성 TYDC 효소의 첨가를 필요로 한다.

미생물 티라민 생성을 위한 조작

조작되는 미생물 세포에서 활성인 임의의 TYDC는 전형적으로 표준 유전자 조작 기술을 사용하여 효소를 코딩하는 유전자를 도입시켜 발현시킴으로써 세포로 도입될 수 있다. 적합한 TYDC는 식물, 고세균, 진균, 그람-양성 박테리아 및 그람-음성 박테리아 공급원을 포함하는 임의의 공급원으로부터 유래될 수 있다. 예시적인 공급원은 제한없이 파파베르 솜니페럼 (Papaver somniferum), 페트로셀리늄 크리스펌 (Petroselinum crispum), 오리자 사티바 (Oryza sativa), 메타노스파에룰라 팔루스트리스 (Methanosphaerula palustris), 메타노칼도코커스 잔나시 (Methanocaldococcus jannaschii), 자이고사카로마이세스 바일리 (Zygosaccharomyces bailii), 페니실리움 마르네페이 (Penicillium marneffei), 탈라로마이세스 스티피타터스 (Talaromyces stipitatus), 트리코피톤 에퀴넘 (Trichophyton equinum), 프로피오니박테리움 (Propionibacterium) 종 경구 분류군, 엔테로코커스 패시움 (Enterococcus faecium), 스트렙토마이세스 히그로스코피커스 (Streptomyces hygroscopicus), 스트렙토마이세스 스비세우스 (Streptomyces sviceus), 모데스토박터 마리너스 (Modestobacter marinus), 슈도모나스 푸티다 (Pseudomonas putida), 시노리조비움 프레디 (Sinorhizobium fredii)를 포함한다. 일부 공급원, 예컨대 피. 솜니페럼은 하나를 초과하는 TYDC를 포함할 수 있고, 이들 중 어느 하나가 본 명세서에 기술된 방법에서 사용될 수 있다.

TYDC의 하나 이상의 카피가 선택된 미생물 숙주 세포에 도입될 수 있다. TYDC 유전자의 하나를 초과하는 카피가 도입되면, 카피들은 동일하거나 또는 상이한 TYDC 유전자의 카피일 수 있다. 일부 실시형태에서, 이종성 TYDC 유전자(들)는 강력한 항상성 프로모터로부터 발현된다. 일부 실시형태에서, 이종성 TYDC 유전자(들)는 유도성 프로모터로부터 발현된다. 임의로 이종성 유전자는 선택된 미생물 숙주 세포에서 발현을 증강시키기 위해 코돈-최적화될 수 있다. 코돈-최적화 표는 일반적인 미생물 숙주 세포로부터 입수가능하다. 실시예에서 사용된 코돈-최적화 표는 다음과 같다: 바실러스 서브틸리스 카즈사 코돈 표: www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=1423&aa=1&style=N; 야로위아 리폴리티카 카즈사 코돈 표: www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=4952&aa=1&style=N; 코리네박테리아 글루타미컴 카즈사 코돈 표: www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=340322&aa=1&style=N; 사카로마이세스 세레비지아 카즈사 코돈 표: http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=4932&aa=1&style=N. 또한 하기에서 재현된, 에스. 세레비지아 및 씨. 글루타미컴에 대한 변형된, 조합 용법 계획도 사용되었다.

실시예 1에서, 씨. 글루타미컴은 80 ㎍/L의 티라민 역가를 산출하는 이. 패시움 유래 TYDC (SEQ ID NO: 1)를 발현하도록 조작되었다.

증가된 티라민 생성을 위한 조작

내생성 상류 효소의 활성 증가

이종성 TYDC를 발현하는 미생물 세포에서 티라민 생성을 증가시키기 위한 한가지 접근법은 티라민 생합성 경로의 하나 이상의 상류 효소의 활성을 증가시키는 것이다. 상류 경로 효소는 공급원료로부터 완전히 티로신으로의 전환에 관여되는 모든 효소를 포함한다. 일정 실시형태에서, 상류 경로 효소는 특히 티라민으로 이어지는 경로에서 핵심 전구체 (즉, E4P 및 PEP)의 마지막 천연 대사산물 (즉, 티로신)로의 전환에 관여되는 효소를 의미한다. 일부 실시형태에서, 하나 이상의 상류 경로 효소의 활성은 내생성 효소(들)의 발현 또는 활성을 조정하여 증가된다. 일부 실시형태에서, 하나 이상의 상류 경로 효소의 활성은 TYDC-발현 미생물 숙주 세포로 해당 유전자 중 하나 이상의 도입에 의해 보충된다. 이러한 유전자는 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 방향족 아미노산 트랜스퍼라제 예컨대 티로신 아미노트랜스퍼라제, 글리세르알데히드-3-포스페이트 디히드로게나제, 트랜스알돌라제, 트랜스케톨라제, DAHP 신타제, 포스포에놀피루베이트 신타제, 글루타메이트 신타제를 코딩하는 것들을 포함한다. 적합한 상류 경로 유전자는 예를 들어 이종성 TYDC 유전자의 공급원으로서 상기에 기술된 것들을 포함하여, 임의 공급원으로부터 유래될 수 있다.

실시예 1은 상류 유전자로서, 코리스메이트 신타제 또는 프리페네이트 디히드로게나제를 코딩하는 도입된 유전자와 함께, 이종성 TYDC를 발현하기 위한 미생물 숙주 세포의 성공적 조작을 기술한다. 특히, 에스. 세레비지아는 피. 솜니페럼 (SEQ ID NO:2) 유래 TYDC 및 코리스메이트 신타제 (SEQ ID NO:3) 또는 프리페네이트 디히드로게나제 (SEQ ID NO:4)를 코딩하는 에스. 세레비지아 유전자의 추가 카피를 발현하도록 조작되었다. 결과는 하기 실시예 1에 제공된다.

도입된 상류 경로 유전자는 이종성일 수 있거나 또는 단순히 내생성 유전자의 추가 카피일 수 있다. 일부 실시형태에서, 하나 이상의 이러한 유전자는 TYDC-발현 미생물 숙주 세포로 도입되어 강력한 항상성 프로모터로부터 발현되고/되거나 임의로 선택된 미생물 숙주 세포에서의 발현을 증강시키도록 코돈-최적화될 수 있다. TYDC-발현 미생물 세포는 예를 들어 하나 이상의 상류 경로 유전자의 하나 이상의 카피를 발현하도록 조작될 수 있다.

다양한 실시형태에서, 하나 이상의 상류 경로 효소의 활성을 증가시키기 위한 TYDC-발현 미생물 세포의 조작은 티라민 역가를 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90% 또는 적어도 2-배, 2.5-배, 3-배, 3.5-배, 4-배, 4.5-배, 5-배, 5.5-배, 6-배, 6.5-배, 7-배, 7.5-배, 8-배, 8.5-배, 9-배, 9.5-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 21-배, 22-배, 23-배, 24-배, 25-배, 30-배, 35-배, 40-배, 45-배, 50-배, 55-배, 60-배, 65-배, 70-배, 75-배, 80-배, 85-배, 90-배, 95-배, 또는 100배 까지 증가시킨다. 다양한 실시형태에서, 티라민 역가의 증가는 10% 내지 100-배, 2-배 내지 50-배, 5-배 내지 40-배, 10-배 내지 30-배의 범위이거나, 또는 상기 열거된 임의 값으로 한정되는 임의 범위이다. (본 명세서에서 범위는 그들 종료점을 포함함). 이들 증가는 상류 경로 효소의 활성에서 임의의 증가가 결여된 티라민-생성 미생물 세포에서 관찰되는 티라민 역가와 비교하여 결정된다. 이러한 기준 세포는 티라민 생성 증가를 목표로 하는 하나 이상의 다른 유전자 변경을 가질 수 있으며, 예를 들어 세포는 피드백-이상조절된 효소를 발현할 수 있다.

다양한 실시형태에서, 하나 이상의 상류 경로 유전자의 활성을 증가시켜 획득되는 티라민 역가는 적어도 10, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 또는 900 ㎎/L 또는 적어도 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 또는 10 gm/L이다. 다양한 실시형태에서, 역가는 10 ㎎/L 내지 10 gm/L, 100 ㎎/L 내지 5 gm/L, 200 ㎎/L 내지 4 gm/L, 300　㎎/L 내지 3 gm/L 범위이거나, 또는 상기 열거된 임의 값으로 한정된 임의 범위이다.

피드백-이상조절된 효소의 도입

방향족 아미노산 생합성이 피드백 억제를 겪기 때문에, 이종성 TYDC를 발현하도록 조작된 미생물 세포에서 티라민 생성을 증가시키기 위한 다른 접근법은 정상적으로 TYDC-발현 미생물 세포에서 피드백 억제를 겪는 하나 이상의 효소의 피드백-이상조절된 형태를 도입하는 것이다. 이러한 효소의 예는 DAHP 신타제 및 코리스메이트 뮤타제를 포함한다. 피드백-이상조절된 형태는 특정한 미생물 숙주 세포에서 내생성 효소보다 피드백 억제에 덜 민감한 이종성, 야생형 효소일 수 있다. 대안적으로, 피드백-이상조절된 형태는 상응하는 야생형 효소보다 피드백 억제에 대해 덜 민감하게 만드는 하나 이상의 돌연변이를 갖는 내생성 또는 이종성 효소의 변이체일 수 있다. 후자의 예는 그들을 피드백 억제에 내성이게 만드는 기지의 점 돌연변이를 갖는 변이체 DAHP 신타제 (에스. 세레비지아로부터 2종, 이. 콜라이로부터 1종), 예를 들어, 에스. 세레비지아 ARO4Q166K (SEQ ID NO:5), 에스. 세레비지아 ARO4K229L (SEQ ID NO:6), 및 이. 콜라이 AroGD146N (SEQ ID NO:7)을 포함한다. 이들 명칭의 마지막 5 글자는 아미노산 치환을 의미하는 것으로서, 아미노산에 대한 표준 1-글자 코드를 사용하여, 처음 글자는 야생형 잔기를 의미하고, 마지막 글자는 치환 잔기를 의미하며, 번호는 번역된 단백질 중 아미노산 치환의 위치를 의미한다.

실시예 1은 피드백-이상조절된 DAHP 신타제를 코딩하는 도입된 유전자와 함께, 이종성 TYDC를 발현하기 위한 진균 및 박테리아 숙주 세포의 성공적인 조작을 기술한다. 특히, 에스. 세레비지아는 387 ㎍/L의 티라민 역가를 제공하는 피. 솜니페럼 (SEQ ID NO:2) 및 에스. 세레비지아 ARO4K229L (SEQ ID NO:6) 유래 TYDC 2를 발현하도록 조작되었다.

다양한 실시형태에서, 피드백-이상조절된 효소를 발현하기 위한 TYDC-발현 미생물 세포의 조작은 티라민 역가를 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90% 또는 적어도 2-배, 2.5-배, 3-배, 3.5-배, 4-배, 4.5-배, 5-배, 5.5-배, 6-배, 6.5-배, 7-배, 7.5-배, 8-배, 8.5-배, 9-배, 9.5-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 21-배, 22-배, 23-배, 24-배, 25-배, 30-배, 35-배, 40-배, 45-배, 50-배, 55-배, 60-배, 65-배, 70-배, 75-배, 80-배, 85-배, 90-배, 95-배, 또는 100-배까지 증가시킨다. 다양한 실시형태에서, 티라민 역가의 증가는 10% 내지 100-배, 2-배 내지 50-배, 5-배 내지 40-배, 10-배 내지 30-배의 범위, 또는 상기 열거된 임의 값으로 한정되는 임의 범위이다. 이들 증가는 피드백-이상조절된 효소를 발현하지 않는 티라민-생성 미생물 세포에서 관찰되는 티라민 역가와 비교하여 결정된다. 이러한 기준 세포는 티라민 생성 증가를 목표로 하는 다른 유전자 변경을 가질 수 있고 (그러나, 그럴 필요는 없음), 즉 세포는 피드백-무감응성보다는 일부 수단으로 초래되는 상류 경로 효소의 증가된 활성을 가질 수 있다.

다양한 실시형태에서, 티라민 생합성 경로를 통한 흐름을 증가시키기 위해 피드백-이상조절된 효소를 사용하여 획득된 티라민 역가는 적어도 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 또는 900 ㎎/L 또는 적어도 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 또는 5 gm/L이다. 다양한 실시형태에서, 역가는 100 ㎎/L 내지 5 gm/L, 200 ㎎/L 내지 4 gm/L, 300　㎎/L 내지 3 gm/L의 범위이거나, 또는 상기 열거된 임의 값으로 한정된 임의 범위이다.

하나 이상의 내생성 효소의 활성을 보충하고/하거나 하나 이상의 피드백-이상조절된 효소를 도입시키는 접근법은 심지어 더 높은 티라민 생성 수준을 획득하하기 위해 TYDC-발현 미생물 세포에서 조합될 수 있다.

미생물 숙주 세포

도입된 유전자를 발현시키기 위해 사용할 수 있는 임의의 미생물은 상기 기술된 바와 같은 티라민의 발효적 생성을 위해 조작될 수 있다. 일정 실시형태에서, 미생물은 티라민의 발효적 생성이 천연적으로 가능하지 않은 것이다. 일부 실시형태에서, 미생물은 쉽게 배양되는 것, 예컨대, 예를 들어, 관심 화합물의 발효적 생성에서 숙주 세포로서 유용하다고 알려진 미생물이다. 그람 양성 또는 그람 음성 박테리아를 포함하는 박테리아 세포가 상기 기술된 바와 같이 조작될 수 있다. 예로는 씨. 글루타미컴 세포 이외에도, 피. 시트레아 (P. citrea), 비. 서브틸리스 (B. subtilis), 비. 리체니포르미스 (B. licheniformis), 비. 렌터스 (B. lentus), 비. 브레비스 (B. brevis), 비. 스테아로써모필러스 (B. stearothermophilus), 비. 알칼로필러스 (B. alkalophilus), 비. 아밀로리케파시엔스 (B. amyloliquefaciens), 비. 클라우시 (B. clausii), 비. 할로두란스 (B. halodurans), 비. 메가테리움 (B. megaterium), 비. 코아굴란스 (B. coagulans), 비. 서쿨란스 (B. circulans), 비. 라우터스 (B. lautus), 비. 투린지엔시스 (B. thuringiensis), 에스. 알부스 (S. albus), 에스. 리비단스 (S. lividans), 에스. 코엘리콜로르 (S. coelicolor), 에스. 그리세우스 (S. griseus), 슈도모나스 (Pseudomonas) sp., 피. 알칼리제네스 (P. alcaligenes), 락토바실리스 (Lactobacilis) sp., 예컨대 엘. 락티스 (L. lactis), 엘. 플란타럼 (L. plantarum), 엘. 그라이 (L. grayi), 이. 콜라이 (E. coli), 이. 패시움 (E. faecium), 이. 갈리나럼 (E. gallinarum), 이. 카셀리플라버스 (E. casseliflavus), 및/또는 이. 패칼리스 (E. faecalis) 세포를 포함한다.

본 명세서에 기술된 방법에서 미생물 숙주 세포로서 사용할 수 있는 많은 유형의 혐기성 세포가 존재한다. 일부 실시형태에서, 미생물 세포는 절대 혐기성 세포이다. 절대 혐기성 미생물은 전형적으로 성장하더라도, 산소가 존재하는 조건 하에서는 충분히 성장하지 않는다. 소량의 산소가 존재할 수 있으며, 즉, 절대 혐기성 미생물이 낮은 수준의 산소에 대해서 약간의 내성 수준이 존재한다는 것을 이해해야 한다. 상기 기술된 바와 같이 조작된 절대 혐기성 미생물은 실질적으로 무산소 조건 하에서 성장될 수 있으며, 여기서 존재하는 산소의 양은 혐기성 미생물의 성장, 유지 및/또는 발효에 유해하지 않다.

대안적으로, 본 명세서에 기술된 방법에서 사용되는 미생물은 조건적 혐기성 세포일 수 있다. 조건적 혐기성 미생물은 산소가 존재하면 통기성 호흡 (예를 들어, TCA 사이클의 이용)을 통해 세포 ATP를 발생시킬 수 있다. 그러나, 조건적 혐기성 미생물은 또한 산소의 부재 하에서도 성장할 수 있다. 상기 기술된 바와 같이 조작된 조건적 혐기성 미생물은 실질적으로 무산소 조건 하에서 성장될 수 있고, 여기서 존재하는 산소의 양은 혐기성 미생물의 성장, 유지, 및/또는 발효에 유해하지 않거나, 또는 대안적으로 상당량의 산소의 존재 하에서 성장될 수 있다.

일부 실시형태에서, 본 명세서에서 기술된 방법에서 사용되는 미생물 숙주 세포는 섬유상 진균 세포이다 (예를 들어, Berka & Barnett, Biotechnology Advances, (1989), 7(2):127-154 참조). 예에는 트리코더마 롱기브라키아텀 (Trichoderma longibrachiatum), 티. 비리데 (T. viride), 티. 코닌지 (T. koningii), 티. 하르지아넘 (T. harzianum), 페니실륨 (Penicillium) sp., 후미콜라 인솔렌스 (Humicola insolens), 에이치. 라누지노스 (H. lanuginose), 에이치. 그리세아 (H. grisea), 크리소스포륨 (Chrysosporium) sp., 씨. 루크노웬스 (C. lucknowense), 글리오클라듐 (Gliocladium) sp., 아스퍼질러스 (Aspergillus) sp. (예컨대 에이. 오리재 (A. oryzae), 에이. 니거 (A. niger), 에이. 소재 (A. sojae), 에이. 자포니커스 (A. japonicus), 에이. 니둘란스 (A. nidulans), 또는 에이. 아와모리 (A. awamori)), 푸사리움 (Fusarium) sp. (예컨대, 에프. 로세움 (F. roseum), 에프. 그라미넘 (F. graminum), 에프 세레알리스 (F. cerealis), 에프. 옥시스포루임 (F. oxysporuim), 또는 에프. 베네나텀 (F. venenatum)), 뉴로스포라 (Neurospora) sp. (예컨대, 엔. 크라싸 (N. crassa) 또는 히포크레아 (Hypocrea) sp.)), 무코르 (Mucor) sp. (예컨대, 엠. 미에헤이 (M. miehei)), 리조푸스 (Rhizopus) sp., 및 에메리셀라 (Emericella) sp. 세포가 포함된다. 특정 실시형태에서, 상기 기술된 바와 같이 조작된 진균 세포는 에이. 니둘란스, 에이. 아와모리, 에이. 오리재, 에이. 아쿨레아터스 (A. aculeatus), 에이. 니거 (A. niger), 에이. 자포니커스 (A. japonicus), 티. 레에세이 (T. reesei), 티. 비리데, 에프. 옥시스포럼 (F. oxysporum), 또는 에프. 솔라니(F. solani)를 포함한다. 이러한 숙주와 함께 사용을 위한 예시적인 플라스미드 또는 플라스미드 성분은 미국 공개 특허 출원 제2011/0045563호에 기술된 것들을 포함한다.

효모가 또한 본 명세서에 기술된 방법에서 미생물 숙주 세포로서 사용될 수 있다. 예에는 사카로마이세스 (Saccharomyces) sp., 스키조사카로마이세스 (Schizosaccharomyces) sp., 피키아 (Pichia) sp., 한세눌라 폴리모르파 (Hansenula polymorpha), 피키아 스티피테스 (Pichia stipites), 클루이베로마이세스 마르시아너스 (Kluyveromyces marxianus), 클루이베로마이세스 (Kluyveromyces) spp., 야로위아 리폴리티카 (Yarrowia lipolytica) 및 캔디다 (Candida) sp.을 포함한다. 일부 실시형태에서, 사카로마이세스 sp.는 에스. 세레비지아 (예를 들어, Romanos et al., Yeast, (1992), 8(6):423-488 참조)이다. 이러한 숙주와 함께 사용을 위한 예시적인 플라스미드 또는 플라스미드 성분은 미국 특허 제7,659,097호 및 미국 공개 특허 출원 제2011/0045563호에 기술된 것들을 포함한다.

일부 실시형태에서, 숙주 세포는 녹조류, 홍조류, 회조류, 클로라라크니오파이트 (chlorarachniophyte), 유글레니드 (euglenid), 크로미스타 (chromista), 또는 디노플라젤레이트 (dinoflagellate)로부터 유래되는 조류 세포일 수 있다. (예를 들어, Saunders & Warmbrodt, "Gene Expression in Algae and Fungi, Including Yeast," (1993), National Agricultural Library, Beltsville, Md. 참조). 조류 세포에서 사용을 위한 예시적인 플라스미드 또는 플라스미드 성분은 미국 공개 특허 출원 제2011/0045563호에 기술된 것들을 포함한다.

다른 실시형태에서, 숙주 세포는 시아노박테리움 (cyanobacterium), 예컨대 형태학을 기반으로 다음의 그룹 중 어느 하나로 분류되는 시아노박테리움이다: 클로로코칼레스 (Chlorococcales), 플레우로캡살레스 (Pleurocapsales), 오실라토리알레스 (Oscillatoriales), 노스토칼레스 (Nostocales), 시네코시스틱 (Synechosystic) 또는 스티고네마탈레스 (Stigonematales) (예를 들어, Lindberg et al., Metab. Eng., (2010) 12(1):70-79 참조). 시아노박테리아 세포에서 사용을 위한 예시적인 플라스미드 또는 플라스미드 성분은 미국 공개 특허 출원 제 2010/0297749호 및 제2009/0282545호 및 국제 공개 특허 출원 번호 WO 2011/034863에 기술된 것들을 포함한다.

유전자 조작 방법

미생물 세포는 당업자가 속하는 분자 생물학 (재조합 기술 포함), 미생물학, 세포 생물학, 및 생화학의 통상의 기술을 사용하여 발효적 티라민 생성을 위해 조작될 수 있다. 이러한 기술은 문헌에 완전하게 설명되어 있고, 예를 들어 다음의 문헌들을 참조한다: "Molecular Cloning: A Laboratory Manual," fourth edition (Sambrook et al., 2012); "Oligonucleotide Synthesis" (M. J. Gait, ed., 1984); "Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications" (R. I. Freshney, ed., 6th Edition, 2010); "Methods in Enzymology" (Academic Press, Inc.); "Current Protocols in Molecular Biology" (F. M. Ausubel et al., eds., 1987, and periodic updates); "PCR: The Polymerase Chain Reaction," (Mullis et al., eds., 1994); Singleton et al., Dictionary of Microbiology and Molecular Biology 2nd ed., J. Wiley & Sons (New York, N.Y. 1994).

벡터는 세포로 유전자 물질을 도입시키기 위해 사용되는 폴리뉴클레오티드 비히클이다. 본 명세서에 기술된 방법에서 유용한 벡터는 선형일 수 있거나 또는 원형일 수 있다. 벡터는 숙주 세포의 표적 게놈으로 통합될 수 있거나 또는 숙주 세포에서 독립적으로 복제될 수 있다. 많은 적용 분야에서, 안정한 형질전환체를 생성시키는 통합 벡터가 바람직하다. 벡터는 예를 들어 복제 기원, 다중 클로닝 부위 (MCS), 및/또는 선별 마커를 포함할 수 있다. 발현 벡터는 전형적으로 특정한 숙주 세포에서 폴리뉴클레오티드 서열 (흔히 코딩 서열)의 발현을 촉진하는 조절 엘리먼트를 함유하는 발현 카세트를 포함한다. 벡터는 제한없이, 통합 벡터, 원핵생물 플라스미드, 에피솜, 바이러스 벡터, 코스미드 및 인공 염색체를 포함한다.

발현 카세트에서 사용될 수 있는 예시적인 조절 엘리먼트는 프로모터, 인핸서, 내부 리보솜 진입 부위 (IRES), 및 다른 발현 제어 엘리먼트 (예를 들어, 전사 종결 신호, 예컨대 폴리아데닐화 신호 및 폴리-U 서열)를 포함한다. 이러한 조절 엘리먼트는 예를 들어, 다음의 문헌에 기술되어 있다: Goeddel, Gene Expression Technology: Methods In Enzymology 185, Academic Press, San Diego, Calif. (1990).

일부 실시형태에서, 벡터는 CRISPR 시스템과 같은 게놈 편집을 수행할 수 있는 시스템을 도입시키는데 사용될 수 있다. 2014년 3월 6일에 공개된 미국 공개 특허 출원 제2014/0068797호를 참조하고, 또한, 다음의 문헌을 참조한다: Jinek M., et al., "A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity," Science 337:816-21, 2012). II형 CRISPR-Cas9 시스템에서, Cas9는 부위-지정 엔도뉴클레아제로서, 즉, 2개의 별개 엔도뉴클레아제 도메인 (HNH 및 RuvC/RNase H-유사 도메인)을 사용하여 특정한 표적 서열에서 폴리뉴클레오티드를 절단하도록 유도되거나 또는 유도할 수 있는 효소이다. Cas9는 Cas9가 RNA에 의해 이의 절단 부위로 유도되기 때문에 임의의 바람직한 부위에서 DNA를 절단하도록 조작될 수 있다. 그러므로, Cas9는 "RNA-가이딩된 뉴클레아제"로서 설명된다. 보다 특히, Cas9는 표적 폴리뉴클레오티드의 특별한 서열과 RNA 분자(들)의 적어도 일부분의 하이브리드화를 기반으로 특별한 폴리뉴클레오티드 표적으로 Cas9를 가이딩하는, 하나 이상의 RNA 분자와 연합된다. Ran, F.A. 등 ("In vivo genome editing using Staphylococcus aureus Cas9," Nature 520(7546):186-91, 2015, Apr 9], 모든 증보된 데이타 포함)은 crRNA/tracrRNA 서열 및 8종의 II형 CRISPR-Cas9 시스템의 구조를 제시한다. Cas9-유사 합성 단백질이 또한 당분야에 공지되어 있다 (2014년 10월 23일 공개된, 미국 공개 특허 출원 제2014-0315985호 참조).

실시예 1은 에스. 세레비지아 및 씨. 글루타미컴 세포의 게놈으로 폴리뉴클레오티드를 도입시키기 위한 2가지 예시적인 통합 접근법을 기술한다.

벡터 또는 다른 폴리뉴클레오티드는 형질전환, 접합, 전기천공, 핵 미세주사, 형질도입, 형질감염 (예를 들어, 리포펙션 매개 또는 DEAE-덱스트린 매개 형질감염 또는 재조합 파지 바이러스를 사용한 형질감염), 인산칼슘 DNA 침전제와의 인큐베이션, DNA-코팅된 미세투사체에 의한 고속 충격, 및 원형질체 융합과 같은 임의의 다양한 표준 방법을 통해서 미생물 세포로 도입될 수 있다. 형질전환체는 당분야에 공지된 임의의 방법으로 선별될 수 있다. 형질전환체를 선별하기 위한 적합한 방법은 미국 공개 특허 출원 제2009/0203102호, 제2010/0048964호, 및 제2010/0003716호, 및 국제 공개 특허 출원 번호 WO 2009/076676, WO 2010/003007, 및 WO 2009/132220에 기술되어 있다.

조작된 미생물 세포

상기 기술된 방법은 티라민을 생성시키고, 일정 실시형태에서, 과생성시키는 조작된 미생물 세포를 생성시키기 위해 사용될 수 있다. 조작된 미생물 세포는 본 명세서에 기술된 임의의 미생물 숙주 세포와 같은, 야생형 미생물 세포와 비교하여, 적어도 1, 2, 3, 4, 5, 6 ,7, 8, 9, 10개 이상의 유전자 변경, 예컨대 30-40개 변경을 가질 수 있다. 하기 실시예에 기술된 조작된 미생물 세포는 하나, 둘, 또는 3개의 유전자 변경을 갖지만, 당업자는 본 명세서에 기재된 지침에 따라서, 추가 변경을 갖는 미생물 세포를 디자인할 수 있다. 일부 실시형태에서, 조작된 미생물 세포는 야생형 미생물 세포와 비교하여, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 또는 4개 이하의 유전자 변경을 갖는다. 다양한 실시형태에서, 티라민 생성을 위해 조작된 미생물 세포는 임의의 하기에 예시된 범위 내에 속하는 다수의 유전자 변경을 가질 수 있다: 1-10, 1-9, 1-8, 2-7, 2-6, 2-5, 2-4, 2-3, 3-7, 3-6, 3-5, 3-4 등.

일부 실시형태에서, 조작된 미생물 세포는 적어도 하나의 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 이것은 천연적으로 티라민을 생성시키지 않는 미생물 숙주 세포의 경우에 필수적이다. 다양한 실시형태에서, 미생물 세포는 예를 들어 (1) 단일 이종성 TYDC 유전자, (2) 동일하거나 또는 상이할 수 있는 둘 이상의 이종성 TYDC 유전자 (달리 말해서, 동일한 이종성 TYDC 유전자의 다수 카피가 도입될 수 있거나 또는 다수의 상이한 이종성 TYDC 유전자가 도입될 수 있음), (3) 단일 이종성 TYDC 유전자 및 내생성 TYDC 유전자의 하나 이상의 추가 카피, 또는 (4) 동일하거나 또는 상이할 수 있는 둘 이상의 이종성 TYDC 유전자, 및 내생성 TYDC 유전자의 하나 이상의 추가 카피를 포함하고 발현시킬 수 있다.

이러한 조작된 숙주 세포는 티로신 (티라민의 중간 전구체)의 생성으로 이어지는 경로를 통하는 흐름을 증가시키는 적어도 하나의 추가적인 유전자 변경을 포함할 수 있다. 경로에서 이들 "상류" 효소는 이들 효소 활성을 갖는 임의의 이소폼, 파라로그, 또는 오르쏘로그를 포함하여, 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 및 티로신 아미노트랜스퍼라제를 포함한다 (당업자가 쉽게 이해하는 바와 같이 상이한 명칭으로 공지될 수 있음). 적어도 하나의 추가적인 변경은 임의의 이용가능한 수단에 의해서, 예를 들어, (1) 내생성 효소(들)의 발현 또는 활성의 변경, (2) 내생성 효소에 대한 유전자의 하나 이상의 추가 카피의 발현, 또는 (3) 하나 이상의 이종성 효소에 대한 유전자의 하나 이상의 카피의 발현에 의해서, 상류 경로 효소(들)의 활성을 증가시킬 수 있다.

일부 실시형태에서, 경로를 통해서 증가된 흐름은 상기에 기술된 바와 같이, 피드백-이상조절된 효소를 코딩하는 하나 이상의 유전자를 발현하여 달성될 수 있다. 예를 들어, 조작된 숙주 세포는 (1)　하나 이상의 피드백-이상조절된 DAHP 신타제 유전자, (2) 하나 이상의 피드백-이상조절된 코리스메이트 뮤타제 유전자, 또는 (3) 하나 이상의 피드백-이상조절된 DAHP 신타제 유전자 및 하나 이상의 피드백-이상조절된 코리스메이트 뮤타제 유전자를 포함할 수 있고 발현할 수 있다. 따라서, 임의의 이들 유전자 변경을 갖는 조작된 미생물 세포는 또한 적어도 하나의 이종성 TYDC, 및 임의로 하나 이상의 상류 경로 효소의 활성을 증가시키는 하나 이상의 유전자 변경을 포함할 수 있다.

조작된 미생물 세포는 야생형 뉴클레오티드 서열을 갖거나 또는 야생형과 상이한 도입된 유전자를 함유할 수 있다. 예를 들어, 야생형 뉴클레오티드 서열은 특정한 숙주 세포에서의 발현을 위해 코돈-최적화될 수 있다. 임의의 이들 도입된 유전자에 의해 코딩되는 아미노산 서열은 야생형일 수 있거나 또는 야생형과 상이할 수 있다. 다양한 실시형태에서, 아미노산 서열은 야생형 아미노산 서열과 적어도 0%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는다.

조작된 미생물 세포는 다양한 실시형태에서, 상기 기술된 바와 같이, 고역가로 티라민을 생성시킬 수 있다. 일부 실시형태에서, 조작된 미생물 세포는 기질의 발효에 의해 티라민을 생성시킬 수 있고, 여기서 기질의 적어도 20%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 다양한 실시형태에서, 기질의 적어도 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 일부 실시형태에서, 단백질 또는 아미노산 공급원으로부터 유래되지 않는 발효 기질의 백분율은 임의의 하기의 예시적인 범위 내에 속한다: 40-100%, 40-90%, 40-80%, 50-100%, 50-90%, 50-80%, 60-100%, 60-90%, 60-80% 등.

본 명세서에 기술된 접근법은 진균 세포, 즉 효모 에스. 세레비지아 (진핵생물), 및 박테리아 세포, 즉 씨. 글루타미컴 (원핵생물)에서 수행되었다. (실시예 1 참조)

예시적인 조작된 진균 세포

예시적인 조작된 사카로마이세스 세레비지아 세포

일정한 실시형태에서, 조작된 효모 (예를 들어, 에스. 세레비지아) 세포는 파파베르 솜니페럼 유래의 TYDC와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 다양한 실시형태에서, 피. 솜니페럼 TYDC는 SEQ ID NO:20을 포함한다. 이것은 보다 일반적으로 상기에 기술된 바와 같이, 조작된 효모 세포의 유일한 유전자 변경일 수 있거나, 또는 효모 세포는 하나 이상의 추가적인 유전자 변경을 포함할 수 있다.

특정한 실시형태에서, 조작된 효모 (예를 들어, 에스. 세레비지아) 세포는 야생형 에스. 세레비지아 DAHP 신타제와 전형적으로 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 에스. 세레비지아 DAHP 신타제의 변이체를 추가적으로 발현한다. 예시적인 실시형태에서, 조작된 효모 (예를 들어, 에스. 세레비지아) 세포는 피. 솜니페럼 티로신/DOPA 디카복실라제 2 (SEQ ID NO:2) 및 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 피드백-이상조절된 에스. 세레비지아 DAHP 신타제 (SEQ ID NO:6)를 발현한다.

제3의 유전자 변경을 갖는 예시적인 효모 (예를 들어, 에스. 세레비지아) 세포는 대조군 세포에 비해, 세포에 야생형 에스. 세레비지아 프리페네이트 디히드로게나제 (SEQ ID NO:4) 유전자의 추가 카피 또는 야생형 에스. 세레비지아 프리페네이트 디히드로게나제와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 프리페네이트 디히드로게나제를 코딩하는 유전자를 도입시켜 생성되는, 상류 경로 효소, 예컨대 프리페네이트 디히드로게나제의 증가된 활성을 추가로 가질 수 있다.

제4 유전자 변경을 갖는 예시적인 효모 (예를 들어, 에스. 세레비지아) 세포는 대조군 세포에 비해, 세포에 야생형 에스. 세레비지아 트랜스알돌라제 (SEQ ID NO:8) 유전자의 추가 카피 또는 야생형 에스. 세레비지아 트랜스알돌라제와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 트랜스알돌라제를 코딩하는 유전자를 도입시켜 생성되는, 상류 경로 효소, 예컨대 트랜스알돌라제의 증가된 활성을 추가로 가질 수 있다. 예시적인 실시형태에서, 조작된 에스. 세레비지아 세포는 코리네박테리움 글루타미컴 및 에스. 세레비지아에 대한 변형된 조합 코돈을 사용하여 코돈-최적화된 이들 유전자의 형태를 발현시킨다.

예시적인 조작된 야로위아 리폴리티카 세포

일정한 실시형태에서, 조작된 효모 (예를 들어, 야로위아 리폴리티카) 세포는 엔테로코커스 패시움 (예를 들어, Com15) 유래 피리독살-의존성 디카복실라제 (TYDC)와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 다양한 실시형태에서, 이. 패시움 TYDC는 SEQ ID NO:1을 포함한다. 이것은 조작된 효모 세포의 유일한 유전자 변경일 수 있거나, 또는 효모 세포는 보다 일반적으로 상기에 기술된 바와 같이, 하나 이상의 추가적인 유전자 변경을 포함할 수 있다.

특정한 실시형태에서, 조작된 효모 (예를 들어, 와이. 리폴리티카) 세포는 야생형 에스. 세레비지아 (예를 들어, S288c) 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)(SEQ ID NO: 9)와 전형적으로 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는, 에스. 세레비지아 DAHP 신타제를 추가로 발현한다. 예시적인 실시형태에서, 조작된 와이. 리폴리티카 세포는 와이. 리폴리티카에 대해 코돈-최적화된 이들 유전자의 형태를 발현한다 (SEQ ID NO: 10).

예시적인 조작된 박테리아 세포

예시적인 조작된 코리네박테리움 글루타미컴 세포

일정한 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 엔테로코커스 패시움 (예를 들어, Com15) 또는 자이고사카로마이세스 바일리 유래 TYDC와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 예를 들어, 이. 패시움 TYDC는 SEQ ID NO:1을 포함할 수 있고, 지. 바일리 TYDC는 SEQ ID NO:11을 포함할 수 있다. 이종성 TYDC의 발현은 조작된 박테리아 세포의 유일한 유전자 변경일 수 있거나, 또는 박테리아 세포는 상기에 보다 일반적으로 기술된 바와 같이, 하나 이상의 추가적인 유전자 변경을 포함할 수 있다.

특정한 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 에스. 세레비지아 DAHP 신타제 (예를 들어, 균주 288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제) 또는 전형적으로 야생형 에스. 세레비지아 DAHP 신타제 (SEQ ID NO:9)와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 이의 변이체를 추가로 발현한다. 양쪽 유전자는 예를 들어 에스. 세레비지아에 대해 코돈-최적화될 수 있다. 예시적인 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 피드백-이상조절된 에스. 세레비지아 DAHP 신타제 (SEQ ID NO:6)와 조합하여 이. 패시움 TYDC (SEQ ID NO:1) 또는 지. 바일리 TYDC (SEQ ID NO:11) 중 하나 (또는 둘 모두)를 발현한다.

DAHP 신타제 변이체를 발현시키는 것 이외에도, 또는 대안적으로, TYDC-발현 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 대조군 세포에 비해서 상류 경로 효소, 예컨대 코리스메이트 신타제 및/또는 프리프레네이트 디히드로게나제의 증가된 활성을 가질 수 있다. 예시적인 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 야생형 에스. 세레비지아 코리스메이트 신타제 (SEQ ID NO:12) 유전자의 카피 또는 야생형 에스. 세레비지아 코리스메이트 신타제와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 코리스메이트 신타제를 코딩하는 유전자 (SEQ ID NO: 3)와 조합하여 이. 패시움 TYDC (SEQ ID NO:1)를 발현한다. 다른 예시적인 실시형태에서, 조작된 박테리아 (예를 들어, 씨. 글루타미컴) 세포는 야생형 에스. 세레비지아 프리페네이트 디히드로게나제 (SEQ ID NO:13) 유전자의 카피 또는 야생형 에스. 세레비지아 프리페네이트 디히드로게나제와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 프리페네이트 디히드로게나제를 코딩하는 유전자 (SEQ ID NO: 4)와 조합하여 이. 패시움 TYDC (SEQ ID NO:1)를 발현한다.

예시적인 조작된 바실러스 서브틸리스 세포

일정한 실시형태에서 조작된 박테리아 (예를 들어, 바실러스 서브틸리스) 세포는 엔테로코커스 패시움 (예를 들어, Com15) 유래 TYDC와 적어도 70%, 75%, 80%, 85%, 90%, 95% 또는 100%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 발현한다. 예를 들어, 이. 패시움 TYDC는 SEQ ID NO:1을 포함할 수 있다. 이종성 TYDC의 발현은 조작된 박테리아 세포의 유일한 유전자 변경일 수 있거나, 또는 박테리아 세포는 상기에 보다 일반적으로 기술되는 바와 같이, 하나 이상의 추가적인 유전자 변경을 포함할 수 있다.

특정한 실시형태에서, 조작된 박테리아 (예를 들어, 비. 서브틸리스) 세포는 야생형 에스. 세레비지아 DAHP 신타제 (SEQ ID NO:9)와 전형적으로 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 에스. 세레비지아 DAHP 신타제 (예를 들어, 균주 288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제)의 변이체를 추가적으로 발현한다.

제3의 유전자 변경을 갖는 예시적인 박테리아 (예를 들어, 비. 서브틸리스)는 대조군 세포에 비해, 세포에 야생형 이. 콜라이 (예를 들어, K12) 시키메이트 키나제 2 (SEQ ID NO:14) 유전자의 추가 카피 또는 야생형 이. 콜라이 시키메이트 키나제 2와 적어도 70%, 75%, 80%, 85%, 90%, 또는 95%의 아미노산 서열 동일성을 갖는 시키메이트 키나제를 코딩하는 유전자 (SEQ ID NO: 15)를 도입시켜 생성되는, 상류 경로 효소, 예컨대 시키메이트 키나제의 증가된 활성을 추가로 가질 수 있다. 예시적인 실시형태에서, 조작된 비. 서브틸리스 세포는 에스. 세레비지아에 대해 코돈-최적화된 이들 유전자의 형태를 발현한다.

조작된 미생물 세포의 배양

본 명세서에 기술된 임의의 미생물 세포는 예를 들어, 유지, 성장, 및/또는 티라민 생성을 위해서 배양될 수 있다. 일반적으로, 티라민은 기질의 발효로부터 생성되고 여기서 기질의 적어도 20%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 따라서, 본 명세서에 기술된 조작된 미생물 세포의 배양은 발효 기질을 포함하고, 여기서 기질의 적어도 20%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 다양한 실시형태에서, 기질의 적어도 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는다. 일부 실시형태에서, 단백질 또는 아미노산 공급원으로부터 유래되지 않는 발효 기질의 백분율은 임의의 하기의 예시적인 범위 내에 속한다: 40-100%, 40-90%, 40-80%, 50-100%, 50-90%, 50-80%, 60-100%, 60-90%, 60-80% 등.

일부 실시형태에서, 배양은 10-500의 600 nm에서의 광학 밀도, 예컨대 50-150의 광학 밀도까지 성장된다.

다양한 실시형태에서, 배양물은 적어도 10, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 또는 900 ㎎/L 또는 적어도 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 또는 10 gm/L의 역가로 생성된 티라민을 포함한다. 다양한 실시형태에서, 역가는 10 ㎎/L 내지 10 gm/L, 100 ㎎/L 내지 5 gm/L, 200 ㎎/L 내지 4 gm/L, 300　㎎/L 내지 3 gm/L의 범위, 또는 상기 열거된 임의 값으로 한정되는 임의 범위이다.

배양 배지

미생물 세포는 제한없이, 최소 배지 즉 세포 성장을 위해 가능한 최소 영양분을 함유하는 것을 포함하는, 임의의 적합한 배지에서 배양될 수 있다. 전형적으로, 최소 배지는 (1) 미생물 성장을 위한 탄소원; (2) 특정한 미생물 세포 및 성장 조건에 의해 좌우될 수 있는 염; 및 (3) 물을 함유한다. 적합한 배지는 또한 다음의 임의 조합을 포함할 수 있다: 성장 및 생성물 형성을 위한 질소원, 성장을 위한 황원, 성장을 위한 포스페이트원, 성장을 위한 금속염, 성장을 위한 비타민, 및 성장을 위한 다른 보조인자.

임의의 적합한 탄소원은 숙주 세포를 배양하는데 사용될 수 있다. 용어 "탄소원"은 미생물 세포에 의해 물질대사될 수 있는 하나 이상의 탄소-함유 화합물을 의미한다. 다양한 실시형태에서, 탄소원은 탄수화물 (예컨대, 모노사카라이드, 디사카라이드, 올리고사카라이드, 또는 폴리사카라이드), 또는 전화당 (예를 들어, 효소적으로 처리된 수크로스 시럽)이다. 예시적인 모노사카라이드는 포도당 (덱스트로스), 프룩토스 (레불로스), 및 갈락토스를 포함하고, 예시적인 올리고사카라이드는 덱스트란 또는 글루칸을 포함하고, 예시적인 폴리사카라이드는 전분 및 셀룰로스를 포함한다. 적합한 당류는 C6 당류 (예를 들어, 프룩토스, 만노스, 갈락토스, 또는 포도당) 및 C5 당류 (예를 들어, 자일로스 또는 아라비노스)를 포함한다. 다른, 덜 값비싼 탄소원은 사탕수수액, 비트액, 수수액 등을 포함하고, 이들 중 어느 하나는 그럴 필요는 없지만, 완전하게 또는 부분적으로 탈이온화된다.

배양 배지 내 염은 일반적으로 세포가 단백질 및 핵산을 합성할 수 있도록 필수 원소, 예컨대 마그네슘, 질소, 인 및 황을 제공한다.

최소 배지는 하나 이상의 선별제, 예컨대 항생제가 보충될 수 있다.

티라민을 생성시키기 위해서, 배양 배지는 포도당 및/또는 질소원 예컨대 우레아, 암모늄 염, 암모니아, 또는 이의 임의 조합이 배양 동안 포함될 수 있고/있거나 보충된다.

배양 조건

미생물 세포의 유지 및 성장을 위해 적합한 재료 및 방법은 당분야에 충분히 공지되어 있다. 예를 들어, 미국 공개 특허 출원 제2009/0203102호, 제2010/0003716호, 및 제2010/0048964호, 및 국제 공개 특허 출원 번호 WO 2004/033646, WO 2009/076676, WO 2009/132220, 및 WO 2010/003007, [Manual of Methods for General Bacteriology, Gerhardt et al., eds, American Society for Microbiology, Washington, D.C. (1994)] 또는 [Brock in Biotechnology: A Textbook of Industrial Microbiology, Second Edition (1989) Sinauer Associates, Inc., Sunderland, Mass]를 참조한다.

일반적으로, 세포는 적절한 온도, 가스 혼합물, 및 pH (예컨대, 약 20℃ 내지 약 37℃, 약 6% 내지 약 84% CO₂, 및 약 5 내지 약 9의 pH)에서 성장되고 유지된다. 일부 양상에서, 세포는 35℃에서 성장된다. 일정 실시형태에서, 예컨대 호열성 박테리아가 숙주 세포로서 사용되는 경우에, 고온 (예를 들어, 50℃ 내지 75℃)이 사용될 수 있다. 일부 양상에서, 발효를 위한 pH 범위는 약 pH 5.0 내지 약 pH 9.0 (예컨대 약 pH 6.0 내지 약 pH 8.0 또는 약 6.5 내지 약 7.0)이다. 세포는 특정한 세포의 요건을 기반으로 통기성, 저산소성, 또는 혐기성 조건 하에서 성장될 수 있다.

사용될 수 있는 회분식, 유가식 또는 연속 발효와 같은, 표준 배양 조건 및 발효 방식은 미국 공개 특허 출원 제2009/0203102호, 제2010/0003716호, 및 제2010/0048964호, 및 국제 공개 특허 출원 번호 WO 2009/076676, WO 2009/132220, 및 WO 2010/003007에 기술되어 있다. 회분식 및 유가식 발효는 당분야에서 일반적이고 충분히 공지되어 있으며, 그 예는 [Brock, Biotechnology: A Textbook of Industrial Microbiology, Second Edition (1989) Sinauer Associates, Inc.]에서 확인할 수 있다.

일부 실시형태에서, 세포는 제한된 당 (예를 들어, 포도당) 조건 하에서 배양된다. 다양한 실시형태에서, 첨가되는 당의 양은 세포에 의해 소모될 수 있는 당의 양의 약 105% 이하 (예컨대 약 100%, 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 또는 10%)이다. 특정한 실시형태에서, 배양 배지에 첨가되는 당의 양은 지정된 시간 동안 세포에 의해 소모되는 당의 양과 대략 동일하다. 일부 실시형태에서, 세포 성장 속도는 세포 배지 중 당의 양에 의해 지지될 수 있는 속도로 세포가 성장하도록 첨가되는 당의 양을 제한하여 제어된다. 일부 실시형태에서, 당은 세포가 배양되는 시간 동안 축적되지 않는다. 다양한 실시형태에서, 세포는 약 1, 2, 3, 5, 10, 15, 20, 25, 30, 35, 40, 50, 60, 또는 70시간 이상 동안 또는 심지어 최대 약 5 내지 10일의 시간 동안 제한된 당 조건 하에서 배양된다. 다양한 실시형태에서, 세포는 세포가 배양되는 총 시간 길이의 약 5, 10, 15, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 95, 또는 100% 이상 동안 제한된 당 조건 하에서 배양된다. 임의의 특정한 이론으로 한정하려는 의도는 아니지만, 제한된 당 조건은 세포의 보다 호의적인 조절을 가능하게 할 수 있다고 믿는다.

일부 양상에서, 세포는 회분식 배양으로 성장된다. 세포는 또한 유가식 배양 또는 연속 배양으로 성장될 수 있다. 추가적으로, 세포는 제한없이, 상기 기술된 임의의 최소 배지를 포함하여, 최소 배지에서 배양될 수 있다. 최소 배지는 1.0% (w/v) 이하의 포도당 (또는 임의의 다른 6-탄소당)이 더 보충될 수 있다. 특히, 최소 배지는 1% (w/v), 0.9% (w/v), 0.8% (w/v), 0.7% (w/v), 0.6% (w/v), 0.5% (w/v), 0.4% (w/v), 0.3% (w/v), 0.2% (w/v), 또는 0.1% (w/v)의 포도당이 보충될 수 있다. 일부 배양에서, 유의하게 더 높은 수준의 당 (예를 들어, 포도당)이, 예를 들어, 적어도 10% (w/v), 20% (w/v), 30% (w/v), 40　% (w/v), 50% (w/v), 60% (w/v), 70% (w/v), 또는 최대 배지 중 당의 가용 한계로 사용된다. 일부 실시형태에서, 당의 수준은 상기 값의 임의의 2개의 범위 내에 속한다: 예를 들어, 0.1-10% (w/v), 1.0-20% (w/v), 10-70% (w/v), 20-60% (w/v), 또는 30-50% (w/v). 뿐만 아니라, 상이한 당 수준이 배양 단계의 상이한 시기 동안 사용될 수 있다. (예를 들어, 에스. 세레비지아 또는 씨. 글루타미컴의) 유가식 배양의 경우, 당의 수준은 회분식 시기에는 약 100-200 g/L (10-20% (w/v))일 수 있고 그 다음으로 최대 약 500-700 g/L (공급물 중 50-70%)일 수 있다.

추가적으로, 최소 배지는 0.1% (w/v) 이하의 효모 추출물이 보충될 수 있다. 특히, 최소 배지는 0.1% (w/v), 0.09% (w/v), 0.08% (w/v), 0.07% (w/v), 0.06% (w/v), 0.05% (w/v), 0.04% (w/v), 0.03% (w/v), 0.02% (w/v), 또는 0.01% (w/v)의 효모 추출물이 보충될 수 있다. 대안적으로, 최소 배지는 1% (w/v), 0.9% (w/v), 0.8% (w/v), 0.7% (w/v), 0.6% (w/v), 0.5% (w/v), 0.4% (w/v), 0.3% (w/v), 0.2% (w/v), 또는 0.1% (w/v)의 포도당 및 0.1% (w/v), 0.09% (w/v), 0.08% (w/v), 0.07% (w/v), 0.06% (w/v), 0.05% (w/v), 0.04% (w/v), 0.03% (w/v), 또는 0.02% (w/v)의 효모 추출물이 보충될 수 있다. 일부 배양에서, 유의하게 더 높은 수준의 효모 추출물이, 예를 들어, 적어도 1.5% (w/v), 2.0% (w/v), 2.5% (w/v), 또는 3% (w/v)로 사용될 수 있다. (예를 들어, 에스. 세레비지아 또는 씨. 글루타미컴의) 일부 배양에서, 효모 추출물 수준은 상기 값의 임의의 2개의 범위 내에 속한다: 예를 들어, 0.5-3.0% (w/v), 1.0-2.5% (w/v), 또는 1.5-2.0% (w/v).

본 명세서에 기술된 조작된 미생물 세포의 유지 및 성장을 위해 적합한 예시적인 재료 및 방법은 하기 실시예에서 확인할 수 있다.

티라민 생성 및 회수

본 명세서에 기술된 임의의 방법은 티라민을 회수하는 단계를 더 포함할 수 있다. 일부 실시형태에서, 소위 회수 스트립에 함유된 생성된 티라민은 생성 용기로부터 회수/수확된다. 회수 스트림은 예를 들어, 생성 용기 중 휴면 세포에 의한 생성 기질의 전환의 결과로서 티라민을 함유하는, 생성 용기로부터 발생되는 세포-무함유 또는 세포-함유 수용액을 포함할 수 있다. 회수 스트림에 여전히 존재하는 세포는 당분야에 공지된 임의의 작업, 예컨대, 예를 들어 여과, 원심분리, 디캔테이션, 막 직교류 한외여과 또는 미세여과, 접선 유동 한외여과 또는 미세여과 또는 데드 엔드 여과에 의해 티라민으로부터 분리될 수 있다. 이러한 세포 분리 작업 이후에, 회수 스트림은 본질적으로 세포를 함유하지 않는다.

회수 스트림에 함유된 다른 성분으로부터 생성된 티라민의 분리 및/또는 정제의 추가 단계, 즉 소위 하류 프로세싱 단계는 임의로 수행될 수 있다. 이들 단계는 당업자에게 공지된 임의의 수단, 예컨대, 예를 들어 농축, 추출, 결정화, 침전, 흡착, 이온 교환, 크로마토그래피, 증류, 전기투석, 이중극성막 전기투석 및/또는 역삼투압을 포함할 수 있다. 임의의 이들 절차는 티라민을 정제하기 위해 단독으로 또는 조합하여 사용될 수 있다. 추가 정제 단계는 예를 들어, 농축, 결정화, 침전, 세척 및 건조, 활성 탄소 처리, 이온 교환 및/또는 재결정화 중 하나 이상을 포함할 수 있다. 적합한 정제 프로토콜의 디자인은 세포, 배양 배지, 배양의 크기, 생성 용기 등에 따라 좌우될 수 있고, 당업자의 수준 내이다.

하기의 실시예는 본 개시 내용의 다양한 실시형태를 예시하려는 목적으로 제공되고 임의 방식으로 본 개시 내용을 제한하는 것을 의미하지 않는다. 청구항의 범주에 의해 한정되는, 본 개시 내용의 사조 내에 포괄되는 그의 변화 및 다른 용도는 당업자가 확인할 수 있을 것이다.

실시예 1 - 티라민을 생성시키도록 조작된 사카로마이세스 세레비지아 및 코리네박테리움 글루타미컴의 균주의 구축 및 선별

플라스미드/DNA 디자인

이 작업에 시험된 모든 균주는 사유 소프트웨어를 사용해 디자인된 플라스미드 DNA로 형질감염된다. 플라스미드 디자인은 이 작업에서 조작된 2종의 숙주 유기체 중 하나에 특이적이었다. 플라스미드 DNA는 물리적으로 표준 DNA 조립 방법으로 구축되었다. 그리고 이 플라스미드 DNA는 각각 하기에 기술된 2가지 숙주-특이적 방법 중 하나에 의해 물질대사 경로 삽입체를 통합시키는데 사용되었다.

에스. 세레비지아 경로 통합

"분할-마커, 이중-크로스오버" 게놈 통합 전략이 에스. 세레비지아 균주를 조작하기 위해 개발되었다. 도 2는 상보성, 분할-마커 플라스미드의 게놈 통합 및 에스. 세레비지아에서 콜로니 PCR을 통한 올바른 게놈 통합의 검증을 예시한다. 상보성 5' 및 3' 상동성 및 URA3 선별 마커의 중복된 절반 (해시 바로 표시된 직접 반복부)을 갖는 2개 플라스미드를 메가뉴클레아제로 분해시켰고 선형 단편으로서 형질전환시켰다. 삼중-크로스오버 사건은 표적화된 유전자좌에 바람직한 이종성 유전자를 통합시켰고 완전한 URA3 유전자를 재구성시켰다. 이러한 통합 사건으로부터 유래된 콜로니는 5' 및 3' 접합부 둘 모두를 확인하기 위해 2개 3-프라이머 (UF/IF/wt-R 및 DR/IF/wt-F) 반응을 사용해 어세이하였다. 추가 조작이 바람직한 균주의 경우, 균주는 5-FOA 플레이트 상에 플레이팅시켜서 본래 직접 반복부의 소형 단일 카피는 남겨두고, URA3의 제거에 대해 선별될 수 있다. 이러한 게놈 통합 전략은 동일한 작업흐름으로 유전자 넉-아웃, 유전자 넉-인, 및 프로모터 적정을 위해 사용될 수 있다.

씨. 글루타미컴 경로 통합

"루프-인, 단일-크로스오버" 게놈 통합 전략이 씨. 글루타미컴 균주를 조작하기 위해 개발되었다. 도 3은 루프-인 단독 및 루프-인/루프-아웃 구성체의 게놈 통합 및 콜로니 PCR을 통한 올바른 통합의 검증을 예시한다. 루프-인 단독 구성체 (제목 "루프-인"에 도시)는 단일 2-kb 상동성 팔부 ("통합 유전자좌"로서 표시됨), 양성 선별 마커 ("마커"로 표시됨)), 및 관심 유전자(들) ("프로모터-유전자-종결인자"로 표시됨)를 함유하였다. 단일 크로스오버 사건이 씨. 글루타미컴 염색체로 플라스미드를 통합시켰다. 통합 사건은 항생제 (25 ㎍/㎖ 카나마이신)의 존재 하에서 성장에 의해 게놈에서 안정하게 유지된다. 루프-인 통합으로부터 유래된 콜로니에서 올바른 게놈 통합은 UF/IR 및 DR/IF PCR 프라이머를 사용한 콜로니 PCR로 확인하였다.

루프-인, 루프-아웃 구성체 (제목 "루프-인, 루프-아웃으로 표시)는 2개 2-kb 상보성 팔부 (5' 및 3' 팔부), 관심 유전자(들) (화살표), 양성 선별 마커 ("마커"로 표시), 및 역선별 마커를 함유하였다. "루프-인" 단독 구성체와 유사하게, 단일 크로스오버 사건은 플라스미드를 씨. 글루타미컴의 염색체로 통합시켰다. 주: 2가지 가능한 통합중 오직 하나만을 여기에 도시한다. 올바른 게놈 통합은 콜로니 PCR을 통해 확인하였고 플라스미드 골격 및 역선별 마커가 절개될 수 있도록 역선별이 적용되었다. 그 결과로 2가지 가능성 중 하나가 일어난다: 야생형으로의 복귀 (아래 좌측 박스) 또는 바람직한 경로 통합 (아래 우측 박스). 역시, 올바른 게놈 루프-아웃은 콜로니 PCR로 확인한다. (약어: 프라이머: UF = 상류 전방향, DR = 하류 역방향, IR = 내부 역방향, IF = 내부 전방향.)

세포 배양

배지 요건 및 성장의 차이에 기인하여 씨. 글루타미컴 및 에스. 세레비지아에 대한 개별 작업흐름을 확립시켰다. 양쪽 과정은 플레이트의 균주를 임의추출하는 자동화 작업흐름을 사용하여 성공적으로 구축된 균주를 강화시키는 히트-피킹 단계를 포함하였다. 성공적으로 구축된 각 균주의 경우에, 콜로니 대 콜로니 변동 및 다른 과정중 변동을 시험하기 위해 별개 콜로니로부터 최대 4개의 복제물을 시험하였다. 4개보다 적게 콜로니가 수득되었다면, 존재하는 콜로니는 각각의 바람직한 유전자형으로부터 적어도 4개 웰이 시험되도록 복제하였다.

콜로니는 선별 배지 (씨. 글루타미컴의 경우 BHI, 에스. 세레비지아의 경우 SD-ura)를 포함하는 95-웰 플레이트에서 강화시켰고 포화까지 2일 동안 배양하였으며 이후 16.6% 글리세롤을 포함시켜 -80℃에서 저장을 위해 냉동시켰다. 이후에 냉동된 스톡은 냉동으로부터 성장 및 회수를 돕도록 저수준의 아미노산이 포함된 최소 배지 중에서 씨드 단계를 접종하는데 사용되었다. 씨드 플레이트는 1일 내지 2일 동안 30℃에서 성장시켰다. 그리고 씨드 플레이트는 최소 배지를 포함하는 주요 배양 플레이트에 접종하여 48시간 내지 88시간 동안 성장시키는데 사용되었다. 플레이트는 바람직한 시점에 제거되었고 세포 밀도 (OD600), 생존능 및 포도당에 대해 시험되었으며, 상청액 샘플은 관심 생성물에 대한 LC-MS 분석을 위해 저장되었다.

세포 밀도

세포 밀도는 600 nm에서 각 웰의 흡광도를 검출하는 분광광도 어세이를 사용해 측정되었다. 고정량의 배양물을 각 배양 플레이트로부터 어세이 플레이트로 전달한 후에, 175 mM 소듐 포스페이트 (pH 7.0)와 혼합하여 10-배 희석물을 생성시키는데 로봇공학이 사용되었다. 어세이 플레이트는 Tecan M1000 분광광도계를 사용하여 측정하였고 어세이 데이타를 LIMS 데이타베이스에 업로딩하였다. 비접종 대조군을 사용하여 배경치 흡광도를 빼주었다. 세포 성장은 각 단계에서 다수 플레이트를 접종하고, 그 이후 각 시점에 전체 플레이트를 희생시켜 모니터링하였다.

대량의 플레이트를 취급하는 동안 세포의 침강 (그 결과로 측정동안 비대표적 샘플이 야기될 수 있음)을 최소화하기 위해서 각 플레이트는 각 판독 전에 10 내지 15초 동안 진탕시켰다. 플레이트 내에서 세포 밀도의 광범위한 변동은 또한 직선 검출 범위의 바깥쪽에서 흡광도 측정을 초래할 수 있고, 그 결과로 더 높은 OD 배양물을 과소평가하게 될 수 있다. 일반적으로, 지금까지 시험된 균주는 이것이 우려될 만큼 충분히 유의하게 변동되지 않았다.

세포 생존능

2종의 방법을 사용하여 세포 생존능을 측정하였다. 첫번째 어세이는 세포 생존능을 평가하기 위해, 단일 염색제, 프로피듐 아이오다이드를 이용하였다. 프로피듐 아이오다이드는 DNA에 결합하고 세포막이 손상된 세포로 투과가능하다. 프로피듐 요오다이드를 흡수한 세포는 비생존으로 간주된다. 죽은 세포 대조군은 10분 동안 95℃에서 대조군 배양물의 세포 샘플을 인큐베이션시킴으로써, 세포의 전체 개수에 대해 정규화하는데 사용되었다. 이들 대조군 샘플 및 시험 샘플은 5분 동안 프로피듐 아이오다이드 염색제와 인큐베이션시켰고, 2회 175 mM 포스페이트 완충액으로 세척하였으며, 형광도는 617 nm에서 검은색 고형-바닥 96웰 플레이트에서 측정하였다.

포도당

포도당은 175 mM 소듐 포스페이트 완충액, pH 7 중 0.2 U/㎖ 홀스래디쉬 퍼옥시다제 (Sigma) 및 0.2 mM 앰플렉스 레드와 16 U/㎖ 포도당 옥시다제 (Sigma)를 사용하는 효소 어세이를 사용하여 측정된다. 포도당의 산화는 히드로겐 퍼옥시다제를 발생시키고, 이후에 산화되어 앰플렉스 레드로 환원되어, 560 nm에서 흡광도를 변화시킨다. 변화는 흡광도이고 기지 농도의 표준물을 사용하는 샘플 중 포도당 농도와 상관성이 있다.

액체-고체 분리

LC-MS에 의한 분석을 위해 세포외 샘플을 수확하기 위해서, 액체 및 고체 상은 원심분리를 통해서 분리시켰다. 배양 플레이트는 2000 rpm에서 4분 동안 원심분리시켰고, 상청액은 로봇공학을 사용해 목적 플레이트로 전달하였다. 75 ㎕의 상청액을 각 플레이트로 전달하였고, 하나는 4℃에 저장하였고, 두번째는 장기간 저장을 위해 80℃에 저장하였다.

1회차의 유전자 조작 및 스크리닝은 숙주 세포로서 씨. 글루타미컴 및 에스. 세레비지아를 사용해 수행되었다. 이종성 TYDC는 일부 경우에서, 피드백-이상조절된 DAHP 신타제와 함께 숙주 세포에서 발현시켰다. 일부 경우에, TYDC 뉴클레오티드 서열은 씨. 글루타미컴 또는 에스. 세레비지아에 대해 코돈-최적화되었다. 균주는 상기에 기술된 바와 같이 생성시켰고 배양하였으며, 배양 배지 중 티라민 역가는 LC-MS로 측정하였다. 균주 및 결과는 표 1에 표시되어 있다. 최고-성능 균주는 K229L 아미노산 치환을 갖는 에스. 세레비지아 DAHP 신타제 (SEQ ID NO: 6)와 함께, 피. 솜니페럼 TYDC (SEQ ID NO: 2)를 발현하는 에스. 세레비지아 균주였고, 배양 배지의 L 기준으로 거의 387 ㎍/L의 티라민 역가를 제공하였다. 이러한 균주는 2회차의 유전자 조작 및 스크리닝을 위해 선택되었다.

2회차의 조작/스크리닝에서, 제3 효소는 1회차로부터의 K229L 아미노산 치환을 갖는 에스. 세레비지아 DAHP 신타제와 함께, 피. 솜니페럼 TYDC를 발현하는 에스. 세레비지아 균주에서 발현시켰다. 일부 경우에서, 제3 효소를 코딩하는 뉴클레오티드 서열은 코돈-최적화되었다. 표 2는 시험된 제3 효소 및 최종 티라민 역가를 표시하고 있다. 더 높은 역가는 약 346　㎎/L로서, 거의 1000-배 개선이 제3 효소로서 천연 에스. 세레비지아 프리페네이트 디히드로게나제를 발현하는 균주에 의해 달성되었다.

실시예 2A - 에스. 세레비지아 구축물에서 개선-회차 (3회차) 결과 및 티라민의 생성을 위한 상이한 미생물 숙주 세포의 평가

요약

실시예 1의 최고-성능 균주는 사카로마이세스 세레비지아에서 티라민을 개선시키려는 노력으로 3회차 유전자 조작 ("개선 회차")을 시험하기 위한 대조군 균주로서 선택되었다. 대조군 균주는 에스. 세레비지아 유래 프리페네이트 디히드로게나제 (UniProt ID P20049)(SEQ ID NO: 4), 아미노산 치환 K229L을 보유하는 에스. 세레비지아 S288c 유래 DAHP 신타제 (UniProt ID P32449)(SEQ ID NO: 6) 및 파파베르 솜니페럼 유래 티로신/DOPA 디카복실라제 2 (UniProt ID P54769)(SEQ ID NO: 2)를 발현하였다. 티라민 생성은 대조군에 비해서 8종 균주의 경우에 에스. 세레비지아에서 개선되었고, 이들 균주 중에서, 최고 역가를 제공하는 균주 (300 ㎎/L vs. 대조군의 경우 266 ㎎/L)는 에스. 세레비지아 유래 트랜스알돌라제 (UniProt ID P15019)(SEQ ID NO: 8)를 발현하였다.

시험된 균주 디자인

티라민 생성은 대조군 대비 하기 이종성 효소 각각 또는 이종성 효소의 조합의 발현에 의해 개선되었다:

1) 방향족 아미노산 아미노트랜스퍼라제 (SEQ ID NO: 28)

2) 에스케리치아 콜라이 K12 유래 포스포에놀피루베이트 신타제 (UniProt ID P23538) (SEQ ID NO: 29)

3) 에스. 세레비지아 유래 트랜스케톨라제 (UniProt ID P23254) (SEQ ID NO: 30)

4) 에스. 세레비지아 유래 트랜스알돌라제 (UniProt ID P15019) (SEQ ID NO: 8)

5) 에스. 세레비지아 유래 트랜스케톨라제 (UniProt ID P23254) (SEQ ID NO: 30) 및 에스. 세레비지아 유래 트랜스알돌라제 (UniProt ID P15019) (SEQ ID NO: 8)

6) 에스. 세레비지아 유래 트랜스케톨라제 (UniProt ID P23254) (SEQ ID NO: 30) 및 이. 콜라이 K12 유래 포스포에놀피루베이트 신타제 (UniProt ID P23538) (SEQ ID NO: 29).

7) 에스. 세레비지아 유래 트랜스알돌라제 (UniProt ID P15019) (SEQ ID NO: 8) 및 아미노산 치환 K299L을 보유하는 에스. 세레비지아 유래 DAHP 신타제 (UniProt ID P32449) (SEQ ID NO: 6).

8) 그라실라리아 그라실리스 (Gracilaria gracilis) 유래 글리세르알데히드-3-포스페이트 디히드로게나제 (UniProt ID P30724) (SEQ ID NO: 31)

결과

결과는 표 7 (하기) 및 도 9에 표시되어 있다.

추가의 디자인, 티라민의 생성은 이 실시예로부터의 최고-성능 균주에 하기 이종성 효소 또는 이종성 효소의 조합의 첨가를 함유하는 균주에서 개선에 대해 시험될 수 있다:

1) 2-디히드로-3-데옥시포스포헵토네이트 알돌라제 (SEQ ID NO: 32)

2) 코리스메이트 뮤타제 (SEQ ID NO: 33)

3) 코리스메이트 뮤타제 (SEQ ID NO: 33) 및 프리페네이트 디히드로게나제 (SEQ ID NO: 4)

4) 시키메이트 키나제 1 (SEQ ID NO: 34)

5) 시키메이트 디히드로게나제 (SEQ ID NO: 35)

6) 프리페네이트 디히드로게나제 (SEQ ID NO: 4)

7) 티로신 아미노트랜스퍼라제 (SEQ ID NO: 36)

8) 프리페네이트 디히드로게나제 (SEQ ID NO: 4)

9) 글루타메이트 신타제 (GOGAT) 대형 서브유닛 (SEQ ID NO: 37)

10) 글루타민 신써타제 (GS) (SEQ ID NO: 39)

11) 글루타메이트 신타제 소형 서브유닛 (SEQ ID NO: 38)

12) 시키메이트 디히드로게나제 (SEQ ID NO: 35)

13) 시키메이트 키나제 2 (SEQ ID NO: 15)

14) 코리스메이트 뮤타제 (SEQ ID NO: 33) 및 프리페네이트 디히드로게나제 (SEQ ID NO: 4)

실시예 2B - 티라민의 생성을 위한 상이한 미생물 숙주 세포의 평가

요약

숙주 평가 디자인은 야로위아 리폴리티카, 바실러스 서브틸리스, 에스. 세레비지아 및 코리네박테리아 글루타미컴에서 시험되었다. 티라민 생성은 시험된 모든 균주에서 입증되었다. 최고-성능 와이. 리폴리티카 균주는 평균 54.5 ㎎/L 티라민을 생성하였다. 최고-성능 비. 서브틸러스 균주는 19.9 ㎎/L 티라민을 생성하였다. 숙주 평가로부터의 최고-성능 에스. 세레비지아 균주는 189　㎎/L 티라민을 생성하였다. 최고-성능 씨. 글루타미컴 균주는 467 ㎎/L 티라민을 생성하였다.

결과

최고 성능 와이. 리폴리티카 균주는 평균 54.5 ㎎/L 티라민을 생성하였고 엔테로코커스 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC) (UniProt ID C9ASN2) (SEQ ID NO: 1), 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제) (UniProt ID P32449) (SEQ ID NO: 9)를 발현하였으며, 여기서 양쪽 효소에 대한 DNA 서열은 와이. 리폴리티카에 대해 코돈-최적화되었다. (표 3, 도 5) (각각, SEQ ID No: 40 및 10).

최고-성능 비. 서브틸리스 균주는 19.9 ㎎/L 티라민을 생성시켰고 엔테로코커스 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC) (UniProt ID C9ASN2) (SEQ ID NO: 1), 사카로마이세스 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제) (UniProt ID P32449) (SEQ ID NO: 9), 및 에스케리치아 콜라이 K12 유래 시키메이트 키나제 2 (UniProt ID P0A6E1) (SEQ ID NO: 15)를 발현하였고, 여기서 모든 3종 효소에 대한 DNA 서열은 에스. 세레비지아에 대해 코돈-최적화되었다. (표 4, 도 6) (SEQ ID NO: 43, 42, 41)

숙주 평가로부터의 최고-성능 에스. 세레비지아 균주는 189 ㎎/L 티라민을 생성하였고 이. 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC) (UniProt ID C9ASN2) (SEQ ID NO: 1), 에스. 세레비지아 S288c 유래의 아미노산 치환 K229L을 보유하는 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제) (UniProt ID P32449) (SEQ ID NO: 6)를 발현하였고, 여기서 양쪽 효소에 대한 DNA 서열은 씨. 글루타미컴 및 에스. 세레비지아에 대한 변형된 조합 코돈 표를 사용하여 코돈-최적화되었다. (표 5, 도　7) (SEQ ID NO: 45, 44).

최고-성능 씨. 글루타미컴 균주는 467 ㎎/L 티라민을 생성하였고 이. 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC) (UniProt ID C9ASN2) (SEQ ID NO: 1), 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)(UniProt ID P32449) (SEQ ID NO: 9)를 발현하였고, 여기서 양쪽 효소에 대한 DNA 서열은 에스. 세레비지아에 대해 코돈-최적화되었다. (표 6, 도 8) (SEQ ID NO: 43, 42).

스틸벤 및 (2S)-플라바논의 생성을 위한 플랫폼 씨. 글루타미컴 균주를 개선시키기 위해서, Kallscheuer 등 (하기 참조문헌 참조)은 폴리프로파노이드 분해 오페론 (phdBCDE, cg0344-47); 4-히드록시벤조에이트-3-히드롤라제 (pobA (cg1226); 4-히드록시벤조에이트, 카테콜, 벤조에이트, 및 프로토카테추에이트의 분해에 필수적인, cat, ben, pca를 보유하는 유전자 클러스터 (cg2625-40); 및 동화적 시키메이트 경로의 필수 유전자로 구성된 오페론의 일부인 qsuE (cg0502)를 포함하는, 방향족 고리를 분해시키는 유전자 및 오페론을 결실시켰다. 씨. 글루타미컴에서 티라민의 생성은 또한 티라민이 방향족 고리를 함유하므로, 방향족을 분해하는 이들 효소의 발현을 결실시키거나 또는 저하시켜 추가 개선에 대해 시험될 수 있다.

참조문헌

Noda, S. et al., PLoS One, DOI:10.1371/journal.pone.0125488 May 21, 2015.

Koma, D. et al., Appl Microbiol Biotechnol (2012) 93:815-829, DOI 10.1007/s00253-011-3735-z, November, 2011.

WO 2008/064835 (2007년 11월 27일 출원, 우선일: 2006년 11월 27, DSM IP ASSETS B.V.에게 양도됨)

Zhang, C. et al., FEMS Microbiol Lett 353 (2014) 11-18, 0.1111/1574-6968.12397, 2014.

Kallscheuer, N., et al., Construction of a Corynebacterium glutamicum platform strain for the production of stilbenes and (2S)-flavanones. Metab Eng, 2016. 38: p. 47-55.

SEQUENCE LISTING <110> Zymergen Inc. <120> ENGINEERED BIOSYNTHETIC PATHWAYS FOR PRODUCTION OF TYRAMINE BY FERMENTATION <130> ZMGNP001WO/ZMN0012-WO-00 <140> Not Assigned <141> 2018-02-06 <150> 62/455,428 <151> 2017-02-06 <160> 122 <170> PatentIn version 3.5 <210> 1 <211> 625 <212> PRT <213> Enterococcus faecium Com15 <400> 1 Met Ser Glu Ser Leu Ser Lys Asp Leu Asn Leu Asn Ala Leu Phe Ile 1 5 10 15 Gly Asp Lys Ala Glu Asn Gly Gln Ile Tyr Lys Ala Leu Leu Asn Glu 20 25 30 Leu Val Asp Glu His Leu Gly Trp Arg Gln Asn Tyr Met Pro Gln Asp 35 40 45 Met Pro Ile Ile Thr Pro Glu Glu Lys Ser Ser Ala Ser Phe Glu His 50 55 60 Thr Val Asn Lys Thr Lys Asp Val Leu Ser Glu Ile Ser Ala Arg Met 65 70 75 80 Arg Thr His Ser Val Pro Trp His Asn Ala Gly Arg Tyr Trp Gly His 85 90 95 Met Asn Ser Glu Thr Leu Met Pro Ser Leu Leu Ala Tyr Asn Phe Ala 100 105 110 Met Leu Trp Asn Gly Asn Asn Val Ala Tyr Glu Ser Ser Pro Ala Thr 115 120 125 Ser Gln Met Glu Glu Glu Val Gly Met Glu Phe Ala Lys Leu Met Ser 130 135 140 Tyr Lys Asp Gly Trp Gly His Ile Val Ala Asp Gly Ser Leu Ala Asn 145 150 155 160 Leu Glu Gly Leu Trp Tyr Ala Arg Asn Ile Lys Ser Leu Pro Leu Ala 165 170 175 Met Lys Glu Val Thr Pro Glu Leu Val Ala Gly Lys Ser Asp Trp Glu 180 185 190 Leu Met Asn Leu Ser Thr Glu Glu Ile Met Asn Leu Leu Asp Ser Val 195 200 205 Pro Glu Lys Ile Asp Glu Ile Lys Ala His Ser Ala Arg Ser Gly Lys 210 215 220 His Leu Glu Lys Leu Gly Lys Trp Leu Val Pro Gln Thr Lys His Tyr 225 230 235 240 Ser Trp Leu Lys Ala Ala Asp Ile Ile Gly Ile Gly Leu Asp Gln Val 245 250 255 Ile Pro Val Pro Val Asp His Asn Tyr Arg Met Asp Ile Asn Glu Leu 260 265 270 Glu Lys Ile Val Arg Gly Leu Ala Ala Glu Lys Thr Pro Ile Leu Gly 275 280 285 Val Val Gly Val Val Gly Ser Thr Glu Glu Gly Ala Ile Asp Gly Ile 290 295 300 Asp Lys Ile Val Ala Leu Arg Arg Val Leu Glu Lys Asp Gly Ile Tyr 305 310 315 320 Phe Tyr Leu His Val Asp Ala Ala Tyr Gly Gly Tyr Gly Arg Ala Ile 325 330 335 Phe Leu Asp Glu Asp Asn Asn Phe Ile Pro Phe Glu Asp Leu Lys Asp 340 345 350 Val His Tyr Lys Tyr Asn Val Phe Thr Glu Asn Lys Asp Tyr Ile Leu 355 360 365 Glu Glu Val His Ser Ala Tyr Lys Ala Ile Glu Glu Ala Glu Ser Val 370 375 380 Thr Ile Asp Pro His Lys Met Gly Tyr Val Pro Tyr Ser Ala Gly Gly 385 390 395 400 Ile Val Ile Lys Asp Ile Arg Met Arg Asp Val Ile Ser Tyr Phe Ala 405 410 415 Thr Tyr Val Phe Glu Lys Gly Ala Asp Ile Pro Ala Leu Leu Gly Ala 420 425 430 Tyr Ile Leu Glu Gly Ser Lys Ala Gly Ala Thr Ala Ala Ser Val Trp 435 440 445 Ala Ala His His Val Leu Pro Leu Asn Val Thr Gly Tyr Gly Lys Leu 450 455 460 Met Gly Ala Ser Ile Glu Gly Ala His Arg Phe Tyr Asn Phe Leu Asn 465 470 475 480 Asp Leu Ser Phe Lys Val Gly Asp Lys Glu Ile Glu Val His Pro Leu 485 490 495 Thr Tyr Pro Asp Phe Asn Met Val Asp Tyr Val Phe Lys Glu Lys Gly 500 505 510 Asn Asp Asp Leu Val Ala Met Asn Lys Leu Asn His Asp Val Tyr Asp 515 520 525 Tyr Ser Ser Tyr Val Lys Gly Ser Ile Tyr Gly Asn Glu Phe Leu Thr 530 535 540 Ser His Thr Asp Phe Ala Ile Pro Asp Tyr Gly Asn Ser Pro Leu Gln 545 550 555 560 Phe Val Asn Gln Leu Gly Phe Ser Asp Glu Glu Trp Asn Arg Ala Gly 565 570 575 Lys Val Thr Val Leu Arg Ala Ser Val Met Thr Pro Tyr Met Asn Lys 580 585 590 Glu Glu His Phe Glu Glu Tyr Ala Glu Lys Ile Lys Ala Ala Leu Gln 595 600 605 Glu Lys Leu Glu Lys Ile Tyr Ala Asp Gln Leu Leu Ala Ser Glu Ala 610 615 620 Lys 625 <210> 2 <211> 531 <212> PRT <213> Papaver somniferum (Opium poppy) <400> 2 Met Gly Ser Leu Asn Thr Glu Asp Val Leu Glu Asn Ser Ser Ala Phe 1 5 10 15 Gly Val Thr Asn Pro Leu Asp Pro Glu Glu Phe Arg Arg Gln Gly His 20 25 30 Met Ile Ile Asp Phe Leu Ala Asp Tyr Tyr Arg Asp Val Glu Lys Tyr 35 40 45 Pro Val Arg Ser Gln Val Glu Pro Gly Tyr Leu Arg Lys Arg Leu Pro 50 55 60 Glu Thr Ala Pro Tyr Asn Pro Glu Ser Ile Glu Thr Ile Leu Gln Asp 65 70 75 80 Val Thr Thr Glu Ile Ile Pro Gly Leu Thr His Trp Gln Ser Pro Asn 85 90 95 Tyr Tyr Ala Tyr Phe Pro Ser Ser Gly Ser Val Ala Gly Phe Leu Gly 100 105 110 Glu Met Leu Ser Thr Gly Phe Asn Val Val Gly Phe Asn Trp Met Ser 115 120 125 Ser Pro Ala Ala Thr Glu Leu Glu Ser Val Val Met Asp Trp Phe Gly 130 135 140 Lys Met Leu Asn Leu Pro Glu Ser Phe Leu Phe Ser Gly Ser Gly Gly 145 150 155 160 Gly Val Leu Gln Gly Thr Ser Cys Glu Ala Ile Leu Cys Thr Leu Thr 165 170 175 Ala Ala Arg Asp Arg Lys Leu Asn Lys Ile Gly Arg Glu His Ile Gly 180 185 190 Arg Leu Val Val Tyr Gly Ser Asp Gln Thr His Cys Ala Leu Gln Lys 195 200 205 Ala Ala Gln Val Ala Gly Ile Asn Pro Lys Asn Phe Arg Ala Ile Lys 210 215 220 Thr Phe Lys Glu Asn Ser Phe Gly Leu Ser Ala Ala Thr Leu Arg Glu 225 230 235 240 Val Ile Leu Glu Asp Ile Glu Ala Gly Leu Ile Pro Leu Phe Val Cys 245 250 255 Pro Thr Val Gly Thr Thr Ser Ser Thr Ala Val Asp Pro Ile Ser Pro 260 265 270 Ile Cys Glu Val Ala Lys Glu Tyr Glu Met Trp Val His Val Asp Ala 275 280 285 Ala Tyr Ala Gly Ser Ala Cys Ile Cys Pro Glu Phe Arg His Phe Ile 290 295 300 Asp Gly Val Glu Glu Ala Asp Ser Phe Ser Leu Asn Ala His Lys Trp 305 310 315 320 Phe Phe Thr Thr Leu Asp Cys Cys Cys Leu Trp Val Lys Asp Pro Ser 325 330 335 Ala Leu Val Lys Ala Leu Ser Thr Asn Pro Glu Tyr Leu Arg Asn Lys 340 345 350 Ala Thr Glu Ser Arg Gln Val Val Asp Tyr Lys Asp Trp Gln Ile Ala 355 360 365 Leu Ser Arg Arg Phe Arg Ser Leu Lys Leu Trp Met Val Leu Arg Ser 370 375 380 Tyr Gly Val Thr Asn Leu Arg Asn Phe Leu Arg Ser His Val Lys Met 385 390 395 400 Ala Lys Thr Phe Glu Gly Leu Ile Cys Met Asp Gly Arg Phe Glu Ile 405 410 415 Thr Val Pro Arg Thr Phe Ala Met Val Cys Phe Arg Leu Leu Pro Pro 420 425 430 Lys Thr Ile Lys Val Tyr Asp Asn Gly Val His Gln Asn Gly Asn Gly 435 440 445 Val Val Pro Leu Arg Asp Glu Asn Glu Asn Leu Val Leu Ala Asn Lys 450 455 460 Leu Asn Gln Val Tyr Leu Glu Thr Val Asn Ala Thr Gly Ser Val Tyr 465 470 475 480 Met Thr His Ala Val Val Gly Gly Val Tyr Met Ile Arg Phe Ala Val 485 490 495 Gly Ser Thr Leu Thr Glu Glu Arg His Val Ile Tyr Ala Trp Lys Ile 500 505 510 Leu Gln Glu His Ala Asp Leu Ile Leu Gly Lys Phe Ser Glu Ala Asp 515 520 525 Phe Ser Ser 530 <210> 3 <211> 376 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 3 Met Ser Thr Phe Gly Lys Leu Phe Arg Val Thr Thr Tyr Gly Glu Ser 1 5 10 15 His Cys Lys Ser Val Gly Cys Ile Val Asp Gly Val Pro Pro Gly Met 20 25 30 Ser Leu Thr Glu Ala Asp Ile Gln Pro Gln Leu Thr Arg Arg Arg Pro 35 40 45 Gly Gln Ser Lys Leu Ser Thr Pro Arg Asp Glu Lys Asp Arg Val Glu 50 55 60 Ile Gln Ser Gly Thr Glu Phe Gly Lys Thr Leu Gly Thr Pro Ile Ala 65 70 75 80 Met Met Ile Lys Asn Glu Asp Gln Arg Pro His Asp Tyr Ser Asp Met 85 90 95 Asp Lys Phe Pro Arg Pro Ser His Ala Asp Phe Thr Tyr Ser Glu Lys 100 105 110 Tyr Gly Ile Lys Ala Ser Ser Gly Gly Gly Arg Ala Ser Ala Arg Glu 115 120 125 Thr Ile Gly Arg Val Ala Ser Gly Ala Ile Ala Glu Lys Phe Leu Ala 130 135 140 Gln Asn Ser Asn Val Glu Ile Val Ala Phe Val Thr Gln Ile Gly Glu 145 150 155 160 Ile Lys Met Asn Arg Asp Ser Phe Asp Pro Glu Phe Gln His Leu Leu 165 170 175 Asn Thr Ile Thr Arg Glu Lys Val Asp Ser Met Gly Pro Ile Arg Cys 180 185 190 Pro Asp Ala Ser Val Ala Gly Leu Met Val Lys Glu Ile Glu Lys Tyr 195 200 205 Arg Gly Asn Lys Asp Ser Ile Gly Gly Val Val Thr Cys Val Val Arg 210 215 220 Asn Leu Pro Thr Gly Leu Gly Glu Pro Cys Phe Asp Lys Leu Glu Ala 225 230 235 240 Met Leu Ala His Ala Met Leu Ser Ile Pro Ala Ser Lys Gly Phe Glu 245 250 255 Ile Gly Ser Gly Phe Gln Gly Val Ser Val Pro Gly Ser Lys His Asn 260 265 270 Asp Pro Phe Tyr Phe Glu Lys Glu Thr Asn Arg Leu Arg Thr Lys Thr 275 280 285 Asn Asn Ser Gly Gly Val Gln Gly Gly Ile Ser Asn Gly Glu Asn Ile 290 295 300 Tyr Phe Ser Val Pro Phe Lys Ser Val Ala Thr Ile Ser Gln Glu Gln 305 310 315 320 Lys Thr Ala Thr Tyr Asp Gly Glu Glu Gly Ile Leu Ala Ala Lys Gly 325 330 335 Arg His Asp Pro Ala Val Thr Pro Arg Ala Ile Pro Ile Val Glu Ala 340 345 350 Met Thr Ala Leu Val Leu Ala Asp Ala Leu Leu Ile Gln Lys Ala Arg 355 360 365 Asp Phe Ser Arg Ser Val Val His 370 375 <210> 4 <211> 452 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 4 Met Val Ser Glu Asp Lys Ile Glu Gln Trp Lys Ala Thr Lys Val Ile 1 5 10 15 Gly Ile Ile Gly Leu Gly Asp Met Gly Leu Leu Tyr Ala Asn Lys Phe 20 25 30 Thr Asp Ala Gly Trp Gly Val Ile Cys Cys Asp Arg Glu Glu Tyr Tyr 35 40 45 Asp Glu Leu Lys Glu Lys Tyr Ala Ser Ala Lys Phe Glu Leu Val Lys 50 55 60 Asn Gly His Leu Val Ser Arg Gln Ser Asp Tyr Ile Ile Tyr Ser Val 65 70 75 80 Glu Ala Ser Asn Ile Ser Lys Ile Val Ala Thr Tyr Gly Pro Ser Ser 85 90 95 Lys Val Gly Thr Ile Val Gly Gly Gln Thr Ser Cys Lys Leu Pro Glu 100 105 110 Ile Glu Ala Phe Glu Lys Tyr Leu Pro Lys Asp Cys Asp Ile Ile Thr 115 120 125 Val His Ser Leu His Gly Pro Lys Val Asn Thr Glu Gly Gln Pro Leu 130 135 140 Val Ile Ile Asn His Arg Ser Gln Tyr Pro Glu Ser Phe Glu Phe Val 145 150 155 160 Asn Ser Val Met Ala Cys Leu Lys Ser Lys Gln Val Tyr Leu Thr Tyr 165 170 175 Glu Glu His Asp Lys Ile Thr Ala Asp Thr Gln Ala Val Thr His Ala 180 185 190 Ala Phe Leu Ser Met Gly Ser Ala Trp Ala Lys Ile Lys Ile Tyr Pro 195 200 205 Trp Thr Leu Gly Val Asn Lys Trp Tyr Gly Gly Leu Glu Asn Val Lys 210 215 220 Val Asn Ile Ser Leu Arg Ile Tyr Ser Asn Lys Trp His Val Tyr Ala 225 230 235 240 Gly Leu Ala Ile Thr Asn Pro Ser Ala His Gln Gln Ile Leu Gln Tyr 245 250 255 Ala Thr Ser Ala Thr Glu Leu Phe Ser Leu Met Ile Asp Asn Lys Glu 260 265 270 Gln Glu Leu Thr Asp Arg Leu Leu Lys Ala Lys Gln Phe Val Phe Gly 275 280 285 Lys His Thr Gly Leu Leu Leu Leu Asp Asp Thr Ile Leu Glu Lys Tyr 290 295 300 Ser Leu Ser Lys Ser Ser Ile Gly Asn Ser Asn Asn Cys Lys Pro Val 305 310 315 320 Pro Asn Ser His Leu Ser Leu Leu Ala Ile Val Asp Ser Trp Phe Gln 325 330 335 Leu Gly Ile Asp Pro Tyr Asp His Met Ile Cys Ser Thr Pro Leu Phe 340 345 350 Arg Ile Phe Leu Gly Val Ser Glu Tyr Leu Phe Leu Lys Pro Gly Leu 355 360 365 Leu Glu Gln Thr Ile Asp Ala Ala Ile His Asp Lys Ser Phe Ile Lys 370 375 380 Asp Asp Leu Glu Phe Val Ile Ser Ala Arg Glu Trp Ser Ser Val Val 385 390 395 400 Ser Phe Ala Asn Phe Asp Ile Tyr Lys Lys Gln Phe Gln Ser Val Gln 405 410 415 Lys Phe Phe Glu Pro Met Leu Pro Glu Ala Asn Leu Ile Gly Asn Glu 420 425 430 Met Ile Lys Thr Ile Leu Ser His Ser Ser Asp Arg Ser Ala Ala Glu 435 440 445 Lys Arg Asn Thr 450 <210> 5 <211> 370 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 5 Met Ser Glu Ser Pro Met Phe Ala Ala Asn Gly Met Pro Lys Val Asn 1 5 10 15 Gln Gly Ala Glu Glu Asp Val Arg Ile Leu Gly Tyr Asp Pro Leu Ala 20 25 30 Ser Pro Ala Leu Leu Gln Val Gln Ile Pro Ala Thr Pro Thr Ser Leu 35 40 45 Glu Thr Ala Lys Arg Gly Arg Arg Glu Ala Ile Asp Ile Ile Thr Gly 50 55 60 Lys Asp Asp Arg Val Leu Val Ile Val Gly Pro Cys Ser Ile His Asp 65 70 75 80 Leu Glu Ala Ala Gln Glu Tyr Ala Leu Arg Leu Lys Lys Leu Ser Asp 85 90 95 Glu Leu Lys Gly Asp Leu Ser Ile Ile Met Arg Ala Tyr Leu Glu Lys 100 105 110 Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro Asp Val 115 120 125 Asn Asn Thr Phe Asn Ile Asn Lys Gly Leu Gln Ser Ala Arg Gln Leu 130 135 140 Phe Val Asn Leu Thr Asn Ile Gly Leu Pro Ile Gly Ser Glu Met Leu 145 150 155 160 Asp Thr Ile Ser Pro Lys Tyr Leu Ala Asp Leu Val Ser Phe Gly Ala 165 170 175 Ile Gly Ala Arg Thr Thr Glu Ser Gln Leu His Arg Glu Leu Ala Ser 180 185 190 Gly Leu Ser Phe Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr Leu 195 200 205 Asn Val Ala Val Asp Ala Cys Gln Ala Ala Ala His Ser His His Phe 210 215 220 Met Gly Val Thr Lys His Gly Val Ala Ala Ile Thr Thr Thr Lys Gly 225 230 235 240 Asn Glu His Cys Phe Val Ile Leu Arg Gly Gly Lys Lys Gly Thr Asn 245 250 255 Tyr Asp Ala Lys Ser Val Ala Glu Ala Lys Ala Gln Leu Pro Ala Gly 260 265 270 Ser Asn Gly Leu Met Ile Asp Tyr Ser His Gly Asn Ser Asn Lys Asp 275 280 285 Phe Arg Asn Gln Pro Lys Val Asn Asp Val Val Cys Glu Gln Ile Ala 290 295 300 Asn Gly Glu Asn Ala Ile Thr Gly Val Met Ile Glu Ser Asn Ile Asn 305 310 315 320 Glu Gly Asn Gln Gly Ile Pro Ala Glu Gly Lys Ala Gly Leu Lys Tyr 325 330 335 Gly Val Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Asp 340 345 350 Val Leu Arg Lys Leu Ala Ala Ala Val Arg Gln Arg Arg Glu Val Asn 355 360 365 Lys Lys 370 <210> 6 <211> 370 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 6 Met Ser Glu Ser Pro Met Phe Ala Ala Asn Gly Met Pro Lys Val Asn 1 5 10 15 Gln Gly Ala Glu Glu Asp Val Arg Ile Leu Gly Tyr Asp Pro Leu Ala 20 25 30 Ser Pro Ala Leu Leu Gln Val Gln Ile Pro Ala Thr Pro Thr Ser Leu 35 40 45 Glu Thr Ala Lys Arg Gly Arg Arg Glu Ala Ile Asp Ile Ile Thr Gly 50 55 60 Lys Asp Asp Arg Val Leu Val Ile Val Gly Pro Cys Ser Ile His Asp 65 70 75 80 Leu Glu Ala Ala Gln Glu Tyr Ala Leu Arg Leu Lys Lys Leu Ser Asp 85 90 95 Glu Leu Lys Gly Asp Leu Ser Ile Ile Met Arg Ala Tyr Leu Glu Lys 100 105 110 Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro Asp Val 115 120 125 Asn Asn Thr Phe Asn Ile Asn Lys Gly Leu Gln Ser Ala Arg Gln Leu 130 135 140 Phe Val Asn Leu Thr Asn Ile Gly Leu Pro Ile Gly Ser Glu Met Leu 145 150 155 160 Asp Thr Ile Ser Pro Gln Tyr Leu Ala Asp Leu Val Ser Phe Gly Ala 165 170 175 Ile Gly Ala Arg Thr Thr Glu Ser Gln Leu His Arg Glu Leu Ala Ser 180 185 190 Gly Leu Ser Phe Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr Leu 195 200 205 Asn Val Ala Val Asp Ala Cys Gln Ala Ala Ala His Ser His His Phe 210 215 220 Met Gly Val Thr Leu His Gly Val Ala Ala Ile Thr Thr Thr Lys Gly 225 230 235 240 Asn Glu His Cys Phe Val Ile Leu Arg Gly Gly Lys Lys Gly Thr Asn 245 250 255 Tyr Asp Ala Lys Ser Val Ala Glu Ala Lys Ala Gln Leu Pro Ala Gly 260 265 270 Ser Asn Gly Leu Met Ile Asp Tyr Ser His Gly Asn Ser Asn Lys Asp 275 280 285 Phe Arg Asn Gln Pro Lys Val Asn Asp Val Val Cys Glu Gln Ile Ala 290 295 300 Asn Gly Glu Asn Ala Ile Thr Gly Val Met Ile Glu Ser Asn Ile Asn 305 310 315 320 Glu Gly Asn Gln Gly Ile Pro Ala Glu Gly Lys Ala Gly Leu Lys Tyr 325 330 335 Gly Val Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Asp 340 345 350 Val Leu Arg Lys Leu Ala Ala Ala Val Arg Gln Arg Arg Glu Val Asn 355 360 365 Lys Lys 370 <210> 7 <211> 350 <212> PRT <213> Escherichia coli (strain K12) <400> 7 Met Asn Tyr Gln Asn Asp Asp Leu Arg Ile Lys Glu Ile Lys Glu Leu 1 5 10 15 Leu Pro Pro Val Ala Leu Leu Glu Lys Phe Pro Ala Thr Glu Asn Ala 20 25 30 Ala Asn Thr Val Ala His Ala Arg Lys Ala Ile His Lys Ile Leu Lys 35 40 45 Gly Asn Asp Asp Arg Leu Leu Val Val Ile Gly Pro Cys Ser Ile His 50 55 60 Asp Pro Val Ala Ala Lys Glu Tyr Ala Thr Arg Leu Leu Ala Leu Arg 65 70 75 80 Glu Glu Leu Lys Asp Glu Leu Glu Ile Val Met Arg Val Tyr Phe Glu 85 90 95 Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro His 100 105 110 Met Asp Asn Ser Phe Gln Ile Asn Asp Gly Leu Arg Ile Ala Arg Lys 115 120 125 Leu Leu Leu Asp Ile Asn Asp Ser Gly Leu Pro Ala Ala Gly Glu Phe 130 135 140 Leu Asn Met Ile Thr Pro Gln Tyr Leu Ala Asp Leu Met Ser Trp Gly 145 150 155 160 Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Val His Arg Glu Leu Ala 165 170 175 Ser Gly Leu Ser Cys Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr 180 185 190 Ile Lys Val Ala Ile Asp Ala Ile Asn Ala Ala Gly Ala Pro His Cys 195 200 205 Phe Leu Ser Val Thr Lys Trp Gly His Ser Ala Ile Val Asn Thr Ser 210 215 220 Gly Asn Gly Asp Cys His Ile Ile Leu Arg Gly Gly Lys Glu Pro Asn 225 230 235 240 Tyr Ser Ala Lys His Val Ala Glu Val Lys Glu Gly Leu Asn Lys Ala 245 250 255 Gly Leu Pro Ala Gln Val Met Ile Asp Phe Ser His Ala Asn Ser Ser 260 265 270 Lys Gln Phe Lys Lys Gln Met Asp Val Cys Ala Asp Val Cys Gln Gln 275 280 285 Ile Ala Gly Gly Glu Lys Ala Ile Ile Gly Val Met Val Glu Ser His 290 295 300 Leu Val Glu Gly Asn Gln Ser Leu Glu Ser Gly Glu Pro Leu Ala Tyr 305 310 315 320 Gly Lys Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Asp Thr Asp Ala 325 330 335 Leu Leu Arg Gln Leu Ala Asn Ala Val Lys Ala Arg Arg Gly 340 345 350 <210> 8 <211> 335 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 8 Met Ser Glu Pro Ala Gln Lys Lys Gln Lys Val Ala Asn Asn Ser Leu 1 5 10 15 Glu Gln Leu Lys Ala Ser Gly Thr Val Val Val Ala Asp Thr Gly Asp 20 25 30 Phe Gly Ser Ile Ala Lys Phe Gln Pro Gln Asp Ser Thr Thr Asn Pro 35 40 45 Ser Leu Ile Leu Ala Ala Ala Lys Gln Pro Thr Tyr Ala Lys Leu Ile 50 55 60 Asp Val Ala Val Glu Tyr Gly Lys Lys His Gly Lys Thr Thr Glu Glu 65 70 75 80 Gln Val Glu Asn Ala Val Asp Arg Leu Leu Val Glu Phe Gly Lys Glu 85 90 95 Ile Leu Lys Ile Val Pro Gly Arg Val Ser Thr Glu Val Asp Ala Arg 100 105 110 Leu Ser Phe Asp Thr Gln Ala Thr Ile Glu Lys Ala Arg His Ile Ile 115 120 125 Lys Leu Phe Glu Gln Glu Gly Val Ser Lys Glu Arg Val Leu Ile Lys 130 135 140 Ile Ala Ser Thr Trp Glu Gly Ile Gln Ala Ala Lys Glu Leu Glu Glu 145 150 155 160 Lys Asp Gly Ile His Cys Asn Leu Thr Leu Leu Phe Ser Phe Val Gln 165 170 175 Ala Val Ala Cys Ala Glu Ala Gln Val Thr Leu Ile Ser Pro Phe Val 180 185 190 Gly Arg Ile Leu Asp Trp Tyr Lys Ser Ser Thr Gly Lys Asp Tyr Lys 195 200 205 Gly Glu Ala Asp Pro Gly Val Ile Ser Val Lys Lys Ile Tyr Asn Tyr 210 215 220 Tyr Lys Lys Tyr Gly Tyr Lys Thr Ile Val Met Gly Ala Ser Phe Arg 225 230 235 240 Ser Thr Asp Glu Ile Lys Asn Leu Ala Gly Val Asp Tyr Leu Thr Ile 245 250 255 Ser Pro Ala Leu Leu Asp Lys Leu Met Asn Ser Thr Glu Pro Phe Pro 260 265 270 Arg Val Leu Asp Pro Val Ser Ala Lys Lys Glu Ala Gly Asp Lys Ile 275 280 285 Ser Tyr Ile Ser Asp Glu Ser Lys Phe Arg Phe Asp Leu Asn Glu Asp 290 295 300 Ala Met Ala Thr Glu Lys Leu Ser Glu Gly Ile Arg Lys Phe Ser Ala 305 310 315 320 Asp Ile Val Thr Leu Phe Asp Leu Ile Glu Lys Lys Val Thr Ala 325 330 335 <210> 9 <211> 370 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 9 Met Ser Glu Ser Pro Met Phe Ala Ala Asn Gly Met Pro Lys Val Asn 1 5 10 15 Gln Gly Ala Glu Glu Asp Val Arg Ile Leu Gly Tyr Asp Pro Leu Ala 20 25 30 Ser Pro Ala Leu Leu Gln Val Gln Ile Pro Ala Thr Pro Thr Ser Leu 35 40 45 Glu Thr Ala Lys Arg Gly Arg Arg Glu Ala Ile Asp Ile Ile Thr Gly 50 55 60 Lys Asp Asp Arg Val Leu Val Ile Val Gly Pro Cys Ser Ile His Asp 65 70 75 80 Leu Glu Ala Ala Gln Glu Tyr Ala Leu Arg Leu Lys Lys Leu Ser Asp 85 90 95 Glu Leu Lys Gly Asp Leu Ser Ile Ile Met Arg Ala Tyr Leu Glu Lys 100 105 110 Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro Asp Val 115 120 125 Asn Asn Thr Phe Asn Ile Asn Lys Gly Leu Gln Ser Ala Arg Gln Leu 130 135 140 Phe Val Asn Leu Thr Asn Ile Gly Leu Pro Ile Gly Ser Glu Met Leu 145 150 155 160 Asp Thr Ile Ser Pro Gln Tyr Leu Ala Asp Leu Val Ser Phe Gly Ala 165 170 175 Ile Gly Ala Arg Thr Thr Glu Ser Gln Leu His Arg Glu Leu Ala Ser 180 185 190 Gly Leu Ser Phe Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr Leu 195 200 205 Asn Val Ala Val Asp Ala Cys Gln Ala Ala Ala His Ser His His Phe 210 215 220 Met Gly Val Thr Lys His Gly Val Ala Ala Ile Thr Thr Thr Lys Gly 225 230 235 240 Asn Glu His Cys Phe Val Ile Leu Arg Gly Gly Lys Lys Gly Thr Asn 245 250 255 Tyr Asp Ala Lys Ser Val Ala Glu Ala Lys Ala Gln Leu Pro Ala Gly 260 265 270 Ser Asn Gly Leu Met Ile Asp Tyr Ser His Gly Asn Ser Asn Lys Asp 275 280 285 Phe Arg Asn Gln Pro Lys Val Asn Asp Val Val Cys Glu Gln Ile Ala 290 295 300 Asn Gly Glu Asn Ala Ile Thr Gly Val Met Ile Glu Ser Asn Ile Asn 305 310 315 320 Glu Gly Asn Gln Gly Ile Pro Ala Glu Gly Lys Ala Gly Leu Lys Tyr 325 330 335 Gly Val Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Asp 340 345 350 Val Leu Arg Lys Leu Ala Ala Ala Val Arg Gln Arg Arg Glu Val Asn 355 360 365 Lys Lys 370 <210> 10 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 10 atgtctgagt ccccaatgtt cgccgcaaac ggtatgccta aagtcaacca gggagcagag 60 gaggacgtgc ggatcctggg ttacgatccc cttgcctcgc ctgcactgct ccaggttcag 120 attccagcca cgcccacctc tctggagacc gccaaacgag gtcgacgaga agcaattgac 180 atcattactg gcaaggatga ccgagtcctg gtgattgttg gcccctgttc tatccacgac 240 ctcgaggccg cacaggagta cgcccttcga cttaaaaagc tttccgatga gcttaagggc 300 gatctgtcga tcatcatgcg tgcttacctg gagaagcccc gtacgactgt cggatggaag 360 ggactgatta acgatcccga cgtcaataac acatttaaca ttaacaaggg cctgcagtcc 420 gctagacagc ttttcgttaa cctcaccaac attggcctcc ccattggctc cgagatgctc 480 gacactattt cgccccagta tctcgccgat ctcgtgtcct ttggtgctat cggtgctcga 540 acaaccgagt cccagctgca tcgagagctg gcatctggcc tctctttccc cgtcggcttc 600 aagaacggaa ccgatggtac cctcaacgtt gccgtggacg cctgtcaggc cgctgcccac 660 tctcaccact tcatgggagt gaccaagcac ggtgtcgctg ctattactac caccaaggga 720 aacgagcact gcttcgttat tctccgaggt ggcaagaagg gtactaacta cgatgccaag 780 tccgtggctg aagccaaggc ccagctgccc gccggctcta acggcctgat gattgattac 840 agccatggta attccaacaa ggatttccga aaccagccta aggtcaacga tgtggtctgc 900 gagcaaatcg ctaacggaga aaatgccatc accggcgtca tgattgagtc taacatcaac 960 gagggcaatc agggtatccc tgctgaggga aaggccggcc tgaagtacgg agtttccatt 1020 acagacgcct gcatcggatg ggagactaca gaggatgtcc tccgaaagct ggctgccgct 1080 gtgcgacagc gtcgggaggt gaacaagaag 1110 <210> 11 <211> 510 <212> PRT <213> Zygosaccharomyces bailii ISA1307 <400> 11 Met Asp Ala Thr Asn Ile Ser Ala Ser Glu Gln Glu Lys Ile Leu Gly 1 5 10 15 Asn Leu Trp Lys Ala Ala Gln Gly Pro Gly Glu Gly His Val Leu Pro 20 25 30 Thr Val Asp Gln Leu Asn Arg Ala Arg Ala Ser Leu Tyr Asn Ser Leu 35 40 45 Pro Glu Glu Gly Val Gly Tyr Gln Ser Val Gln Arg His Ile Leu Asp 50 55 60 Asp Ile Val Pro Ala Phe Asn Gly Gly Ser Ile Asn Pro Asn Tyr Tyr 65 70 75 80 Gly Phe Val Thr Gly Gly Val Thr Pro Ala Ala Leu Phe Ala Asp Ala 85 90 95 Val Val Ser Ala Tyr Asp Gln Asn Val Gln Val His Leu Gln Ser His 100 105 110 Ser Ile Val Thr Asp Val Glu Phe Lys Thr Leu Gly Leu Leu Leu Gln 115 120 125 Leu Leu Lys Leu Asp Val Pro Ser Trp Leu Asn Gly Thr Phe Thr Thr 130 135 140 Gly Ala Thr Ala Ser Asn Ile Ile Gly Leu Ala Cys Gly Arg Glu Phe 145 150 155 160 Val Ile Gln Lys Ala Ala Gln Arg Lys Gly Ser Pro Ile Lys Ser Thr 165 170 175 Ala Asp Ala Gly Leu His Glu Val Leu Gln Ser Ile Gly Ala Ser Gly 180 185 190 Ile Gln Val Leu Ser Thr Leu Pro His Ser Ser Leu Val Lys Ala Ala 195 200 205 Gly Val Leu Gly Ile Gly Arg Met Asn Val Arg Asp Ile Ser Thr Glu 210 215 220 Ala Asn Pro Leu Asp Ile Asp Leu Lys Lys Leu Gln Thr Glu Leu Ser 225 230 235 240 Arg Val Asp Val Val Ser Ile Val Ala Ile Ser Cys Gly Glu Val Asn 245 250 255 Ser Gly Arg Phe Ala Ser Ala Gly Leu His Glu Leu Arg Lys Ile Arg 260 265 270 Gln Leu Cys Asp Arg His Gly Ala Trp Leu His Val Asp Gly Ala Phe 275 280 285 Gly Ile Phe Gly Arg Leu Val Gly Asp Asp Thr Glu Phe Met Ala Ile 290 295 300 Lys Glu Gly Cys Asp Gly Ile Glu Leu Ala Asp Ser Ile Thr Gly Asp 305 310 315 320 Ala His Lys Leu Leu Asn Val Pro Tyr Asp Cys Gly Phe Phe Phe Cys 325 330 335 Arg His Ala Ser Ile Ala Arg Glu Val Phe Gln Asn Ala Asn Ala Ala 340 345 350 Tyr Leu Ala Ser Val Asp Gly Arg Asp Ser Phe Ile Pro Ser Pro Leu 355 360 365 Asn Ile Gly Ile Glu Asn Ser Arg Arg Phe Arg Ala Leu Pro Val Tyr 370 375 380 Ala Ser Leu Leu Ala Tyr Gly Glu Val Glu Tyr Arg Lys Met Leu His 385 390 395 400 Arg Gln Ile Arg Leu Ala Arg Met Ile Tyr Gly Trp Ile Phe Asp His 405 410 415 Pro Gly Tyr Thr Ala Leu Pro Glu Thr Thr Ser Arg Glu Glu Leu Leu 420 425 430 Asp Leu Thr Tyr Met Val Val Leu Phe Arg Ala Lys Asp Gly Gly Leu 435 440 445 Asn Arg Thr Leu Glu Ala Lys Ile Asn Ala Thr Ser Arg Met Phe Val 450 455 460 Ser Gly Thr Ser Trp Ala Asp Ala Pro Ala Cys Arg Ile Ala Ile Ser 465 470 475 480 Asn Trp Arg Val Asp Glu Lys Arg Asp Phe Ala Leu Val Thr Gly Val 485 490 495 Leu Glu Ser Ala Leu Arg Ser Ser Gly Ser Ala Val Ser Cys 500 505 510 <210> 12 <211> 1128 <212> DNA <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 12 atgtcaacgt ttgggaaact gttccgcgtc accacatatg gtgaatcgca ttgtaagtct 60 gtcggttgca ttgtcgacgg tgttcctcca ggaatgtcat taaccgaagc tgacattcag 120 ccacaattga ccagaagaag accgggtcaa tctaagctat cgacccctag agacgaaaag 180 gatagagtgg aaatccagtc cggtaccgag ttcggcaaga ctctaggtac acccatcgcc 240 atgatgatca aaaacgagga ccaaagacct cacgactact ccgacatgga caagttccct 300 agaccttccc atgcggactt cacgtactcg gaaaagtacg gtatcaaggc ctcctctggt 360 ggtggcagag cttctgctag agaaacgatt ggccgtgtcg cttcaggtgc cattgctgag 420 aagttcttag ctcagaactc taatgtcgag atcgtagcct ttgtgacaca aatcggggaa 480 atcaagatga acagagactc tttcgatcct gaatttcagc atctgttgaa caccatcacc 540 agggaaaaag tggactcaat gggtcctatc agatgtccag acgcctccgt tgctggtttg 600 atggtcaagg aaatcgaaaa gtacagaggc aacaaggact ctatcggtgg tgtcgtcact 660 tgtgtcgtga gaaacttgcc taccggtctc ggtgagccat gctttgacaa gttggaagcc 720 atgttggctc atgctatgtt gtccattcca gcatccaagg gtttcgaaat tggctcaggt 780 tttcagggtg tctctgttcc agggtccaag cacaatgacc cattttactt tgaaaaagaa 840 acaaacagat taagaacaaa gaccaacaat tcaggtggtg tacaaggtgg tatctctaat 900 ggtgagaaca tctatttctc tgtcccattc aagtcagtgg ccactatctc tcaagaacaa 960 aaaaccgcca cttacgatgg tgaagaaggt atcttagccg ctaagggtag acatgaccct 1020 gctgtcactc caagagctat tcctattgtg gaagccatga ccgctctggt gttggctgac 1080 gcgcttttga tccaaaaggc aagagatttc tccagatccg tggttcat 1128 <210> 13 <211> 1356 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 13 atggtatcag aggataagat tgagcaatgg aaagccacaa aagtcattgg tataattggt 60 ctgggtgata tgggcctatt atacgctaat aaatttacag atgctggatg gggtgttata 120 tgttgtgata gggaagaata ttatgatgaa ctgaaagaaa aatatgcctc agctaaattc 180 gaactggtga aaaatggtca tttggtatcc aggcaaagcg actatattat ctatagtgtt 240 gaagcatcca atattagtaa gatcgtcgca acgtatggac catcttctaa ggttggaaca 300 attgttgggg gtcaaacgag ttgtaagctg ccggaaatcg aggctttcga aaagtattta 360 cccaaggact gcgacatcat taccgtgcat tcccttcatg ggcctaaagt taatactgaa 420 ggccaaccac tagttattat caatcacaga tcacagtacc cagaatcttt tgagttcgtt 480 aattctgtta tggcatgttt gaaaagtaag caagtttatt tgacatatga agagcatgac 540 aagattaccg ctgatacaca agctgtgaca catgctgctt tcttaagtat gggatctgcg 600 tgggcaaaga taaagattta tccttggact ctgggtgtaa acaaatggta cggtggccta 660 gaaaatgtga aagttaatat atcactaaga atctattcga acaagtggca tgtttacgca 720 ggattagcca taacaaaccc aagtgcacat cagcaaattc ttcaatatgc aaccagtgca 780 acagaactat ttagtttaat gatagataac aaagaacaag aacttactga tagactatta 840 aaagctaagc aatttgtatt tggaaagcat actggtctct tactattgga tgacacgatt 900 ttagagaaat attcgctatc aaaaagcagc attggtaaca gcaacaattg caagccagtg 960 ccgaattcac atttatcatt gttggcgatt gttgattcgt ggtttcaact tggtattgat 1020 ccatatgatc atatgatttg ttcgacgcca ttattcagaa tattcctggg tgtgtccgaa 1080 tatctttttt taaaacctgg cttattagaa cagacaattg atgcagctat ccatgataaa 1140 tcattcataa aagatgattt agaatttgtt atttcggcta gagaatggag ctcggttgtt 1200 tcttttgcca attttgatat atacaaaaag caatttcaga gtgttcaaaa gttctttgag 1260 ccaatgcttc cagaggctaa tctcattggc aacgagatga taaaaaccat tctgagtcat 1320 tctagtgacc gttcggccgc tgaaaaaaga aataca 1356 <210> 14 <211> 522 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 14 atgacacaac cgttattctt gataggcccg cgcggctgtg gcaagactac agtaggaatg 60 gcgttggcag actcactgaa ccgacggttc gtggatacag accagtggct tcaatcgcaa 120 ttaaatatga cggtcgccga aatcgtagaa cgggaggagt gggcggggtt tagagcgcgg 180 gagactgctg cgctggaagc ggtcacagca ccgtcaaccg tgattgcgac aggggggggt 240 atcatcctta cggagtttaa tagacacttt atgcagaata atggaatcgt agtgtatctt 300 tgcgcaccgg tgagcgtctt ggtgaataga ctgcaagcag ccccggaaga agatttgaga 360 ccaaccctga ccggcaagcc gttgagcgaa gaggtccagg aggtgttgga agaacgggac 420 gcgctgtatc gggaggtggc acacatcatt attgatgcta cgaatgaacc gtctcaagtc 480 ataagcgaga ttcgtagcgc gttagcccaa acgattaatt gc 522 <210> 15 <211> 174 <212> PRT <213> Escherichia coli (strain K12) <400> 15 Met Thr Gln Pro Leu Phe Leu Ile Gly Pro Arg Gly Cys Gly Lys Thr 1 5 10 15 Thr Val Gly Met Ala Leu Ala Asp Ser Leu Asn Arg Arg Phe Val Asp 20 25 30 Thr Asp Gln Trp Leu Gln Ser Gln Leu Asn Met Thr Val Ala Glu Ile 35 40 45 Val Glu Arg Glu Glu Trp Ala Gly Phe Arg Ala Arg Glu Thr Ala Ala 50 55 60 Leu Glu Ala Val Thr Ala Pro Ser Thr Val Ile Ala Thr Gly Gly Gly 65 70 75 80 Ile Ile Leu Thr Glu Phe Asn Arg His Phe Met Gln Asn Asn Gly Ile 85 90 95 Val Val Tyr Leu Cys Ala Pro Val Ser Val Leu Val Asn Arg Leu Gln 100 105 110 Ala Ala Pro Glu Glu Asp Leu Arg Pro Thr Leu Thr Gly Lys Pro Leu 115 120 125 Ser Glu Glu Val Gln Glu Val Leu Glu Glu Arg Asp Ala Leu Tyr Arg 130 135 140 Glu Val Ala His Ile Ile Ile Asp Ala Thr Asn Glu Pro Ser Gln Val 145 150 155 160 Ile Ser Glu Ile Arg Ser Ala Leu Ala Gln Thr Ile Asn Cys 165 170 <210> 16 <211> 363 <212> PRT <213> Escherichia coli (D146N) DAHP synthase <400> 16 Met Leu Asn Lys Gly Leu Ala Glu Glu Glu Leu Phe Ser Phe Leu Ser 1 5 10 15 Lys Lys Arg Glu Glu Asp Leu Cys His Ser His Ile Leu Ser Ser Met 20 25 30 Cys Thr Val Pro His Pro Ile Ala Val Lys Ala His Leu Met Phe Met 35 40 45 Glu Thr Asn Leu Gly Asp Pro Gly Leu Phe Pro Gly Thr Ala Ser Leu 50 55 60 Glu Arg Leu Leu Ile Glu Arg Leu Gly Asp Leu Phe His His Arg Glu 65 70 75 80 Ala Gly Gly Tyr Ala Thr Ser Gly Gly Thr Glu Ser Asn Ile Gln Ala 85 90 95 Leu Arg Ile Ala Lys Ala Gln Lys Lys Val Asp Lys Pro Asn Val Val 100 105 110 Ile Pro Glu Thr Ser His Phe Ser Phe Lys Lys Ala Cys Asp Ile Leu 115 120 125 Gly Ile Gln Met Lys Thr Val Pro Ala Asp Arg Ser Met Arg Thr Asp 130 135 140 Ile Ser Glu Val Ser Asp Ala Ile Asp Lys Asn Thr Ile Ala Leu Val 145 150 155 160 Gly Ile Ala Gly Ser Thr Glu Tyr Gly Met Val Asp Asp Ile Gly Ala 165 170 175 Leu Ala Thr Ile Ala Glu Glu Glu Asp Leu Tyr Leu His Val Asp Ala 180 185 190 Ala Phe Gly Gly Leu Val Ile Pro Phe Leu Pro Asn Pro Pro Ala Phe 195 200 205 Asp Phe Ala Leu Pro Gly Val Ser Ser Ile Ala Val Asp Pro His Lys 210 215 220 Met Gly Met Ser Thr Leu Pro Ala Gly Ala Leu Leu Val Arg Glu Pro 225 230 235 240 Gln Met Leu Gly Leu Leu Asn Ile Asp Thr Pro Tyr Leu Thr Val Lys 245 250 255 Gln Glu Tyr Thr Leu Ala Gly Thr Arg Pro Gly Ala Ser Val Ala Gly 260 265 270 Ala Leu Ala Val Leu Asp Tyr Met Gly Arg Asp Gly Met Glu Ala Val 275 280 285 Val Ala Gly Cys Met Lys Asn Thr Ser Arg Leu Ile Arg Gly Met Glu 290 295 300 Thr Leu Gly Phe Pro Arg Ala Val Thr Pro Asp Val Asn Val Ala Thr 305 310 315 320 Phe Ile Thr Asn His Pro Ala Pro Lys Asn Trp Val Val Ser Gln Thr 325 330 335 Arg Arg Gly His Met Arg Ile Ile Cys Met Pro His Val Thr Ala Asp 340 345 350 Met Ile Glu Gln Phe Leu Ile Asp Ile Gly Glu 355 360 <210> 17 <211> 384 <212> PRT <213> Propionibacterium sp. oral taxon 192 str. F0372 <400> 17 Met Gly Met Asp Ile Ser Ser Arg Pro Val Glu Trp Ala Ser Leu Ser 1 5 10 15 Glu Ile Thr Ala Ser Asp Val Ser Phe Glu Gly Gly Ala Ile Phe Asn 20 25 30 Ser Ile Cys Thr Arg Pro His Pro Leu Ala Ala Gln Val Met Ala Asp 35 40 45 Asn Leu His Leu Asn Ala Gly Asp Gly Arg Leu Phe Pro Ser Val Ala 50 55 60 Arg Cys Glu Ser Glu Ile Thr Asn Phe Leu Gly Gly Leu Met Gly Leu 65 70 75 80 Pro Arg Ala Val Gly Met Cys Thr Ser Gly Ala Thr Glu Ala Asn Leu 85 90 95 Ile Ala Val His Ser Ala Ile Glu Asn Trp Arg Arg Lys Gly Gly Gln 100 105 110 Gly Arg Pro Gln Val Ile Leu Gly Arg Gly Gly His Phe Ser Phe Asp 115 120 125 Lys Ile Ser Val Leu Leu Gly Val Glu Leu Val Leu Ala Trp Ser Asp 130 135 140 Ile Asp Thr Leu Lys Val Asp Pro Glu Ser Val Ser Glu Leu Ile Ser 145 150 155 160 Pro Arg Thr Ala Leu Ile Val Ala Thr Ala Gly Ser Ser Glu Thr Gly 165 170 175 Ala Val Asp Asp Val Glu Trp Leu Ser Arg Val Ala Leu Ser Lys Gly 180 185 190 Val Pro Leu His Val Asp Ala Ala Ser Gly Gly Leu Leu Ile Pro Phe 195 200 205 Leu Arg Asp Leu Gly Gly Ala Leu Pro Asp Ile Gly Phe Arg Asn Asp 210 215 220 Gly Val Thr Thr Ile Ala Ile Asp Pro His Lys Phe Gly Ser Ala Pro 225 230 235 240 Ile Pro Ser Gly His Leu Val Ala Arg Glu Trp Thr Trp Ile Glu Gly 245 250 255 Leu Arg Thr Glu Ser His Tyr Gln Gly Thr Ala Arg His Leu Thr Phe 260 265 270 Leu Gly Thr Arg Ser Gly Gly Ser Ile Leu Ala Thr Tyr Ala Leu Phe 275 280 285 Gly His Leu Gly Glu Lys Gly Leu Arg Gly Met Ala Glu Gln Leu Lys 290 295 300 Ala Leu Arg Ser His Leu Val Asp Arg Leu Arg Lys Ala Gly Ala Thr 305 310 315 320 Leu Ala Tyr Val Pro Glu Leu Met Val Val Ala Leu Lys Ala Asp Ser 325 330 335 Asp Ala Val Lys Val Leu Glu Arg Arg Gly Ile Phe Thr Ser Tyr Ala 340 345 350 Lys Arg Leu Gly Tyr Leu Arg Ile Val Val Gln Leu His Met Ser Glu 355 360 365 Gly Gln Val Asp Gly Leu Val Asp Ala Leu Leu Met Glu Gly Ile Val 370 375 380 <210> 18 <211> 514 <212> PRT <213> Petroselinum crispum <400> 18 Met Gly Ser Ile Asp Asn Leu Thr Glu Lys Leu Ala Ser Gln Phe Pro 1 5 10 15 Met Asn Thr Leu Glu Pro Glu Glu Phe Arg Arg Gln Gly His Met Met 20 25 30 Ile Asp Phe Leu Ala Asp Tyr Tyr Arg Lys Val Glu Asn Tyr Pro Val 35 40 45 Arg Ser Gln Val Ser Pro Gly Tyr Leu Arg Glu Ile Leu Pro Glu Ser 50 55 60 Ala Pro Tyr Asn Pro Glu Ser Leu Glu Thr Ile Leu Gln Asp Val Gln 65 70 75 80 Thr Lys Ile Ile Pro Gly Ile Thr His Trp Gln Ser Pro Asn Phe Phe 85 90 95 Ala Tyr Phe Pro Ser Ser Gly Ser Thr Ala Gly Phe Leu Gly Glu Met 100 105 110 Leu Ser Thr Gly Phe Asn Val Val Gly Phe Asn Trp Met Val Ser Pro 115 120 125 Ala Ala Thr Glu Leu Glu Asn Val Val Thr Asp Trp Phe Gly Lys Met 130 135 140 Leu Gln Leu Pro Lys Ser Phe Leu Phe Ser Gly Gly Gly Gly Gly Val 145 150 155 160 Leu Gln Gly Thr Thr Cys Glu Ala Ile Leu Cys Thr Leu Val Ala Ala 165 170 175 Arg Asp Lys Asn Leu Arg Gln His Gly Met Asp Asn Ile Gly Lys Leu 180 185 190 Val Val Tyr Cys Ser Asp Gln Thr His Ser Ala Leu Gln Lys Ala Ala 195 200 205 Lys Ile Ala Gly Ile Asp Pro Lys Asn Phe Arg Ala Ile Glu Thr Thr 210 215 220 Lys Ser Ser Asn Phe Gln Leu Cys Pro Lys Arg Leu Glu Ser Ala Ile 225 230 235 240 Leu His Asp Leu Gln Asn Gly Leu Ile Pro Leu Tyr Leu Cys Ala Thr 245 250 255 Val Gly Thr Thr Ser Ser Thr Thr Val Asp Pro Leu Pro Ala Leu Thr 260 265 270 Glu Val Ala Lys Lys Tyr Asp Leu Trp Val His Val Asp Ala Ala Tyr 275 280 285 Ala Gly Ser Ala Cys Ile Cys Pro Glu Phe Arg Gln Tyr Leu Asp Gly 290 295 300 Val Glu Asn Ala Asp Ser Phe Ser Leu Asn Ala His Lys Trp Phe Leu 305 310 315 320 Thr Thr Leu Asp Cys Cys Cys Leu Trp Val Arg Asn Pro Ser Ala Leu 325 330 335 Ile Lys Ser Leu Ser Thr Tyr Pro Glu Phe Leu Lys Asn Asn Ala Ser 340 345 350 Glu Thr Asn Lys Val Val Asp Tyr Lys Asp Trp Gln Ile Met Leu Ser 355 360 365 Arg Arg Phe Arg Ala Leu Lys Leu Trp Phe Val Leu Arg Ser Tyr Gly 370 375 380 Val Gly Gln Leu Arg Glu Phe Ile Arg Gly His Val Gly Met Ala Lys 385 390 395 400 Tyr Phe Glu Gly Leu Val Asn Met Asp Lys Arg Phe Glu Val Val Ala 405 410 415 Pro Arg Leu Phe Ser Met Val Cys Phe Arg Ile Lys Pro Ser Ala Met 420 425 430 Ile Gly Lys Asn Asp Glu Asp Glu Val Asn Glu Ile Asn Arg Lys Leu 435 440 445 Leu Glu Ser Val Asn Asp Ser Gly Arg Ile Tyr Val Ser His Thr Val 450 455 460 Leu Gly Gly Ile Tyr Val Ile Arg Phe Ala Ile Gly Gly Thr Leu Thr 465 470 475 480 Asp Ile Asn His Val Ser Ala Ala Trp Lys Val Leu Gln Asp His Ala 485 490 495 Gly Ala Leu Leu Asp Asp Thr Phe Thr Ser Asn Lys Leu Val Glu Val 500 505 510 Leu Ser <210> 19 <211> 517 <212> PRT <213> Trichophyton equinum (strain ATCC MYA-4606 CBS 127.97) (Horse ringworm fungus) <400> 19 Met Glu Arg Asn His Leu Lys Asp Ser Val Gly Val Gln Val Asp Asp 1 5 10 15 Gly His Ser Lys Glu Leu Trp Glu Thr Ala Leu Asn Pro Pro Arg Arg 20 25 30 Ser Val Leu Pro Pro Ala Ala Ser Leu Ala His Ser Arg Ser Ser Ile 35 40 45 Ile Thr Glu Leu Pro His Ala Gly Gln Gly Tyr Thr Gln Thr Lys Val 50 55 60 His Leu Phe Asn Asp Ile Ile Pro Gly Leu Asn Asp Cys Ala Ile Asn 65 70 75 80 Ala Asn Tyr Tyr Gly Phe Val Thr Gly Gly Val Thr Pro Ala Ala Leu 85 90 95 Leu Ala Asp Asn Val Val Ser Val Tyr Asp Gln Asn Val Cys Val His 100 105 110 Leu Val Asp His Ser Val Ala Thr Asp Val Asp Tyr Ala Ala Leu Cys 115 120 125 Leu Leu Lys Asp Leu Phe Gly Leu Lys Arg Asp Glu Trp Pro His Gly 130 135 140 Ile Phe Thr Thr Gly Ala Thr Ala Ser Asn Leu Val Gly Leu Ala Cys 145 150 155 160 Gly Arg Glu Tyr Val Leu Arg Lys Ala Ala Gln Lys Arg Gly Leu Ser 165 170 175 Gly Asn Ile Ala Ser Gly Asn Ile Thr Asp Ser Val Gly Glu Tyr Gly 180 185 190 Met Pro Ala Val Leu Glu Ala Ala Gly Leu Lys Gly Leu Gln Val Leu 195 200 205 Ser Thr Met Pro His Ser Ser Val Gly Lys Val Ala Gly Ile Leu Gly 210 215 220 Ile Gly Arg Ala Asn Val Lys Ser Ile Val Ser Lys Thr Gly Glu Ser 225 230 235 240 His Gly Gln Pro Leu Glu Phe Asp Phe Glu Leu Phe Glu Lys Glu Leu 245 250 255 Ala Arg Ala Gly Phe Ala Ser Ile Val Ser Ile Ser Cys Gly Glu Val 260 265 270 Asn Thr Gly Arg Phe Ala Thr Lys Gly Val Asp Glu Phe Arg Arg Val 275 280 285 Arg Ala Leu Cys Asp Lys Tyr Asn Ala Trp Leu His Val Asp Ala Ala 290 295 300 Phe Gly Met Phe Gly Arg Val Leu Asp Asp Ser Pro Glu Phe Glu Thr 305 310 315 320 Ile Lys Lys Gly Ser Glu Gly Ile Glu Leu Ala Asp Ser Ile Thr Gly 325 330 335 Asp Gly His Lys Leu Leu Asn Val Pro Tyr Asp Cys Gly Phe Phe Phe 340 345 350 Ser Arg His Gly Asp Ile Ala Glu Glu Val Phe Arg Asn Pro Asn Ala 355 360 365 Val Tyr Leu Ser Ser Ser Ala Gly Glu His Ile Pro Thr Pro Leu Asn 370 375 380 Ile Gly Val Glu Asn Ser Arg Arg Phe Arg Ala Leu Pro Val Tyr Ser 385 390 395 400 Thr Leu Val Ala Tyr Gly Lys Asp Gly Tyr Arg Ala Met Val Glu Arg 405 410 415 Gln Ile Arg Leu Ala Arg Leu Ile Thr Gly Trp Leu His Glu His Pro 420 425 430 Lys Tyr Thr Val Leu Gly Gly Gly Ala Ser Lys Glu Asp Leu Ile Ala 435 440 445 Ala Thr Tyr Val Ile Val Leu Phe Arg Ala Lys Asp Glu Ala Leu Asn 450 455 460 Ala Arg Leu Ala Ser Ala Ile Asn Gly Thr Gly Lys Met Phe Val Ser 465 470 475 480 Gly Thr Lys Trp Ala Gly Glu Pro Ala Cys Arg Val Ala Ile Ser Asn 485 490 495 Trp Lys Val Gln Val Glu Arg Asp Phe Thr Leu Val Lys Glu Val Leu 500 505 510 Asp Glu Val Ser Arg 515 <210> 20 <211> 481 <212> PRT <213> Streptomyces sviceus ATCC 29083 <400> 20 Met Pro Asp Leu Glu Pro Asp Glu Phe Arg Arg Gln Gly His Gln Leu 1 5 10 15 Val Asp Trp Val Ala Arg Tyr Arg Thr Ser Leu Pro Ser Leu His Val 20 25 30 Arg Pro Lys Val Val Pro Gly Ser Val Lys Ala Gln Leu Pro Arg Glu 35 40 45 Leu Pro Glu Gln Pro Ser Gln Ala Leu Gly Asp Asp Leu Ile Ala Leu 50 55 60 Leu Asn Asp Val Val Val Pro Ser Ser Leu His Trp Gln His Pro Gly 65 70 75 80 Phe Phe Gly Tyr Phe Pro Ala Asn Ala Ser Leu Leu Ser Leu Leu Gly 85 90 95 Asp Ile Ala Ser Gly Gly Ile Gly Ala Gln Gly Met Leu Trp Ser Thr 100 105 110 Ser Pro Ala Gly Thr Glu Ile Glu Gln Val Leu Leu Asp Gly Leu Ala 115 120 125 Asp Ala Leu Gly Leu Gly Arg Glu Phe Thr Phe Ala Gly Gly Gly Gly 130 135 140 Gly Ser Leu Gln Asp Ser Ala Ser Ser Ala Ser Leu Ala Ala Leu Leu 145 150 155 160 Ala Ala Leu Gln Arg Ser Asn Pro Asp Trp Arg Glu His Gly Val Asp 165 170 175 Gly Thr Glu Thr Val Tyr Val Thr Ala Glu Thr His Ser Ser Leu Ala 180 185 190 Lys Ala Val Arg Val Ala Gly Leu Gly Ala Arg Ala Leu Arg Ile Val 195 200 205 Pro Phe Thr Gln Gly Thr Leu Ser Met Ser Ala Asp Ala Leu Ala Asp 210 215 220 Met Leu Ala Lys Asp Thr Ala Ala Gly Lys Arg Pro Val Met Val Cys 225 230 235 240 Pro Thr Val Gly Thr Thr Gly Thr Gly Ala Ile Asp Pro Val Arg Glu 245 250 255 Val Ala Leu Ala Ala Arg Thr Tyr Glu Ala Trp Val His Val Asp Ala 260 265 270 Ala Trp Ala Gly Val Ala Ala Leu Cys Pro Glu Phe Arg Trp Leu Leu 275 280 285 Asp Gly Val Asn Leu Val Asp Ser Phe Cys Thr Asp Ala His Lys Trp 290 295 300 Phe Tyr Thr Ala Phe Asp Ala Ser Phe Met Trp Val Arg Asp Ala Arg 305 310 315 320 Ala Leu Pro Thr Ala Leu Ser Ile Thr Pro Glu Tyr Leu Arg Asn Ala 325 330 335 Ala Thr Glu Ser Gly Glu Val Ile Asp Tyr Arg Asp Trp Gln Val Pro 340 345 350 Leu Gly Arg Arg Met Arg Ala Leu Lys Ile Trp Ser Val Val His Gly 355 360 365 Ala Gly Leu Glu Gly Leu Arg Glu Ser Ile Arg Gly His Val Ala Met 370 375 380 Ala Asn Ser Leu Ala Gly Arg Ile Glu Ser Glu Ser Gly Phe Ala Leu 385 390 395 400 Ala Thr Pro Pro Ser Leu Ala Leu Val Cys Leu Tyr Leu Val Asp Gln 405 410 415 Glu Gly Arg Pro Asp Asp Ala Ala Thr Lys Ala Ala Met Glu Ala Val 420 425 430 Asn Ala Glu Gly His Ser Phe Leu Thr His Thr Ser Val Asn Gly His 435 440 445 Phe Ala Ile Arg Val Ala Ile Gly Ala Thr Thr Thr Leu Pro Asp His 450 455 460 Ile Asp Thr Leu Trp Asp Ser Leu Cys Lys Ala Ala Arg Gln Ser Gly 465 470 475 480 Gly <210> 21 <211> 470 <212> PRT <213> Pseudomonas putida (strain KT2440) <400> 21 Met Thr Pro Glu Gln Phe Arg Gln Tyr Gly His Gln Leu Ile Asp Leu 1 5 10 15 Ile Ala Asp Tyr Arg Gln Thr Val Gly Glu Arg Pro Val Met Ala Gln 20 25 30 Val Glu Pro Gly Tyr Leu Lys Ala Ala Leu Pro Ala Thr Ala Pro Gln 35 40 45 Gln Gly Glu Pro Phe Ala Ala Ile Leu Asp Asp Val Asn Asn Leu Val 50 55 60 Met Pro Gly Leu Ser His Trp Gln His Pro Asp Phe Tyr Gly Tyr Phe 65 70 75 80 Pro Ser Asn Gly Thr Leu Ser Ser Val Leu Gly Asp Phe Leu Ser Thr 85 90 95 Gly Leu Gly Val Leu Gly Leu Ser Trp Gln Ser Ser Pro Ala Leu Ser 100 105 110 Glu Leu Glu Glu Thr Thr Leu Asp Trp Leu Arg Gln Leu Leu Gly Leu 115 120 125 Ser Gly Gln Trp Ser Gly Val Ile Gln Asp Thr Ala Ser Thr Ser Thr 130 135 140 Leu Val Ala Leu Ile Ser Ala Arg Glu Arg Ala Thr Asp Tyr Ala Leu 145 150 155 160 Val Arg Gly Gly Leu Gln Ala Glu Pro Lys Pro Leu Ile Val Tyr Val 165 170 175 Ser Ala His Ala His Ser Ser Val Asp Lys Ala Ala Leu Leu Ala Gly 180 185 190 Phe Gly Arg Asp Asn Ile Arg Leu Ile Pro Thr Asp Glu Arg Tyr Ala 195 200 205 Leu Arg Pro Glu Ala Leu Gln Ala Ala Ile Glu Gln Asp Leu Ala Ala 210 215 220 Gly Asn Gln Pro Cys Ala Val Val Ala Thr Thr Gly Thr Thr Thr Thr 225 230 235 240 Thr Ala Leu Asp Pro Leu Arg Pro Val Gly Glu Ile Ala Gln Ala Asn 245 250 255 Gly Leu Trp Leu His Val Asp Ser Ala Met Ala Gly Ser Ala Met Ile 260 265 270 Leu Pro Glu Cys Arg Trp Met Trp Asp Gly Ile Glu Leu Ala Asp Ser 275 280 285 Val Val Val Asn Ala His Lys Trp Leu Gly Val Ala Phe Asp Cys Ser 290 295 300 Ile Tyr Tyr Val Arg Asp Pro Gln His Leu Ile Arg Val Met Ser Thr 305 310 315 320 Asn Pro Ser Tyr Leu Gln Ser Ala Val Asp Gly Glu Val Lys Asn Leu 325 330 335 Arg Asp Trp Gly Ile Pro Leu Gly Arg Arg Phe Arg Ala Leu Lys Leu 340 345 350 Trp Phe Met Leu Arg Ser Glu Gly Val Asp Ala Leu Gln Ala Arg Leu 355 360 365 Arg Arg Asp Leu Asp Asn Ala Gln Trp Leu Ala Gly Gln Val Glu Ala 370 375 380 Ala Ala Glu Trp Glu Val Leu Ala Pro Val Gln Leu Gln Thr Leu Cys 385 390 395 400 Ile Arg His Arg Pro Ala Gly Leu Glu Gly Glu Ala Leu Asp Ala His 405 410 415 Thr Lys Gly Trp Ala Glu Arg Leu Asn Ala Ser Gly Ala Ala Tyr Val 420 425 430 Thr Pro Ala Thr Leu Asp Gly Arg Trp Met Val Arg Val Ser Ile Gly 435 440 445 Ala Leu Pro Thr Glu Arg Gly Asp Val Gln Arg Leu Trp Ala Arg Leu 450 455 460 Gln Asp Val Ile Lys Gly 465 470 <210> 22 <211> 575 <212> PRT <213> Modestobacter marinus (strain BC501) <400> 22 Met Thr Gly His Met Thr Pro Glu Gln Phe Arg Gln His Gly His Glu 1 5 10 15 Val Val Asp Trp Ile Ala Asp Tyr Trp Glu Arg Ile Gly Ser Phe Pro 20 25 30 Val Arg Ser Gln Val Ser Pro Gly Asp Val Arg Ala Ser Leu Pro Pro 35 40 45 Thr Ala Pro Glu Gln Gly Glu Pro Phe Ser Ala Val Leu Ala Asp Leu 50 55 60 Asp Arg Val Val Leu Pro Gly Val Thr His Trp Gln His Pro Gly Phe 65 70 75 80 Phe Gly Tyr Phe Pro Ala Asn Thr Ser Gly Pro Ser Val Leu Gly Asp 85 90 95 Leu Val Ser Ala Gly Leu Gly Val Gln Gly Met Ser Trp Val Thr Ser 100 105 110 Pro Ala Ala Thr Glu Leu Glu Gln His Val Met Asp Trp Phe Ala Asp 115 120 125 Leu Leu Gly Leu Pro Glu Ser Phe Arg Ser Thr Gly Ser Gly Gly Gly 130 135 140 Val Val Gln Asp Ser Ser Ser Gly Ala Asn Leu Val Ala Leu Leu Ala 145 150 155 160 Ala Leu His Arg Ala Ser Lys Gly Ala Thr Leu Arg His Gly Val Arg 165 170 175 Pro Glu Asp His Thr Val Tyr Val Ser Ala Glu Thr His Ser Ser Met 180 185 190 Glu Lys Ala Ala Arg Ile Ala Gly Leu Gly Thr Asp Ala Ile Arg Ile 195 200 205 Val Glu Val Gly Pro Asp Leu Ala Met Asn Pro Arg Ala Leu Ala Gln 210 215 220 Arg Leu Glu Arg Asp Val Ala Arg Gly Tyr Thr Pro Val Leu Val Cys 225 230 235 240 Ala Thr Val Gly Thr Thr Ser Thr Thr Ala Ile Asp Pro Leu Ala Glu 245 250 255 Leu Gly Pro Ile Cys Gln Gln His Gly Val Trp Leu His Val Asp Ala 260 265 270 Ala Tyr Ala Gly Val Ser Ala Val Ala Pro Glu Leu Arg Ala Leu Gln 275 280 285 Ala Gly Val Glu Trp Ala Asp Ser Tyr Thr Thr Asp Ala His Lys Trp 290 295 300 Leu Leu Thr Gly Phe Asp Ala Thr Leu Phe Trp Val Ala Asp Arg Ala 305 310 315 320 Ala Leu Thr Gly Ala Leu Ser Ile Leu Pro Glu Tyr Leu Arg Asn Ala 325 330 335 Ala Thr Asp Thr Gly Ala Val Val Asp Tyr Arg Asp Trp Gln Ile Glu 340 345 350 Leu Gly Arg Arg Phe Arg Ala Leu Lys Leu Trp Phe Val Val Arg Trp 355 360 365 Tyr Gly Ala Glu Gly Leu Arg Glu His Val Arg Ser His Val Ala Leu 370 375 380 Ala Gln Glu Leu Ala Gly Trp Ala Asp Ala Asp Glu Arg Phe Asp Val 385 390 395 400 Ala Ala Pro His Pro Phe Ser Leu Val Cys Leu Arg Pro Arg Trp Ala 405 410 415 Pro Gly Ile Asp Ala Asp Val Ala Thr Met Thr Leu Leu Asp Arg Leu 420 425 430 Asn Asp Gly Gly Glu Val Phe Leu Thr His Thr Thr Val Asp Gly Ala 435 440 445 Ala Val Leu Arg Val Ala Ile Gly Ala Pro Ala Thr Thr Arg Glu His 450 455 460 Val Glu Arg Val Trp Ala Leu Leu Gly Glu Ala His Asp Trp Leu Ala 465 470 475 480 Arg Asp Phe Glu Glu Gln Ala Ala Glu Arg Arg Ala Ala Glu Leu Arg 485 490 495 Glu Arg Glu Ala Ala Glu Glu Gln Leu Arg Ala Arg Arg Glu Ala Glu 500 505 510 Ala Ala Ala Ala Ala Ala Thr Glu Ala Pro Val Glu Pro Ala Ala Glu 515 520 525 Glu Pro Glu Gln Leu Val Val Pro Pro Val Glu Val Pro Ala Val Glu 530 535 540 Thr Pro Ala Ala Trp Asp Glu Ser Ala Thr Gln Val Ala Ala Gln Thr 545 550 555 560 Asp Leu His Ala Asp Pro Ala Pro Gln Pro Ala Asp Gly Gln Gly 565 570 575 <210> 23 <211> 418 <212> PRT <213> Sinorhizobium fredii USDA 257 <400> 23 Met Lys Gln Ile Pro Ala Lys Gly Leu Glu Arg Asp Val Ile Met Gln 1 5 10 15 Glu Leu Arg Gln Met Lys Ser Leu Asp Phe Asp Trp Arg Ala Gly Arg 20 25 30 Val Pro Ser Tyr Thr Tyr Phe Val Asp Asp Glu Thr Leu Asp Val Gln 35 40 45 Arg Glu Ala Tyr Gly Glu Tyr Ile Ala Glu Asn Gly Leu Gly Ala Gly 50 55 60 Arg Ala Phe Lys Ser Leu Glu Leu Met Thr Asp Asp Ile Lys Ser Met 65 70 75 80 Ala Ile Ser Leu Phe Asn Ala Pro Ala Ala Ala Gly Ala Ser Phe Thr 85 90 95 Ser Gly Gly Thr Glu Ser Ile Phe Met Ala Val Lys Thr Ala Arg Asp 100 105 110 Leu Thr Arg His Arg Arg Gly Glu Pro Asp Gly Arg Tyr Asn Ile Val 115 120 125 Ala Cys Glu Thr Ala His Pro Cys Leu Asp Lys Ala Gly Gln Leu Leu 130 135 140 Gly Val Asp Ile Arg Arg Thr Pro His Thr Ala Glu Phe Arg Ala Asp 145 150 155 160 Pro Ala Leu Leu Arg Thr Ser Ile Asp Gln Lys Thr Met Met Leu Phe 165 170 175 Ala Ser Ala Pro Asn Tyr Pro Phe Gly Thr Phe Asp Pro Ile Ser Lys 180 185 190 Ile Gly Arg Leu Ala Gln Glu Arg Asp Leu Arg Leu His Val Asp Gly 195 200 205 Cys Trp Gly Gly Phe Leu Ser Pro Phe Ala Glu Arg Leu Gly Tyr Pro 210 215 220 Ile Pro Glu Trp Asp Phe Arg Val Pro Gly Val Ser Ser Leu Ser Ala 225 230 235 240 Asp Ile His Lys Phe Gly Tyr Ala Ala Lys Gly Ala Ser Val Val Leu 245 250 255 Tyr Arg Asp Val Glu Asp Gln Glu His Glu Arg Phe Ser Phe Ser Gly 260 265 270 Trp Pro Arg Gly Thr Tyr Ser Thr Pro Thr Phe Leu Gly Thr Lys Ala 275 280 285 Gly Gly Ala Ile Ala Ser Ala Trp Ala Val Met His Phe Leu Gly Val 290 295 300 Glu Gly Tyr Leu Arg Ala Ala Lys Leu Thr Met Asp Ala Thr Met Gln 305 310 315 320 Leu Ile Glu Gly Leu Asn Ala Ile Pro Asp Ile Tyr Cys Leu Thr Pro 325 330 335 Asn Gly Glu Ser Asn Leu Ile Ser Phe Ala Thr Ser Asp Pro Lys Leu 340 345 350 Asp Ile Tyr Ala Val Ala Asp Arg Leu Glu Glu Cys Gly Trp Leu Arg 355 360 365 Gly Arg Met Arg Glu Pro Lys Ala Ile Gln Gln Gly Val Asn Pro Ala 370 375 380 His Leu Ala Thr Val Thr Glu Tyr Leu Ala Glu Val Arg Lys Ala Ile 385 390 395 400 Asp His Val Arg Gly Asn Val Ala Ala Pro Val Ala Tyr Asp Glu His 405 410 415 Ser Tyr <210> 24 <211> 497 <212> PRT <213> Oryza sativa subsp. Japonica <400> 24 Met Glu Gly Val Gly Gly Gly Gly Gly Gly Glu Glu Trp Leu Arg Pro 1 5 10 15 Met Asp Ala Glu Gln Leu Arg Glu Cys Gly His Arg Met Val Asp Phe 20 25 30 Val Ala Asp Tyr Tyr Lys Ser Ile Glu Ala Phe Pro Val Leu Ser Gln 35 40 45 Val Gln Pro Gly Tyr Leu Lys Glu Val Leu Pro Asp Ser Ala Pro Arg 50 55 60 Gln Pro Asp Thr Leu Asp Ser Leu Phe Asp Asp Ile Gln Gln Lys Ile 65 70 75 80 Ile Pro Gly Val Thr His Trp Gln Ser Pro Asn Tyr Phe Ala Tyr Tyr 85 90 95 Pro Ser Asn Ser Ser Thr Ala Gly Phe Leu Gly Glu Met Leu Ser Ala 100 105 110 Ala Phe Asn Ile Val Gly Phe Ser Trp Ile Thr Ser Pro Ala Ala Thr 115 120 125 Glu Leu Glu Val Ile Val Leu Asp Trp Phe Ala Lys Met Leu Gln Leu 130 135 140 Pro Ser Gln Phe Leu Ser Thr Ala Leu Gly Gly Gly Val Ile Gln Gly 145 150 155 160 Thr Ala Ser Glu Ala Val Leu Val Ala Leu Leu Ala Ala Arg Asp Arg 165 170 175 Ala Leu Lys Lys His Gly Lys His Ser Leu Glu Lys Leu Val Val Tyr 180 185 190 Ala Ser Asp Gln Thr His Ser Ala Leu Gln Lys Ala Cys Gln Ile Ala 195 200 205 Gly Ile Phe Ser Glu Asn Val Arg Val Val Ile Ala Asp Cys Asn Lys 210 215 220 Asn Tyr Ala Val Ala Pro Glu Ala Val Ser Glu Ala Leu Ser Ile Asp 225 230 235 240 Leu Ser Ser Gly Leu Ile Pro Phe Phe Ile Cys Ala Thr Val Gly Thr 245 250 255 Thr Ser Ser Ser Ala Val Asp Pro Leu Pro Glu Leu Gly Gln Ile Ala 260 265 270 Lys Ser Asn Asp Met Trp Phe His Ile Asp Ala Ala Tyr Ala Gly Ser 275 280 285 Ala Cys Ile Cys Pro Glu Tyr Arg His His Leu Asn Gly Val Glu Glu 290 295 300 Ala Asp Ser Phe Asn Met Asn Ala His Lys Trp Phe Leu Thr Asn Phe 305 310 315 320 Asp Cys Ser Leu Leu Trp Val Lys Asp Arg Ser Phe Leu Ile Gln Ser 325 330 335 Leu Ser Thr Asn Pro Glu Phe Leu Lys Asn Lys Ala Ser Gln Ala Asn 340 345 350 Ser Val Val Asp Phe Lys Asp Trp Gln Ile Pro Leu Gly Arg Arg Phe 355 360 365 Arg Ser Leu Lys Leu Trp Met Val Leu Arg Leu Tyr Gly Val Asp Asn 370 375 380 Leu Gln Ser Tyr Ile Arg Lys His Ile His Leu Ala Glu His Phe Glu 385 390 395 400 Gln Leu Leu Leu Ser Asp Ser Arg Phe Glu Val Val Thr Pro Arg Thr 405 410 415 Phe Ser Leu Val Cys Phe Arg Leu Val Pro Pro Thr Ser Asp His Glu 420 425 430 Asn Gly Arg Lys Leu Asn Tyr Asp Met Met Asp Gly Val Asn Ser Ser 435 440 445 Gly Lys Ile Phe Leu Ser His Thr Val Leu Ser Gly Lys Phe Val Leu 450 455 460 Arg Phe Ala Val Gly Ala Pro Leu Thr Glu Glu Arg His Val Asp Ala 465 470 475 480 Ala Trp Lys Leu Leu Arg Asp Glu Ala Thr Lys Val Leu Gly Lys Met 485 490 495 Val <210> 25 <211> 396 <212> PRT <213> Methanocaldococcus jannaschii <400> 25 Met Arg Asn Met Gln Glu Lys Gly Val Ser Glu Lys Glu Ile Leu Glu 1 5 10 15 Glu Leu Lys Lys Tyr Arg Ser Leu Asp Leu Lys Tyr Glu Asp Gly Asn 20 25 30 Ile Phe Gly Ser Met Cys Ser Asn Val Leu Pro Ile Thr Arg Lys Ile 35 40 45 Val Asp Ile Phe Leu Glu Thr Asn Leu Gly Asp Pro Gly Leu Phe Lys 50 55 60 Gly Thr Lys Leu Leu Glu Glu Lys Ala Val Ala Leu Leu Gly Ser Leu 65 70 75 80 Leu Asn Asn Lys Asp Ala Tyr Gly His Ile Val Ser Gly Gly Thr Glu 85 90 95 Ala Asn Leu Met Ala Leu Arg Cys Ile Lys Asn Ile Trp Arg Glu Lys 100 105 110 Arg Arg Lys Gly Leu Ser Lys Asn Glu His Pro Lys Ile Ile Val Pro 115 120 125 Ile Thr Ala His Phe Ser Phe Glu Lys Gly Arg Glu Met Met Asp Leu 130 135 140 Glu Tyr Ile Tyr Ala Pro Ile Lys Glu Asp Tyr Thr Ile Asp Glu Lys 145 150 155 160 Phe Val Lys Asp Ala Val Glu Asp Tyr Asp Val Asp Gly Ile Ile Gly 165 170 175 Ile Ala Gly Thr Thr Glu Leu Gly Thr Ile Asp Asn Ile Glu Glu Leu 180 185 190 Ser Lys Ile Ala Lys Glu Asn Asn Ile Tyr Ile His Val Asp Ala Ala 195 200 205 Phe Gly Gly Leu Val Ile Pro Phe Leu Asp Asp Lys Tyr Lys Lys Lys 210 215 220 Gly Val Asn Tyr Lys Phe Asp Phe Ser Leu Gly Val Asp Ser Ile Thr 225 230 235 240 Ile Asp Pro His Lys Met Gly His Cys Pro Ile Pro Ser Gly Gly Ile 245 250 255 Leu Phe Lys Asp Ile Gly Tyr Lys Arg Tyr Leu Asp Val Asp Ala Pro 260 265 270 Tyr Leu Thr Glu Thr Arg Gln Ala Thr Ile Leu Gly Thr Arg Val Gly 275 280 285 Phe Gly Gly Ala Cys Thr Tyr Ala Val Leu Arg Tyr Leu Gly Arg Glu 290 295 300 Gly Gln Arg Lys Ile Val Asn Glu Cys Met Glu Asn Thr Leu Tyr Leu 305 310 315 320 Tyr Lys Lys Leu Lys Glu Asn Asn Phe Lys Pro Val Ile Glu Pro Ile 325 330 335 Leu Asn Ile Val Ala Ile Glu Asp Glu Asp Tyr Lys Glu Val Cys Lys 340 345 350 Lys Leu Arg Asp Arg Gly Ile Tyr Val Ser Val Cys Asn Cys Val Lys 355 360 365 Ala Leu Arg Ile Val Val Met Pro His Ile Lys Arg Glu His Ile Asp 370 375 380 Asn Phe Ile Glu Ile Leu Asn Ser Ile Lys Arg Asp 385 390 395 <210> 26 <211> 370 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 26 Met Phe Ile Lys Asn Asp His Ala Gly Asp Arg Lys Arg Leu Glu Asp 1 5 10 15 Trp Arg Ile Lys Gly Tyr Asp Pro Leu Thr Pro Pro Asp Leu Leu Gln 20 25 30 His Glu Phe Pro Ile Ser Ala Lys Gly Glu Glu Asn Ile Ile Lys Ala 35 40 45 Arg Asp Ser Val Cys Asp Ile Leu Asn Gly Lys Asp Asp Arg Leu Val 50 55 60 Ile Val Ile Gly Pro Cys Ser Leu His Asp Pro Lys Ala Ala Tyr Asp 65 70 75 80 Tyr Ala Asp Arg Leu Ala Lys Ile Ser Glu Lys Leu Ser Lys Asp Leu 85 90 95 Leu Ile Ile Met Arg Ala Tyr Leu Glu Lys Pro Arg Thr Thr Val Gly 100 105 110 Trp Lys Gly Leu Ile Asn Asp Pro Asp Met Asn Asn Ser Phe Gln Ile 115 120 125 Asn Lys Gly Leu Arg Ile Ser Arg Glu Met Phe Ile Arg Leu Val Glu 130 135 140 Lys Leu Pro Ile Ala Gly Glu Met Leu Asp Thr Ile Ser Pro Gln Phe 145 150 155 160 Leu Ser Asp Cys Phe Ser Leu Gly Ala Ile Gly Ala Arg Thr Thr Glu 165 170 175 Ser Gln Leu His Arg Glu Leu Ala Ser Gly Leu Ser Phe Pro Ile Gly 180 185 190 Phe Lys Asn Gly Thr Asp Gly Gly Leu Gln Val Ala Ile Asp Ala Met 195 200 205 Arg Ala Ala Ala His Asp His Tyr Phe Leu Ser Val Thr Lys Pro Gly 210 215 220 Val Thr Ala Ile Val Gly Thr Glu Gly Asn Lys Asp Thr Phe Leu Ile 225 230 235 240 Leu Arg Gly Gly Lys Asn Gly Thr Asn Phe Asp Lys Glu Ser Val Gln 245 250 255 Asn Thr Lys Lys Gln Leu Glu Lys Ala Gly Leu Thr Asp Asp Ser Gln 260 265 270 Lys Arg Ile Met Ile Asp Cys Ser His Gly Asn Ser Asn Lys Asp Phe 275 280 285 Lys Asn Gln Pro Lys Val Ala Lys Cys Ile Tyr Asp Gln Leu Thr Glu 290 295 300 Gly Glu Asn Ser Leu Cys Gly Val Met Ile Glu Ser Asn Ile Asn Glu 305 310 315 320 Gly Arg Gln Asp Ile Pro Lys Glu Gly Gly Arg Glu Gly Leu Lys Tyr 325 330 335 Gly Cys Ser Val Thr Asp Ala Cys Ile Gly Trp Glu Thr Thr Glu Gln 340 345 350 Val Leu Glu Leu Leu Ala Glu Gly Val Arg Asn Arg Arg Lys Ala Leu 355 360 365 Lys Lys 370 <210> 27 <211> 500 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 27 Met Thr Leu Pro Glu Ser Arg Asp Phe Ser Tyr Leu Phe Ser Asp Glu 1 5 10 15 Thr Asn Ala Arg Lys Pro Ser Pro Leu Lys Thr Cys Ile His Leu Phe 20 25 30 Gln Asp Pro Asn Ile Ile Phe Leu Gly Gly Gly Leu Pro Leu Lys Asp 35 40 45 Tyr Phe Pro Trp Asp Asn Leu Ser Val Asp Ser Pro Lys Pro Pro Phe 50 55 60 Pro Gln Gly Ile Gly Ala Pro Ile Asp Glu Gln Asn Cys Ile Lys Tyr 65 70 75 80 Thr Val Asn Lys Asp Tyr Ala Asp Lys Ser Ala Asn Pro Ser Asn Asp 85 90 95 Ile Pro Leu Ser Arg Ala Leu Gln Tyr Gly Phe Ser Ala Gly Gln Pro 100 105 110 Glu Leu Leu Asn Phe Ile Arg Asp His Thr Lys Ile Ile His Asp Leu 115 120 125 Lys Tyr Lys Asp Trp Asp Val Leu Ala Thr Ala Gly Asn Thr Asn Ala 130 135 140 Trp Glu Ser Thr Leu Arg Val Phe Cys Asn Arg Gly Asp Val Ile Leu 145 150 155 160 Val Glu Ala His Ser Phe Ser Ser Ser Leu Ala Ser Ala Glu Ala Gln 165 170 175 Gly Val Ile Thr Phe Pro Val Pro Ile Asp Ala Asp Gly Ile Ile Pro 180 185 190 Glu Lys Leu Ala Lys Val Met Glu Asn Trp Thr Pro Gly Ala Pro Lys 195 200 205 Pro Lys Leu Leu Tyr Thr Ile Pro Thr Gly Gln Asn Pro Thr Gly Thr 210 215 220 Ser Ile Ala Asp His Arg Lys Glu Ala Ile Tyr Lys Ile Ala Gln Lys 225 230 235 240 Tyr Asp Phe Leu Ile Val Glu Asp Glu Pro Tyr Tyr Phe Leu Gln Met 245 250 255 Asn Pro Tyr Ile Lys Asp Leu Lys Glu Arg Glu Lys Ala Gln Ser Ser 260 265 270 Pro Lys Gln Asp His Asp Glu Phe Leu Lys Ser Leu Ala Asn Thr Phe 275 280 285 Leu Ser Leu Asp Thr Glu Gly Arg Val Ile Arg Met Asp Ser Phe Ser 290 295 300 Lys Val Leu Ala Pro Gly Thr Arg Leu Gly Trp Ile Thr Gly Ser Ser 305 310 315 320 Lys Ile Leu Lys Pro Tyr Leu Ser Leu His Glu Met Thr Ile Gln Ala 325 330 335 Pro Ala Gly Phe Thr Gln Val Leu Val Asn Ala Thr Leu Ser Arg Trp 340 345 350 Gly Gln Lys Gly Tyr Leu Asp Trp Leu Leu Gly Leu Arg His Glu Tyr 355 360 365 Thr Leu Lys Arg Asp Cys Ala Ile Asp Ala Leu Tyr Lys Tyr Leu Pro 370 375 380 Gln Ser Asp Ala Phe Val Ile Asn Pro Pro Ile Ala Gly Met Phe Phe 385 390 395 400 Thr Val Asn Ile Asp Ala Ser Val His Pro Glu Phe Lys Thr Lys Tyr 405 410 415 Asn Ser Asp Pro Tyr Gln Leu Glu Gln Ser Leu Tyr His Lys Val Val 420 425 430 Glu Arg Gly Val Leu Val Val Pro Gly Ser Trp Phe Lys Ser Glu Gly 435 440 445 Glu Thr Glu Pro Pro Gln Pro Ala Glu Ser Lys Glu Val Ser Asn Pro 450 455 460 Asn Ile Ile Phe Phe Arg Gly Thr Tyr Ala Ala Val Ser Pro Glu Lys 465 470 475 480 Leu Thr Glu Gly Leu Lys Arg Leu Gly Asp Thr Leu Tyr Glu Glu Phe 485 490 495 Gly Ile Ser Lys 500 <210> 28 <211> 513 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 28 Met Thr Ala Gly Ser Ala Pro Pro Val Asp Tyr Thr Ser Leu Lys Lys 1 5 10 15 Asn Phe Gln Pro Phe Leu Ser Arg Arg Val Glu Asn Arg Ser Leu Lys 20 25 30 Ser Phe Trp Asp Ala Ser Asp Ile Ser Asp Asp Val Ile Glu Leu Ala 35 40 45 Gly Gly Met Pro Asn Glu Arg Phe Phe Pro Ile Glu Ser Met Asp Leu 50 55 60 Lys Ile Ser Lys Val Pro Phe Asn Asp Asn Pro Lys Trp His Asn Ser 65 70 75 80 Phe Thr Thr Ala His Leu Asp Leu Gly Ser Pro Ser Glu Leu Pro Ile 85 90 95 Ala Arg Ser Phe Gln Tyr Ala Glu Thr Lys Gly Leu Pro Pro Leu Leu 100 105 110 His Phe Val Lys Asp Phe Val Ser Arg Ile Asn Arg Pro Ala Phe Ser 115 120 125 Asp Glu Thr Glu Ser Asn Trp Asp Val Ile Leu Ser Gly Gly Ser Asn 130 135 140 Asp Ser Met Phe Lys Val Phe Glu Thr Ile Cys Asp Glu Ser Thr Thr 145 150 155 160 Val Met Ile Glu Glu Phe Thr Phe Thr Pro Ala Met Ser Asn Val Glu 165 170 175 Ala Thr Gly Ala Lys Val Ile Pro Ile Lys Met Asn Leu Thr Phe Asp 180 185 190 Arg Glu Ser Gln Gly Ile Asp Val Glu Tyr Leu Thr Gln Leu Leu Asp 195 200 205 Asn Trp Ser Thr Gly Pro Tyr Lys Asp Leu Asn Lys Pro Arg Val Leu 210 215 220 Tyr Thr Ile Ala Thr Gly Gln Asn Pro Thr Gly Met Ser Val Pro Gln 225 230 235 240 Trp Lys Arg Glu Lys Ile Tyr Gln Leu Ala Gln Arg His Asp Phe Leu 245 250 255 Ile Val Glu Asp Asp Pro Tyr Gly Tyr Leu Tyr Phe Pro Ser Tyr Asn 260 265 270 Pro Gln Glu Pro Leu Glu Asn Pro Tyr His Ser Ser Asp Leu Thr Thr 275 280 285 Glu Arg Tyr Leu Asn Asp Phe Leu Met Lys Ser Phe Leu Thr Leu Asp 290 295 300 Thr Asp Ala Arg Val Ile Arg Leu Glu Thr Phe Ser Lys Ile Phe Ala 305 310 315 320 Pro Gly Leu Arg Leu Ser Phe Ile Val Ala Asn Lys Phe Leu Leu Gln 325 330 335 Lys Ile Leu Asp Leu Ala Asp Ile Thr Thr Arg Ala Pro Ser Gly Thr 340 345 350 Ser Gln Ala Ile Val Tyr Ser Thr Ile Lys Ala Met Ala Glu Ser Asn 355 360 365 Leu Ser Ser Ser Leu Ser Met Lys Glu Ala Met Phe Glu Gly Trp Ile 370 375 380 Arg Trp Ile Met Gln Ile Ala Ser Lys Tyr Asn His Arg Lys Asn Leu 385 390 395 400 Thr Leu Lys Ala Leu Tyr Glu Thr Glu Ser Tyr Gln Ala Gly Gln Phe 405 410 415 Thr Val Met Glu Pro Ser Ala Gly Met Phe Ile Ile Ile Lys Ile Asn 420 425 430 Trp Gly Asn Phe Asp Arg Pro Asp Asp Leu Pro Gln Gln Met Asp Ile 435 440 445 Leu Asp Lys Phe Leu Leu Lys Asn Gly Val Lys Val Val Leu Gly Tyr 450 455 460 Lys Met Ala Val Cys Pro Asn Tyr Ser Lys Gln Asn Ser Asp Phe Leu 465 470 475 480 Arg Leu Thr Ile Ala Tyr Ala Arg Asp Asp Asp Gln Leu Ile Glu Ala 485 490 495 Ser Lys Arg Ile Gly Ser Gly Ile Lys Glu Phe Phe Asp Asn Tyr Lys 500 505 510 Ser <210> 29 <211> 792 <212> PRT <213> Escherichia coli (strain K12) <400> 29 Met Ser Asn Asn Gly Ser Ser Pro Leu Val Leu Trp Tyr Asn Gln Leu 1 5 10 15 Gly Met Asn Asp Val Asp Arg Val Gly Gly Lys Asn Ala Ser Leu Gly 20 25 30 Glu Met Ile Thr Asn Leu Ser Gly Met Gly Val Ser Val Pro Asn Gly 35 40 45 Phe Ala Thr Thr Ala Asp Ala Phe Asn Gln Phe Leu Asp Gln Ser Gly 50 55 60 Val Asn Gln Arg Ile Tyr Glu Leu Leu Asp Lys Thr Asp Ile Asp Asp 65 70 75 80 Val Thr Gln Leu Ala Lys Ala Gly Ala Gln Ile Arg Gln Trp Ile Ile 85 90 95 Asp Thr Pro Phe Gln Pro Glu Leu Glu Asn Ala Ile Arg Glu Ala Tyr 100 105 110 Ala Gln Leu Ser Ala Asp Asp Glu Asn Ala Ser Phe Ala Val Arg Ser 115 120 125 Ser Ala Thr Ala Glu Asp Met Pro Asp Ala Ser Phe Ala Gly Gln Gln 130 135 140 Glu Thr Phe Leu Asn Val Gln Gly Phe Asp Ala Val Leu Val Ala Val 145 150 155 160 Lys His Val Phe Ala Ser Leu Phe Asn Asp Arg Ala Ile Ser Tyr Arg 165 170 175 Val His Gln Gly Tyr Asp His Arg Gly Val Ala Leu Ser Ala Gly Val 180 185 190 Gln Arg Met Val Arg Ser Asp Leu Ala Ser Ser Gly Val Met Phe Ser 195 200 205 Ile Asp Thr Glu Ser Gly Phe Asp Gln Val Val Phe Ile Thr Ser Ala 210 215 220 Trp Gly Leu Gly Glu Met Val Val Gln Gly Ala Val Asn Pro Asp Glu 225 230 235 240 Phe Tyr Val His Lys Pro Thr Leu Ala Ala Asn Arg Pro Ala Ile Val 245 250 255 Arg Arg Thr Met Gly Ser Lys Lys Ile Arg Met Val Tyr Ala Pro Thr 260 265 270 Gln Glu His Gly Lys Gln Val Lys Ile Glu Asp Val Pro Gln Glu Gln 275 280 285 Arg Asp Ile Phe Ser Leu Thr Asn Glu Glu Val Gln Glu Leu Ala Lys 290 295 300 Gln Ala Val Gln Ile Glu Lys His Tyr Gly Arg Pro Met Asp Ile Glu 305 310 315 320 Trp Ala Lys Asp Gly His Thr Gly Lys Leu Phe Ile Val Gln Ala Arg 325 330 335 Pro Glu Thr Val Arg Ser Arg Gly Gln Val Met Glu Arg Tyr Thr Leu 340 345 350 His Ser Gln Gly Lys Ile Ile Ala Glu Gly Arg Ala Ile Gly His Arg 355 360 365 Ile Gly Ala Gly Pro Val Lys Val Ile His Asp Ile Ser Glu Met Asn 370 375 380 Arg Ile Glu Pro Gly Asp Val Leu Val Thr Asp Met Thr Asp Pro Asp 385 390 395 400 Trp Glu Pro Ile Met Lys Lys Ala Ser Ala Ile Val Thr Asn Arg Gly 405 410 415 Gly Arg Thr Cys His Ala Ala Ile Ile Ala Arg Glu Leu Gly Ile Pro 420 425 430 Ala Val Val Gly Cys Gly Asp Ala Thr Glu Arg Met Lys Asp Gly Glu 435 440 445 Asn Val Thr Val Ser Cys Ala Glu Gly Asp Thr Gly Tyr Val Tyr Ala 450 455 460 Glu Leu Leu Glu Phe Ser Val Lys Ser Ser Ser Val Glu Thr Met Pro 465 470 475 480 Asp Leu Pro Leu Lys Val Met Met Asn Val Gly Asn Pro Asp Arg Ala 485 490 495 Phe Asp Phe Ala Cys Leu Pro Asn Glu Gly Val Gly Leu Ala Arg Leu 500 505 510 Glu Phe Ile Ile Asn Arg Met Ile Gly Val His Pro Arg Ala Leu Leu 515 520 525 Glu Phe Asp Asp Gln Glu Pro Gln Leu Gln Asn Glu Ile Arg Glu Met 530 535 540 Met Lys Gly Phe Asp Ser Pro Arg Glu Phe Tyr Val Gly Arg Leu Thr 545 550 555 560 Glu Gly Ile Ala Thr Leu Gly Ala Ala Phe Tyr Pro Lys Arg Val Ile 565 570 575 Val Arg Leu Ser Asp Phe Lys Ser Asn Glu Tyr Ala Asn Leu Val Gly 580 585 590 Gly Glu Arg Tyr Glu Pro Asp Glu Glu Asn Pro Met Leu Gly Phe Arg 595 600 605 Gly Ala Gly Arg Tyr Val Ser Asp Ser Phe Arg Asp Cys Phe Ala Leu 610 615 620 Glu Cys Glu Ala Val Lys Arg Val Arg Asn Asp Met Gly Leu Thr Asn 625 630 635 640 Val Glu Ile Met Ile Pro Phe Val Arg Thr Val Asp Gln Ala Lys Ala 645 650 655 Val Val Glu Glu Leu Ala Arg Gln Gly Leu Lys Arg Gly Glu Asn Gly 660 665 670 Leu Lys Ile Ile Met Met Cys Glu Ile Pro Ser Asn Ala Leu Leu Ala 675 680 685 Glu Gln Phe Leu Glu Tyr Phe Asp Gly Phe Ser Ile Gly Ser Asn Asp 690 695 700 Met Thr Gln Leu Ala Leu Gly Leu Asp Arg Asp Ser Gly Val Val Ser 705 710 715 720 Glu Leu Phe Asp Glu Arg Asn Asp Ala Val Lys Ala Leu Leu Ser Met 725 730 735 Ala Ile Arg Ala Ala Lys Lys Gln Gly Lys Tyr Val Gly Ile Cys Gly 740 745 750 Gln Gly Pro Ser Asp His Glu Asp Phe Ala Ala Trp Leu Met Glu Glu 755 760 765 Gly Ile Asp Ser Leu Ser Leu Asn Pro Asp Thr Val Val Gln Thr Trp 770 775 780 Leu Ser Leu Ala Glu Leu Lys Lys 785 790 <210> 30 <211> 680 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 30 Met Thr Gln Phe Thr Asp Ile Asp Lys Leu Ala Val Ser Thr Ile Arg 1 5 10 15 Ile Leu Ala Val Asp Thr Val Ser Lys Ala Asn Ser Gly His Pro Gly 20 25 30 Ala Pro Leu Gly Met Ala Pro Ala Ala His Val Leu Trp Ser Gln Met 35 40 45 Arg Met Asn Pro Thr Asn Pro Asp Trp Ile Asn Arg Asp Arg Phe Val 50 55 60 Leu Ser Asn Gly His Ala Val Ala Leu Leu Tyr Ser Met Leu His Leu 65 70 75 80 Thr Gly Tyr Asp Leu Ser Ile Glu Asp Leu Lys Gln Phe Arg Gln Leu 85 90 95 Gly Ser Arg Thr Pro Gly His Pro Glu Phe Glu Leu Pro Gly Val Glu 100 105 110 Val Thr Thr Gly Pro Leu Gly Gln Gly Ile Ser Asn Ala Val Gly Met 115 120 125 Ala Met Ala Gln Ala Asn Leu Ala Ala Thr Tyr Asn Lys Pro Gly Phe 130 135 140 Thr Leu Ser Asp Asn Tyr Thr Tyr Val Phe Leu Gly Asp Gly Cys Leu 145 150 155 160 Gln Glu Gly Ile Ser Ser Glu Ala Ser Ser Leu Ala Gly His Leu Lys 165 170 175 Leu Gly Asn Leu Ile Ala Ile Tyr Asp Asp Asn Lys Ile Thr Ile Asp 180 185 190 Gly Ala Thr Ser Ile Ser Phe Asp Glu Asp Val Ala Lys Arg Tyr Glu 195 200 205 Ala Tyr Gly Trp Glu Val Leu Tyr Val Glu Asn Gly Asn Glu Asp Leu 210 215 220 Ala Gly Ile Ala Lys Ala Ile Ala Gln Ala Lys Leu Ser Lys Asp Lys 225 230 235 240 Pro Thr Leu Ile Lys Met Thr Thr Thr Ile Gly Tyr Gly Ser Leu His 245 250 255 Ala Gly Ser His Ser Val His Gly Ala Pro Leu Lys Ala Asp Asp Val 260 265 270 Lys Gln Leu Lys Ser Lys Phe Gly Phe Asn Pro Asp Lys Ser Phe Val 275 280 285 Val Pro Gln Glu Val Tyr Asp His Tyr Gln Lys Thr Ile Leu Lys Pro 290 295 300 Gly Val Glu Ala Asn Asn Lys Trp Asn Lys Leu Phe Ser Glu Tyr Gln 305 310 315 320 Lys Lys Phe Pro Glu Leu Gly Ala Glu Leu Ala Arg Arg Leu Ser Gly 325 330 335 Gln Leu Pro Ala Asn Trp Glu Ser Lys Leu Pro Thr Tyr Thr Ala Lys 340 345 350 Asp Ser Ala Val Ala Thr Arg Lys Leu Ser Glu Thr Val Leu Glu Asp 355 360 365 Val Tyr Asn Gln Leu Pro Glu Leu Ile Gly Gly Ser Ala Asp Leu Thr 370 375 380 Pro Ser Asn Leu Thr Arg Trp Lys Glu Ala Leu Asp Phe Gln Pro Pro 385 390 395 400 Ser Ser Gly Ser Gly Asn Tyr Ser Gly Arg Tyr Ile Arg Tyr Gly Ile 405 410 415 Arg Glu His Ala Met Gly Ala Ile Met Asn Gly Ile Ser Ala Phe Gly 420 425 430 Ala Asn Tyr Lys Pro Tyr Gly Gly Thr Phe Leu Asn Phe Val Ser Tyr 435 440 445 Ala Ala Gly Ala Val Arg Leu Ser Ala Leu Ser Gly His Pro Val Ile 450 455 460 Trp Val Ala Thr His Asp Ser Ile Gly Val Gly Glu Asp Gly Pro Thr 465 470 475 480 His Gln Pro Ile Glu Thr Leu Ala His Phe Arg Ser Leu Pro Asn Ile 485 490 495 Gln Val Trp Arg Pro Ala Asp Gly Asn Glu Val Ser Ala Ala Tyr Lys 500 505 510 Asn Ser Leu Glu Ser Lys His Thr Pro Ser Ile Ile Ala Leu Ser Arg 515 520 525 Gln Asn Leu Pro Gln Leu Glu Gly Ser Ser Ile Glu Ser Ala Ser Lys 530 535 540 Gly Gly Tyr Val Leu Gln Asp Val Ala Asn Pro Asp Ile Ile Leu Val 545 550 555 560 Ala Thr Gly Ser Glu Val Ser Leu Ser Val Glu Ala Ala Lys Thr Leu 565 570 575 Ala Ala Lys Asn Ile Lys Ala Arg Val Val Ser Leu Pro Asp Phe Phe 580 585 590 Thr Phe Asp Lys Gln Pro Leu Glu Tyr Arg Leu Ser Val Leu Pro Asp 595 600 605 Asn Val Pro Ile Met Ser Val Glu Val Leu Ala Thr Thr Cys Trp Gly 610 615 620 Lys Tyr Ala His Gln Ser Phe Gly Ile Asp Arg Phe Gly Ala Ser Gly 625 630 635 640 Lys Ala Pro Glu Val Phe Lys Phe Phe Gly Phe Thr Pro Glu Gly Val 645 650 655 Ala Glu Arg Ala Gln Lys Thr Ile Ala Phe Tyr Lys Gly Asp Lys Leu 660 665 670 Ile Ser Pro Leu Lys Lys Ala Phe 675 680 <210> 31 <211> 416 <212> PRT <213> Gracilaria gracilis (Red alga) <400> 31 Met Ala Phe Val Ala Pro Val Ser Ser Val Phe Ser Thr Ser Ser Lys 1 5 10 15 Ser Ala Val Cys Ser Gly Arg Ser Ser Phe Ala Gln Phe Ser Gly Leu 20 25 30 Lys Lys Val Asn Asn Thr Ala Arg Leu Gln Thr Ala Glu Gln Gly Ser 35 40 45 Ala Phe Gly Gly Val Ser Asp Ala Asn Asp Ala Phe Phe Asn Ala Val 50 55 60 Asn Thr Met Gly Ala Pro Ala Arg Thr Ser Asn Ala Pro Ser Met Lys 65 70 75 80 Val Arg Val Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Asn Phe Ile 85 90 95 Arg Cys Trp Ala Gly Arg Thr Asp Ser Asn Met Asp Val Val Cys Ile 100 105 110 Asn Asp Thr Ser Gly Val Lys Thr Ala Ser His Leu Leu Lys Tyr Asp 115 120 125 Ser Ile Leu Gly Thr Phe Asp Ser Asp Val Val Ala Gly Glu Asp Ser 130 135 140 Ile Thr Val Asp Gly Lys Thr Ile Lys Val Val Ser Asn Arg Asn Pro 145 150 155 160 Leu Glu Leu Pro Trp Lys Glu Met Glu Ile Asp Ile Val Val Glu Ala 165 170 175 Thr Gly Val Phe Val Asp Ala Val Gly Ala Gly Lys His Ile Gln Ala 180 185 190 Gly Ala Lys Lys Val Leu Ile Thr Ala Pro Gly Lys Gly Glu Gly Val 195 200 205 Gly Thr Phe Val Val Gly Val Asn Asp His Leu Tyr Ser His Asp Lys 210 215 220 Phe Asp Ile Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Met Ala Pro 225 230 235 240 Phe Met Lys Val Leu Asp Asp Glu Phe Gly Val Val Arg Gly Met Met 245 250 255 Thr Thr Thr His Ser Tyr Thr Gly Asp Gln Arg Leu Leu Asp Ala Gly 260 265 270 His Arg Asp Leu Arg Arg Ala Arg Ser Ala Ala Leu Asn Ile Val Pro 275 280 285 Thr Thr Thr Gly Ala Ala Lys Ala Val Ala Leu Val Val Pro Thr Leu 290 295 300 Ala Gly Lys Leu Asn Gly Ile Ala Leu Arg Val Pro Thr Pro Asn Val 305 310 315 320 Ser Val Cys Asp Val Val Met Gln Val Ser Lys Lys Thr Phe Lys Glu 325 330 335 Glu Val Asn Gly Ala Leu Leu Lys Ala Ala Asn Gly Ser Met Lys Gly 340 345 350 Ile Ile Lys Tyr Ser Asp Glu Pro Leu Val Ser Cys Asp Tyr Arg Gly 355 360 365 Thr Asp Glu Ser Thr Ile Ile Asp Ser Ser Leu Thr Met Val Met Gly 370 375 380 Asp Asp Met Leu Lys Val Val Ala Trp Tyr Asp Asn Glu Trp Gly Tyr 385 390 395 400 Ser Gln Arg Val Val Asp Leu Gly Glu Val Met Ala Ser Gln Trp Lys 405 410 415 <210> 32 <211> 262 <212> PRT <213> Pyrococcus furiosus (strain ATCC 43587 DSM 3638 JCM 8422 Vc1) <400> 32 Met Lys Tyr Ser Lys Glu Tyr Lys Glu Lys Thr Val Val Lys Ile Asn 1 5 10 15 Asp Val Lys Phe Gly Glu Gly Phe Thr Ile Ile Ala Gly Pro Cys Ser 20 25 30 Ile Glu Ser Arg Asp Gln Ile Met Lys Val Ala Glu Phe Leu Ala Glu 35 40 45 Val Gly Ile Lys Val Leu Arg Gly Gly Ala Phe Lys Pro Arg Thr Ser 50 55 60 Pro Tyr Ser Phe Gln Gly Tyr Gly Glu Lys Ala Leu Arg Trp Met Arg 65 70 75 80 Glu Ala Ala Asp Glu Tyr Gly Leu Val Thr Val Thr Glu Val Met Asp 85 90 95 Thr Arg His Val Glu Leu Val Ala Lys Tyr Ser Asp Ile Leu Gln Ile 100 105 110 Gly Ala Arg Asn Ser Gln Asn Phe Glu Leu Leu Lys Glu Val Gly Lys 115 120 125 Val Glu Asn Pro Val Leu Leu Lys Arg Gly Met Gly Asn Thr Ile Gln 130 135 140 Glu Leu Leu Tyr Ser Ala Glu Tyr Ile Met Ala Gln Gly Asn Glu Asn 145 150 155 160 Val Ile Leu Cys Glu Arg Gly Ile Arg Thr Phe Glu Thr Ala Thr Arg 165 170 175 Phe Thr Leu Asp Ile Ser Ala Val Pro Val Val Lys Glu Leu Ser His 180 185 190 Leu Pro Ile Ile Val Asp Pro Ser His Pro Ala Gly Arg Arg Ser Leu 195 200 205 Val Ile Pro Leu Ala Lys Ala Ala Tyr Ala Ile Gly Ala Asp Gly Ile 210 215 220 Met Val Glu Val His Pro Glu Pro Glu Lys Ala Leu Ser Asp Ser Gln 225 230 235 240 Gln Gln Leu Thr Phe Asp Asp Phe Leu Gln Leu Leu Lys Glu Leu Glu 245 250 255 Ala Leu Gly Trp Lys Gly 260 <210> 33 <211> 267 <212> PRT <213> Meyerozyma guilliermondii (strain ATCC 6260 CBS 566 DSM 6381 JCM 1539 NBRC 10279 NRRL Y-324) (Yeast) (Candida guilliermondii) <400> 33 Met Asp Phe Thr Lys Pro Glu Thr Val Leu Asp Leu Gly Asn Ile Arg 1 5 10 15 Gln Ala Leu Ile Arg Met Glu Asp Thr Ile Val Phe Phe Leu Ile Glu 20 25 30 Arg Ser Gln Phe Tyr Ser Ser Pro Ser Val Tyr Ile Lys Asn Lys Phe 35 40 45 Pro Ile Pro Asn Phe Asp Gly Ser Phe Leu Asp Trp Ser Leu Gln Gln 50 55 60 Met Glu Arg Thr His Ser Gln Ile Arg Arg Tyr Glu Ala Pro Asp Glu 65 70 75 80 Ile Pro Phe Phe Pro Glu Val Leu Leu Glu Ser Phe Leu Pro Pro Ile 85 90 95 Asn Tyr Pro Asn Ile Leu Ala Ser Tyr His Lys Glu Val Asn His Asn 100 105 110 Gln Thr Val Leu Asn Phe Tyr Val Glu Asn Ile Val Pro Gln Val Ala 115 120 125 Cys Glu Ile Gly Glu Gln Glu Glu Asn Ile Gly Ser Val Ser Val Cys 130 135 140 Asp Ile Asp Cys Leu Gln Ser Leu Ser Arg Arg Ile His Phe Gly Lys 145 150 155 160 Phe Val Ala Glu Ala Lys Tyr Gln Ser Asp Lys Pro Lys Tyr Ile Lys 165 170 175 Leu Ile Leu Ala Lys Asp Val Lys Gly Ile Glu Asp Ser Ile Thr Asn 180 185 190 Ser Ala Val Glu Glu Lys Ile Leu Glu Arg Leu Gln Lys Lys Gly Gln 195 200 205 Ser Tyr Gly Thr Asp Pro Thr Leu Met Tyr Ser Gln Asn Pro Gln Ser 210 215 220 Lys Val Arg Pro Glu Val Ile Ala Gln Leu Tyr Lys Asp His Val Ile 225 230 235 240 Pro Leu Thr Lys Lys Val Glu Val Asp Tyr Leu Leu Arg Arg Leu Glu 245 250 255 Asp Glu Asp Glu Ala Val Val Ala Lys Tyr Lys 260 265 <210> 34 <211> 173 <212> PRT <213> Escherichia coli (strain K12) <400> 34 Met Ala Glu Lys Arg Asn Ile Phe Leu Val Gly Pro Met Gly Ala Gly 1 5 10 15 Lys Ser Thr Ile Gly Arg Gln Leu Ala Gln Gln Leu Asn Met Glu Phe 20 25 30 Tyr Asp Ser Asp Gln Glu Ile Glu Lys Arg Thr Gly Ala Asp Val Gly 35 40 45 Trp Val Phe Asp Leu Glu Gly Glu Glu Gly Phe Arg Asp Arg Glu Glu 50 55 60 Lys Val Ile Asn Glu Leu Thr Glu Lys Gln Gly Ile Val Leu Ala Thr 65 70 75 80 Gly Gly Gly Ser Val Lys Ser Arg Glu Thr Arg Asn Arg Leu Ser Ala 85 90 95 Arg Gly Val Val Val Tyr Leu Glu Thr Thr Ile Glu Lys Gln Leu Ala 100 105 110 Arg Thr Gln Arg Asp Lys Lys Arg Pro Leu Leu His Val Glu Thr Pro 115 120 125 Pro Arg Glu Val Leu Glu Ala Leu Ala Asn Glu Arg Asn Pro Leu Tyr 130 135 140 Glu Glu Ile Ala Asp Val Thr Ile Arg Thr Asp Asp Gln Ser Ala Lys 145 150 155 160 Val Val Ala Asn Gln Ile Ile His Met Leu Glu Ser Asn 165 170 <210> 35 <211> 1588 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 35 Met Val Gln Leu Ala Lys Val Pro Ile Leu Gly Asn Asp Ile Ile His 1 5 10 15 Val Gly Tyr Asn Ile His Asp His Leu Val Glu Thr Ile Ile Lys His 20 25 30 Cys Pro Ser Ser Thr Tyr Val Ile Cys Asn Asp Thr Asn Leu Ser Lys 35 40 45 Val Pro Tyr Tyr Gln Gln Leu Val Leu Glu Phe Lys Ala Ser Leu Pro 50 55 60 Glu Gly Ser Arg Leu Leu Thr Tyr Val Val Lys Pro Gly Glu Thr Ser 65 70 75 80 Lys Ser Arg Glu Thr Lys Ala Gln Leu Glu Asp Tyr Leu Leu Val Glu 85 90 95 Gly Cys Thr Arg Asp Thr Val Met Val Ala Ile Gly Gly Gly Val Ile 100 105 110 Gly Asp Met Ile Gly Phe Val Ala Ser Thr Phe Met Arg Gly Val Arg 115 120 125 Val Val Gln Val Pro Thr Ser Leu Leu Ala Met Val Asp Ser Ser Ile 130 135 140 Gly Gly Lys Thr Ala Ile Asp Thr Pro Leu Gly Lys Asn Phe Ile Gly 145 150 155 160 Ala Phe Trp Gln Pro Lys Phe Val Leu Val Asp Ile Lys Trp Leu Glu 165 170 175 Thr Leu Ala Lys Arg Glu Phe Ile Asn Gly Met Ala Glu Val Ile Lys 180 185 190 Thr Ala Cys Ile Trp Asn Ala Asp Glu Phe Thr Arg Leu Glu Ser Asn 195 200 205 Ala Ser Leu Phe Leu Asn Val Val Asn Gly Ala Lys Asn Val Lys Val 210 215 220 Thr Asn Gln Leu Thr Asn Glu Ile Asp Glu Ile Ser Asn Thr Asp Ile 225 230 235 240 Glu Ala Met Leu Asp His Thr Tyr Lys Leu Val Leu Glu Ser Ile Lys 245 250 255 Val Lys Ala Glu Val Val Ser Ser Asp Glu Arg Glu Ser Ser Leu Arg 260 265 270 Asn Leu Leu Asn Phe Gly His Ser Ile Gly His Ala Tyr Glu Ala Ile 275 280 285 Leu Thr Pro Gln Ala Leu His Gly Glu Cys Val Ser Ile Gly Met Val 290 295 300 Lys Glu Ala Glu Leu Ser Arg Tyr Phe Gly Ile Leu Ser Pro Thr Gln 305 310 315 320 Val Ala Arg Leu Ser Lys Ile Leu Val Ala Tyr Gly Leu Pro Val Ser 325 330 335 Pro Asp Glu Lys Trp Phe Lys Glu Leu Thr Leu His Lys Lys Thr Pro 340 345 350 Leu Asp Ile Leu Leu Lys Lys Met Ser Ile Asp Lys Lys Asn Glu Gly 355 360 365 Ser Lys Lys Lys Val Val Ile Leu Glu Ser Ile Gly Lys Cys Tyr Gly 370 375 380 Asp Ser Ala Gln Phe Val Ser Asp Glu Asp Leu Arg Phe Ile Leu Thr 385 390 395 400 Asp Glu Thr Leu Val Tyr Pro Phe Lys Asp Ile Pro Ala Asp Gln Gln 405 410 415 Lys Val Val Ile Pro Pro Gly Ser Lys Ser Ile Ser Asn Arg Ala Leu 420 425 430 Ile Leu Ala Ala Leu Gly Glu Gly Gln Cys Lys Ile Lys Asn Leu Leu 435 440 445 His Ser Asp Asp Thr Lys His Met Leu Thr Ala Val His Glu Leu Lys 450 455 460 Gly Ala Thr Ile Ser Trp Glu Asp Asn Gly Glu Thr Val Val Val Glu 465 470 475 480 Gly His Gly Gly Ser Thr Leu Ser Ala Cys Ala Asp Pro Leu Tyr Leu 485 490 495 Gly Asn Ala Gly Thr Ala Ser Arg Phe Leu Thr Ser Leu Ala Ala Leu 500 505 510 Val Asn Ser Thr Ser Ser Gln Lys Tyr Ile Val Leu Thr Gly Asn Ala 515 520 525 Arg Met Gln Gln Arg Pro Ile Ala Pro Leu Val Asp Ser Leu Arg Ala 530 535 540 Asn Gly Thr Lys Ile Glu Tyr Leu Asn Asn Glu Gly Ser Leu Pro Ile 545 550 555 560 Lys Val Tyr Thr Asp Ser Val Phe Lys Gly Gly Arg Ile Glu Leu Ala 565 570 575 Ala Thr Val Ser Ser Gln Tyr Val Ser Ser Ile Leu Met Cys Ala Pro 580 585 590 Tyr Ala Glu Glu Pro Val Thr Leu Ala Leu Val Gly Gly Lys Pro Ile 595 600 605 Ser Lys Leu Tyr Val Asp Met Thr Ile Lys Met Met Glu Lys Phe Gly 610 615 620 Ile Asn Val Glu Thr Ser Thr Thr Glu Pro Tyr Thr Tyr Tyr Ile Pro 625 630 635 640 Lys Gly His Tyr Ile Asn Pro Ser Glu Tyr Val Ile Glu Ser Asp Ala 645 650 655 Ser Ser Ala Thr Tyr Pro Leu Ala Phe Ala Ala Met Thr Gly Thr Thr 660 665 670 Val Thr Val Pro Asn Ile Gly Phe Glu Ser Leu Gln Gly Asp Ala Arg 675 680 685 Phe Ala Arg Asp Val Leu Lys Pro Met Gly Cys Lys Ile Thr Gln Thr 690 695 700 Ala Thr Ser Thr Thr Val Ser Gly Pro Pro Val Gly Thr Leu Lys Pro 705 710 715 720 Leu Lys His Val Asp Met Glu Pro Met Thr Asp Ala Phe Leu Thr Ala 725 730 735 Cys Val Val Ala Ala Ile Ser His Asp Ser Asp Pro Asn Ser Ala Asn 740 745 750 Thr Thr Thr Ile Glu Gly Ile Ala Asn Gln Arg Val Lys Glu Cys Asn 755 760 765 Arg Ile Leu Ala Met Ala Thr Glu Leu Ala Lys Phe Gly Val Lys Thr 770 775 780 Thr Glu Leu Pro Asp Gly Ile Gln Val His Gly Leu Asn Ser Ile Lys 785 790 795 800 Asp Leu Lys Val Pro Ser Asp Ser Ser Gly Pro Val Gly Val Cys Thr 805 810 815 Tyr Asp Asp His Arg Val Ala Met Ser Phe Ser Leu Leu Ala Gly Met 820 825 830 Val Asn Ser Gln Asn Glu Arg Asp Glu Val Ala Asn Pro Val Arg Ile 835 840 845 Leu Glu Arg His Cys Thr Gly Lys Thr Trp Pro Gly Trp Trp Asp Val 850 855 860 Leu His Ser Glu Leu Gly Ala Lys Leu Asp Gly Ala Glu Pro Leu Glu 865 870 875 880 Cys Thr Ser Lys Lys Asn Ser Lys Lys Ser Val Val Ile Ile Gly Met 885 890 895 Arg Ala Ala Gly Lys Thr Thr Ile Ser Lys Trp Cys Ala Ser Ala Leu 900 905 910 Gly Tyr Lys Leu Val Asp Leu Asp Glu Leu Phe Glu Gln Gln His Asn 915 920 925 Asn Gln Ser Val Lys Gln Phe Val Val Glu Asn Gly Trp Glu Lys Phe 930 935 940 Arg Glu Glu Glu Thr Arg Ile Phe Lys Glu Val Ile Gln Asn Tyr Gly 945 950 955 960 Asp Asp Gly Tyr Val Phe Ser Thr Gly Gly Gly Ile Val Glu Ser Ala 965 970 975 Glu Ser Arg Lys Ala Leu Lys Asp Phe Ala Ser Ser Gly Gly Tyr Val 980 985 990 Leu His Leu His Arg Asp Ile Glu Glu Thr Ile Val Phe Leu Gln Ser 995 1000 1005 Asp Pro Ser Arg Pro Ala Tyr Val Glu Glu Ile Arg Glu Val Trp 1010 1015 1020 Asn Arg Arg Glu Gly Trp Tyr Lys Glu Cys Ser Asn Phe Ser Phe 1025 1030 1035 Phe Ala Pro His Cys Ser Ala Glu Ala Glu Phe Gln Ala Leu Arg 1040 1045 1050 Arg Ser Phe Ser Lys Tyr Ile Ala Thr Ile Thr Gly Val Arg Glu 1055 1060 1065 Ile Glu Ile Pro Ser Gly Arg Ser Ala Phe Val Cys Leu Thr Phe 1070 1075 1080 Asp Asp Leu Thr Glu Gln Thr Glu Asn Leu Thr Pro Ile Cys Tyr 1085 1090 1095 Gly Cys Glu Ala Val Glu Val Arg Val Asp His Leu Ala Asn Tyr 1100 1105 1110 Ser Ala Asp Phe Val Ser Lys Gln Leu Ser Ile Leu Arg Lys Ala 1115 1120 1125 Thr Asp Ser Ile Pro Ile Ile Phe Thr Val Arg Thr Met Lys Gln 1130 1135 1140 Gly Gly Asn Phe Pro Asp Glu Glu Phe Lys Thr Leu Arg Glu Leu 1145 1150 1155 Tyr Asp Ile Ala Leu Lys Asn Gly Val Glu Phe Leu Asp Leu Glu 1160 1165 1170 Leu Thr Leu Pro Thr Asp Ile Gln Tyr Glu Val Ile Asn Lys Arg 1175 1180 1185 Gly Asn Thr Lys Ile Ile Gly Ser His His Asp Phe Gln Gly Leu 1190 1195 1200 Tyr Ser Trp Asp Asp Ala Glu Trp Glu Asn Arg Phe Asn Gln Ala 1205 1210 1215 Leu Thr Leu Asp Val Asp Val Val Lys Phe Val Gly Thr Ala Val 1220 1225 1230 Asn Phe Glu Asp Asn Leu Arg Leu Glu His Phe Arg Asp Thr His 1235 1240 1245 Lys Asn Lys Pro Leu Ile Ala Val Asn Met Thr Ser Lys Gly Ser 1250 1255 1260 Ile Ser Arg Val Leu Asn Asn Val Leu Thr Pro Val Thr Ser Asp 1265 1270 1275 Leu Leu Pro Asn Ser Ala Ala Pro Gly Gln Leu Thr Val Ala Gln 1280 1285 1290 Ile Asn Lys Met Tyr Thr Ser Met Gly Gly Ile Glu Pro Lys Glu 1295 1300 1305 Leu Phe Val Val Gly Lys Pro Ile Gly His Ser Arg Ser Pro Ile 1310 1315 1320 Leu His Asn Thr Gly Tyr Glu Ile Leu Gly Leu Pro His Lys Phe 1325 1330 1335 Asp Lys Phe Glu Thr Glu Ser Ala Gln Leu Val Lys Glu Lys Leu 1340 1345 1350 Leu Asp Gly Asn Lys Asn Phe Gly Gly Ala Ala Val Thr Ile Pro 1355 1360 1365 Leu Lys Leu Asp Ile Met Gln Tyr Met Asp Glu Leu Thr Asp Ala 1370 1375 1380 Ala Lys Val Ile Gly Ala Val Asn Thr Val Ile Pro Leu Gly Asn 1385 1390 1395 Lys Lys Phe Lys Gly Asp Asn Thr Asp Trp Leu Gly Ile Arg Asn 1400 1405 1410 Ala Leu Ile Asn Asn Gly Val Pro Glu Tyr Val Gly His Thr Ala 1415 1420 1425 Gly Leu Val Ile Gly Ala Gly Gly Thr Ser Arg Ala Ala Leu Tyr 1430 1435 1440 Ala Leu His Ser Leu Gly Cys Lys Lys Ile Phe Ile Ile Asn Arg 1445 1450 1455 Thr Thr Ser Lys Leu Lys Pro Leu Ile Glu Ser Leu Pro Ser Glu 1460 1465 1470 Phe Asn Ile Ile Gly Ile Glu Ser Thr Lys Ser Ile Glu Glu Ile 1475 1480 1485 Lys Glu His Val Gly Val Ala Val Ser Cys Val Pro Ala Asp Lys 1490 1495 1500 Pro Leu Asp Asp Glu Leu Leu Ser Lys Leu Glu Arg Phe Leu Val 1505 1510 1515 Lys Gly Ala His Ala Ala Phe Val Pro Thr Leu Leu Glu Ala Ala 1520 1525 1530 Tyr Lys Pro Ser Val Thr Pro Val Met Thr Ile Ser Gln Asp Lys 1535 1540 1545 Tyr Gln Trp His Val Val Pro Gly Ser Gln Met Leu Val His Gln 1550 1555 1560 Gly Val Ala Gln Phe Glu Lys Trp Thr Gly Phe Lys Gly Pro Phe 1565 1570 1575 Lys Ala Ile Phe Asp Ala Val Thr Lys Glu 1580 1585 <210> 36 <211> 454 <212> PRT <213> Homo sapiens (Human) <400> 36 Met Asp Pro Tyr Met Ile Gln Met Ser Ser Lys Gly Asn Leu Pro Ser 1 5 10 15 Ile Leu Asp Val His Val Asn Val Gly Gly Arg Ser Ser Val Pro Gly 20 25 30 Lys Met Lys Gly Arg Lys Ala Arg Trp Ser Val Arg Pro Ser Asp Met 35 40 45 Ala Lys Lys Thr Phe Asn Pro Ile Arg Ala Ile Val Asp Asn Met Lys 50 55 60 Val Lys Pro Asn Pro Asn Lys Thr Met Ile Ser Leu Ser Ile Gly Asp 65 70 75 80 Pro Thr Val Phe Gly Asn Leu Pro Thr Asp Pro Glu Val Thr Gln Ala 85 90 95 Met Lys Asp Ala Leu Asp Ser Gly Lys Tyr Asn Gly Tyr Ala Pro Ser 100 105 110 Ile Gly Phe Leu Ser Ser Arg Glu Glu Ile Ala Ser Tyr Tyr His Cys 115 120 125 Pro Glu Ala Pro Leu Glu Ala Lys Asp Val Ile Leu Thr Ser Gly Cys 130 135 140 Ser Gln Ala Ile Asp Leu Cys Leu Ala Val Leu Ala Asn Pro Gly Gln 145 150 155 160 Asn Ile Leu Val Pro Arg Pro Gly Phe Ser Leu Tyr Lys Thr Leu Ala 165 170 175 Glu Ser Met Gly Ile Glu Val Lys Leu Tyr Asn Leu Leu Pro Glu Lys 180 185 190 Ser Trp Glu Ile Asp Leu Lys Gln Leu Glu Tyr Leu Ile Asp Glu Lys 195 200 205 Thr Ala Cys Leu Ile Val Asn Asn Pro Ser Asn Pro Cys Gly Ser Val 210 215 220 Phe Ser Lys Arg His Leu Gln Lys Ile Leu Ala Val Ala Ala Arg Gln 225 230 235 240 Cys Val Pro Ile Leu Ala Asp Glu Ile Tyr Gly Asp Met Val Phe Ser 245 250 255 Asp Cys Lys Tyr Glu Pro Leu Ala Thr Leu Ser Thr Asp Val Pro Ile 260 265 270 Leu Ser Cys Gly Gly Leu Ala Lys Arg Trp Leu Val Pro Gly Trp Arg 275 280 285 Leu Gly Trp Ile Leu Ile His Asp Arg Arg Asp Ile Phe Gly Asn Glu 290 295 300 Ile Arg Asp Gly Leu Val Lys Leu Ser Gln Arg Ile Leu Gly Pro Cys 305 310 315 320 Thr Ile Val Gln Gly Ala Leu Lys Ser Ile Leu Cys Arg Thr Pro Gly 325 330 335 Glu Phe Tyr His Asn Thr Leu Ser Phe Leu Lys Ser Asn Ala Asp Leu 340 345 350 Cys Tyr Gly Ala Leu Ala Ala Ile Pro Gly Leu Arg Pro Val Arg Pro 355 360 365 Ser Gly Ala Met Tyr Leu Met Val Gly Ile Glu Met Glu His Phe Pro 370 375 380 Glu Phe Glu Asn Asp Val Glu Phe Thr Glu Arg Leu Val Ala Glu Gln 385 390 395 400 Ser Val His Cys Leu Pro Ala Thr Cys Phe Glu Tyr Pro Asn Phe Ile 405 410 415 Arg Val Val Ile Thr Val Pro Glu Val Met Met Leu Glu Ala Cys Ser 420 425 430 Arg Ile Gln Glu Phe Cys Glu Gln His Tyr His Cys Ala Glu Gly Ser 435 440 445 Gln Glu Glu Cys Asp Lys 450 <210> 37 <211> 1486 <212> PRT <213> Escherichia coli (strain K12) <400> 37 Met Leu Tyr Asp Lys Ser Leu Glu Arg Asp Asn Cys Gly Phe Gly Leu 1 5 10 15 Ile Ala His Ile Glu Gly Glu Pro Ser His Lys Val Val Arg Thr Ala 20 25 30 Ile His Ala Leu Ala Arg Met Gln His Arg Gly Ala Ile Leu Ala Asp 35 40 45 Gly Lys Thr Gly Asp Gly Cys Gly Leu Leu Leu Gln Lys Pro Asp Arg 50 55 60 Phe Phe Arg Ile Val Ala Gln Glu Arg Gly Trp Arg Leu Ala Lys Asn 65 70 75 80 Tyr Ala Val Gly Met Leu Phe Leu Asn Lys Asp Pro Glu Leu Ala Ala 85 90 95 Ala Ala Arg Arg Ile Val Glu Glu Glu Leu Gln Arg Glu Thr Leu Ser 100 105 110 Ile Val Gly Trp Arg Asp Val Pro Thr Asn Glu Gly Val Leu Gly Glu 115 120 125 Ile Ala Leu Ser Ser Leu Pro Arg Ile Glu Gln Ile Phe Val Asn Ala 130 135 140 Pro Ala Gly Trp Arg Pro Arg Asp Met Glu Arg Arg Leu Phe Ile Ala 145 150 155 160 Arg Arg Arg Ile Glu Lys Arg Leu Glu Ala Asp Lys Asp Phe Tyr Val 165 170 175 Cys Ser Leu Ser Asn Leu Val Asn Ile Tyr Lys Gly Leu Cys Met Pro 180 185 190 Thr Asp Leu Pro Arg Phe Tyr Leu Asp Leu Ala Asp Leu Arg Leu Glu 195 200 205 Ser Ala Ile Cys Leu Phe His Gln Arg Phe Ser Thr Asn Thr Val Pro 210 215 220 Arg Trp Pro Leu Ala Gln Pro Phe Arg Tyr Leu Ala His Asn Gly Glu 225 230 235 240 Ile Asn Thr Ile Thr Gly Asn Arg Gln Trp Ala Arg Ala Arg Thr Tyr 245 250 255 Lys Phe Gln Thr Pro Leu Ile Pro Asp Leu His Asp Ala Ala Pro Phe 260 265 270 Val Asn Glu Thr Gly Ser Asp Ser Ser Ser Met Asp Asn Met Leu Glu 275 280 285 Leu Leu Leu Ala Gly Gly Met Asp Ile Ile Arg Ala Met Arg Leu Leu 290 295 300 Val Pro Pro Ala Trp Gln Asn Asn Pro Asp Met Asp Pro Glu Leu Arg 305 310 315 320 Ala Phe Phe Asp Phe Asn Ser Met His Met Glu Pro Trp Asp Gly Pro 325 330 335 Ala Gly Ile Val Met Ser Asp Gly Arg Phe Ala Ala Cys Asn Leu Asp 340 345 350 Arg Asn Gly Leu Arg Pro Ala Arg Tyr Val Ile Thr Lys Asp Lys Leu 355 360 365 Ile Thr Cys Ala Ser Glu Val Gly Ile Trp Asp Tyr Gln Pro Asp Glu 370 375 380 Val Val Glu Lys Gly Arg Val Gly Pro Gly Glu Leu Met Val Ile Asp 385 390 395 400 Thr Arg Ser Gly Arg Ile Leu His Ser Ala Glu Thr Asp Asp Asp Leu 405 410 415 Lys Ser Arg His Pro Tyr Lys Glu Trp Met Glu Lys Asn Val Arg Arg 420 425 430 Leu Val Pro Phe Glu Asp Leu Pro Asp Glu Glu Val Gly Ser Arg Glu 435 440 445 Leu Asp Asp Asp Thr Leu Ala Ser Tyr Gln Lys Gln Phe Asn Tyr Ser 450 455 460 Ala Glu Glu Leu Asp Ser Val Ile Arg Val Leu Gly Glu Asn Gly Gln 465 470 475 480 Glu Ala Val Gly Ser Met Gly Asp Asp Thr Pro Phe Ala Val Leu Ser 485 490 495 Ser Gln Pro Arg Ile Ile Tyr Asp Tyr Phe Arg Gln Gln Phe Ala Gln 500 505 510 Val Thr Asn Pro Pro Ile Asp Pro Leu Arg Glu Ala His Val Met Ser 515 520 525 Leu Ala Thr Ser Ile Gly Arg Glu Met Asn Val Phe Cys Glu Ala Glu 530 535 540 Gly Gln Ala His Arg Leu Ser Phe Lys Ser Pro Ile Leu Leu Tyr Ser 545 550 555 560 Asp Phe Lys Gln Leu Thr Thr Met Lys Glu Glu His Tyr Arg Ala Asp 565 570 575 Thr Leu Asp Ile Thr Phe Asp Val Thr Lys Thr Thr Leu Glu Ala Thr 580 585 590 Val Lys Glu Leu Cys Asp Lys Ala Glu Lys Met Val Arg Ser Gly Thr 595 600 605 Val Leu Leu Val Leu Ser Asp Arg Asn Ile Ala Lys Asp Arg Leu Pro 610 615 620 Val Pro Ala Pro Met Ala Val Gly Ala Ile Gln Thr Arg Leu Val Asp 625 630 635 640 Gln Ser Leu Arg Cys Asp Ala Asn Ile Ile Val Glu Thr Ala Ser Ala 645 650 655 Arg Asp Pro His His Phe Ala Val Leu Leu Gly Phe Gly Ala Thr Ala 660 665 670 Ile Tyr Pro Tyr Leu Ala Tyr Glu Thr Leu Gly Arg Leu Val Asp Thr 675 680 685 His Ala Ile Ala Lys Asp Tyr Arg Thr Val Met Leu Asn Tyr Arg Asn 690 695 700 Gly Ile Asn Lys Gly Leu Tyr Lys Ile Met Ser Lys Met Gly Ile Ser 705 710 715 720 Thr Ile Ala Ser Tyr Arg Cys Ser Lys Leu Phe Glu Ala Val Gly Leu 725 730 735 His Asp Asp Val Val Gly Leu Cys Phe Gln Gly Ala Val Ser Arg Ile 740 745 750 Gly Gly Ala Ser Phe Glu Asp Phe Gln Gln Asp Leu Leu Asn Leu Ser 755 760 765 Lys Arg Ala Trp Leu Ala Arg Lys Pro Ile Ser Gln Gly Gly Leu Leu 770 775 780 Lys Tyr Val His Gly Gly Glu Tyr His Ala Tyr Asn Pro Asp Val Val 785 790 795 800 Arg Thr Leu Gln Gln Ala Val Gln Ser Gly Glu Tyr Ser Asp Tyr Gln 805 810 815 Glu Tyr Ala Lys Leu Val Asn Glu Arg Pro Ala Thr Thr Leu Arg Asp 820 825 830 Leu Leu Ala Ile Thr Pro Gly Glu Asn Ala Val Asn Ile Ala Asp Val 835 840 845 Glu Pro Ala Ser Glu Leu Phe Lys Arg Phe Asp Thr Ala Ala Met Ser 850 855 860 Ile Gly Ala Leu Ser Pro Glu Ala His Glu Ala Leu Ala Glu Ala Met 865 870 875 880 Asn Ser Ile Gly Gly Asn Ser Asn Ser Gly Glu Gly Gly Glu Asp Pro 885 890 895 Ala Arg Tyr Gly Thr Asn Lys Val Ser Arg Ile Lys Gln Val Ala Ser 900 905 910 Gly Arg Phe Gly Val Thr Pro Ala Tyr Leu Val Asn Ala Asp Val Ile 915 920 925 Gln Ile Lys Val Ala Gln Gly Ala Lys Pro Gly Glu Gly Gly Gln Leu 930 935 940 Pro Gly Asp Lys Val Thr Pro Tyr Ile Ala Lys Leu Arg Tyr Ser Val 945 950 955 960 Pro Gly Val Thr Leu Ile Ser Pro Pro Pro His His Asp Ile Tyr Ser 965 970 975 Ile Glu Asp Leu Ala Gln Leu Ile Phe Asp Leu Lys Gln Val Asn Pro 980 985 990 Lys Ala Met Ile Ser Val Lys Leu Val Ser Glu Pro Gly Val Gly Thr 995 1000 1005 Ile Ala Thr Gly Val Ala Lys Ala Tyr Ala Asp Leu Ile Thr Ile 1010 1015 1020 Ala Gly Tyr Asp Gly Gly Thr Gly Ala Ser Pro Leu Ser Ser Val 1025 1030 1035 Lys Tyr Ala Gly Cys Pro Trp Glu Leu Gly Leu Val Glu Thr Gln 1040 1045 1050 Gln Ala Leu Val Ala Asn Gly Leu Arg His Lys Ile Arg Leu Gln 1055 1060 1065 Val Asp Gly Gly Leu Lys Thr Gly Val Asp Ile Ile Lys Ala Ala 1070 1075 1080 Ile Leu Gly Ala Glu Ser Phe Gly Phe Gly Thr Gly Pro Met Val 1085 1090 1095 Ala Leu Gly Cys Lys Tyr Leu Arg Ile Cys His Leu Asn Asn Cys 1100 1105 1110 Ala Thr Gly Val Ala Thr Gln Asp Asp Lys Leu Arg Lys Asn His 1115 1120 1125 Tyr His Gly Leu Pro Phe Lys Val Thr Asn Tyr Phe Glu Phe Ile 1130 1135 1140 Ala Arg Glu Thr Arg Glu Leu Met Ala Gln Leu Gly Val Thr Arg 1145 1150 1155 Leu Val Asp Leu Ile Gly Arg Thr Asp Leu Leu Lys Glu Leu Asp 1160 1165 1170 Gly Phe Thr Ala Lys Gln Gln Lys Leu Ala Leu Ser Lys Leu Leu 1175 1180 1185 Glu Thr Ala Glu Pro His Pro Gly Lys Ala Leu Tyr Cys Thr Glu 1190 1195 1200 Asn Asn Pro Pro Phe Asp Asn Gly Leu Leu Asn Ala Gln Leu Leu 1205 1210 1215 Gln Gln Ala Lys Pro Phe Val Asp Glu Arg Gln Ser Lys Thr Phe 1220 1225 1230 Trp Phe Asp Ile Arg Asn Thr Asp Arg Ser Val Gly Ala Ser Leu 1235 1240 1245 Ser Gly Tyr Ile Ala Gln Thr His Gly Asp Gln Gly Leu Ala Ala 1250 1255 1260 Asp Pro Ile Lys Ala Tyr Phe Asn Gly Thr Ala Gly Gln Ser Phe 1265 1270 1275 Gly Val Trp Asn Ala Gly Gly Val Glu Leu Tyr Leu Thr Gly Asp 1280 1285 1290 Ala Asn Asp Tyr Val Gly Lys Gly Met Ala Gly Gly Leu Ile Ala 1295 1300 1305 Ile Arg Pro Pro Val Gly Ser Ala Phe Arg Ser His Glu Ala Ser 1310 1315 1320 Ile Ile Gly Asn Thr Cys Leu Tyr Gly Ala Thr Gly Gly Arg Leu 1325 1330 1335 Tyr Ala Ala Gly Arg Ala Gly Glu Arg Phe Gly Val Arg Asn Ser 1340 1345 1350 Gly Ala Ile Thr Val Val Glu Gly Ile Gly Asp Asn Gly Cys Glu 1355 1360 1365 Tyr Met Thr Gly Gly Ile Val Cys Ile Leu Gly Lys Thr Gly Val 1370 1375 1380 Asn Phe Gly Ala Gly Met Thr Gly Gly Phe Ala Tyr Val Leu Asp 1385 1390 1395 Glu Ser Gly Asp Phe Arg Lys Arg Val Asn Pro Glu Leu Val Glu 1400 1405 1410 Val Leu Ser Val Asp Ala Leu Ala Ile His Glu Glu His Leu Arg 1415 1420 1425 Gly Leu Ile Thr Glu His Val Gln His Thr Gly Ser Gln Arg Gly 1430 1435 1440 Glu Glu Ile Leu Ala Asn Trp Ser Thr Phe Ala Thr Lys Phe Ala 1445 1450 1455 Leu Val Lys Pro Lys Ser Ser Asp Val Lys Ala Leu Leu Gly His 1460 1465 1470 Arg Ser Arg Ser Ala Ala Glu Leu Arg Val Gln Ala Gln 1475 1480 1485 <210> 38 <211> 472 <212> PRT <213> Escherichia coli (strain K12) <400> 38 Met Ser Gln Asn Val Tyr Gln Phe Ile Asp Leu Gln Arg Val Asp Pro 1 5 10 15 Pro Lys Lys Pro Leu Lys Ile Arg Lys Ile Glu Phe Val Glu Ile Tyr 20 25 30 Glu Pro Phe Ser Glu Gly Gln Ala Lys Ala Gln Ala Asp Arg Cys Leu 35 40 45 Ser Cys Gly Asn Pro Tyr Cys Glu Trp Lys Cys Pro Val His Asn Tyr 50 55 60 Ile Pro Asn Trp Leu Lys Leu Ala Asn Glu Gly Arg Ile Phe Glu Ala 65 70 75 80 Ala Glu Leu Ser His Gln Thr Asn Thr Leu Pro Glu Val Cys Gly Arg 85 90 95 Val Cys Pro Gln Asp Arg Leu Cys Glu Gly Ser Cys Thr Leu Asn Asp 100 105 110 Glu Phe Gly Ala Val Thr Ile Gly Asn Ile Glu Arg Tyr Ile Asn Asp 115 120 125 Lys Ala Phe Glu Met Gly Trp Arg Pro Asp Met Ser Gly Val Lys Gln 130 135 140 Thr Gly Lys Lys Val Ala Ile Ile Gly Ala Gly Pro Ala Gly Leu Ala 145 150 155 160 Cys Ala Asp Val Leu Thr Arg Asn Gly Val Lys Ala Val Val Phe Asp 165 170 175 Arg His Pro Glu Ile Gly Gly Leu Leu Thr Phe Gly Ile Pro Ala Phe 180 185 190 Lys Leu Glu Lys Glu Val Met Thr Arg Arg Arg Glu Ile Phe Thr Gly 195 200 205 Met Gly Ile Glu Phe Lys Leu Asn Thr Glu Val Gly Arg Asp Val Gln 210 215 220 Leu Asp Asp Leu Leu Ser Asp Tyr Asp Ala Val Phe Leu Gly Val Gly 225 230 235 240 Thr Tyr Gln Ser Met Arg Gly Gly Leu Glu Asn Glu Asp Ala Asp Gly 245 250 255 Val Tyr Ala Ala Leu Pro Phe Leu Ile Ala Asn Thr Lys Gln Leu Met 260 265 270 Gly Phe Gly Glu Thr Arg Asp Glu Pro Phe Val Ser Met Glu Gly Lys 275 280 285 Arg Val Val Val Leu Gly Gly Gly Asp Thr Ala Met Asp Cys Val Arg 290 295 300 Thr Ser Val Arg Gln Gly Ala Lys His Val Thr Cys Ala Tyr Arg Arg 305 310 315 320 Asp Glu Glu Asn Met Pro Gly Ser Arg Arg Glu Val Lys Asn Ala Arg 325 330 335 Glu Glu Gly Val Glu Phe Lys Phe Asn Val Gln Pro Leu Gly Ile Glu 340 345 350 Val Asn Gly Asn Gly Lys Val Ser Gly Val Lys Met Val Arg Thr Glu 355 360 365 Met Gly Glu Pro Asp Ala Lys Gly Arg Arg Arg Ala Glu Ile Val Ala 370 375 380 Gly Ser Glu His Ile Val Pro Ala Asp Ala Val Ile Met Ala Phe Gly 385 390 395 400 Phe Arg Pro His Asn Met Glu Trp Leu Ala Lys His Ser Val Glu Leu 405 410 415 Asp Ser Gln Gly Arg Ile Ile Ala Pro Glu Gly Ser Asp Asn Ala Phe 420 425 430 Gln Thr Ser Asn Pro Lys Ile Phe Ala Gly Gly Asp Ile Val Arg Gly 435 440 445 Ser Asp Leu Val Val Thr Ala Ile Ala Glu Gly Arg Lys Ala Ala Asp 450 455 460 Gly Ile Met Asn Trp Leu Glu Val 465 470 <210> 39 <211> 370 <212> PRT <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 39 Met Ala Glu Ala Ser Ile Glu Lys Thr Gln Ile Leu Gln Lys Tyr Leu 1 5 10 15 Glu Leu Asp Gln Arg Gly Arg Ile Ile Ala Glu Tyr Val Trp Ile Asp 20 25 30 Gly Thr Gly Asn Leu Arg Ser Lys Gly Arg Thr Leu Lys Lys Arg Ile 35 40 45 Thr Ser Ile Asp Gln Leu Pro Glu Trp Asn Phe Asp Gly Ser Ser Thr 50 55 60 Asn Gln Ala Pro Gly His Asp Ser Asp Ile Tyr Leu Lys Pro Val Ala 65 70 75 80 Tyr Tyr Pro Asp Pro Phe Arg Arg Gly Asp Asn Ile Val Val Leu Ala 85 90 95 Ala Cys Tyr Asn Asn Asp Gly Thr Pro Asn Lys Phe Asn His Arg His 100 105 110 Glu Ala Ala Lys Leu Phe Ala Ala His Lys Asp Glu Glu Ile Trp Phe 115 120 125 Gly Leu Glu Gln Glu Tyr Thr Leu Phe Asp Met Tyr Asp Asp Val Tyr 130 135 140 Gly Trp Pro Lys Gly Gly Tyr Pro Ala Pro Gln Gly Pro Tyr Tyr Cys 145 150 155 160 Gly Val Gly Ala Gly Lys Val Tyr Ala Arg Asp Met Ile Glu Ala His 165 170 175 Tyr Arg Ala Cys Leu Tyr Ala Gly Leu Glu Ile Ser Gly Ile Asn Ala 180 185 190 Glu Val Met Pro Ser Gln Trp Glu Phe Gln Val Gly Pro Cys Thr Gly 195 200 205 Ile Asp Met Gly Asp Gln Leu Trp Met Ala Arg Tyr Phe Leu His Arg 210 215 220 Val Ala Glu Glu Phe Gly Ile Lys Ile Ser Phe His Pro Lys Pro Leu 225 230 235 240 Lys Gly Asp Trp Asn Gly Ala Gly Cys His Thr Asn Val Ser Thr Lys 245 250 255 Glu Met Arg Gln Pro Gly Gly Met Lys Tyr Ile Glu Gln Ala Ile Glu 260 265 270 Lys Leu Ser Lys Arg His Ala Glu His Ile Lys Leu Tyr Gly Ser Asp 275 280 285 Asn Asp Met Arg Leu Thr Gly Arg His Glu Thr Ala Ser Met Thr Ala 290 295 300 Phe Ser Ser Gly Val Ala Asn Arg Gly Ser Ser Ile Arg Ile Pro Arg 305 310 315 320 Ser Val Ala Lys Glu Gly Tyr Gly Tyr Phe Glu Asp Arg Arg Pro Ala 325 330 335 Ser Asn Ile Asp Pro Tyr Leu Val Thr Gly Ile Met Cys Glu Thr Val 340 345 350 Cys Gly Ala Ile Asp Asn Ala Asp Met Thr Lys Glu Phe Glu Arg Glu 355 360 365 Ser Ser 370 <210> 40 <211> 1875 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 40 atgtccgagt ccctgtctaa agacctcaac ctcaatgcac tgttcattgg tgacaaggcc 60 gagaatggcc agatctacaa ggccctgctt aacgagcttg tcgatgagca cctcggctgg 120 agacagaact atatgcctca ggacatgccc attattactc cagaagagaa atcttctgca 180 tcctttgagc acaccgtgaa caagaccaag gacgtcctct ctgagatttc ggcccgaatg 240 cgaacacatt ctgtgccctg gcataatgct ggcagatact ggggacacat gaactctgag 300 actctcatgc catcccttct ggcttacaat tttgcaatgc tgtggaatgg aaacaatgtc 360 gcctacgagt cctccccagc tacctcccag atggaggagg aggtcggcat ggagtttgca 420 aagctgatgt cctataaaga cggttggggt cacattgttg ctgatggttc tctcgccaat 480 ctcgaaggcc tgtggtacgc tcgaaatatc aagagccttc ctctggctat gaaggaggtg 540 acccccgagc tcgttgccgg taagtctgat tgggagctca tgaacctctc cactgaagag 600 attatgaacc tcctcgactc tgtgcctgag aaaatcgacg agattaaggc ccattcggct 660 cgttccggca agcatctgga gaagcttggc aagtggcttg tgccacagac gaagcactat 720 tcctggctta aggctgccga tatcatcggt attggcctgg accaagtgat ccctgtgccc 780 gttgatcaca actaccggat ggacatcaat gagctcgaaa agattgttcg aggactggcc 840 gccgagaaga ccccaatcct cggagtcgtg ggtgtcgttg gttccaccga ggagggagct 900 attgatggta tcgacaagat tgtcgctctc cgacgagtcc tcgagaagga tggaatttac 960 ttttacctcc acgttgacgc tgcctacgga ggctacggcc gagctatctt cctcgacgaa 1020 gacaataact ttattccttt tgaggatctt aaggatgtcc actacaagta taacgtcttt 1080 accgagaaca aagattacat cctggaagag gttcatagcg cctacaaggc tattgaggaa 1140 gctgagtcgg tcaccattga cccacacaag atgggttacg tcccctacag cgccggaggc 1200 attgttatta aggacattag aatgcgagac gttatctcct acttcgctac ctacgtgttt 1260 gagaagggcg ctgacatccc cgctcttctc ggagcctaca tcctggaagg ctctaaggcc 1320 ggagccacgg ccgcttctgt ctgggccgcc caccatgttc tgcccctgaa cgtgactggc 1380 tacggaaagc ttatgggtgc ctccattgag ggagcacacc gtttctacaa cttcctcaac 1440 gacctgtctt tcaaggttgg cgacaaggag atcgaagttc accctctcac ttaccctgat 1500 ttcaatatgg ttgactacgt ctttaaggag aagggcaacg atgacctcgt tgccatgaat 1560 aagctcaacc acgatgtgta cgattactcg tcctacgtca agggaagcat ctacggtaac 1620 gagttcctga cttcccacac ggacttcgct atccctgact atggaaacag cccccttcag 1680 ttcgtgaacc agctgggatt ttctgacgag gaatggaacc gagcaggtaa agtcaccgtg 1740 ctgcgagctt cggtcatgac cccctacatg aacaaagaag agcacttcga ggagtacgca 1800 gagaaaatca aggctgccct gcaggagaag cttgagaaga tttacgccga tcagctcctg 1860 gcatccgagg ctaaa 1875 <210> 41 <211> 522 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 41 atgactcaac ccttattctt gattggcccg aggggttgtg gtaagacaac cgttggtatg 60 gccctggctg attctcttaa caggaggttc gtcgataccg atcaatggtt gcaatcacaa 120 cttaatatga ctgtcgcaga gattgttgag agagaggagt gggcaggttt tagggctaga 180 gaaacggcgg cattggaggc tgtaacagct ccgtctaccg tgattgcaac aggagggggt 240 attattttaa cggaatttaa tagacacttt atgcaaaata atggaattgt tgtatacctt 300 tgtgctccgg ttagtgtttt ggtaaacaga ttacaagcgg ccccagaaga agatttgaga 360 cctactttga ccgggaagcc actaagcgaa gaagttcagg aagtcttaga agaaagagat 420 gccctttaca gagaagttgc ccacatcata atcgatgcca ctaacgaacc atctcaggtg 480 atatctgaaa tacgttctgc gttggcccag acgattaatt gc 522 <210> 42 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 42 atgagcgagt caccaatgtt tgcagctaat ggtatgccga aggtcaacca gggcgccgag 60 gaagacgtaa ggattcttgg atatgatccc ttagcatcac cagctttatt acaagttcaa 120 attccagcta cgcctactag tttagaaacg gctaaaagag gtagaagaga agccattgat 180 attatcacag gaaaggacga tagggtcttg gttatagttg ggccttgttc tatccacgat 240 ttggaagcag cacaggaata tgccctaaga ttgaaaaagc taagtgatga attgaagggt 300 gatctgtcaa ttattatgcg tgcatacctg gaaaagccta gaacaaccgt tggttggaaa 360 ggcctaatca atgaccccga tgtcaataat acgtttaata ttaataaagg attacaatca 420 gcgaggcaat tgttcgtgaa cttgacaaac attggtttgc ccattggttc cgaaatgcta 480 gataccattt ctcctcaata cttagccgac ttggtctctt tcggtgcgat aggagctaga 540 actaccgaat ctcagctgca tagagagctt gcatctggtc tgagctttcc agttggtttt 600 aaaaatggca ctgatggtac gcttaatgtt gctgtcgatg cttgccaggc cgcagctcat 660 tcacaccatt tcatgggcgt taccaagcat ggagtagcag ctataactac aaccaaagga 720 aatgagcatt gctttgtaat tttaagaggt ggaaagaagg gcactaatta cgacgccaaa 780 tctgttgcag aggccaaagc ccaattgcct gcaggtagta acggactaat gattgattac 840 agtcatggaa attcaaacaa agatttcaga aaccaaccca aagtaaacga cgtggtttgt 900 gaacaaattg ctaatggtga aaacgctatc accggtgtta tgatagaatc taacattaat 960 gaaggcaacc aaggcattcc agctgaaggt aaagctggtt tgaaatacgg tgtttctata 1020 accgacgcct gcataggatg ggaaacaact gaggacgtat tacgtaaatt agccgccgct 1080 gtgagacaaa gaagggaggt taacaaaaag 1110 <210> 43 <211> 1875 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 43 atgtctgagt cacttagcaa agatttaaac ttaaatgctt tgtttattgg ggataaggct 60 gaaaatggtc aaatttacaa agccctttta aatgaacttg tcgatgagca tttgggttgg 120 agacaaaact acatgccaca ggatatgcca ataatcacac cagaggagaa atctagcgct 180 agctttgaac atacagtcaa taaaacgaag gatgtcttgt ccgaaattag cgctaggatg 240 agaactcata gtgtgccatg gcataatgca ggtagatatt ggggacacat gaactcagaa 300 accttgatgc ccagcttact tgcgtacaat tttgctatgt tgtggaacgg gaataacgtt 360 gcatatgaat cctcccccgc tacatctcaa atggaggagg aggtaggaat ggaatttgca 420 aagctgatgt cctataaaga tggctggggc catattgttg ctgatggtag tttagcaaac 480 ttggaaggtc tttggtacgc aaggaacatt aaaagcctgc cattggccat gaaggaagtg 540 actccagaac tggtagcggg taagtccgat tgggagctga tgaacttgtc tactgaggag 600 ataatgaact tgttagactc cgttccagaa aagatcgatg aaattaaggc acacagcgca 660 aggtccggga aacatctaga aaaactaggg aaatggttgg ttccccaaac aaaacattat 720 tcttggttga aggcggccga cattattggt attggactag atcaagttat acctgtcccg 780 gttgaccaca actatagaat ggatattaat gaattagaaa agatagtgag gggtttagca 840 gcggaaaaga ctccaatctt aggtgtagtg ggggtggtcg gatccaccga agaaggtgca 900 attgatggaa tcgacaagat cgtagcacta aggcgtgtct tggaaaagga cggtatatac 960 ttctacttgc atgtcgacgc tgcctatggg ggttatggcc gtgcaatttt tctggacgaa 1020 gacaataatt tcatcccgtt tgaagatctt aaagatgtgc attataaata taatgttttt 1080 accgagaata aagactacat cttagaagaa gtacactctg catataaagc catcgaagaa 1140 gcggagagtg tcactataga ccctcataag atgggctatg tgccatactc tgctggtggt 1200 atcgttatta aagatataag aatgcgtgac gtaattagtt acttcgctac ctatgtgttt 1260 gagaagggtg cagatatccc tgcactgctt ggcgcttaca ttttggaagg ttcaaaagct 1320 ggtgcgactg cagctagcgt gtgggctgca catcatgtct taccattaaa tgttactggc 1380 tatggaaagt tgatgggtgc atcaatagaa ggcgctcacc gtttctacaa ctttttaaac 1440 gacctatcat ttaaagttgg tgacaaggag attgaggttc accctctaac ataccccgat 1500 ttcaatatgg ttgactatgt ctttaaagag aagggcaacg acgatttagt ggcgatgaat 1560 aagctaaatc atgatgtcta tgactacagt tcctacgtga agggtagcat ttacggtaac 1620 gaatttttaa ctagccatac agacttcgct ataccggact atggtaattc tccgttgcaa 1680 ttcgttaatc aactagggtt ctctgatgag gaatggaata gagcgggtaa agttaccgta 1740 ctacgtgcaa gtgtcatgac cccttatatg aataaggaag aacactttga agaatacgcc 1800 gaaaaaatta aggcagcact tcaggaaaag cttgaaaaaa tttatgcgga tcaattgtta 1860 gcaagtgaag cgaag 1875 <210> 44 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 44 atgagcgagt ctcccatgtt tgcggcgaac ggcatgccga aagttaacca gggtgcagaa 60 gaggatgtgc gtattctcgg ctacgacccg ttggcgtctc cagccctgtt gcaagttcaa 120 atcccagcca ccccgacgtc tctcgagact gctaagcgcg gtcgccgtga agccatcgat 180 attatcacgg gaaaagacga tcgcgttttg gtcatcgtgg gcccatgctc tatccacgac 240 ctggaagcag cacaggagta cgccttgcgc ttgaagaagc tttccgacga actcaagggc 300 gacctttcta tcatcatgcg tgcttacttg gagaagcccc gaaccaccgt cggatggaag 360 ggcttgatta atgatcctga tgttaataac acgttcaata ttaataaggg cttgcagtcc 420 gctcgtcaac tgttcgttaa cctgaccaat atcggccttc cgattggctc tgagatgttg 480 gataccatct cccctcagta cctcgctgat ctcgtttcct ttggcgcgat cggtgctcgt 540 accaccgaat ctcagctgca tcgcgagctg gcgtccggcc tctccttccc tgtcggtttt 600 aaaaatggca cggatggtac cttgaatgtc gcggtggatg catgtcaggc tgcggctcat 660 tcacatcatt tcatgggagt gaccttgcac ggagttgccg ctatcaccac tacgaaggga 720 aacgagcact gctttgtgat ccttcgtggt ggcaaaaaag gcaccaacta tgacgcaaag 780 tcggtggctg aggccaaagc ccagttgcct gcaggcagca atggactcat gattgactat 840 tcccatggaa actcaaacaa agactttcgc aaccagccaa aagtcaatga cgtggtgtgc 900 gaacaaatcg ctaacggtga aaatgcaatc accggcgtga tgatcgaaag caatattaat 960 gagggcaacc aaggcatccc ggctgagggc aaagcgggcc tgaaatacgg tgttagcatc 1020 accgatgcat gtatcggctg ggaaacaacg gaagacgttc tccgaaagct cgctgcggca 1080 gttcgccagc gccgcgaagt taacaagaag 1110 <210> 45 <211> 1875 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 45 atgtccgaat ccctttccaa agacctgaac ctcaacgcat tgttcattgg cgacaaggcc 60 gagaacggtc agatttacaa ggctctgctc aatgagctcg tggacgaaca tctgggctgg 120 cgtcagaact acatgcccca ggacatgccc atcatcaccc ccgaagagaa atctagcgcg 180 tcattcgaac acacggtaaa caaaacaaaa gatgtgctgt ctgaaatctc ggcccgcatg 240 cgcacacatt ccgtgccctg gcataacgcc ggccgctact ggggccatat gaattcagaa 300 accctcatgc cctcactgtt ggcatataat ttcgcgatgc tgtggaacgg taacaacgtt 360 gcgtatgaaa gctctccagc aacctcccag atggaagaag aagttggcat ggagttcgcg 420 aagctcatgt cgtataaaga tggttggggc catatcgtag ccgatggttc tctggcgaat 480 ttggagggct tgtggtatgc gcgtaacatc aagtccttgc cactggcaat gaaagaggtt 540 acaccagagc tcgtggccgg caagtccgat tgggagctga tgaacctctc aacagaggaa 600 attatgaacc ttctggactc ggtgcccgaa aaaatcgacg agatcaaggc ccactccgcc 660 cgttcgggca agcacctgga gaagttgggc aaatggttgg tccctcagac caaacactat 720 tcctggttga aagccgcgga tattatcgga atcggtctgg atcaagttat ccctgttccg 780 gtagaccata actaccgaat ggatattaac gagctcgaga agattgtccg cggcctggcc 840 gccgaaaaga cacccatcct gggtgtcgtt ggcgtcgttg gttcgactga agagggcgcc 900 attgacggca ttgacaagat cgtggcgttg cgccgcgttc ttgaaaagga tggcatttat 960 ttctaccttc acgtggacgc ggcttacggc ggctacggcc gcgccatctt tcttgacgaa 1020 gataataatt tcatcccctt cgaggatctc aaggacgtcc actataagta caacgtattc 1080 accgagaaca aagactacat tttggaggag gttcattccg cttataaggc gattgaggaa 1140 gcggagtccg ttacgattga tccgcacaag atgggctatg tgccttacag cgcgggcggc 1200 atcgtgatca aggatatccg tatgcgtgat gtcatttcct attttgccac ctacgtgttc 1260 gagaagggag cagatatccc tgccctgctc ggagcgtaca tcctggaagg ctcaaaagca 1320 ggtgctactg ctgcctcagt ttgggccgca caccacgtcc tcccattgaa cgtgaccggc 1380 tacggaaaat tgatgggtgc ctccattgaa ggcgcccacc gtttctacaa ctttctgaat 1440 gacctgagct tcaaggtcgg tgataaggaa atcgaagttc atccgctgac ctaccccgat 1500 tttaacatgg tcgattacgt atttaaagaa aaaggaaacg acgatctcgt ggcaatgaac 1560 aagctgaacc acgatgtgta tgattacagc tcttatgtga agggatcgat ttacggtaat 1620 gaattcttga cctcccatac cgatttcgca atcccagatt acggaaattc tcctttgcag 1680 ttcgttaacc agctgggctt ttctgacgag gagtggaatc gcgcaggaaa ggtcaccgta 1740 ttgcgtgcct cagtgatgac cccatacatg aacaaggagg agcattttga ggagtacgcc 1800 gagaaaatta aagcagcact tcaggaaaag ttggagaaaa tctacgctga tcaacttctt 1860 gcgtcggagg ctaag 1875 <210> 46 <211> 540 <212> PRT <213> Escherichia coli (strain K12) <400> 46 Met Arg Val Asn Asn Gly Leu Thr Pro Gln Glu Leu Glu Ala Tyr Gly 1 5 10 15 Ile Ser Asp Val His Asp Ile Val Tyr Asn Pro Ser Tyr Asp Leu Leu 20 25 30 Tyr Gln Glu Glu Leu Asp Pro Ser Leu Thr Gly Tyr Glu Arg Gly Val 35 40 45 Leu Thr Asn Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly 50 55 60 Arg Ser Pro Lys Asp Lys Tyr Ile Val Arg Asp Asp Thr Thr Arg Asp 65 70 75 80 Thr Phe Trp Trp Ala Asp Lys Gly Lys Gly Lys Asn Asp Asn Lys Pro 85 90 95 Leu Ser Pro Glu Thr Trp Gln His Leu Lys Gly Leu Val Thr Arg Gln 100 105 110 Leu Ser Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Asn 115 120 125 Pro Asp Thr Arg Leu Ser Val Arg Phe Ile Thr Glu Val Ala Trp Gln 130 135 140 Ala His Phe Val Lys Asn Met Phe Ile Arg Pro Ser Asp Glu Glu Leu 145 150 155 160 Ala Gly Phe Lys Pro Asp Phe Ile Val Met Asn Gly Ala Lys Cys Thr 165 170 175 Asn Pro Gln Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala 180 185 190 Phe Asn Leu Thr Glu Arg Met Gln Leu Ile Gly Gly Thr Trp Tyr Gly 195 200 205 Gly Glu Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Leu Leu Pro 210 215 220 Leu Lys Gly Ile Ala Ser Met His Cys Ser Ala Asn Val Gly Glu Lys 225 230 235 240 Gly Asp Val Ala Val Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr 245 250 255 Leu Ser Thr Asp Pro Lys Arg Arg Leu Ile Gly Asp Asp Glu His Gly 260 265 270 Trp Asp Asp Asp Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys 275 280 285 Thr Ile Lys Leu Ser Lys Glu Ala Glu Pro Glu Ile Tyr Asn Ala Ile 290 295 300 Arg Arg Asp Ala Leu Leu Glu Asn Val Thr Val Arg Glu Asp Gly Thr 305 310 315 320 Ile Asp Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr 325 330 335 Pro Ile Tyr His Ile Asp Asn Ile Val Lys Pro Val Ser Lys Ala Gly 340 345 350 His Ala Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu 355 360 365 Pro Pro Val Ser Arg Leu Thr Ala Asp Gln Thr Gln Tyr His Phe Leu 370 375 380 Ser Gly Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Ile Thr Glu 385 390 395 400 Pro Thr Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu 405 410 415 His Pro Thr Gln Tyr Ala Glu Val Leu Val Lys Arg Met Gln Ala Ala 420 425 430 Gly Ala Gln Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys 435 440 445 Arg Ile Ser Ile Lys Asp Thr Arg Ala Ile Ile Asp Ala Ile Leu Asn 450 455 460 Gly Ser Leu Asp Asn Ala Glu Thr Phe Thr Leu Pro Met Phe Asn Leu 465 470 475 480 Ala Ile Pro Thr Glu Leu Pro Gly Val Asp Thr Lys Ile Leu Asp Pro 485 490 495 Arg Asn Thr Tyr Ala Ser Pro Glu Gln Trp Gln Glu Lys Ala Glu Thr 500 505 510 Leu Ala Lys Leu Phe Ile Asp Asn Phe Asp Lys Tyr Thr Asp Thr Pro 515 520 525 Ala Gly Ala Ala Leu Val Ala Ala Gly Pro Lys Leu 530 535 540 <210> 47 <211> 373 <212> PRT <213> Escherichia coli (strain K12) <400> 47 Met Val Ala Glu Leu Thr Ala Leu Arg Asp Gln Ile Asp Glu Val Asp 1 5 10 15 Lys Ala Leu Leu Asn Leu Leu Ala Lys Arg Leu Glu Leu Val Ala Glu 20 25 30 Val Gly Glu Val Lys Ser Arg Phe Gly Leu Pro Ile Tyr Val Pro Glu 35 40 45 Arg Glu Ala Ser Ile Leu Ala Ser Arg Arg Ala Glu Ala Glu Ala Leu 50 55 60 Gly Val Pro Pro Asp Leu Ile Glu Asp Val Leu Arg Arg Val Met Arg 65 70 75 80 Glu Ser Tyr Ser Ser Glu Asn Asp Lys Gly Phe Lys Thr Leu Cys Pro 85 90 95 Ser Leu Arg Pro Val Val Ile Val Gly Gly Gly Gly Gln Met Gly Arg 100 105 110 Leu Phe Glu Lys Met Leu Thr Leu Ser Gly Tyr Gln Val Arg Ile Leu 115 120 125 Glu Gln His Asp Trp Asp Arg Ala Ala Asp Ile Val Ala Asp Ala Gly 130 135 140 Met Val Ile Val Ser Val Pro Ile His Val Thr Glu Gln Val Ile Gly 145 150 155 160 Lys Leu Pro Pro Leu Pro Lys Asp Cys Ile Leu Val Asp Leu Ala Ser 165 170 175 Val Lys Asn Gly Pro Leu Gln Ala Met Leu Val Ala His Asp Gly Pro 180 185 190 Val Leu Gly Leu His Pro Met Phe Gly Pro Asp Ser Gly Ser Leu Ala 195 200 205 Lys Gln Val Val Val Trp Cys Asp Gly Arg Lys Pro Glu Ala Tyr Gln 210 215 220 Trp Phe Leu Glu Gln Ile Gln Val Trp Gly Ala Arg Leu His Arg Ile 225 230 235 240 Ser Ala Val Glu His Asp Gln Asn Met Ala Phe Ile Gln Ala Leu Arg 245 250 255 His Phe Ala Thr Phe Ala Tyr Gly Leu His Leu Ala Glu Glu Asn Val 260 265 270 Gln Leu Glu Gln Leu Leu Ala Leu Ser Ser Pro Ile Tyr Arg Leu Glu 275 280 285 Leu Ala Met Val Gly Arg Leu Phe Ala Gln Asp Pro Gln Leu Tyr Ala 290 295 300 Asp Ile Ile Met Ser Ser Glu Arg Asn Leu Ala Leu Ile Lys Arg Tyr 305 310 315 320 Tyr Lys Arg Phe Gly Glu Ala Ile Glu Leu Leu Glu Gln Gly Asp Lys 325 330 335 Gln Ala Phe Ile Asp Ser Phe Arg Lys Val Glu His Trp Phe Gly Asp 340 345 350 Tyr Val Gln Arg Phe Gln Ser Glu Ser Arg Val Leu Leu Arg Gln Ala 355 360 365 Asn Asp Asn Arg Gln 370 <210> 48 <211> 173 <212> PRT <213> Dickeya chrysanthemi (Pectobacterium chrysanthemi) (Erwinia chrysanthemi) <400> 48 Met Thr Glu Pro Ile Phe Met Val Gly Ala Arg Gly Cys Gly Lys Thr 1 5 10 15 Thr Val Gly Arg Glu Leu Ala Arg Ala Leu Gly Tyr Glu Phe Val Asp 20 25 30 Thr Asp Ile Phe Met Gln His Thr Ser Gly Met Thr Val Ala Asp Val 35 40 45 Val Ala Ala Glu Gly Trp Pro Gly Phe Arg Arg Arg Glu Ser Glu Ala 50 55 60 Leu Gln Ala Val Ala Thr Pro Asn Arg Val Val Ala Thr Gly Gly Gly 65 70 75 80 Met Val Leu Leu Glu Gln Asn Arg Gln Phe Met Arg Ala His Gly Thr 85 90 95 Val Val Tyr Leu Phe Ala Pro Ala Glu Glu Leu Ala Leu Arg Leu Gln 100 105 110 Ala Ser Pro Gln Ala His Gln Arg Pro Thr Leu Thr Gly Arg Pro Ile 115 120 125 Ala Glu Glu Met Glu Ala Val Leu Arg Glu Arg Glu Ala Leu Tyr Gln 130 135 140 Asp Val Ala His Tyr Val Val Asp Ala Thr Gln Pro Pro Ala Ala Ile 145 150 155 160 Val Ser Glu Leu Met Gln Thr Met Arg Leu Pro Ala Ala 165 170 <210> 49 <211> 334 <212> PRT <213> Clostridium acetobutylicum (strain ATCC 824 DSM 792 JCM 1419 LMG 5710 VKM B-1787) <400> 49 Met Ala Lys Ile Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu Ala 1 5 10 15 Leu Arg Arg Ile Leu Glu Val Pro Gly Leu Glu Val Val Ala Ile Asn 20 25 30 Asp Leu Thr Asp Ala Lys Met Leu Ala His Leu Phe Lys Tyr Asp Ser 35 40 45 Ser Gln Gly Arg Phe Asn Gly Glu Ile Glu Val Lys Glu Gly Ala Phe 50 55 60 Val Val Asn Gly Lys Glu Val Lys Val Phe Ala Glu Ala Asp Pro Glu 65 70 75 80 Lys Leu Pro Trp Gly Asp Leu Gly Ile Asp Val Val Leu Glu Cys Thr 85 90 95 Gly Phe Phe Thr Lys Lys Glu Lys Ala Glu Ala His Val Arg Ala Gly 100 105 110 Ala Lys Lys Val Val Ile Ser Ala Pro Ala Gly Asn Asp Leu Lys Thr 115 120 125 Ile Val Phe Asn Val Asn Asn Glu Asp Leu Asp Gly Thr Glu Thr Val 130 135 140 Ile Ser Gly Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Met Ala Lys 145 150 155 160 Val Leu Asn Asp Lys Phe Gly Ile Glu Lys Gly Phe Met Thr Thr Ile 165 170 175 His Ala Phe Thr Asn Asp Gln Asn Thr Leu Asp Gly Pro His Arg Lys 180 185 190 Gly Asp Leu Arg Arg Ala Arg Ala Ala Ala Val Ser Ile Ile Pro Asn 195 200 205 Ser Thr Gly Ala Ala Lys Ala Ile Ser Gln Val Ile Pro Asp Leu Ala 210 215 220 Gly Lys Leu Asp Gly Asn Ala Gln Arg Val Pro Val Pro Thr Gly Ser 225 230 235 240 Ile Thr Glu Leu Val Ser Val Leu Lys Lys Lys Val Thr Val Glu Glu 245 250 255 Ile Asn Ala Ala Met Lys Glu Ala Ala Asp Glu Ser Phe Gly Tyr Thr 260 265 270 Glu Asp Pro Ile Val Ser Ala Asp Val Val Gly Ile Asn Tyr Gly Ser 275 280 285 Leu Phe Asp Ala Thr Leu Thr Lys Ile Val Asp Val Asn Gly Ser Gln 290 295 300 Leu Val Lys Thr Ala Ala Trp Tyr Asp Asn Glu Met Ser Tyr Thr Ser 305 310 315 320 Gln Leu Val Arg Thr Leu Ala Tyr Phe Ala Lys Ile Ala Lys 325 330 <210> 50 <211> 396 <212> PRT <213> Arabidopsis thaliana (Mouse-ear cress) <400> 50 Met Ala Ser Val Thr Phe Ser Val Pro Lys Gly Phe Thr Glu Phe Ser 1 5 10 15 Gly Leu Arg Ser Ser Ser Ala Ser Leu Pro Phe Gly Lys Lys Leu Ser 20 25 30 Ser Asp Glu Phe Val Ser Ile Val Ser Phe Gln Thr Ser Ala Met Gly 35 40 45 Ser Ser Gly Gly Tyr Arg Lys Gly Val Thr Glu Ala Lys Leu Lys Val 50 55 60 Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Asn Phe Leu Arg Cys Trp 65 70 75 80 His Gly Arg Lys Asp Ser Pro Leu Asp Ile Ile Ala Ile Asn Asp Thr 85 90 95 Gly Gly Val Lys Gln Ala Ser His Leu Leu Lys Tyr Asp Ser Thr Leu 100 105 110 Gly Ile Phe Asp Ala Asp Val Lys Pro Ser Gly Glu Thr Ala Ile Ser 115 120 125 Val Asp Gly Lys Ile Ile Gln Val Val Ser Asn Arg Asn Pro Ser Leu 130 135 140 Leu Pro Trp Lys Glu Leu Gly Ile Asp Ile Val Ile Glu Gly Thr Gly 145 150 155 160 Val Phe Val Asp Arg Glu Gly Ala Gly Lys His Ile Glu Ala Gly Ala 165 170 175 Lys Lys Val Ile Ile Thr Ala Pro Gly Lys Gly Asp Ile Pro Thr Tyr 180 185 190 Val Val Gly Val Asn Ala Asp Ala Tyr Ser His Asp Glu Pro Ile Ile 195 200 205 Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Phe Val Lys Val 210 215 220 Leu Asp Gln Lys Phe Gly Ile Ile Lys Gly Thr Met Thr Thr Thr His 225 230 235 240 Ser Tyr Thr Gly Asp Gln Arg Leu Leu Asp Ala Ser His Arg Asp Leu 245 250 255 Arg Arg Ala Arg Ala Ala Ala Leu Asn Ile Val Pro Thr Ser Thr Gly 260 265 270 Ala Ala Lys Ala Val Ala Leu Val Leu Pro Asn Leu Lys Gly Lys Leu 275 280 285 Asn Gly Ile Ala Leu Arg Val Pro Thr Pro Asn Val Ser Val Val Asp 290 295 300 Leu Val Val Gln Val Ser Lys Lys Thr Phe Ala Glu Glu Val Asn Ala 305 310 315 320 Ala Phe Arg Asp Ser Ala Glu Lys Glu Leu Lys Gly Ile Leu Asp Val 325 330 335 Cys Asp Glu Pro Leu Val Ser Val Asp Phe Arg Cys Ser Asp Phe Ser 340 345 350 Thr Thr Ile Asp Ser Ser Leu Thr Met Val Met Gly Asp Asp Met Val 355 360 365 Lys Val Ile Ala Trp Tyr Asp Asn Glu Trp Gly Tyr Ser Gln Arg Val 370 375 380 Val Asp Leu Ala Asp Ile Val Ala Asn Asn Trp Lys 385 390 395 <210> 51 <211> 374 <212> PRT <213> Chlamydomonas reinhardtii (Chlamydomonas smithii) <400> 51 Met Ala Ala Met Met Gln Lys Ser Ala Phe Thr Gly Ser Ala Val Ser 1 5 10 15 Ser Lys Ser Gly Val Arg Ala Lys Ala Ala Arg Ala Val Val Asp Val 20 25 30 Arg Ala Glu Lys Lys Ile Arg Val Ala Ile Asn Gly Phe Gly Arg Ile 35 40 45 Gly Arg Asn Phe Leu Arg Cys Trp His Gly Arg Gln Asn Thr Leu Leu 50 55 60 Asp Val Val Ala Ile Asn Asp Ser Gly Gly Val Lys Gln Ala Ser His 65 70 75 80 Leu Leu Lys Tyr Asp Ser Thr Leu Gly Thr Phe Ala Ala Asp Val Lys 85 90 95 Ile Val Asp Asp Ser His Ile Ser Val Asp Gly Lys Gln Ile Lys Ile 100 105 110 Val Ser Ser Arg Asp Pro Leu Gln Leu Pro Trp Lys Glu Met Asn Ile 115 120 125 Asp Leu Val Ile Glu Gly Thr Gly Val Phe Ile Asp Lys Val Gly Ala 130 135 140 Gly Lys His Ile Gln Ala Gly Ala Ser Lys Val Leu Ile Thr Ala Pro 145 150 155 160 Ala Lys Asp Lys Asp Ile Pro Thr Phe Val Val Gly Val Asn Glu Gly 165 170 175 Asp Tyr Lys His Glu Tyr Pro Ile Ile Ser Asn Ala Ser Cys Thr Thr 180 185 190 Asn Cys Leu Ala Pro Phe Val Lys Val Leu Glu Gln Lys Phe Gly Ile 195 200 205 Val Lys Gly Thr Met Thr Thr Thr His Ser Tyr Thr Gly Asp Gln Arg 210 215 220 Leu Leu Asp Ala Ser His Arg Asp Leu Arg Arg Ala Arg Ala Ala Ala 225 230 235 240 Leu Asn Ile Val Pro Thr Thr Thr Gly Ala Ala Lys Ala Val Ser Leu 245 250 255 Val Leu Pro Ser Leu Lys Gly Lys Leu Asn Gly Ile Ala Leu Arg Val 260 265 270 Pro Thr Pro Thr Val Ser Val Val Asp Leu Val Val Gln Val Glu Lys 275 280 285 Lys Thr Phe Ala Glu Glu Val Asn Ala Ala Phe Arg Glu Ala Ala Asn 290 295 300 Gly Pro Met Lys Gly Val Leu His Val Glu Asp Ala Pro Leu Val Ser 305 310 315 320 Ile Asp Phe Lys Cys Thr Asp Gln Ser Thr Ser Ile Asp Ala Ser Leu 325 330 335 Thr Met Val Met Gly Asp Asp Met Val Lys Val Val Ala Trp Tyr Asp 340 345 350 Asn Glu Trp Gly Tyr Ser Gln Arg Val Val Asp Leu Ala Glu Val Thr 355 360 365 Ala Lys Lys Trp Val Ala 370 <210> 52 <211> 336 <212> PRT <213> Staphylococcus epidermidis (strain ATCC 35984 RP62A) <400> 52 Met Ala Ile Lys Val Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu 1 5 10 15 Ala Phe Arg Arg Ile Gln Asp Val Glu Gly Leu Glu Val Val Ala Val 20 25 30 Asn Asp Leu Thr Asp Asp Asp Met Leu Ala His Leu Leu Lys Tyr Asp 35 40 45 Thr Met Gln Gly Arg Phe Thr Gly Glu Val Glu Val Ile Glu Gly Gly 50 55 60 Phe Arg Val Asn Gly Lys Glu Ile Lys Ser Phe Asp Glu Pro Asp Ala 65 70 75 80 Gly Lys Leu Pro Trp Gly Asp Leu Asp Ile Asp Val Val Leu Glu Cys 85 90 95 Thr Gly Phe Tyr Thr Asp Lys Glu Lys Ala Gln Ala His Ile Asp Ala 100 105 110 Gly Ala Lys Lys Val Leu Ile Ser Ala Pro Ala Lys Gly Asp Val Lys 115 120 125 Thr Ile Val Phe Asn Thr Asn His Asp Thr Leu Asp Gly Ser Glu Thr 130 135 140 Val Val Ser Gly Ala Ser Cys Thr Thr Asn Ser Leu Ala Pro Val Ala 145 150 155 160 Lys Val Leu Ser Asp Glu Phe Gly Leu Val Glu Gly Phe Met Thr Thr 165 170 175 Ile His Ala Tyr Thr Gly Asp Gln Asn Thr Gln Asp Ala Pro His Arg 180 185 190 Lys Gly Asp Lys Arg Arg Ala Arg Ala Ala Ala Glu Asn Ile Ile Pro 195 200 205 Asn Ser Thr Gly Ala Ala Lys Ala Ile Gly Lys Val Ile Pro Glu Ile 210 215 220 Asp Gly Lys Leu Asp Gly Gly Ala Gln Arg Val Pro Val Ala Thr Gly 225 230 235 240 Ser Leu Thr Glu Leu Thr Val Val Leu Asp Lys Gln Asp Val Thr Val 245 250 255 Asp Gln Val Asn Ser Ala Met Lys Gln Ala Ser Asp Glu Ser Phe Gly 260 265 270 Tyr Thr Glu Asp Glu Ile Val Ser Ser Asp Ile Val Gly Met Thr Tyr 275 280 285 Gly Ser Leu Phe Asp Ala Thr Gln Thr Arg Val Met Thr Val Gly Asp 290 295 300 Arg Gln Leu Val Lys Val Ala Ala Trp Tyr Asp Asn Glu Met Ser Tyr 305 310 315 320 Thr Ala Gln Leu Val Arg Thr Leu Ala His Leu Ala Glu Leu Ser Lys 325 330 335 <210> 53 <211> 356 <212> PRT <213> Escherichia coli (strain K12) <400> 53 Met Gln Lys Asp Ala Leu Asn Lys Val His Ile Thr Asp Glu Gln Val 1 5 10 15 Leu Met Thr Pro Glu Gln Leu Lys Ala Ala Phe Pro Leu Ser Leu Gln 20 25 30 Gln Glu Ala Gln Ile Ala Asp Ser Arg Lys Ser Ile Ser Asp Ile Ile 35 40 45 Ala Gly Arg Asp Pro Arg Leu Leu Val Val Cys Gly Pro Cys Ser Ile 50 55 60 His Asp Pro Glu Thr Ala Leu Glu Tyr Ala Arg Arg Phe Lys Ala Leu 65 70 75 80 Ala Ala Glu Val Ser Asp Ser Leu Tyr Leu Val Met Arg Val Tyr Phe 85 90 95 Glu Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro 100 105 110 His Met Asp Gly Ser Phe Asp Val Glu Ala Gly Leu Gln Ile Ala Arg 115 120 125 Lys Leu Leu Leu Glu Leu Val Asn Met Gly Leu Pro Leu Ala Thr Glu 130 135 140 Ala Leu Asp Pro Asn Ser Pro Gln Tyr Leu Gly Asp Leu Phe Ser Trp 145 150 155 160 Ser Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Thr His Arg Glu Met 165 170 175 Ala Ser Gly Leu Ser Met Pro Val Gly Phe Lys Asn Gly Thr Asp Gly 180 185 190 Ser Leu Ala Thr Ala Ile Asn Ala Met Arg Ala Ala Ala Gln Pro His 195 200 205 Arg Phe Val Gly Ile Asn Gln Ala Gly Gln Val Ala Leu Leu Gln Thr 210 215 220 Gln Gly Asn Pro Asp Gly His Val Ile Leu Arg Gly Gly Lys Ala Pro 225 230 235 240 Asn Tyr Ser Pro Ala Asp Val Ala Gln Cys Glu Lys Glu Met Glu Gln 245 250 255 Ala Gly Leu Arg Pro Ser Leu Met Val Asp Cys Ser His Gly Asn Ser 260 265 270 Asn Lys Asp Tyr Arg Arg Gln Pro Ala Val Ala Glu Ser Val Val Ala 275 280 285 Gln Ile Lys Asp Gly Asn Arg Ser Ile Ile Gly Leu Met Ile Glu Ser 290 295 300 Asn Ile His Glu Gly Asn Gln Ser Ser Glu Gln Pro Arg Ser Glu Met 305 310 315 320 Lys Tyr Gly Val Ser Val Thr Asp Ala Cys Ile Ser Trp Glu Met Thr 325 330 335 Asp Ala Leu Leu Arg Glu Ile His Gln Asp Leu Asn Gly Gln Leu Thr 340 345 350 Ala Arg Val Ala 355 <210> 54 <211> 449 <212> PRT <213> Helicobacter pylori (strain J99 ATCC 700824) (Campylobacter pylori J99) <400> 54 Met Ser Asn Thr Thr Trp Ser Pro Thr Ser Trp His Ser Phe Lys Ile 1 5 10 15 Glu Gln His Pro Thr Tyr Lys Asp Glu Gln Glu Leu Glu Arg Val Lys 20 25 30 Lys Glu Leu Arg Ser Tyr Pro Pro Leu Val Phe Ala Gly Glu Ala Arg 35 40 45 Asn Leu Gln Glu Arg Leu Ala Gln Val Ile Asp Asn Lys Ala Phe Leu 50 55 60 Leu Gln Gly Gly Asp Cys Ala Glu Ser Phe Ser Gln Phe Ser Ala Asn 65 70 75 80 Arg Ile Arg Asp Met Phe Lys Val Met Met Gln Met Ala Ile Val Leu 85 90 95 Thr Phe Ala Gly Ser Ile Pro Ile Val Lys Val Gly Arg Ile Ala Gly 100 105 110 Gln Phe Ala Lys Pro Arg Ser Asn Ala Thr Glu Ile Leu Asp Asp Glu 115 120 125 Glu Val Leu Ser Tyr Arg Gly Asp Ile Ile Asn Gly Ile Ser Lys Lys 130 135 140 Glu Arg Glu Pro Lys Pro Glu Arg Met Leu Lys Ala Tyr His Gln Ser 145 150 155 160 Val Ala Thr Leu Asn Leu Ile Arg Ala Phe Ala Gln Gly Gly Leu Ala 165 170 175 Asp Leu Glu Gln Val His Arg Phe Asn Leu Asp Phe Val Lys Asn Asn 180 185 190 Asp Phe Gly Gln Lys Tyr Gln Gln Ile Ala Asp Arg Ile Thr Gln Ala 195 200 205 Leu Gly Phe Met Arg Ala Cys Gly Val Glu Ile Glu Arg Thr Pro Ile 210 215 220 Leu Arg Glu Val Glu Phe Tyr Thr Ser His Glu Ala Leu Leu Leu His 225 230 235 240 Tyr Glu Glu Pro Leu Val Arg Lys Asp Ser Leu Thr Asn Gln Phe Tyr 245 250 255 Asp Cys Ser Ala His Met Leu Trp Ile Gly Glu Arg Thr Arg Asp Pro 260 265 270 Lys Gly Ala His Val Glu Phe Leu Arg Gly Val Cys Asn Pro Ile Gly 275 280 285 Val Lys Ile Gly Pro Asn Ala Ser Val Ser Glu Val Leu Glu Leu Cys 290 295 300 Asp Val Leu Asn Pro His Asn Leu Lys Gly Arg Leu Asn Leu Ile Val 305 310 315 320 Arg Met Gly Ser Lys Ile Ile Lys Glu Arg Leu Pro Lys Leu Leu Gln 325 330 335 Gly Val Leu Lys Glu Lys Arg His Ile Leu Trp Ser Ile Asp Pro Met 340 345 350 His Gly Asn Thr Val Lys Thr Asn Leu Gly Val Lys Thr Arg Ala Phe 355 360 365 Asp Ser Val Leu Asp Glu Val Lys Ser Phe Phe Glu Ile His Arg Ala 370 375 380 Glu Gly Ser Leu Ala Ser Gly Val His Leu Glu Met Thr Gly Glu Asn 385 390 395 400 Val Thr Glu Cys Ile Gly Gly Ser Gln Ala Ile Thr Glu Glu Gly Leu 405 410 415 Ser Cys His Tyr Tyr Thr Gln Cys Asp Pro Arg Leu Asn Ala Thr Gln 420 425 430 Ala Leu Glu Leu Ala Phe Leu Ile Ala Asp Met Leu Lys Lys Gln Arg 435 440 445 Thr <210> 55 <211> 276 <212> PRT <213> Aeropyrum pernix (strain ATCC 700893 DSM 11879 JCM 9820 NBRC 100138 K1) <400> 55 Met Trp Arg Trp Leu Pro Val Ala Gly Phe Lys Gly Val Lys Leu Ala 1 5 10 15 Leu Lys Ser Glu Glu Arg Arg Glu Thr Val Val Glu Val Glu Gly Val 20 25 30 Arg Ile Gly Gly Gly Ser Lys Ala Val Ile Ala Gly Pro Cys Ser Val 35 40 45 Glu Ser Trp Glu Gln Val Arg Glu Ala Ala Leu Ala Val Lys Glu Ala 50 55 60 Gly Ala His Met Leu Arg Gly Gly Ala Phe Lys Pro Arg Thr Ser Pro 65 70 75 80 Tyr Ser Phe Gln Gly Leu Gly Leu Glu Gly Leu Lys Leu Leu Arg Arg 85 90 95 Ala Gly Asp Glu Ala Gly Leu Pro Val Val Thr Glu Val Leu Asp Pro 100 105 110 Arg His Val Glu Thr Val Ser Arg Tyr Ala Asp Met Leu Gln Ile Gly 115 120 125 Ala Arg Asn Met Gln Asn Phe Pro Leu Leu Arg Glu Val Gly Arg Ser 130 135 140 Gly Lys Pro Val Leu Leu Lys Arg Gly Phe Gly Asn Thr Val Glu Glu 145 150 155 160 Leu Leu Ala Ala Ala Glu Tyr Ile Leu Leu Glu Gly Asn Trp Gln Val 165 170 175 Val Leu Val Glu Arg Gly Ile Arg Thr Phe Glu Pro Ser Thr Arg Phe 180 185 190 Thr Leu Asp Val Ala Ala Val Ala Val Leu Lys Glu Ala Thr His Leu 195 200 205 Pro Val Ile Val Asp Pro Ser His Pro Ala Gly Arg Arg Ser Leu Val 210 215 220 Pro Ala Leu Ala Lys Ala Gly Leu Ala Ala Gly Ala Asp Gly Leu Ile 225 230 235 240 Val Glu Val His Pro Asn Pro Glu Glu Ala Leu Ser Asp Ala Lys Gln 245 250 255 Gln Leu Thr Pro Gly Glu Phe Ala Arg Leu Met Gly Glu Leu Arg Trp 260 265 270 His Arg Leu Leu 275 <210> 56 <211> 350 <212> PRT <213> Escherichia coli (strain K12) <400> 56 Met Asn Tyr Gln Asn Asp Asp Leu Arg Ile Lys Glu Ile Lys Glu Leu 1 5 10 15 Leu Pro Pro Val Ala Leu Leu Glu Lys Phe Pro Ala Thr Glu Asn Ala 20 25 30 Ala Asn Thr Val Ala His Ala Arg Lys Ala Ile His Lys Ile Leu Lys 35 40 45 Gly Asn Asp Asp Arg Leu Leu Val Val Ile Gly Pro Cys Ser Ile His 50 55 60 Asp Pro Val Ala Ala Lys Glu Tyr Ala Thr Arg Leu Leu Ala Leu Arg 65 70 75 80 Glu Glu Leu Lys Asp Glu Leu Glu Ile Val Met Arg Val Tyr Phe Glu 85 90 95 Lys Pro Arg Thr Thr Val Gly Trp Lys Gly Leu Ile Asn Asp Pro His 100 105 110 Met Asp Asn Ser Phe Gln Ile Asn Asp Gly Leu Arg Ile Ala Arg Lys 115 120 125 Leu Leu Leu Asp Ile Asn Asp Ser Gly Leu Pro Ala Ala Gly Glu Phe 130 135 140 Leu Asp Met Ile Thr Leu Gln Tyr Leu Ala Asp Leu Met Ser Trp Gly 145 150 155 160 Ala Ile Gly Ala Arg Thr Thr Glu Ser Gln Val His Arg Glu Leu Ala 165 170 175 Ser Gly Leu Ser Cys Pro Val Gly Phe Lys Asn Gly Thr Asp Gly Thr 180 185 190 Ile Lys Val Ala Ile Asp Ala Ile Asn Ala Ala Gly Ala Pro His Cys 195 200 205 Phe Leu Ser Val Thr Lys Trp Gly His Ser Ala Ile Val Asn Thr Ser 210 215 220 Gly Asn Gly Asp Cys His Ile Ile Leu Arg Gly Gly Lys Glu Pro Asn 225 230 235 240 Tyr Ser Ala Lys His Val Ala Glu Val Lys Glu Gly Leu Asn Lys Ala 245 250 255 Gly Leu Pro Ala Gln Val Met Ile Asp Phe Ser His Ala Asn Ser Ser 260 265 270 Lys Gln Phe Lys Lys Gln Met Asp Val Cys Ala Asp Val Cys Gln Gln 275 280 285 Ile Ala Gly Gly Glu Lys Ala Ile Ile Gly Val Met Val Glu Ser His 290 295 300 Leu Val Glu Gly Asn Gln Ser Leu Glu Ser Gly Glu Pro Leu Ala Tyr 305 310 315 320 Gly Lys Ser Ile Thr Asp Ala Cys Ile Gly Trp Glu Asp Thr Asp Ala 325 330 335 Leu Leu Arg Gln Leu Ala Asn Ala Val Lys Ala Arg Arg Gly 340 345 350 <210> 57 <211> 1593 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 57 atgggctcac tgaacacaga ggacgtactt gaaaactcct cggcatttgg cgtgactaat 60 cctttagatc cggaggagtt tagacgtcag ggacacatga tcattgattt tctcgcggat 120 tattatcgcg acgtcgagaa gtatccggtt cggagtcaag tcgaaccggg atatcttaga 180 aaaagactgc ctgaaactgc gccatataat ccggagtcta tcgaaacaat tttacaagac 240 gtaacgacag agatcattcc gggcctgaca cactggcagt cacctaatta ttacgcgtac 300 tttccgagct cgggctcggt tgccggcttt ttgggtgaaa tgctgtcgac gggattcaat 360 gtcgtcggat ttaactggat gagttctcca gcggcgacag aacttgaatc tgttgttatg 420 gactggttcg gcaaaatgct taacttaccg gaaagcttcc tcttttcagg gagtggaggc 480 ggtgttcttc agggcacaag ttgcgaggct attttatgta cactgactgc agcgcgcgac 540 cggaaactca ataagatagg tagagaacat attggtagac tggtcgtata tggtagcgat 600 cagacacact gcgcgttgca aaaagcggca caggtagccg gcattaaccc gaaaaatttc 660 cgtgcaatca aaacctttaa agaaaactca tttggcctta gcgcggctac actgagagag 720 gttatcctgg aggacattga ggcgggactg attccacttt ttgtgtgtcc gacggtaggt 780 acaacaagtt ccactgcagt tgatccgatt tctccgattt gtgaagttgc aaaggaatat 840 gagatgtggg tccatgtcga tgccgcgtat gctggcagcg cgtgtatttg tcctgaattt 900 cgacatttta tagatggtgt ggaagaagcc gactcctttt ctcttaacgc acataagtgg 960 ttcttcacaa ctctcgattg ctgctgctta tgggttaagg atccttccgc actggtcaag 1020 gccttatcta cgaacccgga atatcttcgc aataaggcga ccgaatccag acaggttgta 1080 gattataaag actggcagat cgcgttatca agacgttttc ggtcattaaa gctgtggatg 1140 gtgctccgga gctatggtgt gacgaacctc cgcaactttc ttagaagcca cgtcaagatg 1200 gcgaaaactt tcgagggatt gatttgcatg gatggtcgct tcgagattac ggttcctcgc 1260 acatttgcga tggtttgctt tcgcctgctt ccaccgaaga cgataaaagt ctatgacaac 1320 ggtgtgcacc agaacggcaa tggtgttgtt ccgctgcgtg atgaaaacga aaatcttgtc 1380 ctggcgaaca aactgaatca agtgtatctg gagacagtca acgccacggg tagtgtatat 1440 atgacgcatg ctgttgtcgg tggcgtgtat atgattagat tcgctgttgg aagtacactt 1500 acggaagaac gccacgtcat ttatgcgtgg aaaatcctgc aagaacacgc tgatttaatt 1560 cttggcaaat tttctgaagc tgatttttcc tct 1593 <210> 58 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 58 atgtctgaaa gcccaatgtt tgctgccaat ggaatgccga aagtaaatca gggtgcagaa 60 gaggacgtcc ggattctggg atatgacccg cttgcatccc cggccctgtt gcaagttcaa 120 atcccagcga cgcctactag ccttgagact gccaagcgcg gccggagaga agcaattgac 180 ataattaccg gaaaggacga tagagtactg gtcattgtag gtccatgctc aatccatgat 240 ttggaggcgg ctcaggaata tgccctgcgg ttaaaaaagt tgtcggatga acttaaaggc 300 gatctgtcga ttattatgcg cgcgtattta gagaagccgc gcacaacagt aggctggaag 360 ggccttatta acgacccaga cgtaaacaac acatttaaca ttaataaagg attacaaagc 420 gctcgccaac tttttgttaa cctcacgaac atcggactcc cgataggaag tgaaatgctg 480 gatacaataa gcccacagta tcttgcagat cttgtctcgt ttggcgctat aggagcccgc 540 acgacggaat ctcaactgca ccgggaactt gccagtggac tgtcattccc ggtggggttt 600 aagaacggca cggatggtac cctgaatgta gcggtcgacg cgtgccaggc ggccgctcac 660 tctcatcatt tcatgggcgt cacactccat ggggtagccg caattacgac gacaaaagga 720 aacgaacact gcttcgtaat tttacgcgga ggtaagaaag gcacgaatta tgacgctaag 780 tcagtcgccg aggcgaaagc acagcttccg gcaggtagca acgggctgat gattgattac 840 tctcatggga attctaataa agatttcaga aaccaaccta aggtcaacga tgttgtatgc 900 gaacagatag ccaatggaga aaacgctatt acaggcgtga tgatagaatc taacattaac 960 gagggaaatc aggggatccc agccgaggga aaggcaggtc ttaagtatgg agtctccatc 1020 acagacgcat gcatagggtg ggaaacgacc gaagatgtcc ttcgcaagtt agcagcggca 1080 gttcgtcaac gccgtgaggt aaataaaaaa 1110 <210> 59 <211> 1593 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 59 atgggcagcc tgaacaccga agatgtcttg gaaaactcct ccgcgtttgg cgtgaccaac 60 cctctggacc cagaagagtt tcgccgtcaa ggacatatga tcatcgattt cctcgcagat 120 tactatcgcg acgttgagaa gtacccggtg cgatctcagg tcgaacctgg ttatctgcgc 180 aagcgtctcc ccgagaccgc cccctataat ccagaatcta ttgagaccat tctgcaggat 240 gttaccactg agatcatccc tggtttgacc cactggcagt ctccaaacta ctacgcttat 300 ttcccttcca gcggttccgt tgcaggtttc ctgggcgaaa tgctgtccac cggctttaac 360 gtggtgggct tcaactggat gtcttctcct gcggctacgg aattggaatc cgtcgtcatg 420 gactggttcg gcaaaatgct gaacctgcca gaatcgtttt tgttttccgg ctctggtggc 480 ggagttctgc aaggcaccag ctgcgaggct atcctctgta cactgacggc cgcgcgcgat 540 cgcaagctca ataaaatcgg ccgcgagcac attggccgtc tcgtagtata tggtagcgac 600 caaacccatt gcgcccttca aaaagcagcg caggtcgcgg gcatcaaccc caaaaacttc 660 cgcgcaatca agacttttaa agagaactcc ttcggtctca gcgctgctac cctgcgcgag 720 gtgattctcg aagatatcga agctggcctg attccactgt ttgtttgtcc taccgtgggc 780 accacttcca gcacggcagt agatccgatc tccccgattt gcgaggtagc taaggaatat 840 gagatgtggg tgcacgtcga tgccgcttat gctggttccg cttgcatctg cccagaattc 900 cgccacttta ttgatggtgt agaggaggcg gattcctttt cccttaatgc tcacaagtgg 960 ttcttcacga cactggattg ttgctgtttg tgggtaaaag atccgtcagc gttggttaaa 1020 gcgttgagca caaaccccga atatctgcgc aataaagcaa ccgagtcccg acaagttgtt 1080 gattataagg actggcagat cgccctctca cgtcgcttcc gctccctgaa gctttggatg 1140 gtgctccgct cctatggtgt cacaaatctg cgcaacttcc tccgctccca tgtaaaaatg 1200 gcgaaaacct tcgaaggact gatctgtatg gatggccgtt ttgagatcac cgtgccacgt 1260 acgttcgcga tggtgtgctt tcgccttctg cctccgaaaa ccattaaggt gtacgacaat 1320 ggtgttcacc agaatggcaa cggcgtcgtc ccattgcgag acgagaacga gaatttggtg 1380 ctggcaaaca agttgaatca ggtctacctg gaaaccgtca acgctacagg aagcgtctac 1440 atgactcacg cagttgttgg cggcgtctac atgatccgtt tcgcagtggg atcgacgctg 1500 acggaagagc gccacgtcat ttacgcgtgg aagatcctgc aagagcacgc ggatttgatc 1560 ttgggcaaat tctctgaggc tgatttctcc tcg 1593 <210> 60 <211> 1593 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 60 atgggctcct taaatacaga agatgtttta gagaatagct ctgcgtttgg cgttacaaat 60 cctttagatc cagaagaatt tagaagacaa ggtcacatga taattgactt tttggctgac 120 tattacagag acgtagaaaa atacccagtt aggtcccaag tggagcctgg ctatttgcgt 180 aaacgtttgc ctgaaacagc tccatataac cctgaatcta tagaaactat tcttcaggat 240 gtgaccactg aaataatccc aggcctaaca cattggcaat cacctaacta ttacgcgtat 300 ttccccagca gtggaagtgt tgcaggtttt ttaggtgaaa tgttatctac aggattcaat 360 gtcgtgggct tcaactggat gtcatcacca gctgctaccg aactagagtc cgtagtaatg 420 gactggtttg ggaaaatgtt aaatttacca gagtcattct tgttttcagg ttctggtggc 480 ggagttcttc aaggaacctc ttgtgaagct attttgtgta ccctaactgc cgccagagat 540 agaaagctga ataaaattgg tagagaacat ataggcagat tggtcgttta cgggtccgat 600 caaacacact gcgctctgca aaaggctgcg caggttgctg gcataaaccc gaaaaacttc 660 agggccatta agacgttcaa agaaaattcc tttggcttat cagcagctac cttgagggaa 720 gtcatattag aagacattga agcaggccta atccctttgt ttgtatgccc tacagtgggt 780 acaacgtctt ccacggctgt cgatccaatt tctcctatct gtgaagtagc gaaagaatac 840 gaaatgtggg ttcacgtcga cgcagcatat gctggatcag catgtatatg tccagaattt 900 agacacttta tagatggtgt agaagaagcc gattcatttt cattgaatgc acataagtgg 960 ttttttacaa cacttgattg ctgttgtttg tgggttaagg acccaagcgc attagttaaa 1020 gcattgtcca caaatcctga gtaccttagg aacaaagcta cagaaagcag gcaagttgtt 1080 gattacaagg attggcagat tgcattgtca aggagattta gaagtttaaa gttatggatg 1140 gtcctgaggt cctatggtgt tactaatttg agaaatttcc tgagatctca tgtaaagatg 1200 gccaagacct tcgaaggctt gatttgcatg gacgggagat ttgaaataac tgtgccgaga 1260 acctttgcga tggtctgttt tagattattg ccacccaaaa ccatcaaggt gtacgataac 1320 ggcgtgcatc aaaatggaaa tggagttgtg ccactgagag acgagaatga aaacttggtt 1380 ttggcaaata agctaaatca agtgtattta gaaaccgtaa atgccacagg ttcagtttat 1440 atgacccatg cagttgtagg tggtgtgtat atgatcagat ttgctgtcgg aagcactcta 1500 accgaagaaa ggcatgtaat ctacgcgtgg aaaattctgc aagaacatgc tgatcttatc 1560 ttggggaagt tttctgaggc tgacttttca tct 1593 <210> 61 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 61 atgtcagaat caccgatgtt tgctgcaaat ggaatgccga aggttaacca gggtgcagaa 60 gaggatgtaa gaatattggg gtatgaccca ctggcatcac cagcattgtt gcaggttcaa 120 attccggcaa ctcctacgtc attagaaacg gcaaagagag gtagacgtga agctatagat 180 attataacag gcaaagacga ccgtgtgctg gtgattgtgg gtccctgctc cattcatgac 240 cttgaagcag cacaggagta tgctttgcgt ctgaagaaac tgtcagacga gcttaaaggt 300 gaccttagta tcattatgag agcctatttg gaaaagccta ggaccaccgt aggctggaaa 360 ggtttgatta atgatccaga tgtaaacaac acctttaata taaataaggg tctacagagt 420 gccagacaac ttttcgtaaa ccttaccaat atcggacttc cgattggctc cgagatgtta 480 gatacaatct caccacaata ccttgccgat cttgtctcat tcggtgctat cggtgctaga 540 actaccgagt ctcagttgca tagagaatta gcttccgggc tatcatttcc agtcggcttc 600 aagaacggta ctgacggcac attgaatgtt gctgtggatg catgtcaagc cgcagcccat 660 agtcaccatt tcatgggcgt tactcttcac ggggttgctg ctataacgac cactaagggg 720 aatgaacatt gctttgtaat cttaaggggt ggcaagaagg gaactaatta cgatgctaaa 780 tctgtagccg aggcgaaagc acagttacca gctgggtcaa acggcttaat gatagattac 840 agtcatggga attctaataa agactttaga aaccaaccaa aagtaaatga tgttgtatgc 900 gagcagattg ctaacggtga aaatgccatc acgggcgtga tgattgaatc caatataaat 960 gagggaaacc aaggcatacc tgccgaaggt aaagctggtc ttaagtacgg cgtttctatt 1020 acagacgcgt gcataggctg ggagacaaca gaagatgtgt tgagaaagct tgctgcggct 1080 gttagacaaa ggagggaagt aaataaaaag 1110 <210> 62 <211> 1593 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 62 atgggctcgc tcaacaccga ggatgtgctg gagaactcgt ctgcctttgg cgttaccaac 60 cctctggacc ctgaggagtt tcggagacaa ggccacatga ttatcgactt tctggctgac 120 tattacagag acgtggagaa gtaccctgtt cggtctcaag tggagccagg ataccttcgg 180 aagcgactgc ccgaaactgc tccctacaat cccgaatcca ttgagaccat tctgcaggac 240 gtgactacgg agatcattcc tggactgacc cactggcaaa gccctaacta ctacgcctac 300 ttcccttcta gcggctcggt cgcaggattt cttggtgaga tgctgtcgac cggttttaac 360 gttgttggct tcaactggat gtcctcccct gctgctacag aactggaatc ggtggttatg 420 gactggttcg gtaagatgct gaacctccct gagtcttttc tgttctccgg tagcggcggc 480 ggagtgctgc agggcacgtc ctgtgaagcc atcctgtgta ctctgaccgc tgcccgtgac 540 cgaaaactta acaaaattgg ccgagagcac attggccggc tggtcgtcta cggatctgac 600 cagacccact gcgctctcca gaaggcagct caggtggccg gcatcaaccc taaaaacttt 660 cgagcaatca agacctttaa ggagaactcg ttcggcctga gcgctgctac tcttagagag 720 gttattctcg aagacattga ggccggtctt attcccctct tcgtctgtcc caccgtcggc 780 actacgtctt ccacggctgt ggatccaatc tcccccatct gtgaggtcgc aaaggagtac 840 gagatgtggg tgcacgtcga cgcagcttac gccggctctg catgcatttg cccagagttc 900 cgtcacttca ttgacggagt tgaggaagcc gactccttca gcctcaacgc ccataaatgg 960 ttcttcacca ccctcgactg ttgttgtctc tgggtcaagg acccctctgc cctggtcaag 1020 gccctgtcga ccaaccccga gtacctgcgg aacaaggcta ccgagtctcg acaagttgtc 1080 gactacaagg actggcaaat cgccctgtcc cgacgattcc ggtctctgaa gctgtggatg 1140 gtgctgcgat cgtatggtgt taccaatctc cgaaatttcc tgcgatctca tgtcaagatg 1200 gcaaaaactt tcgagggtct gatctgtatg gacggaagat ttgagatcac tgttccccga 1260 acattcgcaa tggtttgttt ccgactgctg cctcccaaga ctattaaggt ttacgacaac 1320 ggagtgcatc aaaacggtaa cggtgtggtt cccctccggg acgagaacga aaacctggtc 1380 ctcgccaaca agcttaacca agtctacctc gagaccgtca acgctacagg ctctgtgtac 1440 atgactcatg ccgttgttgg tggagtgtac atgattagat ttgctgtcgg ctctaccctt 1500 actgaggaac gacatgtgat ttacgcctgg aaaattctgc aagagcacgc cgatctgatc 1560 ctgggtaagt tttccgaagc cgacttctcc tcg 1593 <210> 63 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 63 atgtctgagt cccccatgtt cgccgcaaac ggcatgccta aggtcaacca gggtgccgag 60 gaggatgtcc gtatcctcgg ctatgaccct cttgcatccc ccgctcttct ccaggtccag 120 attccagcta ctcccaccag cctcgaaact gccaagagag gacgaagaga agctattgac 180 atcattactg gcaaggacga tcgagtcctt gtcattgttg gcccctgcag cattcacgac 240 ctggaggccg ctcaggaata cgctctgaga cttaagaagc tctctgatga actgaaggga 300 gacctttcca tcatcatgcg tgcctacctg gagaagcccc gaactaccgt cggttggaag 360 ggcctgatca acgacccaga tgtcaacaac acctttaaca tcaataaggg acttcagtcc 420 gctcgacagc tcttcgtcaa cctcacgaac attggtctgc caatcggctc cgaaatgctg 480 gacaccattt cgccccagta cctggctgac cttgtttcgt ttggtgctat cggagctcgg 540 accaccgagt cccagctgca tagagagctt gcttccggcc tgtccttccc tgtgggtttc 600 aagaatggta ccgatggaac cctgaacgtt gccgtcgatg cttgccaagc tgctgcccac 660 tcgcatcact tcatgggagt gaccctgcac ggtgtcgccg ctattactac cacaaagggc 720 aacgagcact gttttgtgat tctgcgaggt ggaaagaagg gcaccaacta cgacgccaag 780 tccgttgccg aggctaaggc tcagctgccc gctggttcca acggtctcat gattgactac 840 tcccatggaa acagcaacaa ggattttcga aaccagccta aagttaacga cgtggtttgc 900 gagcagatcg ccaacggaga aaatgctatt acgggagtga tgatcgagag caacattaac 960 gagggcaacc agggtatccc cgctgaaggt aaggccggac tgaagtacgg tgtttcgatc 1020 accgatgctt gcatcggctg ggaaaccact gaggacgtgc tgcgtaaact cgccgctgcc 1080 gttcgacagc gacgagaggt gaataagaag 1110 <210> 64 <211> 1875 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 64 atgtcagaat ctttaagcaa ggaccttaat ctgaatgcat tattcattgg agataaagcc 60 gagaatggac agatctataa agcattactc aacgaacttg tggatgaaca cttgggttgg 120 agacagaatt acatgcctca ggatatgcct attataaccc cggaagagaa aagctccgct 180 tcatttgagc atacagtcaa taaaacgaaa gacgtcttat cagaaattag cgcccggatg 240 cgaacacact cagtcccttg gcacaatgcg ggccggtact ggggacatat gaactctgaa 300 actctgatgc cgtcattgct ggcatacaat tttgcgatgt tgtggaacgg caataatgtt 360 gcatatgaat cgagcccggc cacctcgcaa atggaagaag aagtcggtat ggaatttgca 420 aaactgatga gttataaaga tggatggggc catattgtag ctgatggaag cttagctaat 480 ctggaagggt tatggtatgc tcgcaatatc aagtctcttc ctcttgcgat gaaggaggtc 540 actccggagc ttgtcgctgg caaatccgat tgggaactga tgaatctctc aacggaagag 600 atcatgaacc ttttagattc agtgccggag aaaatcgatg agattaaggc acactcagca 660 cgctccggaa aacatcttga gaagttggga aaatggcttg tgccacagac aaagcattat 720 tcatggctta aagcagctga tatcattgga attggcttag atcaggtcat tccagtaccg 780 gtggaccaca attatcgaat ggacattaat gagctcgaga aaattgtcag aggcttggca 840 gctgagaaaa caccgatcct cggagtagtg ggtgttgttg gaagtactga ggaaggggct 900 attgacggca ttgataaaat tgtagcgctt cgccgagtgc tggagaaaga cggtatttac 960 ttttacctgc acgtcgacgc ggcgtatgga ggctatggcc gcgcgatttt tcttgatgaa 1020 gataataatt ttattccgtt cgaggatctg aaggatgtcc attacaaata caatgtgttc 1080 actgaaaata aagactacat cctggaggag gtacattctg cttataaggc cattgaagaa 1140 gcagaatccg taaccataga tcctcataaa atgggctacg tgccgtatag cgcggggggc 1200 attgttatta aagacattag aatgcgggat gtgatctctt actttgctac gtatgttttt 1260 gaaaaagggg cggatattcc tgcgctcttg ggagcgtata ttctcgaagg gtcaaaggcg 1320 ggggccacag ctgcctcagt ctgggccgca catcacgttc ttccgttgaa cgttacaggg 1380 tacgggaagc ttatgggagc tagcattgaa ggggcccatc ggttttataa cttcttgaat 1440 gacctgtctt ttaaagtggg cgataaagag attgaagttc atccgttgac ctatccggat 1500 ttcaacatgg ttgattacgt cttcaaagaa aaaggcaatg atgacttagt tgctatgaac 1560 aagttaaacc atgacgttta cgactattcg agctacgtta aaggaagcat ttatggcaat 1620 gaatttctca catcgcacac agactttgcc ataccggatt atgggaatag tccattacag 1680 tttgtaaatc aactgggctt tagcgacgaa gagtggaaca gagcaggaaa agttacggta 1740 cttagagcgt cagtcatgac accgtacatg aacaaggagg aacattttga ggagtacgct 1800 gaaaaaatta aagctgccct ccaggagaaa ctggaaaaga tctatgcgga ccaattattg 1860 gcgtctgaag caaaa 1875 <210> 65 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 65 atgtcggaga gccctatgtt tgctgctaat ggaatgccga aggtgaatca gggagcagag 60 gaggatgtta gaattttagg ttatgaccct ttggcctcac ctgccctgtt gcaggtccag 120 attccagcca cgccaacatc attagaaaca gcgaaaagag gaagacggga ggctattgat 180 atcatcacag ggaaagatga tcgagtgtta gtgattgttg ggccatgctc aatccacgat 240 ctggaagcgg cacaagagta cgctctgcgc ttaaagaaac tgtcggatga attgaagggc 300 gatctgtcaa ttattatgcg tgcgtatctt gaaaaacctc gcactacagt cggctggaaa 360 gggctgatca acgacccgga cgtcaataat acgtttaata ttaataaagg actccaaagc 420 gcacgccagc tgttcgtgaa cttaacgaac atcggactgc ctattggatc ggaaatgctc 480 gatactatta gtccgcaata cctggctgat ctcgtatcct tcggagcgat aggcgcaaga 540 accactgaga gccaattaca tagagaactg gcctctggcc tttctttccc tgttggattc 600 aaaaatggca ctgacggtac tctgaatgta gccgtggacg cttgccaagc cgcagcgcac 660 tctcatcatt ttatgggagt aacaaagcac ggtgtggctg ctatcacgac aacgaaaggc 720 aatgagcatt gctttgtaat cctgagagga ggaaaaaagg gaaccaatta cgacgcaaaa 780 agcgtagcgg aagcgaaagc gcaacttccg gccgggagca atggacttat gattgattac 840 tctcatggaa acagtaataa agattttcgc aatcagccta aagttaatga tgtcgtgtgc 900 gaacaaattg ccaacgggga aaacgcaata acgggagtca tgattgagtc taacattaat 960 gaagggaatc agggaatccc ggctgagggc aaagctggtc ttaagtacgg cgtgagcatt 1020 actgatgcat gcattggctg ggaaacaaca gaagatgtgc ttcggaaact ggctgcggcc 1080 gtaagacaaa gacgtgaagt caacaagaaa 1110 <210> 66 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 66 atgagcgaat ctccaatgtt cgcagctaac ggtatgccga aggtgaacca gggagccgag 60 gaagatgttc gcatccttgg ctacgatcca ctggcatccc ccgctcttct gcaggtccag 120 atcccagcga cccctactag ccttgaaact gctaagcgcg gccgccgcga ggcgattgac 180 attatcaccg gaaaggatga tcgtgttctg gtaatcgttg gcccatgctc catccacgac 240 ttggaagccg cccaggagta tgccctccgt ttgaagaagc tgtcagatga acttaagggc 300 gatttgtcca tcatcatgcg tgcttacctt gaaaagcccc gcacgacggt gggctggaaa 360 ggattgatca acgatccaga cgtaaataac accttcaaca ttaacaaggg actgcaatct 420 gctcgccaac tgttcgtcaa cctcaccaac atcggcttgc ctatcggaag cgagatgctg 480 gatacaatct cccctcaata cctggctgat ctggtgagct tcggtgcaat tggtgcgcgt 540 accaccgagt cccagctcca ccgtgaactg gcgtccggcc ttagcttccc tgtgggattc 600 aagaacggta ccgacggcac cctcaacgtg gctgtggacg cctgccaggc cgctgcgcat 660 tcccatcact tcatgggcgt taccaagcat ggtgtggcgg ctatcaccac aaccaaaggc 720 aatgagcact gtttcgtgat cttgcgcggc ggtaagaagg gcaccaacta cgacgcaaaa 780 tctgttgccg aagcaaaggc ccaactcccc gctggttcca acggattgat gatcgattac 840 agccacggaa atagcaacaa ggattttcgt aaccaaccta aggttaatga cgtcgtgtgc 900 gaacagatcg ctaacggaga aaacgctatt accggcgtta tgatcgaaag caatattaac 960 gagggtaacc aaggcattcc tgccgaaggt aaggcgggcc tgaagtacgg agtgtcaatc 1020 accgatgcat gtatcggctg ggagaccacc gaagatgtcc tgcgcaagtt ggcagccgcg 1080 gtgcgtcagc gacgcgaagt taataagaag 1110 <210> 67 <211> 522 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 67 atgacccaac ccctgtttct tattggaccc cgaggttgcg gcaaaaccac cgtgggcatg 60 gccctggcag actcgctgaa tagacgattt gttgataccg atcagtggct gcagtcccag 120 ctgaacatga ctgtcgctga gatcgtcgaa cgagaggagt gggctggctt ccgggcccgt 180 gagaccgctg cccttgaggc agtgactgct ccctcgactg ttatcgccac cggtggaggt 240 atcattctta ctgagtttaa ccggcacttt atgcagaaca acggtatcgt ggtctacctc 300 tgtgcccctg tgtccgttct tgtgaaccga ctgcaagctg cccccgagga ggacctgcga 360 cccacgctga ctggtaagcc tctgtccgaa gaggtgcagg aggtgctgga ggagagagac 420 gccctctacc gagaggtcgc ccatatcatt atcgacgcca ccaacgaacc ctctcaggtc 480 atctccgaga tccgatctgc ccttgcccaa acaatcaact gc 522 <210> 68 <211> 522 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 68 atgacccagc cactgtttct cattggcccg cgcggatgcg gtaaaaccac tgtaggaatg 60 gcacttgcag actcccttaa ccgtcgcttt gtcgatacag accagtggct tcagtcccaa 120 ctgaacatga ctgtcgccga gatcgtagag cgcgaggaat gggcgggttt ccgcgcacgt 180 gaaacagcgg cacttgaggc agtcaccgct ccttccacag tcatcgcaac gggtggaggc 240 atcatcctga ccgaattcaa tcgccacttt atgcaaaaca acggaattgt cgtctatttg 300 tgcgccccag tgtcagtgct ggtcaatcgc cttcaggccg ccccagaaga agacctccgc 360 ccgacactga ccggtaaacc tctttccgag gaagttcagg aggtcttgga ggaacgcgat 420 gccctttacc gcgaagtcgc acacattatc attgacgcca ccaacgaacc gagccaggtt 480 atttccgaaa tccgttccgc tctggcgcaa accatcaact gc 522 <210> 69 <211> 1593 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 69 atgggttctc ttaatacaga agatgttttg gagaatagtt cagcatttgg tgtaactaat 60 ccccttgatc ctgaagaatt cagaagacaa ggacatatga tcatagattt tcttgctgac 120 tattatagag atgtggagaa atatccggtg agaagtcaag tggagcccgg ttatttaaga 180 aaaagactgc cagaaaccgc cccgtacaat ccagagtcca tcgagaccat attacaagat 240 gtaacaactg agattattcc aggtctaacc cattggcaaa gtcctaacta ttacgcctac 300 tttcctagct ccggtagcgt cgccggcttt cttggtgaaa tgttatccac cggtttcaat 360 gttgttggat tcaattggat gagttcacca gccgctactg aattagaatc cgtggttatg 420 gactggtttg gaaaaatgtt gaacctgccg gagtcatttc ttttctctgg aagtggtggt 480 ggcgtgttgc agggtactag ttgtgaagca attttatgca ctttgacggc agcaagagat 540 agaaagctta ataaaattgg tagagagcat atcggtagat tagtagtcta cggatcagac 600 cagactcatt gtgctttaca aaaggctgca caagtcgctg gcatcaatcc taagaatttc 660 agagcgatta agacgtttaa agaaaactcc tttggtttga gcgcagcaac tctaagagaa 720 gtgatcctag aggacatcga ggcagggttg ataccactgt ttgtttgccc tacagtgggg 780 accacttcta gcaccgccgt tgatcctata tctccgatct gtgaagtagc taaagaatac 840 gaaatgtggg tacacgtaga tgcagcttac gctgggtcag cctgtatttg cccagagttt 900 agacatttta ttgatggtgt cgaagaagcg gacagttttt ctcttaatgc tcataagtgg 960 tttttcacta ctttggactg ttgttgtttg tgggttaagg atccatctgc tctagttaaa 1020 gccctatcca ccaatccgga gtatttgaga aataaggcaa cagaatcaag acaagtcgta 1080 gattataaag actggcaaat agccctgtcc agaaggttca gatcattaaa gttatggatg 1140 gttctgagga gctatggcgt caccaatttg agaaattttt tgagaagcca cgtcaagatg 1200 gcaaagactt ttgaaggact gatctgtatg gatggtaggt ttgaaataac tgttcccagg 1260 acttttgcaa tggtttgttt tagattgctg cccccaaaaa caataaaagt atatgataac 1320 ggcgtgcatc aaaacggtaa cggggtagtt cctttgagag acgagaacga gaacctggtt 1380 ttagcgaata aactaaatca ggtttacctt gagactgtta acgctacggg atctgtatat 1440 atgacacatg ccgttgtagg tggcgtgtac atgatccgtt ttgctgtggg atccacccta 1500 acggaagaaa ggcatgtgat ctacgcttgg aaaatattac aagaacacgc cgacttgatt 1560 ttaggtaaat ttagtgaagc agacttttct tca 1593 <210> 70 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 70 atgtccgaat ctccaatgtt cgctgccaac ggcatgccga aggtgaacca gggagccgaa 60 gaagacgtgc gcatcctcgg ttatgatccg ctcgccagcc cggcactctt gcaagtgcag 120 attcccgcta cgccaacctc actcgagacc gcgaagcgcg gtcgccgcga agcaatcgac 180 atcattactg gtaaggacga tcgcgtgctc gtgatcgttg gcccgtgctc gattcacgac 240 ttggaagcgg ctcaagagta cgcgcttcgc ctcaagaaat tgagcgatga actgaaaggt 300 gatttgtcca tcattatgcg cgcgtacctt gaaaagccac gtacgactgt tggttggaag 360 ggtctgatca acgatcctga tgtcaacaac acctttaata ttaataaggg cctccagtcc 420 gcccgccaac ttttcgtgaa cctgaccaac attggccttc caattggctc agagatgctt 480 gacacgatct ctccacaata cctcgcagat ttggtcagct tcggcgcaat cggcgcgcgc 540 accaccgagt cccagctcca ccgcgaactg gcgagcggac tgagctttcc cgtcggcttc 600 aagaatggca cagatggcac cttgaacgtc gcggtggacg cgtgtcaagc cgccgcgcat 660 tcacaccact tcatgggagt gaccttgcac ggtgtagcgg ccatcactac cacgaagggt 720 aacgagcact gcttcgtgat cttgcgtgga ggtaagaagg gaactaatta cgacgccaag 780 tctgtggcgg aggctaaggc tcagttgcca gcgggatcca acggtttgat gatcgattat 840 agccacggca actccaacaa agactttcgt aatcaaccta aggtgaacga tgtagtctgc 900 gaacaaatcg cgaacggcga aaacgcgatc accggtgtga tgatcgaatc taatattaac 960 gaaggtaacc agggtattcc cgcggagggc aaggcaggtc tgaaatacgg agtcagcatt 1020 acggatgctt gcatcggatg ggagaccacc gaagatgttc tccgaaagtt ggcggcagcg 1080 gtgcgccagc gccgcgaagt gaataagaaa 1110 <210> 71 <211> 771 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 71 atggatttca caaaaccaga aactgtttta aatctacaaa atattagaga tgaattagtt 60 agaatggagg attcgatcat cttcaaattt attgagaggt cgcatttcgc cacatgtcct 120 tcagtttatg aggcaaacca tccaggttta gaaattccga attttaaagg atctttcttg 180 gattgggctc tttcaaatct tgaaattgcg cattctcgca tcagaagatt cgaatcacct 240 gatgaaactc ccttctttcc tgacaagatt cagaaatcat tcttaccgag cattaactac 300 ccacaaattt tggcgcctta tgccccagaa gttaattaca atgataaaat aaaaaaagtt 360 tatattgaaa agattatacc attaatttcg aaaagagatg gtgatgataa gaataacttc 420 ggttctgttg ccactagaga tatagaatgt ttgcaaagct tgagtaggag aatccacttt 480 ggcaagtttg ttgctgaagc caagttccaa tcggatatcc cgctatacac aaagctgatc 540 aaaagtaaag atgtcgaggg gataatgaag aatatcacca attctgccgt tgaagaaaag 600 attctagaaa gattaactaa gaaggctgaa gtctatggtg tggaccctac caacgagtca 660 ggtgaaagaa ggattactcc agaatatttg gtaaaaattt ttaaggaaat tgttatacct 720 atcactaagg aagttgaggt ggaatacttg ctaagaaggt tggaagagta a 771 <210> 72 <211> 786 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 72 atgaagtatt caaaggaata taaggaaaag acggtggtga agatcaacga cgtgaaattc 60 ggagaaggct tcaccatcat cgccggccca tgctcgatcg agtctcgcga ccagatcatg 120 aaggttgcgg agtttctggc tgaagtaggc atcaaggtgc ttcgcggcgg cgcttttaag 180 cctcgaacct ccccttactc cttccaggga tacggtgaga aggcgttgcg ctggatgcgt 240 gaagcagcgg atgagtatgg cctggtgacc gtcactgagg tcatggatac acgccatgtt 300 gagcttgtcg ccaaatatag cgatatcttg caaatcggcg cccgcaacag ccaaaacttt 360 gagctcctga aagaagtcgg taaagtggaa aatccagttc ttctgaaacg tggtatgggc 420 aacaccattc aagaacttct ctactctgcg gaatacatca tggcacaagg caatgaaaac 480 gttatcctgt gcgagcgagg catccgtaca ttcgaaactg caacgcgctt cactttggac 540 atctcggctg taccagtagt taaagaactt tcacacctcc caatcattgt ggacccaagc 600 cacccagccg gccgccgctc gctggtgatc ccactcgcca aagcagcgta tgcaattggt 660 gctgatggaa tcatggtgga agttcatccg gagcctgaaa aagctctttc cgactcgcaa 720 cagcaactca ccttcgacga ctttttgcag ctgctgaaag aactcgaagc actcggttgg 780 aaggga 786 <210> 73 <211> 2376 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 73 atgtctaata atggctcatc acctctcgtc ttgtggtaca atcagctcgg tatgaacgat 60 gtcgaccgtg tgggaggaaa gaacgcctct ctgggtgaga tgattactaa tttgagcggt 120 atgggagttt ccgtgccaaa tggttttgct accacagccg acgcgttcaa ccaatttctc 180 gaccagagcg gcgttaacca gcgaatttac gagttgctgg acaaaactga catcgatgac 240 gtcacccagc tggccaaggc aggcgcacag attcgccagt ggatcatcga taccccattt 300 cagcccgagc tcgagaacgc catccgcgag gcgtacgcac agctcagcgc ggacgacgaa 360 aacgcatcgt tcgctgtacg ttcgtcagca accgcggaag atatgccgga tgcgtctttt 420 gcaggtcagc aagagacgtt cctcaacgtg cagggcttcg atgccgttct tgtggcggta 480 aagcacgtgt tcgcgtccct tttcaacgac cgcgctatca gctaccgtgt tcaccagggc 540 tacgatcatc gtggagtggc tctgtcggca ggcgtacaac gcatggtccg cagcgacttg 600 gcttcttccg gcgttatgtt ctcaatcgac acggaatctg gctttgacca agttgttttc 660 attacctctg catggggtct tggcgaaatg gtcgtgcaag gcgcagtgaa ccccgatgaa 720 ttttatgtgc acaagccaac gctcgccgca aaccgtcccg ccattgtccg ccgtaccatg 780 ggctccaaaa agatccgtat ggtctatgcc ccaacgcaag aacatggcaa gcaggttaaa 840 atcgaagacg tgccacaaga acagcgtgat atcttctccc tgaccaacga ggaggtacag 900 gaactggcta agcaagctgt tcagatcgaa aagcactatg gtcgcccaat ggatatcgag 960 tgggctaagg atggccacac aggcaaattg ttcattgtcc aggcacgccc tgagactgtt 1020 cgctcccgtg gacaagtcat ggagcgctac accctgcaca gccagggaaa gattatcgct 1080 gaaggacgcg ccattggcca tcgcatcggc gccggccccg tgaaggttat tcacgacatc 1140 tccgagatga accgcatcga acctggcgac gtcctggtga ccgatatgac cgacccagat 1200 tgggagccta ttatgaagaa ggcttctgca atcgtaacca accgtggagg tcgcacctgt 1260 cacgctgcta ttatcgcacg cgagctgggt atccctgcag ttgtcggatg cggcgatgcc 1320 actgaacgaa tgaaagacgg agagaacgtg accgtgtctt gtgcagaagg agacactggc 1380 tacgtctacg cagagttgtt ggagttctcc gtgaaatctt cttcagtaga aaccatgcct 1440 gacttgcctc tgaaggtgat gatgaacgtg ggtaacccgg accgcgcgtt cgattttgcg 1500 tgcttgccga acgaaggtgt tggcttggct cgtctcgagt tcatcatcaa tcgcatgatc 1560 ggtgtgcacc cgcgcgcctt gctcgaattc gatgatcagg aacctcagtt gcagaacgaa 1620 atccgcgaaa tgatgaaggg tttcgactcc cctcgtgaat tttatgtcgg tcgtctcacc 1680 gaaggaatcg caacactcgg cgcggcgttc tatcccaagc gcgtcatcgt tcgactttcc 1740 gatttcaagt ccaacgagta cgccaatctg gtcggcggag agcgttacga gcccgacgaa 1800 gagaacccca tgcttggttt ccgcggtgca ggccgctatg tgtcggacag cttccgcgat 1860 tgtttcgctc tcgaatgtga agctgtcaag cgcgtgcgca acgacatggg ccttaccaac 1920 gtagaaatta tgatcccctt tgttcgcaca gtggatcagg ccaaagcggt tgtggaggaa 1980 ctcgctcgtc agggcctgaa acgcggtgaa aacggcctga agatcatcat gatgtgcgaa 2040 attccgtcca acgctctcct tgccgaacaa tttttggagt acttcgacgg cttctcgatt 2100 ggctccaacg acatgaccca actggccctg ggcctcgatc gcgattcggg cgtcgtcagc 2160 gaactcttcg acgaacgtaa tgacgccgtc aaggcattgt tgagcatggc cattcgcgcg 2220 gccaagaagc agggaaagta cgtgggcatt tgcggacagg gtccctcaga ccatgaggac 2280 tttgctgctt ggttgatgga agaaggtatt gattccttgt ctttgaaccc ggacaccgta 2340 gttcagacct ggctgtctct ggccgaactt aagaaa 2376 <210> 74 <211> 801 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 74 atggatttta ccaagccaga aacagtgttg gaccttggca acattcgcca ggcacttatc 60 cgcatggagg acaccattgt ttttttcctg attgagcgtt cccagtttta cagcagccca 120 tccgtctaca ttaagaacaa gttccctatc ccgaacttcg acggctcatt ccttgattgg 180 agcctccaac agatggagcg tacccattct caaatccgcc gctacgaagc accagatgag 240 attccattct tcccagaggt gcttctggag agcttcctgc cccccatcaa ctatcctaat 300 atcttggcgt cctaccacaa agaggttaat cataatcaaa ccgtcctgaa cttctacgta 360 gaaaacatcg tccctcaagt cgcctgcgag attggtgagc aagaagaaaa catcggcagc 420 gtatcggtct gcgacatcga ttgtctccag tccctctccc gccgaattca cttcggaaag 480 ttcgtggcgg aggcaaaata ccaatctgac aagccaaagt acattaagtt gatcctggcc 540 aaggacgtta agggcatcga agattccatt actaactctg ctgtggaaga aaaaattctt 600 gaacgcttgc agaagaaggg acaatcctac ggaaccgacc caaccctgat gtattcccaa 660 aacccgcagt cgaaggttcg cccggaggtg attgcgcagc tctataaaga tcacgtcatt 720 ccgctgacga aaaaagttga ggtggactac ctcctgcgcc gattggaaga tgaagatgag 780 gctgttgtag caaaatacaa a 801 <210> 75 <211> 1620 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 75 atgcgtgtca acaacggttt gacccctcaa gaattggagg cgtacggtat ctctgatgtc 60 cacgacattg tgtacaatcc ctcttacgat cttctctacc aagaagaatt ggatccatcc 120 ctcaccggct acgagcgtgg cgtgcttact aatctgggcg ctgtcgccgt agataccggt 180 atctttactg gccgttctcc gaaagacaag tacattgtgc gagacgatac tacccgcgac 240 accttctggt gggctgataa gggtaaaggc aaaaacgaca acaaaccttt gtccccggaa 300 acctggcagc acctgaaagg actggtcacc cgtcagttgt caggtaagcg tcttttcgtc 360 gtggatgcct tctgcggcgc gaatccagac acccgcttgt ctgtacgctt cattaccgaa 420 gtcgcttggc aggcgcattt cgtgaagaat atgtttatcc gaccttccga cgaggaactg 480 gcgggcttca agccggactt catcgttatg aacggtgcca aatgtaccaa cccacaatgg 540 aaggaacagg gcctcaatag cgaaaacttt gtggctttca acttgaccga gcgcatgcaa 600 ctgatcggag gtacctggta cggtggagag atgaagaagg gtatgtttag catgatgaac 660 taccttctcc ctctcaaagg cattgcgtcc atgcattgct ctgcgaatgt cggcgaaaaa 720 ggagacgttg cggtgttttt tggattgtcg ggcaccggta agacgaccct cagcaccgat 780 ccaaaacgcc gtttgatcgg tgatgacgaa cacggatggg acgacgacgg tgtgttcaac 840 tttgagggcg gatgttacgc aaaaaccatt aagctttcca aagaagcaga gcctgagatc 900 tacaacgcaa ttcgccgcga cgctttgttg gaaaatgtga cagtacgcga agacggtacc 960 atcgactttg atgacggttc caagactgag aacactcgtg tgtcataccc tatttaccac 1020 attgataata tcgttaaacc agtgagcaag gcgggtcacg cgacaaaagt cattttcctg 1080 accgcagatg cgtttggtgt gttgccacca gtctcgcgct tgaccgctga ccaaacccaa 1140 tatcacttct tgtctggttt caccgctaag ctggcgggaa ctgagcgtgg catcaccgag 1200 ccgacgccaa cgttttcggc ctgcttcggc gccgcattcc tctcactcca cccaacccaa 1260 tatgccgaag tcttggttaa gcgcatgcaa gcggcgggtg cacaagctta cctggtaaac 1320 acgggctgga atggtaccgg caagcgtatt tcaattaagg acactcgagc gatcattgac 1380 gcgatcctta atggctcgct tgacaacgcc gagaccttca ccctcccgat gtttaacctc 1440 gcaatcccaa ccgaactgcc tggcgttgat actaaaatct tggacccccg aaacacgtac 1500 gcttcacctg agcaatggca ggagaaagcc gaaacacttg ccaagctgtt tatcgacaac 1560 ttcgacaaat ataccgatac ccctgctggc gccgcactgg tagcggcagg tcccaagctc 1620 <210> 76 <211> 1119 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 76 atggtagctg aactcaccgc tttgcgtgac cagatcgatg aagtggataa ggcactcttg 60 aacctgctcg cgaagcgcct cgagctcgtg gcagaggtgg gcgaggttaa atctcgtttt 120 ggcctcccga tctatgttcc tgaacgagag gcctccatcc tggccagccg tcgcgcagaa 180 gcggaggcac tcggagtgcc gcctgatctg atcgaggatg ttctgcgacg cgtaatgcga 240 gaaagctatt catccgagaa tgataaaggc tttaaaaccc tgtgtccttc cctgcgtcca 300 gtcgtgatcg tgggcggtgg cggccaaatg ggtcgtctct ttgaaaagat gttgacgctt 360 agcggctacc aagtgcgcat tctcgagcaa catgattggg accgtgccgc agacatcgtg 420 gccgatgcgg gtatggtcat tgtttcggtc cctatccatg tcaccgagca agtgattggc 480 aaactgccac cccttccaaa agactgtatt ctcgtggact tggcctcggt taaaaacggt 540 cctctccagg caatgctggt tgcacatgat ggcccagtct tgggcttgca cccaatgttc 600 ggcccagata gcggctcatt ggcaaagcag gtggttgttt ggtgcgatgg ccgaaaacca 660 gaggcatatc agtggttcct ggagcagatt caggtatggg gcgcccgtct gcatcgcatc 720 tcggctgttg aacatgatca gaacatggct ttcattcagg ctctccgaca cttcgcaacc 780 ttcgcttatg gtctgcacct ggcggaagag aacgttcagt tggagcagct gctggccttg 840 tccagcccca tttatcgctt ggagctggcc atggtgggcc gtctcttcgc acaggacccg 900 caactttacg ccgacatcat catgtcctca gagcgcaatc ttgcccttat caaacgctac 960 tacaaacgat tcggagaggc gatcgaactc ttggaacagg gcgacaaaca agccttcatc 1020 gattcttttc gcaaggtgga gcattggttt ggtgattatg ttcagcgttt tcagtccgaa 1080 tcgcgtgtac tcttgcgcca agccaacgac aaccgtcaa 1119 <210> 77 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 77 atgtccgaat cacccatgtt cgcagccaac ggcatgccga aggtcaatca aggcgcggaa 60 gaagatgtcc gcattctcgg ctatgatcca cttgcatccc ctgcgctgct gcaagtacaa 120 attcctgcca ccccgacctc gctggaaact gccaagcgcg gtcgtcgcga ggcgatcgac 180 attattacag gtaaggatga ccgcgttctc gttattgtag gtccatgctc catccacgat 240 ctggaagccg cgcaggaata cgcactgcgt ctgaaaaaac tgtccgatga gctcaagggc 300 gacctttcga tcatcatgcg cgcatacctt gagaagcctc gcaccacggt cggctggaaa 360 ggcctgatca atgaccctga tgtgaataac acgttcaaca tcaacaaagg cttgcagtcc 420 gcgcgacaat tgttcgtgaa cctgaccaac atcggcctcc caattggtag cgaaatgttg 480 gacaccatca gccctcaata cttggcagat cttgtgtctt tcggagctat tggcgcacgc 540 accaccgagt cccaattgca ccgtgagctg gcatcaggtc tgagcttccc tgtgggtttc 600 aagaacggca ccgacggtac tctcaatgtg gcggtcgatg cttgtcaagc ggcggcccac 660 agccatcact ttatgggtgt tacattgcac ggtgtggctg ctattactac gacaaaagga 720 aacgaacact gcttcgtcat cctccgtggt ggtaagaagg gcaccaacta cgatgccaaa 780 tctgtggcag aagcaaaggc acaacttcct gcaggtagca acggcctcat gattgattac 840 tctcatggca actcgaacaa agactttcgc aaccaaccga aggtgaacga tgttgtttgc 900 gaacagattg caaacggcga gaatgccatc acgggtgtga tgatcgaatc taacattaat 960 gaaggaaacc aaggtattcc tgcagagggc aaggcgggct tgaaatacgg cgtatcaatc 1020 accgatgcct gtatcggctg ggaaaccacc gaagacgtgc ttcgaaagct tgccgcagcg 1080 gtgcgccagc gccgcgaagt taacaagaag 1110 <210> 78 <211> 522 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 78 atgacccagc cactgttcct gatcggccct cgcggttgcg gaaagaccac tgttggtatg 60 gcccttgcgg actcacttaa tcgccgtttc gtagacacag atcagtggct tcagagccag 120 cttaacatga cagtggcgga aatcgtggaa cgcgaagagt gggcaggttt tcgcgcccgc 180 gaaactgctg ccttggaagc agtgaccgca ccttcaactg tcattgccac tggcggcggc 240 atcatcctga cggagttcaa ccgccacttc atgcaaaata acggaatcgt agtatatctg 300 tgcgcccctg ttagcgtgct ggtcaaccgc ctgcaggcgg cgcctgagga agacctgcgt 360 cctaccctta ccggaaaacc actctccgag gaagtgcagg aagtgctcga ggaacgcgac 420 gcactctacc gcgaagtcgc ccatatcatt atcgatgcga ccaatgaacc atcacaggtg 480 atctccgaga ttcgctcagc tctggcccag acaattaact gc 522 <210> 79 <211> 519 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 79 atggcggaaa agcgtaacat ttttctggtg ggtccaatgg gagccggcaa gtctaccatt 60 ggtcgacagc tggctcaaca actgaacatg gagttctacg acagcgatca ggaaatcgaa 120 aaacgaaccg gagctgacgt tggctgggtg ttcgatttgg aaggcgagga gggttttcgt 180 gaccgcgagg agaaagtgat caacgagctg acagaaaagc aaggcatcgt cctcgccacc 240 ggcggcggtt ccgtgaagag ccgcgagact cgtaaccgac tgagcgcgcg aggcgttgtg 300 gtatatctcg aaaccaccat cgaaaagcag ctggcacgca cgcaacgcga caagaagcgc 360 cctctcctgc acgtcgaaac cccaccgcgt gaggtcctgg aagcactggc gaacgagcgt 420 aacccgcttt acgaggagat cgccgacgta accatccgta ccgatgacca gagcgctaag 480 gttgtggcga accaaattat ccatatgttg gaatccaac 519 <210> 80 <211> 519 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 80 atgactgagc ccatctttat ggtcggtgct cgcggctgcg gaaaaacaac cgtaggccgc 60 gagctcgcac gtgcactggg ctacgaattt gtcgataccg atatctttat gcagcacacc 120 tcgggcatga ccgtggcaga tgtcgtggcc gccgaaggct ggccgggctt ccgccgtcgc 180 gagtccgagg cgctccaggc cgttgcaacc cccaaccgcg tagtggcgac cggcggaggt 240 atggtgctgc tcgagcagaa ccgccaattc atgcgtgctc acggcacggt ggtatatctg 300 ttcgcgcctg ctgaggaact cgcactgcgc ttgcaggcat ctccgcaggc acaccagcgc 360 ccgaccctga ccggccgccc catcgcggag gaaatggaag cggtcctgcg cgaacgcgaa 420 gctctctacc aggatgttgc ccactacgtt gtcgatgcaa cgcagccacc agcggccatc 480 gtgtcagaac tcatgcagac catgcgtctc cccgcggct 519 <210> 81 <211> 4764 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 81 atggtgcagc tggcaaaggt gccaatcctg ggcaacgata tcatccacgt gggctacaac 60 atccacgatc acctggtgga aaccatcatc aagcactgcc catcctccac ctacgtgatc 120 tgcaacgata ccaacctgtc caaggtgcca tactaccagc agctggtgct ggaattcaag 180 gcatccctgc cagaaggctc ccgtctgctg acctacgtgg tgaagccagg cgaaacctcc 240 aagtctcgtg aaaccaaggc acagctggaa gattacctgt tggtggaagg ctgcacccgt 300 gataccgtga tggtggcaat cggtggcggt gtgatcggcg atatgatcgg cttcgtggca 360 tccaccttca tgcgtggcgt gcgtgtggtg caggtcccaa cctccttgct ggcaatggtg 420 gattcctcca tcggtggcaa gaccgcaatc gataccccac tgggcaagaa cttcatcggt 480 gcattctggc agccaaagtt cgtgctggtc gatatcaagt ggctggaaac cctggcaaag 540 cgtgaattca tcaacggcat ggccgaagtg atcaagaccg cctgcatctg gaacgcagat 600 gagttcaccc gtctggaatc caacgcctcc ttgttcctga acgtggtcaa cggtgcaaag 660 aacgtgaagg tgaccaacca gctgaccaac gaaatcgatg aaatctccaa caccgatatc 720 gaagcaatgc tggatcacac ctacaagttg gtgttggaat ccatcaaggt gaaggctgaa 780 gtggtgtcct ccgatgaacg tgaatcctcc ttgcgtaacc tgctgaactt cggtcactcc 840 atcggccacg catacgaagc aatcttgacc ccacaggcac tgcacggcga atgcgtgtcc 900 atcggcatgg tgaaagaagc agaactgtcc cgttacttcg gcatcttgtc cccaactcag 960 gtggcacgtc tgtccaagat cctggtggca tacggcctgc cagtgtctcc agatgaaaag 1020 tggttcaaag aactgaccct gcacaagaaa accccattgg atatcctgct gaagaagatg 1080 tccatcgata agaagaacga aggctccaag aaaaaggtgg tgatccttga atccatcggt 1140 aagtgctacg gcgattccgc acagttcgtg tccgatgaag atctgcgttt catcctgacc 1200 gatgaaacct tggtgtaccc attcaaagat atcccagcag atcagcagaa ggtggtcatc 1260 ccaccaggtt ccaagtccat ctccaaccgt gcactgatcc tggcagcact tggcgaaggc 1320 cagtgcaaga tcaagaacct gctgcactcc gatgacacca agcacatgct gaccgcagtg 1380 cacgaactga agggtgcaac catctcctgg gaagataacg gcgaaaccgt ggtggtcgaa 1440 ggccacggtg gttccacctt gtccgcatgc gcagatccac tgtacttggg caacgcaggt 1500 actgcatccc gtttcttgac cagcttggca gccctggtga actccacctc ctctcagaag 1560 tacatcgtcc tgaccggcaa cgctcgtatg cagcagcgtc caatcgcacc actggtggac 1620 tccctgcgtg caaacggcac caagatcgaa tacctgaaca acgagggctc cctgccaatc 1680 aaggtctaca ccgattccgt gttcaaaggc ggtcgtatcg aactggcagc aaccgtgtcc 1740 tctcagtacg tgtcctccat cctgatgtgc gcaccatacg ccgaagaacc agtgaccttg 1800 gcactggttg gcggtaagcc aatctccaag ctgtacgtgg atatgaccat caagatgatg 1860 gaaaagttcg gcatcaacgt ggaaacctct accaccgaac catacaccta ctacatccca 1920 aagggccact acatcaaccc atccgaatac gtgatcgaat ccgatgcatc ctccgcaacc 1980 tatccactgg cattcgcagc aatgaccggc accaccgtga ccgtgccaaa catcggtttc 2040 gaatccttgc agggcgacgc acgtttcgca cgtgatgtgc tgaagccaat gggctgcaaa 2100 atcacccaga ccgcaacctc caccactgtg tctggcccac cagtcggcac cctgaagcca 2160 ctgaagcacg tggacatgga accaatgacc gatgcattcc tgaccgcatg cgtggtggca 2220 gcaatctccc acgattccga tccaaactcc gcaaacacca ccaccatcga aggtatcgca 2280 aaccagcgtg tgaaagaatg caaccgtatc ttggcaatgg caaccgaact ggctaagttc 2340 ggcgttaaga ccaccgagct gccagatggc atccaggtgc acggcctgaa ctccatcaaa 2400 gatctgaagg tcccatccga ttcctccggt ccagtgggcg tgtgcaccta cgacgatcac 2460 cgtgtggcaa tgtccttctc cttgttggct ggcatggtca actcccagaa cgaacgtgat 2520 gaagtggcaa acccagtgcg tatcctggaa cgtcactgca ccggcaagac ctggcctgga 2580 tggtgggacg tgttgcactc tgaactgggt gcaaagctgg atggcgcaga accattggaa 2640 tgcacctcca agaagaactc caaaaagtcc gtggtgatca tcggtatgcg tgccgcaggc 2700 aagaccacca tttccaagtg gtgcgcatcc gcattgggct ataagttggt ggatctggat 2760 gaactgttcg agcagcagca caacaaccag tccgtgaagc agttcgtggt ggaaaacggc 2820 tgggagaagt tccgtgaaga agaaacccgt atcttcaaag aagtgatcca gaactacggc 2880 gacgatggct acgtgttctc cactggcggt ggcatcgtgg aatccgcaga atcccgtaag 2940 gcactgaagg atttcgcgtc ctccggtggc tacgtcctgc acttgcaccg tgacatcgaa 3000 gaaaccatcg tgttcttgca gtccgatcca tctcgtccag catacgtgga agaaatccgt 3060 gaagtgtgga accgtcgtga aggttggtac aaagaatgct ccaacttctc cttcttcgca 3120 ccacactgct ccgcagaagc cgaattccag gcattgcgtc gttccttctc caagtacatt 3180 gcaaccatta ccggtgtgcg tgaaatcgaa atcccatccg gtcgttccgc attcgtgtgc 3240 ctgaccttcg acgatctgac cgaacagacc gaaaacttga cccctatctg ctacggctgc 3300 gaagctgtgg aagtgcgtgt cgatcacttg gcaaactact ccgctgattt cgtgtccaag 3360 cagctgtcca tcttgcgtaa ggcaaccgat tccattccaa tcatcttcac cgtgcgtacc 3420 atgaagcaag gcggtaactt cccagatgaa gaattcaaga ccctgcgtga actgtacgat 3480 atcgcactga agaacggcgt ggaattcctg gatttggaac tgaccttgcc aaccgatatc 3540 cagtacgagg tgatcaacaa gcgtggcaac accaaaatca tcggctccca ccacgatttc 3600 cagggcctgt actcctggga tgatgcagaa tgggaaaacc gtttcaacca ggccttgacc 3660 ttggatgtgg atgtggtgaa gttcgtgggc accgcagtga acttcgaaga taacctgcgt 3720 ttggaacact tccgtgacac ccacaagaac aagccattga tcgccgtgaa catgacctcc 3780 aagggctcca tctctcgtgt gttgaacaac gtgttgaccc cagtcacctc cgatctgctg 3840 cctaactccg cagcaccagg ccagttgacc gtggcacaga tcaacaaaat gtacacctcc 3900 atgggtggta tcgaaccaaa agaattgttc gtggtcggca agccaatcgg ccactctcgt 3960 tccccaatcc tgcacaacac cggctacgaa atcttgggcc tgccacacaa gttcgataag 4020 tttgaaaccg aatccgctca gctcgtgaaa gaaaagctgt tggatggcaa caaaaacttc 4080 ggtggcgcag cagtgaccat tccactgaag ttggatatca tgcagtacat ggatgaattg 4140 accgacgcag caaaggtgat cggtgctgtg aacaccgtga ttccattggg caacaagaag 4200 ttcaagggcg ataacaccga ttggttgggc atccgtaacg cattgattaa caacggcgtg 4260 ccagaatacg tgggccacac cgcaggcctg gtgattggcg ctggcggaac ctctcgtgca 4320 gcactgtacg cactgcactc cctgggttgc aagaaaatct tcatcatcaa ccgtaccacc 4380 tccaaactga aaccactgat cgagtccctg ccatccgagt tcaacatcat cggcatcgaa 4440 tccactaagt ccatcgaaga gatcaaagaa cacgtgggcg tcgcagtgtc ctgcgtgcca 4500 gcagataagc cactggatga tgaactgctg tccaagttgg aacgtttcct ggtgaaaggc 4560 gcacacgcag cattcgtgcc aaccttgctg gaagcagcat acaagccatc tgtcacccca 4620 gtgatgacca tctctcagga taagtaccag tggcacgtgg tgccaggctc tcagatgctg 4680 gtccaccagg gcgtcgccca gttcgaaaag tggaccggct tcaagggtcc attcaaggcc 4740 atcttcgatg ctgtgaccaa agag 4764 <210> 82 <211> 1356 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 82 atggtctccg aagacaaaat cgaacaatgg aaggctacca aagtaattgg cattattggt 60 ctgggagata tgggcctgtt gtatgcgaat aagttcaccg acgcaggttg gggcgtgatc 120 tgctgcgacc gtgaggaata ctacgatgaa cttaaggaaa aatacgcatc ggctaagttc 180 gagctcgtga aaaatggtca cctcgtctcg cgtcagtccg attacattat ctattcggtt 240 gaagcatcga acatctcgaa gatcgtggcc acttacggcc cctcgtccaa ggtcggtacc 300 atcgtgggtg gtcagacctc ctgcaaactg ccagagatcg aggcattcga aaagtacttg 360 cctaaggatt gcgatattat tacagttcac tctcttcatg gtccgaaggt taatacggag 420 ggtcagccac tggtcattat caaccaccgt tcgcaatacc ccgaatcctt tgagtttgtt 480 aacagcgtta tggcgtgcct taagtccaaa caggtctact tgacctacga ggaacacgac 540 aaaatcacag ctgacacaca ggccgtgact catgctgcat tcctctcgat gggcagcgct 600 tgggccaaga tcaaaattta cccttggacc ttgggcgtga acaaatggta tggtggcctc 660 gagaacgtga aagtcaacat ttccttgcgc atttattcta ataagtggca cgtttacgcg 720 ggcctcgcaa tcaccaaccc gtctgctcac caacaaattc tgcagtatgc cacatcagcc 780 accgaactct tttccctgat gatcgataat aaggagcaag agctgaccga ccgcctgctg 840 aaagcaaagc agttcgtatt tggaaaacat accggtctgc ttttgttgga cgatactatc 900 cttgagaagt actccctttc gaagtcctcc atcggcaact ctaataactg caagccagtg 960 ccaaactctc acctttcctt gctcgcaatc gtcgattcgt ggttccagct gggtatcgat 1020 ccatacgacc acatgatctg ctccactcca ctttttcgca tctttctcgg cgtgagcgag 1080 tacctctttc tcaagcccgg cttgctggag cagacgatcg acgcagcaat tcacgataaa 1140 tccttcatta aggatgattt ggagttcgtg atcagcgctc gtgagtggtc ctcggtggtg 1200 tcttttgcaa acttcgatat ctacaagaaa cagttccagt ccgtccaaaa gttctttgag 1260 ccgatgctcc ctgaagccaa ccttatcggc aacgagatga tcaaaaccat tttgtcccat 1320 tccagcgatc gatcggcggc tgaaaagcgc aacacg 1356 <210> 83 <211> 4458 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 83 atgctgtacg acaagtccct ggagcgtgat aactgcggct ttggcctcat tgcccatatc 60 gaaggcgaac catcgcacaa ggtagtacga accgctatcc acgccttggc tcgaatgcag 120 caccgtggtg ctatcctcgc agacggaaag acgggtgacg gctgtggtct gttgctgcaa 180 aagccggatc gattcttccg cattgtggct caggaacgcg gctggcgcct ggcgaagaat 240 tacgccgttg gtatgctctt cttgaataag gacccagagc tggctgctgc tgcgcgtcgt 300 attgttgagg aggaactgca gcgcgagacc ctgtctatcg tgggctggcg cgatgtcccc 360 accaatgagg gcgttctcgg cgaaatcgca ctcagctcct tgccacgcat tgagcagatc 420 ttcgttaacg caccggcagg ttggcgtcct cgcgacatgg aacgccgttt gttcatcgca 480 cgtcgacgta ttgaaaaacg tctcgaagct gacaaagatt tctacgtgtg ctccctctcg 540 aacttggtaa acatttacaa gggcctgtgc atgcctacag atctgcctcg cttctacctg 600 gacctggctg acttgcgatt ggagtccgcg atctgccttt tccatcagcg tttttccacc 660 aataccgtcc cacgctggcc cctggcccag cctttccgct acctcgcgca taatggtgaa 720 atcaacacca tcacaggtaa ccgtcagtgg gcccgtgcgc gtacctacaa attccagact 780 ccactcatcc ctgacttgca cgacgcggca ccatttgtta atgaaacagg cagcgattcc 840 tcgtccatgg ataacatgct cgagctgctg ttggctggtg gcatggacat catccgcgca 900 atgcgccttc ttgtaccccc tgcttggcag aacaatcctg atatggatcc agaattgcgc 960 gccttcttcg atttcaattc aatgcatatg gagccttggg atggccctgc aggcattgtt 1020 atgagcgacg gtcgatttgc ggcatgcaat ctggatcgca atggtctccg cccagcgcgt 1080 tatgtcatta ctaaagataa gctgattact tgcgcctccg aagtcggaat ctgggactac 1140 cagccggatg aagtcgtaga aaaaggtcga gtgggaccag gtgaactcat ggttatcgac 1200 actcgttctg gacgaatcct gcactctgcc gaaacagatg atgacctgaa atcccgtcac 1260 ccctacaagg agtggatgga aaagaacgta cgccgtttgg tcccttttga agatctcccg 1320 gacgaggagg tgggcagccg cgagctcgat gatgatacgc tcgcttccta ccaaaaacag 1380 ttcaactact ccgcagaaga actcgatagc gtcatccgag ttctgggaga aaatggtcag 1440 gaagcggtcg gttccatggg agatgatacc cccttcgcag tacttagctc ccagccccgt 1500 atcatctatg actattttcg ccagcaattc gcacaggtga caaacccacc aattgatcca 1560 ctgcgcgagg ctcacgtaat gtctctcgcg accagcatcg gtcgcgagat gaacgtcttt 1620 tgtgaggcag aaggccaggc tcaccgtctt tccttcaaga gcccaatcct cctgtactcg 1680 gattttaaac agttgactac catgaaggag gaacactacc gtgcggacac cttggatatc 1740 actttcgacg tgaccaagac cacactggaa gccaccgtga aagaactctg cgataaggct 1800 gaaaagatgg tccgctccgg caccgtgctt cttgttttgt cggaccgaaa cattgcaaag 1860 gatcgcctgc ctgtcccggc acctatggca gtcggagcca tccagacccg tcttgtggac 1920 caatcgctcc gctgcgacgc aaacatcatt gttgaaacag catcggcgcg cgacccacac 1980 cacttcgccg ttttgctggg attcggcgcc acggctattt acccgtattt ggcatatgaa 2040 accctgggcc gtctcgttga tacgcacgcc attgcgaagg attaccgcac tgtcatgctc 2100 aactaccgta atggtattaa caagggtctg tacaagatca tgtctaaaat gggaatcagc 2160 accatcgcga gctatcgatg ttccaagctc ttcgaagctg tgggcctgca tgatgatgtc 2220 gtcggactct gctttcaagg agcagttagc cgtatcggcg gagcatcttt tgaagatttc 2280 cagcaggacc tcctgaacct ctcaaagcgt gcttggctgg cacgcaaacc tatttcgcaa 2340 ggtggcctcc ttaaatacgt ccacggtggt gaataccatg cgtataatcc ggacgtggtt 2400 cgcacgctgc aacaagccgt ccagtccggc gaatactctg attatcaaga gtacgctaag 2460 cttgttaacg aacgtccagc caccaccttg cgcgacctgt tggcaattac gcccggagaa 2520 aacgctgtca acatcgccga tgttgaacca gcatcagaac tgtttaaacg attcgatact 2580 gcagcgatgt caattggtgc actgtcccca gaagcgcatg aagccttggc cgaggccatg 2640 aacagcatcg gaggtaatag caactcaggt gagggaggag aggacccagc acgctacggt 2700 accaacaagg tctcccgcat caagcaagtt gcatcgggcc gcttcggcgt gactccggca 2760 tatctggtga acgctgacgt gattcaaatc aaagtcgcac agggagccaa gccgggcgaa 2820 ggcggtcaac tgccaggcga taaggtaact ccctacatcg cgaaattgcg ctattcggtt 2880 cctggagtca ccctcatttc tccgccaccc caccacgata tctacagcat cgaggatttg 2940 gcccaattga tcttcgactt gaaacaggtc aacccgaagg ctatgatctc tgtaaaactg 3000 gtgtccgaac ctggtgtggg aaccatcgca accggtgtag caaaggccta cgccgacctg 3060 attaccattg ctggctacga tggcggcaca ggtgcttccc cgctctcgtc cgttaagtac 3120 gcgggttgtc catgggagct gggcttggta gaaacccaac aagcactggt tgcgaacggc 3180 ctccgtcaca agattcgctt gcaggttgat ggcggtctca agacgggtgt ggatatcatc 3240 aaagctgcca ttctgggagc cgaatccttc ggatttggaa ccggcccaat ggtggcgttg 3300 ggttgcaagt acctccgcat ctgtcacctt aataattgcg ctaccggtgt ggctacccag 3360 gatgacaagc tccgaaagaa ccactaccat ggcctcccct ttaaagtgac gaactacttc 3420 gagtttatcg cacgagagac acgcgagttg atggcccagc tcggcgtcac ccgcctggtg 3480 gatttgatcg gacgtaccga cttgctgaaa gagctggatg gcttcaccgc aaagcagcaa 3540 aagctggccc tgtcgaagct cctcgagacg gcagagcctc acccaggaaa agcgctctac 3600 tgtaccgaaa ataaccctcc tttcgataat ggcctgctta acgcacaatt gctgcagcag 3660 gccaaacctt tcgttgatga gcgccagtcg aagacgttct ggttcgatat ccgtaacacg 3720 gatcgctccg ttggcgcctc cttgtccgga tatattgccc aaacccacgg cgatcagggc 3780 ttggccgctg acccgatcaa ggcctatttc aacggtaccg ccggacagag cttcggcgtc 3840 tggaatgccg gaggtgttga gctctacttg actggagatg ctaacgatta cgtaggcaag 3900 ggtatggcgg gcggcttgat tgcgatccga ccccctgtcg gctccgcctt ccgaagccat 3960 gaagcatcta tcattggtaa cacctgtctt tatggcgcaa cgggaggtcg tctctacgct 4020 gccggtcgtg ccggagaacg cttcggagtc cgaaactccg gcgcgattac agttgttgag 4080 ggaatcggtg ataatggctg tgaatatatg accggcggca tcgtttgcat cttgggcaag 4140 accggagtga atttcggtgc tggcatgacc ggtggcttcg cctacgtctt ggacgagtcg 4200 ggcgatttcc gaaaacgtgt taacccagag ctcgtcgaag ttctgtctgt agatgcgctc 4260 gctatccatg aggaacactt gcgcggactc atcactgaac atgtccaaca taccggcagc 4320 cagcgcggcg aagagatctt ggccaactgg tcgaccttcg cgactaaatt tgcactcgtg 4380 aaacccaaat cttccgatgt gaaggctctc ttgggtcacc gtagccgttc tgcagctgaa 4440 ctgcgcgttc aagcgcag 4458 <210> 84 <211> 1539 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 84 atgactgcgg gctccgcccc acctgttgat tacacctccc tcaagaagaa cttccagcct 60 ttcctgtcgc gccgagtcga gaatcgctca ctcaagtcgt tttgggacgc gtcggatatc 120 tccgacgatg tgatcgagtt ggcgggcggt atgcctaatg aacgtttctt ccctattgag 180 tcaatggacc ttaaaatttc caaagtgccg ttcaacgata accctaagtg gcacaattca 240 ttcactaccg cccacctgga cttgggctca ccgtcggaat tgcccattgc ccgctctttc 300 cagtacgcag agacgaaagg ccttcctcca ctgttgcact ttgtaaagga tttcgtttca 360 cgcattaacc gtccagcttt ttccgatgag accgaatcca actgggatgt tattctgtct 420 ggcggtagca acgactctat gttcaaggtt ttcgagacca tctgtgacga gtccacgact 480 gtcatgattg aagagttcac ttttactcct gccatgtcca acgtagaagc gaccggtgcg 540 aaggtgatcc cgattaaaat gaaccttact tttgatcgcg aaagccaggg cattgatgtt 600 gagtacctca cccaactgct ggacaattgg tccaccggcc cgtacaagga tctgaacaaa 660 ccacgcgtcc tttataccat cgccactgga cagaacccga ctggtatgtc tgtgccacaa 720 tggaaacgcg aaaaaatcta ccaacttgcc caacgccacg acttcttgat tgtcgaagac 780 gatccatatg gctacctgta ctttccatcg tacaaccccc aagagccatt ggagaatccc 840 tatcattcat ccgatctcac cacggagcgc tacctgaacg acttcttgat gaaatcattc 900 ttgaccctcg ataccgacgc acgtgtgatc cgtttggaaa ccttttctaa aatttttgcc 960 cccggcctcc gcctgtcttt cattgtagcc aacaaattct tgctgcaaaa gattttggat 1020 ttggcggaca tcaccacccg cgcgcctagc ggtacttccc aagcaattgt gtactccacc 1080 attaaagcca tggccgaatc caatttgtcc tcaagccttt ctatgaaaga agcaatgttc 1140 gagggctgga ttcgctggat catgcaaatc gcatctaagt ataaccaccg caagaacttg 1200 actctgaaag cactctacga gacggaatct tatcaggccg gccaattcac cgttatggaa 1260 ccgtccgccg gtatgttcat cattatcaaa attaattggg gcaattttga tcgccctgat 1320 gatctcccgc aacaaatgga tatcttggac aagttcttgc ttaagaacgg agtgaaggtg 1380 gtcttgggct acaagatggc cgtctgcccc aattactcta agcagaactc cgactttttg 1440 cgcctcacca ttgcctatgc tcgcgatgat gatcagctga tcgaagcaag caagcgtatc 1500 ggctccggaa ttaaggagtt tttcgacaac tataagtcc 1539 <210> 85 <211> 1362 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 85 atggacccat acatgatcca gatgtcctcg aaaggcaatc tgccatcaat ccttgatgtc 60 cacgttaacg taggtggtcg ctcatctgtc cccggcaaga tgaagggccg taaggcacgc 120 tggtccgtac gcccgagcga tatggcaaag aaaaccttta acccaatccg tgctatcgtt 180 gacaacatga aagtgaagcc taacccgaat aaaaccatga tttccctgtc gatcggagat 240 ccaactgtgt tcggcaacct cccaaccgat cccgaggtta ctcaggccat gaaagacgcg 300 ttggactcag gcaagtacaa tggatatgct ccttccatcg gatttttgtc tagccgcgaa 360 gagattgcat cttattacca ttgtccggaa gcccctcttg aggcaaagga tgtgattttg 420 acatccggtt gttctcaggc tatcgatctt tgtctcgcag tgctcgcgaa tcctggccaa 480 aacatccttg ttccacgtcc aggcttctcc ttgtataaaa cccttgccga atcaatggga 540 atcgaagtaa agctgtacaa cttgttgcca gagaaaagct gggaaatcga cctgaaacag 600 ctggaatacc ttattgatga aaagacagcc tgcctgatcg tgaataaccc atccaaccca 660 tgtggtagcg tgttctccaa gcgccatctc cagaagatcc tcgccgtggc tgcccgtcaa 720 tgcgttccaa tcctcgcaga cgagatctac ggcgacatgg ttttcagcga ttgtaagtac 780 gagccactgg cgacgttgtc aaccgatgtc ccgatcctga gctgtggagg tctggctaag 840 cgctggctgg taccaggttg gcgccttggc tggattctca ttcatgatcg ccgagacatt 900 ttcggaaatg agatccgcga cggtcttgtt aagctgtccc agcgcatctt gggtccttgt 960 acgattgtgc aaggtgcgct caaatctatc ctttgccgca ccccaggtga attctaccac 1020 aacactctct ctttcctgaa gtccaacgcg gatctttgct acggcgcgtt ggccgcaatc 1080 ccaggtttgc gccctgtccg accatccggc gccatgtacc tgatggtcgg tatcgaaatg 1140 gagcacttcc cagagttcga gaacgacgtt gaattcaccg agcgattggt ggctgaacag 1200 tccgttcact gcctcccagc aacctgcttt gaatacccaa acttcatccg tgtcgttatc 1260 accgtgccag aagtcatgat gctcgaagcg tgctcccgca tccaagagtt ctgtgagcag 1320 cactatcact gcgcagaggg ctcccaggaa gaatgtgata aa 1362 <210> 86 <211> 2040 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 86 atgactcagt ttactgatat cgacaagctg gcagtttcta ccatccgcat cctggcggtc 60 gacaccgtct caaaggcaaa ctccggccac cctggtgcgc ctctgggtat ggctccagcg 120 gcccacgtcc tttggtcaca gatgcgaatg aatccaacga atcctgattg gatcaaccgc 180 gaccgcttcg ttctctccaa tggacacgca gttgctttgc tgtactcaat gcttcatctc 240 accggttacg atctgagcat tgaagatttg aagcaattcc gccagctggg ttcccgcacc 300 cccggtcacc ctgagttcga attgcccggc gttgaagtta cgaccggccc acttggacaa 360 ggtatttcca acgcagtcgg aatggctatg gcgcaggcga atctggcagc gacctacaac 420 aaaccgggtt ttacactctc cgacaattac acttacgttt tcctgggcga cggatgcctg 480 caagaaggca tctccagcga ggcgtcctcc ttggcgggcc acctcaaact gggtaacctg 540 attgcaatct atgacgataa caaaatcact attgacggcg ccacttccat ctctttcgac 600 gaggatgttg caaagcgcta cgaggcatac ggttgggaag tactgtacgt cgagaatgga 660 aacgaagatc tcgcaggcat cgcgaaagct atcgcccaag ccaagctgtc caaggataag 720 cccactctga ttaaaatgac gaccaccatt ggatacggct ccttgcacgc gggttcacac 780 tctgttcatg gtgctccttt gaaagccgat gatgttaagc aactcaaatc taagtttggc 840 ttcaatcctg ataagtcatt cgttgttcca caggaagtgt acgaccacta tcagaagacc 900 atcctcaaac ccggagttga agccaacaac aagtggaata agctcttcag cgaataccag 960 aagaagtttc ccgagctggg agcggaactt gcccgtcgtc tcagcggtca actgcctgcc 1020 aattgggaat ccaagctgcc cacgtacact gccaaggaca gcgccgttgc gacccgtaaa 1080 ctgtccgaaa ccgtcttgga ggacgtctac aaccaattgc ctgagctgat cggtggctcc 1140 gcggatctta caccgagcaa tttgacccgc tggaaggaag cgctcgattt tcagcctccc 1200 tcgtctggca gcggcaacta ctccggccgc tacatccgtt acggtatccg cgagcacgcc 1260 atgggcgcca tcatgaacgg aatcagcgca ttcggtgcca attacaagcc ttacggtggc 1320 acgttcctga atttcgtgag ctatgccgct ggtgcagttc gtttgtctgc actgtccggt 1380 cacccggtca tctgggtggc aactcacgac tctattggcg ttggagagga cggtccgacc 1440 catcaaccga tcgagactct ggcccacttc cgaagcctcc ccaacattca ggtctggcgc 1500 ccagccgacg gaaacgaggt ctctgcagcc tacaagaaca gccttgagtc caagcacacc 1560 cctagcatca tcgcgctctc tcgccagaat ctgccacagc tcgagggctc ctctatcgaa 1620 tccgcgtcca agggcggtta cgttttgcag gatgtggcaa atccggacat cattttggta 1680 gcaaccggct ccgaagtctc cctgtcagtg gaggccgcaa aaacactcgc ggcaaagaac 1740 atcaaggctc gagtggtctc gcttcccgat ttctttacct tcgataaaca gcccctggag 1800 taccgtttgt ctgtgttgcc agacaacgtg cccatcatgt cagtcgaggt actcgcaacc 1860 acgtgttggg gtaaatacgc gcaccagtcc ttcggcatcg atcgcttcgg agcgagcggc 1920 aaggcacccg aggtctttaa gttttttgga tttaccccag aaggagttgc agagcgtgcg 1980 caaaaaacca ttgcattcta taagggtgac aagctgatct cgccgctcaa gaaggcgttc 2040 <210> 87 <211> 1005 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 87 atgtccgaac cagcccaaaa aaagcaaaag gttgctaaca attccctgga gcaactgaag 60 gcctctggta ctgttgtagt ggctgatact ggtgatttcg gttccatcgc caagtttcag 120 cctcaggatt ccactacaaa cccctccttg atccttgccg ccgctaagca accaacctac 180 gccaagctca tcgacgtcgc agttgaatac ggcaagaaac acggtaagac tacggaggag 240 caagtcgaga acgcggtcga ccgcctgttg gtggagttcg gcaaggagat ccttaaaatc 300 gttcccggcc gcgtctccac cgaagtcgat gcccgattgt cctttgatac ccaagccacg 360 atcgaaaagg cccgtcacat cattaagctc tttgagcagg aaggcgtttc caaagaacga 420 gtcctcatta agattgcgtc aacctgggaa ggcatccaag cagccaaaga gcttgaggag 480 aaggacggta ttcattgtaa tctgacgctg ctcttttctt tcgttcaggc tgtagcttgt 540 gcagaggcgc aggttactct catctcccca ttcgtaggtc gaatcctgga ttggtacaaa 600 tcttcaaccg gcaaggatta caagggcgag gctgaccctg gcgtcatctc cgtcaaaaag 660 atctataact actacaagaa gtatggctat aagaccatcg tcatgggcgc ctctttccgt 720 tccaccgatg aaattaaaaa ccttgctggc gttgactatc tgacgatttc ccccgcactc 780 ctggacaaac tgatgaattc aaccgaaccc tttccccgtg tcttggatcc tgtctcggcg 840 aaaaaggaag ccggcgataa aatttcatac atctctgacg agtctaagtt ccgttttgat 900 ctgaatgaag acgctatggc aaccgaaaaa ctgtcagaag gcatccgtaa gttctccgcc 960 gacatcgtta ccctttttga cctcattgaa aagaaagtga cagcc 1005 <210> 88 <211> 1002 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 88 atggcgaaaa tcgcaatcaa cggtttcggc cgaattggtc gcctggctct gcgccgcatc 60 ctcgaagttc cgggtttgga agttgtggca attaacgatc tgacggatgc taaaatgctt 120 gcgcatttgt ttaaatacga ctctagccag ggccgcttca atggagagat cgaagtgaaa 180 gaaggtgcct tcgtggttaa cggtaaagag gtgaaagtat tcgcagaagc cgacccggaa 240 aagttgcctt ggggcgattt gggcatcgac gtcgttctgg agtgcacggg tttctttacc 300 aagaaagaaa aggcagaagc ccacgtgcgt gcgggtgcta agaaggtcgt tatttcagcc 360 ccagcaggca acgacctcaa aaccatcgtg ttcaacgtaa ataacgaaga tctcgatggt 420 accgaaaccg tcatttcggg tgcctcttgc actactaact gtcttgctcc gatggcaaag 480 gttctcaacg acaaattcgg catcgagaag ggattcatga ctacgatcca cgccttcacg 540 aacgatcaga acactcttga cggacctcac cgtaagggtg atctccgtcg tgctcgtgcg 600 gcggcggttt cgatcattcc taatagcact ggcgccgcaa aggcaatttc gcaagtgatt 660 ccagacttgg ccggcaaact cgatggcaac gcgcagcgcg taccggtgcc caccggctcg 720 atcaccgaac tcgtgtccgt gctcaagaag aaggttacgg tggaagagat caatgcggct 780 atgaaggaag cagcagatga gtcgttcggc tatacagaag atcctatcgt tagcgcagac 840 gtggtgggca tcaactacgg atccttgttt gatgcaacct tgacgaagat tgttgatgta 900 aacggatccc agcttgtgaa aacggccgcg tggtacgata acgagatgag ctacacgtcg 960 caactcgtgc gtactctggc ctacttcgct aagatcgcga ag 1002 <210> 89 <211> 1188 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 89 atggcatccg tgacgttctc tgtgcccaaa ggcttcaccg agttctcagg ccttcgaagc 60 tcctccgcat cgctgccctt tggtaaaaaa cttagctccg acgagttcgt atccattgtt 120 tcctttcaaa cgtccgcaat gggctcctct ggcggctatc gaaagggcgt gaccgaagct 180 aaactcaagg tcgcaattaa cggtttcggc cgtattggac gcaactttct tcgctgttgg 240 cacggccgca aggactctcc attggatatc atcgctatca acgacaccgg aggcgtgaag 300 caggcgtcac accttttgaa gtatgattcc acgctcggta ttttcgatgc agatgttaaa 360 ccttccggcg aaacggctat ttctgtggat ggaaagatca tccaggtcgt ctcaaatcgc 420 aacccgtccc tgcttccctg gaaggaactc ggaattgaca tcgtgatcga gggcaccggc 480 gtttttgtcg atcgtgaagg cgccggtaag cacattgagg caggcgccaa aaaggttatt 540 atcaccgcac ccggtaaggg cgacatccca acctacgtgg ttggtgttaa cgcagatgct 600 tatagccacg atgaaccaat catttcaaac gcatcatgca ctaccaactg tctcgctcca 660 ttcgttaaag ttcttgacca gaagttcggt atcatcaagg gtactatgac aacgacccac 720 tcctatacgg gtgatcagcg cctgctcgat gcctcccacc gcgaccttcg ccgcgcacgc 780 gcagctgccc tcaacattgt accgacctcc acgggagcgg caaaggcagt cgcattggtt 840 ctgccaaact tgaaaggtaa actcaacggt atcgctctgc gtgttcccac tccaaacgtc 900 tctgttgtgg acctggttgt acaggtttcc aagaagactt tcgccgaaga agtcaacgcc 960 gcttttcgcg attccgctga gaaagaattg aagggcattc tggacgtgtg tgacgaaccc 1020 ctggtgagcg tcgatttccg ctgttccgac ttctccacta ctattgattc ctcgctcact 1080 atggtgatgg gagatgacat ggttaaggtc atcgcgtggt atgacaacga gtggggttac 1140 tctcaacgcg ttgtcgatct cgcagatatc gttgccaata actggaaa 1188 <210> 90 <211> 1122 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 90 atggccgcca tgatgcagaa gtccgccttc actggctccg cagtttcatc caagtcagga 60 gtccgcgcaa aggccgcacg cgctgtggtc gacgtccgtg cggaaaaaaa gattcgtgtc 120 gccatcaatg gtttcggacg tatcggtcgc aacttcttgc gctgctggca cggccgccaa 180 aacaccctcc tggatgtagt cgctattaac gattccggtg gtgtcaagca ggcgtcccat 240 ctgcttaagt acgatagcac ccttggtacg ttcgccgcgg atgtcaagat cgtggatgat 300 tcccacattt ccgttgacgg caaacagatc aaaatcgtgt cctcgcgcga cccactccaa 360 ctgccgtgga aggagatgaa cattgacctg gttatcgagg gtaccggagt attcattgac 420 aaggttggag ccggtaaaca catccaggct ggcgcgagca aggtgctgat cactgcccca 480 gccaaggata aagacatccc aaccttcgtt gtgggcgtaa acgaaggaga ttataagcac 540 gaatacccta ttatcagcaa tgcttcctgc accactaact gtctggcgcc atttgtcaag 600 gtgcttgagc agaaattcgg catcgtgaag ggaactatga ctaccaccca tagctacacc 660 ggcgatcaac gcctcttgga cgcatcccac cgagatctgc gtcgcgcacg cgctgcggcc 720 cttaacatcg tccctaccac caccggcgct gcgaaggccg tgagccttgt gctgccgtcc 780 cttaaaggca aactgaatgg cattgcgctg cgcgttccaa ctcccaccgt ctccgtcgtg 840 gatttggtgg tgcaggtgga gaaaaagaca ttcgccgagg aggtcaatgc tgcgttccgc 900 gaagccgcaa acggccccat gaaaggcgta ctccatgttg aagacgctcc gcttgtatcc 960 attgacttca aatgcactga ccagagcacc tccattgatg cgtccctgac catggtcatg 1020 ggagacgaca tggtcaaagt ggttgcgtgg tacgataacg agtggggata ttcccaacgc 1080 gttgttgatc tggcagaggt cacggctaag aaatgggtcg ca 1122 <210> 91 <211> 1008 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 91 atggccatta aggtggcgat caacggtttc ggtcgcattg gccgtcttgc gtttcgccgt 60 atccaggatg tggagggctt ggaggttgtg gccgtgaacg acctgaccga tgacgatatg 120 ctggcccacc ttctcaagta cgataccatg cagggacgct tcaccggaga agtggaggta 180 attgaaggtg gtttccgcgt gaatggaaag gagatcaaat cattcgatga accagatgca 240 ggaaagcttc catggggaga ccttgatatt gacgtggtgc tcgagtgcac cggtttctac 300 accgataagg agaaggcgca ggctcatatc gatgctggtg cgaagaaggt gctgatctca 360 gcaccagcaa agggtgacgt taagactatt gtcttcaaca ccaaccatga caccctggac 420 ggctcagaaa ccgtcgtcag cggagcatct tgtaccacaa acagcctggc gccggtggca 480 aaggttctct ccgatgaatt cggtctcgtc gagggcttca tgaccactat tcatgcatac 540 actggcgacc agaatacaca ggacgcgcca caccgaaagg gcgacaagcg acgagcacgc 600 gcagcagccg agaacatcat tcccaattcg acgggtgctg ccaaagctat cggcaaagtt 660 atcccagaga ttgatggcaa gctggatggc ggagcacaac gtgttccagt agcgacggga 720 tcacttacag aattgactgt ggttttggat aaacaagacg tgacggtgga ccaggtgaat 780 tctgctatga agcaggcgag cgacgaaagc ttcggctata ccgaagatga aatcgtctcc 840 tccgatatcg taggcatgac ctacggaagc ctgttcgacg cgacccagac ccgtgtcatg 900 acggtgggcg atcgccaact tgtgaaggtg gctgcctggt atgacaacga gatgtcctat 960 acggctcagt tggtccgcac cttggcacac ttggcggagc ttagcaag 1008 <210> 92 <211> 1248 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 92 atggctttcg ttgctccggt ttcttccgta ttctctacaa gctccaaatc cgctgtctgt 60 tccggccgct cttcgttcgc ccaattttcc ggcctgaaga aagtaaacaa taccgcacga 120 ctccagacgg cggagcaagg ctcggcattt ggaggcgtgt ctgatgcaaa cgatgcgttt 180 ttcaacgcag tgaacacaat gggagctcct gcacgaacaa gcaatgctcc gtccatgaag 240 gtccgagtgg ccatcaacgg cttcggccgc atcggccgca atttcatccg ctgttgggca 300 ggacgtaccg actcgaatat ggatgtcgtc tgcatcaatg atacctccgg cgtcaagacg 360 gccagccact tgctcaagta tgattcaatt ctcggcactt ttgacagcga cgtggtcgcc 420 ggagaggact ccattaccgt tgatggaaag accattaaag tcgtctcaaa ccgtaaccct 480 cttgaactgc cttggaaaga gatggaaatt gatatcgtgg ttgaggccac cggcgtgttc 540 gtcgatgccg tgggtgcagg aaagcacatc caggcgggtg ccaaaaaggt cttgattacc 600 gcacctggta aaggagaagg tgttggtacc ttcgttgtcg gcgttaatga tcatctctat 660 tcccacgata aattcgacat tgtcagcaac gcatcctgta caaccaattg catggcccca 720 tttatgaaag tgctggatga tgaattcggc gtggtgcgtg gcatgatgac tactactcat 780 tcgtacaccg gtgatcagcg tctgctcgat gcaggacacc gtgatctgcg tcgcgcgcgt 840 tctgccgccc tcaacatcgt tcccactacc accggtgctg cgaaagccgt cgcattggtt 900 gttccaactt tggctggtaa gcttaacggc atcgcgctcc gcgttcctac tccgaacgtt 960 tctgtgtgtg atgtggttat gcaggtcagc aagaaaactt tcaaggagga ggtcaatgga 1020 gctctcttga aagctgcgaa cggctcgatg aagggcatta tcaaatattc cgatgagccc 1080 cttgtgagct gtgattaccg tggaaccgac gaatcaacca tcatcgattc cagcctcact 1140 atggtgatgg gcgacgatat gcttaaggtg gtggcttggt acgacaacga atggggatac 1200 tcacaacgcg ttgtggatct cggcgaggtc atggcgagcc aatggaag 1248 <210> 93 <211> 1416 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 93 atgtcccaga acgtgtacca attcatcgac cttcagcgcg tcgatccacc gaagaaacct 60 ctcaagattc gcaagattga atttgtcgag atctacgagc ccttttccga gggtcaggcg 120 aaggcacagg ccgaccgctg cctctcctgc ggcaatccat actgcgaatg gaagtgtcca 180 gttcacaact acatcccaaa ttggcttaaa ctggcaaatg aaggacgcat cttcgaggct 240 gcggagctct cccaccagac caacacgctt ccagaagtat gcggacgtgt ttgccctcaa 300 gaccgtctct gcgaaggtag ctgcacgctt aacgatgaat tcggagccgt caccattggt 360 aatatcgagc gttacattaa cgacaaggcc ttcgaaatgg gatggcgccc ggacatgtcc 420 ggcgtgaagc aaaccggtaa gaaggtcgcg atcatcggcg cgggtccagc tggccttgct 480 tgcgccgatg tcctgacccg caacggtgtg aaagcagttg tattcgatcg ccatcccgaa 540 attggaggcc tgctcacttt tggcatcccc gcattcaaac tcgaaaaaga agtgatgacc 600 cgtcgtcgag agatttttac cggtatggga attgagttca agcttaacac tgaagtcgga 660 cgcgatgttc agctcgacga cctcctgtcc gactacgacg cagttttcct tggtgtcggt 720 acttaccagt caatgcgcgg tggtctggaa aatgaggatg cggacggtgt ttacgcagcg 780 cttccctttc ttattgctaa caccaagcag ctgatgggat ttggtgaaac tcgagatgaa 840 cctttcgttt caatggaagg aaagcgcgtt gtggttcttg gaggtggcga taccgccatg 900 gactgcgtgc gtacctccgt tcgacagggc gccaaacatg tcacctgtgc ataccgccgt 960 gacgaggaaa acatgcccgg ttcacgacgt gaggtgaaaa acgcccgcga agaaggtgtt 1020 gagttcaagt tcaacgtgca gccacttggt attgaggtga acggtaacgg aaaggtctcc 1080 ggagttaaga tggtgcgtac cgagatgggt gaaccagacg caaagggtcg tcgccgcgcc 1140 gagatcgtcg cgggatcgga gcatatcgtg ccagctgacg ctgtaatcat ggcatttggt 1200 ttccgcccac acaatatgga gtggctggcg aagcattccg tggagctcga tagccagggc 1260 cgtatcattg cacctgaggg ttcggacaat gcctttcaga cctccaaccc aaaaatcttc 1320 gctggcggcg acattgtgcg tggctcagat cttgttgtga ccgcaatcgc tgagggtcgt 1380 aaggcagctg acggtatcat gaattggctc gaagtc 1416 <210> 94 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 94 atggcagaag cctctattga gaaaacacag attctgcaga aatatcttga attggatcaa 60 cgtggtcgaa tcattgctga gtatgtttgg attgatggca ccggtaacct gcgctccaag 120 ggccgcaccc tcaagaagcg cattacatcc attgaccagt tgcccgaatg gaactttgat 180 ggctcaagca ccaaccaggc cccaggtcac gactctgata tctatctcaa gccagttgct 240 tattacccgg acccattccg ccgcggtgat aacatcgtcg tgttggctgc ttgctacaac 300 aacgatggaa ctcccaacaa attcaaccac cgacatgaag cagcgaagct gttcgccgcc 360 cacaaagacg aagaaatttg gttcggactt gaacaggaat acacgctgtt tgatatgtat 420 gatgatgtgt acggttggcc taagggaggc tacccagctc cacaaggtcc atactattgc 480 ggcgtcggcg cgggaaaggt gtacgctcgc gatatgatcg aagcacatta ccgcgcctgt 540 ttgtacgctg gccttgaaat ctccggtatc aacgcagaag tgatgccatc ccagtgggag 600 ttccaggtgg gtccgtgtac cggcattgac atgggagatc agctgtggat ggcccgctac 660 ttccttcatc gcgtcgcaga agaattcggt atcaaaatct ctttccatcc aaaacccttg 720 aaaggcgact ggaacggtgc gggttgtcat actaatgtat ccaccaagga gatgcgtcaa 780 ccgggaggca tgaagtacat cgagcaagct atcgaaaagc tcagcaaacg ccacgcggaa 840 cacattaaac tgtatggctc cgataacgac atgcgcctga ctggtcgcca tgagacggct 900 tccatgactg catttagctc cggtgtggcc aaccgtggct ccagcatccg aattcctcgt 960 agcgtggcaa aggaaggata tggttacttt gaggatcgac gcccagcatc caacatcgat 1020 ccttacctcg tcacaggcat tatgtgtgag accgtctgtg gagcaatcga caacgcagac 1080 atgaccaagg aatttgagcg tgagtcgtcg 1110 <210> 95 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 95 atgtctgaaa gcccgatgtt tgccgcgaat ggcatgccaa aggttaatca aggcgcagag 60 gaagatgttc gtatcctcgg ttacgatcca ctggcatcac ctgctctgct ccaagttcaa 120 attccggcga cccctacctc cttggagacc gcgaaacgcg gtcgccgcga ggcaatcgat 180 atcatcaccg gtaaagatga ccgcgtcctg gttattgtcg gcccatgctc catccacgac 240 ctggaagctg cgcaagaata tgccctccgt ctcaagaagc tgagcgacga actgaaagga 300 gacttgtcga ttatcatgcg cgcatacctg gagaagccac gtaccaccgt cggttggaaa 360 ggactgatca acgacccaga tgtcaataat acgttcaaca tcaataaagg actccagtcg 420 gctcgtcagt tgttcgtcaa cctcaccaac atcggtttgc caattggtag cgaaatgttg 480 gatactatca gcccaaagta ccttgccgac ctggtgtcgt tcggcgctat tggcgcccgt 540 actaccgaat cccaactcca ccgcgaactg gcctcaggcc tttctttccc tgttggcttc 600 aagaacggca ctgatggcac gttgaacgtt gcagtcgacg catgtcaggc agctgcccat 660 agccaccact ttatgggcgt tacaaaacac ggtgttgcgg ccatcaccac aacaaagggc 720 aacgaacact gctttgttat tttgcgcggc ggcaagaagg gtacaaacta cgatgcgaaa 780 tctgtggcag aagcaaaggc ccaactccct gcaggctcaa acggtctcat gatcgactac 840 tcccatggta actcgaataa agactttcgt aatcaaccca aagtcaacga cgtggtctgc 900 gagcagatcg ccaatggaga gaatgcaatc acaggtgtga tgatcgaatc aaatatcaat 960 gagggtaacc aaggaatccc agctgaaggt aaggcaggcc tcaaatacgg tgtgtccatt 1020 accgatgcat gtattggatg ggaaactacc gaggatgtgc tgcgcaagct cgcggccgca 1080 gttcgccagc gccgcgaggt gaacaaaaaa 1110 <210> 96 <211> 1050 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 96 atgaattatc aaaatgatga ccttcgtatc aaagaaatca aggagttgtt gcccccggta 60 gctttgcttg agaagtttcc cgcaaccgaa aatgctgcta ataccgttgc acacgcacgc 120 aaggctatcc ataagatttt gaagggcaac gacgatcgtc tgctcgtcgt catcggtcct 180 tgctcaattc acgacccggt tgctgccaaa gaatatgcca cccgtttgct ggcgctgcgc 240 gaggaactca aggacgaact ggagatcgtg atgcgagttt attttgaaaa accccgcact 300 accgtgggct ggaagggcct cattaatgac ccccacatgg ataactcgtt tcaaatcaac 360 gatggtcttc gcatcgcgcg caagctgctc ctggacatca atgattctgg tctgccagca 420 gccggcgaat tcctcaatat gatcaccccg caatacctgg ccgatctgat gtcgtggggt 480 gccatcggag cacgcacgac ggagtcacag gtacatcgcg agctggcatc cggtctgagc 540 tgcccagtcg gttttaaaaa cggcacggat ggcactatca aagtggcaat cgacgcaatc 600 aacgccgccg gagcacctca ctgttttttg agcgtaacta agtggggaca cagcgcgatt 660 gttaacacct ccggtaacgg cgactgtcac atcatcttgc gaggtggtaa agaaccaaac 720 tactcggcga aacacgtcgc agaagtcaag gagggtttga acaaagctgg cttgccggcc 780 caggtgatga ttgacttctc tcacgccaac agctcgaaac aatttaagaa gcaaatggat 840 gtctgcgcgg atgtctgcca acaaatcgca ggaggtgaaa aggcgattat tggtgtgatg 900 gttgagagcc acctggtgga aggcaaccaa tccctcgaga gcggtgagcc tctcgcctac 960 ggtaagtcca tcacggatgc gtgtattggc tgggaggaca cggatgcact cctccgtcag 1020 ctggcaaatg ccgttaaggc gcgtcgcggc 1050 <210> 97 <211> 1050 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 97 atgaactatc agaacgatga cctccgcatc aaggagatta aagagctgct ccctcctgtt 60 gcgctgttgg aaaagttccc agcgacggag aacgccgcga acaccgtcgc ccacgctcgc 120 aaagctattc acaagatttt gaagggcaac gatgaccgtc tcctggttgt cattggccca 180 tgttcgattc atgatcctgt ggcggccaag gaatacgcga cgcgtctgct tgccctgcgt 240 gaagagctta aggacgaact cgaaatcgtg atgcgcgtat atttcgagaa accacgcact 300 accgttggat ggaagggcct catcaatgat ccgcatatgg ataatagctt tcaaatcaat 360 gatggcttgc gcatcgctcg caagctcctc cttgatatta acgattccgg cctgccagct 420 gcgggtgaat tcttggatat gatcactctg caatacctgg cggacctgat gtcttggggc 480 gccatcggag cccgtaccac cgagtcccaa gtccatcgcg agctggcatc cggtctgtcc 540 tgcccggtcg gtttcaagaa cggaactgat ggtactatca aggtggccat cgacgctatt 600 aacgccgcag gagcgccgca ttgctttctc tcagtgacca agtggggtca ctccgccatc 660 gtcaatacat ctggcaatgg cgactgtcat atcatccttc gcggaggcaa agagcctaac 720 tattcggcta aacacgtggc agaagttaaa gaaggcctca acaaggccgg actgccagcc 780 caagttatga ttgatttttc acacgctaac tcctcaaaac agtttaagaa gcagatggac 840 gtttgcgcag atgtttgtca acaaatcgcg ggtggcgaaa aggcgatcat tggagttatg 900 gtggaaagcc acctggtgga aggcaaccaa tctctggagt ctggagaacc gcttgcatac 960 ggtaagagca ttaccgacgc atgcattggc tgggaagata cggacgcgct gctgcgacag 1020 ctcgcgaatg ctgttaaggc ccgacgcggt 1050 <210> 98 <211> 1068 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 98 atgcagaaag atgccctgaa caaagtgcac atcaccgatg agcaggtact tatgaccccg 60 gaacagctca aagcagcatt ccccttgagc cttcaacaag aagctcagat tgcagattcc 120 cgcaagtcga tttccgacat tattgccggt cgtgatccgc gactgctcgt ggtgtgcggc 180 ccatgctcca ttcacgatcc cgagaccgcc ctcgagtacg ctcgacgctt taaggccctt 240 gcggcagagg tatccgattc attgtatctg gtgatgcgcg tgtactttga aaagccgcgt 300 accaccgtgg gctggaaagg cttgatcaac gatccacaca tggatggctc attcgatgtt 360 gaagctggcc tgcaaatcgc ccgcaagctc ctgctggaat tggtgaacat gggtctgccc 420 ctcgcgactg aggccttgga tccaaactca ccacaatacc tgggtgacct cttttcctgg 480 tctgcgatcg gtgcacgcac caccgaatcc cagacccacc gcgagatggc gtctggactt 540 tctatgccag tgggcttcaa gaacggaact gacggttccc tggcaacagc gattaacgcg 600 atgcgcgcgg cggcacaacc gcatcgtttt gtgggcatca accaggcagg ccaggtagcc 660 ctgctgcaaa cccagggaaa tccggatggc cacgtcatcc tccgcggagg caaggctccg 720 aattactctc cagccgatgt tgcccaatgc gaaaaagaaa tggaacaagc cggtctgcgc 780 ccttcgttga tggtcgattg ctcccacggc aattccaaca aagactatcg tcgccagcca 840 gctgtcgcag aatccgttgt cgcacagatc aaagatggca atcgctccat cattggcctt 900 atgatcgaat ctaatatcca cgagggcaat caatcgtctg aacagccgcg ctccgaaatg 960 aaatatggcg tctccgtgac cgacgcgtgc atttcctggg agatgaccga tgcgctcctc 1020 cgcgaaatcc accaagatct taacggccaa cttactgctc gagtggcc 1068 <210> 99 <211> 1347 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 99 atgtccaata ccacatggtc tcctacctca tggcactcct ttaaaattga acagcaccca 60 acctacaagg acgaacagga acttgaacgc gtgaagaaag aacttcgctc ctatcctcca 120 cttgtattcg ccggtgaggc gcgcaacctc caagaacgtc tcgcacaagt gattgacaac 180 aaggcattcc tcctccaggg tggcgattgt gccgagtcat tttcccagtt cagcgcgaat 240 cgcattcgcg atatgttcaa ggtcatgatg caaatggcga tcgttctgac cttcgctggt 300 tctatcccca tcgttaaggt gggccgaatc gcgggccaat ttgctaaacc tcgatcgaat 360 gccaccgaga ttctggacga cgaggaagtt ttgtcgtacc gcggcgatat tatcaatggc 420 atctcaaaga aggagcgcga accgaaacca gagcgcatgc tcaaggcgta ccatcaaagc 480 gtggcaacgc tgaacctgat ccgcgcattt gcacaaggtg gtctggccga ccttgaacag 540 gttcaccgct tcaacctgga tttcgtgaaa aacaacgatt tcggtcaaaa ataccaacaa 600 attgctgatc gcattactca ggcgctgggc ttcatgcgcg cttgcggcgt ggaaatcgaa 660 cgcactccta ttttgcgtga agtcgaattt tacacctctc acgaggcatt gcttctccac 720 tacgaagaac ctctggtacg caaggactcc ctcactaacc aattctacga ttgttccgcc 780 catatgcttt ggattggtga acgaacacgc gacccaaaag gcgctcacgt ggaattcttg 840 cgcggtgtat gtaaccctat tggtgtgaaa attggcccta atgcgagcgt gtccgaggtt 900 cttgagctgt gtgatgtgct caacccgcac aacttgaaag gccgtttgaa tctcatcgta 960 cgcatgggat ccaaaatcat caaagagcga cttccgaagc tgctgcaggg tgtactcaaa 1020 gagaaacgcc acattctgtg gtctattgat ccaatgcacg gaaacaccgt gaaaaccaac 1080 ctgggtgtga agacccgtgc tttcgactcc gtgcttgatg aagttaaatc attcttcgaa 1140 atccaccgtg cggagggttc cctggcatcc ggcgtccacc tcgagatgac gggtgaaaac 1200 gttacggaat gcattggcgg ctcgcaggcg atcaccgaag agggcctgag ctgccattac 1260 tatacgcagt gcgatccccg cctcaacgcg acccaagcat tggaacttgc ctttcttatc 1320 gctgacatgc tcaaaaaaca acgtacc 1347 <210> 100 <211> 828 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 100 atgtggcgtt ggctcccagt tgcgggattt aaaggtgtta aactcgccct gaagtcagag 60 gagcgtcgcg agaccgtcgt ggaggttgaa ggtgtgcgta ttggaggtgg ttctaaggca 120 gtaattgcag gtccttgttc tgttgaatcc tgggaacagg tgcgcgaagc cgcattggcg 180 gtcaaggaag ccggcgctca catgctgcgt ggcggcgcat tcaaaccacg tacctcgccc 240 tactccttcc agggtttggg tttggagggc ctgaagcttt tgcgccgcgc aggagatgag 300 gccggcctgc ccgttgtaac tgaggtattg gacccgcgcc acgtggagac agtttcccgt 360 tatgcggaca tgctgcagat cggtgcacgc aacatgcaga atttcccctt gctgcgtgaa 420 gttggtcgct ccggtaaacc agttcttttg aaacgcggct tcggcaatac tgtggaagaa 480 ctcctcgctg ctgctgaata tatcttgctc gaaggcaatt ggcaggttgt gctggtcgaa 540 cgaggaatcc gcaccttcga gccgtcaacc cgctttaccc tcgacgtagc tgcggtggcg 600 gtgttgaagg aagcaaccca tttgccagtg attgttgatc cctcgcaccc cgcgggacga 660 cgctctttgg ttcctgcgct ggctaaagcc ggcttggccg ctggcgccga tggtcttatc 720 gtcgaagtgc accctaatcc agaggaagct ttgagcgatg caaaacagca gttgaccccc 780 ggcgaattcg cgcgcttgat gggagaactg cgttggcatc gtttgctc 828 <210> 101 <211> 1875 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 101 atgagcgagt ccctctccaa ggatcttaac ttgaatgcgc tgttcattgg cgataaagcc 60 gaaaacggtc agatctataa ggcgctgctt aacgaactcg tggatgagca cttgggatgg 120 cgccagaatt acatgcctca agacatgcca attattacac cggaggaaaa gtcttcagca 180 tccttcgaac acacggtgaa caagacaaag gacgtattga gcgagatctc cgcacgtatg 240 cgaactcatt ccgtcccttg gcacaatgcc ggtcgatatt ggggccacat gaactcggag 300 accctgatgc cttcccttct ggcctacaac ttcgccatgc tttggaacgg taataacgtg 360 gcttatgaat catcacctgc aacctcacag atggaggaag aggttggcat ggaattcgca 420 aagctcatga gctacaaaga tggctgggga cacatcgtgg cagacggttc cctggcaaac 480 cttgaaggct tgtggtacgc gcgtaacatc aaaagccttc ctttggccat gaaggaggtg 540 accccagaac tcgtggctgg caaatccgac tgggaactta tgaacctctc taccgaggag 600 atcatgaatc tgctggattc tgtcccagag aaaatcgatg aaattaaagc gcactcagcc 660 cgttcgggta agcacttgga gaaattgggt aagtggctgg ttcctcagac taagcactac 720 tcctggttga aggcagctga tatcatcggc atcggtcttg atcaagttat ccccgttccg 780 gtcgatcaca actatcgcat ggatattaat gagctcgaaa aaattgttcg tggccttgct 840 gctgaaaaga ctcctattct gggtgtggtc ggcgttgttg gttctaccga agaaggcgca 900 attgacggaa ttgacaagat cgtggctctt cgccgtgtgc tggaaaagga tggtatttac 960 ttctacctgc atgtcgacgc cgcttacggc ggatacggtc gcgccatttt tctcgatgag 1020 gacaacaatt ttatcccctt tgaagacctc aaagacgtcc actataagta caatgttttt 1080 accgagaaca aggactacat tcttgaggaa gtgcactcgg cgtacaaggc gattgaggaa 1140 gcagagtccg taactatcga ccctcacaag atgggctacg tcccttattc cgcaggaggc 1200 atcgttatca aagacattcg catgcgtgat gtaatctctt actttgcaac ctacgtattt 1260 gaaaagggcg ccgacatccc ggctctgctt ggtgcgtata tcctggaggg ttctaaggca 1320 ggcgcaactg ccgcgtccgt gtgggctgct catcatgtat tgccactgaa cgtcacgggt 1380 tacggtaaat tgatgggcgc ttccatcgaa ggcgcgcacc gcttctataa cttcctgaac 1440 gacttgtcct ttaaagtagg cgataaagag attgaagttc accccttgac ctacccggat 1500 tttaatatgg tcgactacgt cttcaaagaa aagggaaatg atgacctggt ggctatgaat 1560 aaactcaatc acgatgtcta cgattactct tcgtacgtaa aaggctccat ctacggcaat 1620 gaattcctca cctctcatac cgatttcgcc attccggatt acggaaattc ccctcttcag 1680 ttcgttaatc agttgggctt ctcggatgag gaatggaacc gagctggcaa ggtgaccgtt 1740 ctccgcgcat ccgtcatgac cccatacatg aataaggaag aacacttcga agaatacgct 1800 gagaaaatca aagcagccct ccaagaaaaa cttgaaaaga tctacgctga tcagctcctt 1860 gctagcgagg ctaaa 1875 <210> 102 <211> 1530 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 102 atggacgcca ctaacatctc ggcctctgaa caagagaaaa ttctgggcaa tctctggaaa 60 gccgcgcaag gcccgggtga aggccacgtc ctgccgactg tggatcagct caaccgcgcc 120 cgcgcaagcc tttataattc cttgcctgag gagggcgtcg gctatcagtc ggttcagcgc 180 cacattctgg acgatatcgt cccagccttc aatggcggct ccatcaatcc aaactattac 240 ggctttgtga caggcggtgt aaccccagcg gctctgttcg cagatgcggt tgtgtccgca 300 tacgatcaga acgtccaagt tcatctgcag tcccactcaa tcgtcactga cgtcgagttc 360 aagaccttgg gcctcctgct ccagcttctc aagcttgacg tcccatcgtg gttgaacggc 420 acctttacta cgggcgccac cgcgtctaac atcattggct tggcatgtgg ccgagaattc 480 gtcatccaga aggcggctca gcgtaagggc tctccgatca aatccaccgc agatgctggt 540 cttcacgaag tcctgcaatc gattggagct tccggcatcc aggtcctgtc caccctcccg 600 cactcgtcac tggtcaaggc agccggagtc ctgggcatcg gtcgtatgaa cgttcgcgat 660 atctctactg aagctaaccc attggatatc gaccttaaga agctccagac ggagctctca 720 cgtgtcgatg tcgtgtcgat tgttgccatt agctgtggcg aggtcaactc cggacgtttc 780 gcatccgcgg gactgcatga attgcgtaag atccgccaac tctgcgaccg ccatggcgcc 840 tggctccacg ttgacggcgc tttcggaatc tttggccgct tggttggtga tgacacggaa 900 tttatggcta ttaaggaggg atgtgatggt attgagctgg cagactctat caccggagac 960 gcccacaaat tgctgaatgt tccgtacgac tgcggcttct tcttctgccg ccacgcctct 1020 attgcacgag aagtgtttca aaacgccaac gcagcttatt tggcttcagt tgacggccgc 1080 gattccttta ttccgtcccc actgaacatc ggaattgaga actctcgccg ctttcgcgct 1140 cttcctgtgt atgcgtcgtt gctggcctac ggtgaagtgg aataccgaaa gatgcttcat 1200 cgccagattc gcttggcccg tatgatctac ggctggatct tcgaccatcc gggatacacc 1260 gcactcccag aaaccacctc tcgtgaggaa ctgcttgatt tgacttacat ggttgtgctc 1320 ttccgtgcca aagatggcgg attgaaccga acgctcgaag ccaaaattaa cgcgacgtca 1380 cgaatgtttg tttctggcac ctcctgggcc gacgcaccgg cctgccgcat tgcaatctca 1440 aactggcgcg ttgatgaaaa gcgtgacttt gccctcgtca ccggtgtgtt ggagtccgcc 1500 ttgcgctcaa gcggtagcgc agtctcttgt 1530 <210> 103 <211> 1089 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 103 atgctgaata agggcttggc ggaagaagaa ttgttttcct ttctctctaa aaagcgtgag 60 gaagacctct gccactcaca cattctctcg tccatgtgta ccgtgcccca cccgattgcg 120 gttaaagcac acctcatgtt catggaaacc aacttgggcg acccaggcct tttcccgggc 180 accgcgtcac tggagcgcct gttgattgaa cgccttggtg acctgttcca ccaccgcgag 240 gcaggtggct acgctacctc cggtggaaca gaatctaata tccaagctct gcgaattgca 300 aaagcacaga aaaaagtgga caagcccaat gtggtgatcc ccgagacttc ccatttctcg 360 ttcaagaaag cttgtgatat tctgggtatt caaatgaaaa ctgtgcccgc tgatcgctct 420 atgcgcacgg atatctctga ggtctcagat gctatcgaca agaatactat cgccctcgtg 480 ggaattgccg gctccaccga gtatggtatg gtcgacgata tcggtgcact ggcgacaatc 540 gcagaagagg aggacctcta cctgcatgtc gatgccgcgt tcggaggcct ggtgatcccg 600 tttcttccaa atcctcccgc gtttgatttc gcgcttccag gcgtgtcgag cattgcggtg 660 gatcctcaca agatgggcat gtctactttg cctgctggcg ctctgctggt ccgcgagccg 720 cagatgctgg gcctgttgaa tatcgatacc ccgtacttga cggtgaagca ggagtataca 780 ctggcaggca cgcgcccggg tgcatccgtg gccggcgcac tggcagtctt ggactacatg 840 ggccgcgatg gaatggaggc ggtggtcgcg ggttgcatga aaaacacttc ccgcctcatc 900 cgaggtatgg agacacttgg atttcctcgt gcggtgacac cagatgtaaa tgtcgccacg 960 ttcatcacta accacccggc cccaaagaac tgggtcgtgt cccagactcg ccgcggacat 1020 atgcgaatta tttgcatgcc acatgtcaca gctgacatga ttgagcaatt cctgatcgac 1080 attggtgaa 1089 <210> 104 <211> 1152 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 104 atgggaatgg atatttcatc acgcccagtg gagtgggcgt ctctctctga gattaccgct 60 agcgacgtct cattcgaggg cggcgctatc tttaattcga tctgcacgcg cccgcacccc 120 ctcgcagccc aggttatggc cgataacctt caccttaacg cgggagatgg ccgtttgttc 180 ccgtctgtcg cccgttgcga atccgaaatt acgaacttcc tgggcggcct gatgggcttg 240 ccccgcgccg tcggcatgtg cacatctggc gcaaccgaag caaacctcat tgctgtccac 300 tccgcgattg agaattggcg ccgcaaaggc ggacagggtc gcccacaagt tatcctgggt 360 cgtggtggtc acttctcctt cgacaaaatc tctgttctgt tgggcgtcga gttggtcctg 420 gcatggtcag atatcgacac tcttaaggtc gatccagaat ctgtgtcaga actgattagc 480 ccacgtactg cgctcatcgt tgccacagcg ggctcgagcg aaaccggtgc agtcgatgac 540 gtggagtggc tgagccgcgt ggcactgtct aagggtgtcc ccctgcacgt ggatgccgca 600 tccggtggct tgctgatccc cttcctccgc gatttgggtg gagctctccc tgatatcggt 660 tttcgtaatg acggtgtaac caccatcgcc atcgatccac ataagtttgg ctccgctcca 720 attccgtcag gccacctggt cgcacgcgaa tggacttgga tcgagggcct gcgcaccgag 780 tctcattatc agggaacggc ccgccacttg accttcctcg gtactcgctc cggaggctca 840 attctcgcaa cctatgcact gttcggccac cttggtgaaa aaggattgcg cggcatggct 900 gaacagctca aggcgctccg ctcccacctg gtcgaccgtc tccgcaaggc tggagctacc 960 ttggcctacg tccctgaatt gatggtggtg gctctcaagg cggattctga tgcggtcaaa 1020 gtactggaac gccgcggcat ctttacctca tacgcgaaac gcttgggtta tctccgcatt 1080 gttgttcagc tgcatatgtc tgaaggccaa gtggacggct tggtcgatgc tctcctcatg 1140 gaaggaattg tt 1152 <210> 105 <211> 1542 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 105 atgggatcta tcgacaacct taccgagaaa ttggcctccc aattccctat gaatacactt 60 gaaccagagg agtttcgccg ccaaggacac atgatgatcg acttcttggc cgattattac 120 cgtaaggttg aaaattaccc cgttcgctcg caagtttcgc ctggatatct gcgcgaaatc 180 cttcctgaat ccgcacccta caaccctgaa tcacttgaaa ccatcctgca ggacgtccaa 240 acaaaaatca ttccgggcat tacgcactgg cagtctccaa acttcttcgc ttattttcct 300 tcctctggca gcaccgcagg attcctgggc gagatgctgt caaccggctt caacgtagtg 360 ggatttaatt ggatggtatc tccagcggct acggaactgg aaaacgttgt caccgattgg 420 tttggaaaaa tgctccaact tccaaaatcc tttcttttct caggcggtgg aggcggtgtg 480 ctgcagggca ctacctgtga agcaattctg tgtactctgg ttgccgcccg cgacaagaac 540 ctccgccaac atggcatgga taacattgga aaacttgtcg tgtactgttc cgatcaaacg 600 cactccgccc tgcagaaggc tgccaaaatt gcgggtatcg atccgaaaaa ttttcgcgcg 660 attgaaacaa ccaagtcttc aaacttccag ttgtgcccaa aacgcctcga atccgcgatc 720 ctccatgatc tgcagaacgg tttgattcct ttgtacctgt gcgccaccgt gggaaccacc 780 agcagcacaa ccgttgaccc tctcccagca ctgaccgaag tggcgaaaaa gtatgatctg 840 tgggtgcacg ttgacgcggc atacgcgggt tcagcgtgca tctgccctga attccgacag 900 tacttggacg gtgtggagaa cgctgattcg ttcagcctga acgcccacaa gtggttcctg 960 accaccttgg actgctgttg cctctgggtc cgcaatcctt ccgcccttat caagtcgttg 1020 tccacttacc cggaattcct gaagaacaat gcatccgaga ccaataaggt cgtggattat 1080 aaagactggc agattatgct gtctcgccgt ttccgcgcac ttaagctttg gttcgtactg 1140 cgttcctacg gcgttggcca actgcgcgag tttatccgcg gtcacgttgg aatggcaaag 1200 tactttgaag gtctggtcaa catggacaag cgctttgagg tcgtagctcc tcgcctcttc 1260 agcatggtgt gtttccgcat taagccatcc gcaatgatcg gtaagaatga cgaagatgag 1320 gtgaacgaga tcaatcgcaa gcttctcgaa agcgtgaacg actcaggccg tatctacgtg 1380 tctcacactg tgctgggtgg tatctacgtg attcgctttg cgattggcgg tacccttacc 1440 gatatcaatc acgtgtctgc agcttggaaa gtactgcaag accacgcggg cgctctgctt 1500 gatgatacct tcacatccaa caaactcgtg gaggttctgt cc 1542 <210> 106 <211> 1551 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 106 atggaacgaa accacctcaa agattctgtc ggcgtacagg tggacgatgg tcactcgaag 60 gagctctggg aaaccgcgct caatccacca cgtcgatctg tactgccacc ggccgcatcc 120 ctggctcaca gccgctcatc aattatcacg gaactgccac atgctggaca aggttacaca 180 caaaccaaag tgcatctgtt taatgatatc atcccaggct tgaacgattg tgccatcaac 240 gctaactatt acggtttcgt caccggtgga gtcaccccgg cagcactgtt ggcagacaat 300 gtcgtaagcg tttacgatca aaacgtttgc gttcacctgg ttgaccactc cgtagcaacg 360 gacgtcgatt acgcggccct gtgcctgttg aaagatctct tcggtcttaa gcgcgatgaa 420 tggccacacg gcatcttcac caccggcgct accgcgtcta accttgttgg actcgcgtgt 480 ggtcgagagt atgtgctccg caaagcggcc cagaagcgcg gcctgtcagg caatatcgca 540 tccggcaaca ttaccgactc ggtcggagaa tacggtatgc cagcagttct ggaggcagct 600 ggtttgaaag gtctccaagt tttgagcacc atgccacact cttccgtagg caaagtcgca 660 ggcatcctcg gcatcggtcg cgccaacgtt aaatctattg tttccaagac cggagaatcc 720 cacggccagc cactcgagtt cgacttcgaa ttgttcgaaa aagaattggc acgcgccggc 780 tttgcttcaa ttgtttccat cagctgcggt gaagtcaata ctggccgctt tgcaacaaag 840 ggtgtggatg agttccgccg tgtacgcgca ctgtgtgata aatataatgc gtggctccac 900 gtcgatgctg cgttcggcat gttcggtcgc gttttggacg attcccccga gtttgagact 960 attaagaaag gttccgaagg catcgaattg gctgattcga tcaccggtga tggtcacaaa 1020 ttgctgaacg tcccttacga ttgcggcttc ttcttctcac gccatggcga catcgctgaa 1080 gaggttttcc gcaatcccaa cgcggtttat ttgagctctt ccgcgggcga gcacatcccg 1140 actccgctga atattggcgt ggagaattct cgccgctttc gtgctctccc agtttattca 1200 accctcgtgg cttatggcaa ggatggctac cgcgctatgg tggaacgcca gattcgcctc 1260 gcacgcctga tcactggttg gttgcacgag catcctaagt acaccgtgct gggcggcggt 1320 gcatctaaag aagatttgat cgctgctact tatgtaatcg tgctttttcg tgcgaaggat 1380 gaagctctca atgcacgcct cgcatctgct attaatggta ccggaaagat gtttgtctct 1440 ggcaccaagt gggctggtga accagcctgc cgcgtagcta tcagcaactg gaaggtccaa 1500 gtggaacgtg acttcacctt ggtaaaggag gtcttggatg aggtctcgcg c 1551 <210> 107 <211> 1443 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 107 atgcccgact tggaaccgga tgaattccgc cgccaaggtc accagctggt ggattgggtt 60 gctcgatacc gaacctcact gccgtccctg cacgtccgcc cgaaggtggt gccaggaagc 120 gtaaaggccc aactgcctcg agagctgcca gaacagccat ctcaagcgct cggagatgat 180 ttgatcgctc tgttgaacga cgtagtcgtg ccatcctcac tccactggca gcatcccggc 240 ttcttcggct acttcccagc gaacgctagc cttctctccc tgctcggcga tattgcgtcc 300 ggcggcattg gcgcgcaggg aatgctgtgg tccactagcc ctgcaggtac cgagattgaa 360 caggtgctcc ttgacggctt ggccgatgca ctgggtctgg gtcgtgagtt caccttcgcg 420 ggtggtggag gcggctcgtt gcaggactct gcctccagcg cttcattggc ggcactcctc 480 gcggctctgc aacgcagcaa tcccgactgg cgcgaacacg gcgtcgatgg aacagaaact 540 gtttacgtga ctgctgagac tcattcgagc ctggctaagg ccgtgcgcgt tgcaggtctc 600 ggcgcgcgcg ctttgcgaat tgtgcccttt acacaaggaa ctttgtcgat gtcggccgat 660 gcgctcgcag atatgctggc aaaggatact gctgctggca aacgccctgt gatggtttgt 720 ccgaccgtag gcaccactgg caccggtgcc atcgatccgg ttcgagaagt agcactcgcc 780 gcgcgcacct atgaagcgtg ggttcacgtg gatgcggctt gggctggcgt cgcagccctt 840 tgcccggaat ttcgctggct tcttgacggt gtcaatctcg tggactcatt ttgcaccgac 900 gcgcacaagt ggttctacac cgcatttgac gccagcttca tgtgggttcg tgatgcacgc 960 gcgttgccaa ccgctctctc aattaccccg gagtacctgc gtaacgccgc gaccgaatcc 1020 ggagaagtca ttgattaccg tgactggcag gtccctcttg gccgccgcat gcgcgctctc 1080 aagatctggt ccgttgtaca tggcgcaggc ctcgaaggct tgcgtgagtc gattcgcggc 1140 cacgtggcca tggccaatag cctggcggga cgcattgaat ccgaaagcgg cttcgctctc 1200 gcaacccctc cgtcccttgc tctggtctgt ctgtacttgg tggaccaaga gggacgccct 1260 gacgatgctg ccaccaaggc ggcaatggaa gccgtcaacg cggaaggtca ctcattcttg 1320 actcatacca gcgtcaatgg acatttcgcc attcgcgtgg caatcggcgc taccaccacg 1380 ctccccgatc acatcgatac tctgtgggac tctttgtgta aagcggcgcg ccagtcaggc 1440 ggt 1443 <210> 108 <211> 1410 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 108 atgacgccgg aacagttccg ccagtatggt caccaactta tcgacttgat tgcggattac 60 cgccaaaccg tgggcgaacg accagtgatg gctcaggtgg aaccgggcta cctcaaagcc 120 gcgcttccgg cgaccgctcc gcagcagggc gaaccattcg ccgcgattct tgatgatgtc 180 aacaatcttg ttatgcctgg cctgagccac tggcaacacc ctgacttcta cggctacttc 240 ccatctaatg gtactctgtc atctgtgttg ggcgacttcc tgtccaccgg cctgggcgtg 300 cttggcttgt cgtggcaaag ctccccggca cttagcgaac tggaggaaac aaccctggat 360 tggttgcgac aactcctggg tctgtcagga cagtggtctg gtgtgattca ggacacagca 420 tctacatcca cgctcgtggc cctgatttct gcacgagagc gtgccaccga ctacgctctg 480 gtgcgcggcg gcctgcaggc tgagccaaag ccattgatcg tttatgtttc cgcgcatgct 540 cactccagcg tggataaagc ggcactcctg gcaggattcg gccgcgataa catccgcctg 600 atcccgacgg acgaacgcta cgccctccgt cccgaggctc tgcaagcggc aatcgagcag 660 gatctcgcgg cgggtaacca gccatgtgca gtggtcgcta ccaccggaac aaccactacg 720 accgccctgg atcccctccg ccctgttggc gaaatcgctc aggccaatgg actctggctc 780 cacgtcgata gcgccatggc aggatccgca atgatcctgc cggaatgtcg ctggatgtgg 840 gatggcatcg aactggctga ttctgttgta gttaacgccc acaagtggct gggagtcgcg 900 tttgactgct ccatttatta cgtgcgcgac ccacagcacc tgattcgagt gatgagcacc 960 aacccctctt acctccagtc cgccgtggat ggtgaggtga aaaacctgcg tgattggggc 1020 atcccgttgg gacgtcgctt ccgcgcgctg aaactttggt ttatgctccg ctcagaagga 1080 gtggacgctc ttcaggctcg cttgcgtcgt gacttggata acgcgcagtg gctcgcagga 1140 caggtggaag cagcggctga atgggaggtt ctggctccag tacagttgca gaccttgtgt 1200 attcgccacc gacctgccgg tcttgaagga gaagcgttgg acgcccacac aaaaggctgg 1260 gccgagcgtt tgaacgcatc tggtgcggca tacgtcacac cagccaccct tgacggacgt 1320 tggatggtgc gcgtgtctat cggagccctg cctactgaac gtggtgatgt gcagcgcctg 1380 tgggcacgac ttcaggacgt tatcaaagga 1410 <210> 109 <211> 1725 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 109 atgactggcc acatgacacc tgaacagttc cgccagcatg gtcatgaagt ggtcgattgg 60 attgcagatt actgggaacg aatcggttcg tttcccgtgc gtagccaggt ctctcccggc 120 gacgtgcgcg cttcactgcc acccaccgcg cccgagcaag gcgaaccatt ctctgcagtt 180 cttgccgacc tggaccgcgt ggtgctgccg ggcgttaccc actggcaaca tccaggtttt 240 ttcggttact tccccgcaaa cacatccggc ccctccgttt tgggagattt ggtatctgca 300 ggcctgggag ttcagggtat gtcgtgggtc acctcccctg cagcgactga actggagcaa 360 cacgtgatgg attggtttgc ggaccttctc ggccttccag aaagctttcg ctcgacgggt 420 tccggaggcg gagtggtgca agattcctct tctggtgcaa acttggtggc cctgttggcg 480 gcactccacc gcgcttccaa aggcgctact ctccgccatg gtgtccgccc cgaagatcat 540 acagtgtatg tctcggcaga gacacacagc tcgatggaga aggccgctcg catcgcagga 600 cttggaaccg acgctattcg cattgtggaa gtgggtcccg atctggcaat gaatccacgt 660 gcgcttgccc agcgcctcga gcgcgatgtg gctcgtggtt acacgcccgt gctggtttgt 720 gcaaccgtgg gcaccacgag caccactgca attgaccctc tggcggaact cggtcctatt 780 tgtcagcagc acggcgtttg gctgcatgtg gacgccgcgt atgcgggcgt gtccgcggtg 840 gcccctgaac ttcgcgcctt gcaagcagga gttgagtggg cagattccta tacgacagat 900 gcccacaagt ggctgctgac cggcttcgac gcaacgttgt tctgggtggc agaccgcgca 960 gctctcaccg gcgcgttgtc catccttcct gaatatctcc gcaacgccgc gaccgatact 1020 ggcgccgttg ttgattaccg cgattggcag attgaattgg gccgtcgatt ccgtgcgctt 1080 aaactctggt ttgttgtgcg ttggtacggt gcagagggct tgcgcgagca tgtccgctca 1140 cacgtcgccc tcgctcaaga actggctggc tgggcagatg ctgatgagcg ttttgatgtc 1200 gcggcccctc atcctttttc gctggtatgc ctgcgtcccc gttgggcccc cggcattgat 1260 gcagacgtcg caacgatgac gctcctggac cgcttgaacg acggtggcga ggtgtttctg 1320 actcatacaa ccgtggatgg cgcggctgtt ttgcgtgtcg cgattggcgc cccggccact 1380 acacgcgaac acgtcgagcg tgtgtgggcc ctcctcggag aggcacacga ttggttggct 1440 cgcgacttcg aggagcaggc ggccgaacgc cgcgctgcgg aactgcgcga acgagaagca 1500 gctgaggagc agctgcgcgc tcgacgcgag gcagaagctg ccgcggctgc cgctaccgaa 1560 gctccagtcg aaccagcggc ggaagagccg gaacagctcg tcgtgccacc tgtggaggtc 1620 ccagctgtcg aaaccccagc agcttgggat gaatcggcga ctcaggtggc cgcacagact 1680 gatctccacg cggatccagc accccaacca gctgatggac aaggc 1725 <210> 110 <211> 1554 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 110 atgggttcac tgccagccaa caatttcgaa tccatgtcgc tgtgttccca aaatcccctt 60 gatccagatg agttccgacg ccagggtcac atgattatcg atttcttggc tgactattat 120 aagaacgttg aaaagtatcc agtccgtacc caagtcgacc ccggttactt gaaaaaacgc 180 cttccagaat cggctccata caatcccgag tctatcgaaa ccattcttga ggatgtgact 240 aatgatatca tcccaggact gactcactgg cagtccccca actatttcgc gtattttccg 300 tcgagcggct ccattgccgg atttcttgga gaaatgctgt caaccggctt caacgtggtt 360 ggtttcaact ggatgtcctc accagcagcc accgagcttg agagcatcgt catgaactgg 420 cttggccaga tgctcacctt gccaaagtcc tttctcttct cctccgatgg ttcctctggt 480 ggaggcggtg tcctccaggg cacgacctgc gaagcaatcc tttgtaccct gaccgccgcg 540 cgagataaga tgctcaacaa gattggacgt gaaaacatta acaagttggt agtctatgct 600 tcagatcaga cccttagcgc gcttcaaaaa gctgcgcaga ttgctggcat caaccccaag 660 aacttcttgg ccatcgcaac ctcaaaagct accaacttcg gactctctcc taactcgctt 720 cagagcacca tcctggctga tatcgagtca ggcttggttc ctttgttcct gtgtgccaca 780 gtgggtacta ccagctccac cgcagtggac ccaatcggcc cactgtgcgc cgttgctaag 840 ctccacggca tttgggtgca tatcgatgct gcgtacgccg gtagcgcatg catttgccct 900 gaatttcgcc atttcatcga tggagtggag gatgccgatt ctttctcact taacgcacac 960 aaatggttct ttaccactct cgattgttgt tgtctgtggg taaaggatag cgacagcttg 1020 gttaaggctc tctccacatc gcccgagtat ctgaagaata aggccacgga ttccaaacag 1080 gtcattgatt acaaggattg gcaaatcgct ctttcccgtc gcttccgcag catgaagctg 1140 tggctggtgc tgcgctccta cggaatcgcc aatctccgta cctttctgcg tagccacgtt 1200 aaaatggcca agcacttcca aggcctcatt ggaatggaca atcgctttga aattgttgta 1260 ccacgtactt ttgcaatggt atgcttccgc ctgaagcccg cagcaatctt tcgcaagaaa 1320 attgttgaag acgatcacat cgaagcgcag accaacgagg tgaatgcaaa gcttcttgag 1380 tccgtgaacg cctcaggaaa gatttacatg actcacgcgg tggtaggagg agtatatatg 1440 attcgcttcg ccgtgggtgc cactctgacc gaagaacgcc acgtgaccgg cgcatggaag 1500 gtggttcagg aacacacgga cgcaatcctg ggcgcgttgg gcgaggacgt ttgc 1554 <210> 111 <211> 1254 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 111 atgaagcaga ttcctgctaa gggtttggaa cgtgacgtca tcatgcagga gctgcgccaa 60 atgaagtctt tggactttga ttggcgcgcc ggtcgtgtgc cttcctacac ctatttcgtt 120 gatgacgaaa cccttgatgt gcaacgtgaa gcttacggag aatacattgc agagaacggc 180 ctgggtgccg gccgcgcgtt caaatcgctc gaactgatga cggacgatat taaaagcatg 240 gctatttccc tgtttaatgc cccggcagct gccggtgcat cgttcacctc tggcggcact 300 gaatccattt ttatggccgt aaagacagca cgagacctta cacgccaccg acgcggcgaa 360 cctgacggac gctataacat tgtggcctgc gaaaccgcac acccttgtct ggataaagcc 420 ggtcaattgc tgggagttga tattcgccgc accccgcaca ctgctgagtt ccgagcagat 480 ccagcactct tgcgaacttc gatcgatcaa aagaccatga tgctgtttgc atctgcacca 540 aactacccat tcggtacttt cgatcctatc tccaagattg gccgcttggc ccaggagcgc 600 gatttgcgtc tccacgttga tggctgctgg ggaggcttcc tgagcccatt cgctgagcgc 660 ctgggctacc ccatcccgga atgggatttt cgtgtaccag gagtttctag cctgtccgct 720 gatattcata aattcggtta cgccgctaag ggagcatctg ttgtcttgta ccgcgatgtc 780 gaagatcagg aacacgaacg cttttctttc tccggctggc ctcgtggcac ctacagcacc 840 ccgaccttcc tcggaaccaa ggccggcggc gcaatcgcct cggcatgggc tgtaatgcat 900 ttcctcggag ttgaaggcta cctgcgtgca gccaagctga ccatggatgc caccatgcaa 960 ttgattgaag gcctcaatgc cattccagat atctactgtc ttacgccaaa cggtgagtct 1020 aacctcatct ccttcgctac ttccgatccg aaacttgata tttacgcagt agcagaccgc 1080 ctcgaggagt gtggttggct gcgaggacgt atgcgcgaac ccaaggccat ccagcaggga 1140 gtgaatcctg cacacttggc tacagttacc gagtacctgg ccgaagtgcg caaggcaatc 1200 gatcatgtcc gcggtaacgt cgctgccccc gtggcctacg atgagcactc ctac 1254 <210> 112 <211> 1593 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 112 atgggttctc ttaatacaga agatgttttg gagaatagtt cagcatttgg tgtaactaat 60 ccccttgatc ctgaagaatt cagaagacaa ggacatatga tcatagattt tcttgctgac 120 tattatagag atgtggagaa atatccggtg agaagtcaag tggagcccgg ttatttaaga 180 aaaagactgc cagaaaccgc cccgtacaat ccagagtcca tcgagaccat attacaagat 240 gtaacaactg agattattcc aggtctaacc cattggcaaa gtcctaacta ttacgcctac 300 tttcctagct ccggtagcgt cgccggcttt cttggtgaaa tgttatccac cggtttcaat 360 gttgttggat tcaattggat gagttcacca gccgctactg aattagaatc cgtggttatg 420 gactggtttg gaaaaatgtt gaacctgccg gagtcatttc ttttctctgg aagtggtggt 480 ggcgtgttgc agggtactag ttgtgaagca attttatgca ctttgacggc agcaagagat 540 agaaagctta ataaaattgg tagagagcat atcggtagat tagtagtcta cggatcagac 600 cagactcatt gtgctttaca aaaggctgca caagtcgctg gcatcaatcc taagaatttc 660 agagcgatta agacgtttaa agaaaactcc tttggtttga gcgcagcaac tctaagagaa 720 gtgatcctag aggacatcga ggcagggttg ataccactgt ttgtttgccc tacagtgggg 780 accacttcta gcaccgccgt tgatcctata tctccgatct gtgaagtagc taaagaatac 840 gaaatgtggg tacacgtaga tgcagcttac gctgggtcag cctgtatttg cccagagttt 900 agacatttta ttgatggtgt cgaagaagcg gacagttttt ctcttaatgc tcataagtgg 960 tttttcacta ctttggactg ttgttgtttg tgggttaagg atccatctgc tctagttaaa 1020 gccctatcca ccaatccgga gtatttgaga aataaggcaa cagaatcaag acaagtcgta 1080 gattataaag actggcaaat agccctgtcc agaaggttca gatcattaaa gttatggatg 1140 gttctgagga gctatggcgt caccaatttg agaaattttt tgagaagcca cgtcaagatg 1200 gcaaagactt ttgaaggact gatctgtatg gatggtaggt ttgaaataac tgttcccagg 1260 acttttgcaa tggtttgttt tagattgctg cccccaaaaa caataaaagt atatgataac 1320 ggcgtgcatc aaaacggtaa cggggtagtt cctttgagag acgagaacga gaacctggtt 1380 ttagcgaata aactaaatca ggtttacctt gagactgtta acgctacggg atctgtatat 1440 atgacacatg ccgttgtagg tggcgtgtac atgatccgtt ttgctgtggg atccacccta 1500 acggaagaaa ggcatgtgat ctacgcttgg aaaatattac aagaacacgc cgacttgatt 1560 ttaggtaaat ttagtgaagc agacttttct tca 1593 <210> 113 <211> 1491 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 113 atggaaggag tgggaggtgg tggaggcggc gaggagtggc tgcgccccat ggatgccgag 60 cagctgcgtg agtgcggaca ccgaatggtt gacttcgttg ctgattacta caaatccatc 120 gaagcattcc cagtgctgag ccaggtccag cccggatacc ttaaggaagt tctcccggac 180 tcagcccctc gtcaacccga taccttggac agcctcttcg atgatattca gcagaagatc 240 atccccggtg tgacccattg gcaaagcccg aactacttcg cttattatcc cagcaactcg 300 tcgactgcag gttttctggg cgaaatgctg tccgcagcat tcaacatcgt cggcttttct 360 tggatcacga gcccggccgc aaccgaattg gaagttattg tcttggattg gttcgctaag 420 atgttgcagc ttccatccca gtttttgagc accgctctcg gcggcggcgt catccagggc 480 acggcatccg aagccgttct cgtggccctc ttggctgccc gtgatcgcgc gcttaaaaaa 540 cacggcaaac attccctgga aaagctcgtc gtgtatgcat ccgaccagac gcattccgcc 600 ctccagaagg cttgccaaat tgcaggtatt ttctccgaaa atgtccgtgt ggtcatcgcc 660 gattgtaaca agaactacgc ggtggccccc gaagctgtct ctgaggcact tagcatcgac 720 ttgtcgtccg gacttatccc ctttttcatt tgtgcaactg tgggcacaac ctcttcctcc 780 gccgttgatc cattgccaga gctcggtcag attgccaaga gcaatgacat gtggttccac 840 atcgacgcag cgtacgctgg ctccgcatgt atctgtccag aatatcgtca ccacctgaat 900 ggcgtggaag aggctgattc gttcaatatg aatgcccaca agtggtttct gactaacttt 960 gattgttccc tcttgtgggt taaagaccgt tcatttctga tccaatctct gtccaccaac 1020 cctgagttcc tgaaaaacaa ggccagccag gccaactccg tcgtggactt caaagactgg 1080 cagattcctc tgggtcgccg cttccgctct ttgaagttgt ggatggttct tcgactctat 1140 ggagtggata accttcaatc gtatatccgc aagcacatcc acctcgccga gcattttgaa 1200 cagctccttc tgtcagactc ccgctttgaa gttgtcaccc cacgaacctt cagccttgtc 1260 tgctttcgtc ttgtgccacc aacgtccgat cacgaaaatg gtcgcaagct taactacgat 1320 atgatggatg gcgttaacag ctccggtaag atctttttga gccacactgt attgtcgggc 1380 aaatttgtac tccgcttcgc agttggcgct ccattgactg aggaacgcca cgttgatgcg 1440 gcatggaagc tgctccgcga cgaagcgacc aaagttttgg gaaaaatggt c 1491 <210> 114 <211> 1188 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 114 atgagaaata tgcaagagaa aggtgtctcc gaaaaggaaa ttttagagga gttgaagaaa 60 tataggtcat tggacttaaa gtacgaggac ggtaacattt ttggtagtat gtgttctaac 120 gtattaccaa tcaccaggaa aattgtagat atctttcttg aaactaattt gggtgaccca 180 ggtttattca aaggtactaa gttattggaa gaaaaggctg ttgctttgtt gggttcttta 240 ttaaataaca aagatgccta tggccatatc gtttccggtg gtacagaagc taatttgatg 300 gcccttaggt gtattaaaaa tatctggagg gagaagagac gtaagggtct gtctaagaac 360 gagcacccca aaattatcgt tcctattaca gctcatttta gtttcgaaaa aggtagagaa 420 atgatggatc ttgaatacat ctatgctccc ataaaagaag actataccat tgacgaaaag 480 tttgttaagg atgctgtcga agattatgac gtcgacggca ttatcggtat tgcagggact 540 acagaattgg gtactattga taatatcgaa gagctatcta aaattgctaa agaaaataac 600 atatacatcc atgttgatgc ggcatttggt ggactggtta tccctttttt ggatgataaa 660 tacaaaaaaa aaggagtgaa ttataaattt gatttctcat taggtgtaga ttctataaca 720 atcgacccac ataagatggg ccattgtcct ataccttctg gtggcatcct atttaaggat 780 attggttata aacgttattt ggacgtcgat gccccatatt taactgagac cagacaagcc 840 accattttgg gtacgagagt tggattcgga ggcgcgtgta cttacgctgt tttaagatac 900 ttagggagag aaggtcagcg taaaatagtt aacgaatgta tggaaaatac cctatacctg 960 tacaaaaaat taaaagagaa taattttaaa ccagtgatcg aaccaattct taatatcgtc 1020 gctattgaag atgaggacta caaagaagtt tgtaaaaagt taagggacag gggcatatat 1080 gtcagcgtat gtaattgtgt aaaagcttta aggatagtag ttatgccaca catcaaaagg 1140 gagcatattg ataattttat tgagattttg aattccatca agagagat 1188 <210> 115 <211> 1110 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 115 atgtcggaaa gcccaatgtt cgccgccaac ggcatgccaa aagttaatca gggcgccgaa 60 gaggacgtcc gcattttggg ctatgatccc ctcgcctccc ccgcactcct gcaagtacag 120 attcccgcca ccccgacctc tttggaaacc gcgaagcgcg gccgccgaga agcgattgat 180 attatcaccg gcaaggatga ccgagtactc gttatcgtcg gtccctgctc gatccacgac 240 ctcgaagccg cgcaggagta tgcattgcga ttgaagaagc tgtctgatga gttgaagggt 300 gatctttcga ttattatgcg tgcgtacctg gaaaagcctc gcaccaccgt gggttggaag 360 ggattgatca atgatcctga cgtaaacaac accttcaaca tcaataaggg cctccaatct 420 gcccgccagc ttttcgttaa cctcactaac attggccttc ccatcggctc cgaaatgctc 480 gatacgatct cgccgaaata cctggccgat ttggtgtcct ttggtgcaat tggtgcccgt 540 accaccgaat cacaactgca ccgcgaattg gcaagcggat tgagcttccc cgtgggtttc 600 aaaaacggta ctgatggcac tcttaacgtg gccgtcgatg catgtcaagc cgccgcacac 660 tcccaccatt tcatgggtgt gactaaacac ggagtggcgg cgattactac caccaagggt 720 aatgagcact gcttcgtcat cctgcgtggc ggaaagaagg gtaccaacta cgacgcaaag 780 agcgtcgctg aggccaaggc ccaattgcca gcaggttcca atggccttat gatcgattat 840 tcccacggca attctaataa ggactttcgc aaccaaccga aggtgaatga tgtggtatgt 900 gagcagatcg cgaatggtga aaatgcgatc actggcgtga tgatcgaatc gaatattaat 960 gagggcaacc agggaattcc tgcggaggga aaggcgggtt tgaagtacgg cgtatctatt 1020 actgacgctt gcattggctg ggagaccacc gaggacgtgc tgcgcaagct tgcagcggcg 1080 gtccgccagc gtcgtgaagt taataaaaaa 1110 <210> 116 <211> 1050 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 116 atgaattacc agaacgacga ccttagaatt aaggaaataa aagagttgct acctcccgtc 60 gcgctgttgg aaaaattccc cgccacagaa aatgctgcta atacggtcgc acatgctaga 120 aaggctattc ataaaattct gaaaggtaat gatgatagat tattggttgt tattggtcca 180 tgttctatac acgaccccgt agccgcaaaa gaatatgcta ccagactttt agctttacgt 240 gaagagttga aagatgaact tgaaattgtc atgcgtgtgt acttcgaaaa accgagaacg 300 accgttggtt ggaagggctt aatcaacgac ccacatatgg acaactcttt ccagatcaat 360 gatggcctaa ggatcgcacg taaacttcta ttagatatta atgattcagg acttcccgct 420 gcaggagaat tccttaatat gattactcct cagtatctag ccgacttaat gtcctggggt 480 gccatcggtg cgagaacgac agaaagtcaa gttcacaggg aactggcctc cggtttgtcc 540 tgtccagttg gtttcaagaa cggtacagat ggtaccatca aagtcgcaat tgacgccata 600 aacgccgccg gagctccaca ctgctttttg agcgtcacta aatggggaca ctcagccata 660 gtcaacactt caggtaacgg tgattgtcat attattctta gaggtggcaa ggaacctaac 720 tactccgcca aacatgttgc tgaagttaaa gaaggtctta acaaggcggg tcttccggcc 780 caagtgatga tagattttag ccatgccaac agctctaagc aatttaaaaa acaaatggat 840 gtttgtgctg atgtttgtca acaaatcgcg ggtggggaga aagcgatcat tggtgtaatg 900 gtcgaaagcc acttggttga aggcaaccaa agtttagaat ctggagagcc cttagcgtat 960 ggaaaaagca tcacagatgc gtgtataggt tgggaagaca ctgacgcctt actaagacaa 1020 ctagctaatg cagttaaggc ccgtagaggg 1050 <210> 117 <211> 1050 <212> DNA <213> Artificial <220> <223> Codon-optimized and/or mutated sequence <400> 117 atgaattacc agaacgatga tctccgcatc aaggaaatca aggagttgct cccaccggtg 60 gctctgttgg agaagtttcc agctactgag aatgctgcca acactgttgc tcacgctcgc 120 aaagcaatcc acaaaatcct caaaggcaat gatgaccgtc tgttggtcgt tatcggacca 180 tgctccattc atgaccccgt ggctgctaaa gaatacgcga cccgactctt ggctctgcgc 240 gaggagctca aggacgaact ggagattgtg atgcgcgtgt acttcgaaaa gccacgcacg 300 actgtgggat ggaaaggact gatcaacgac ccgcacatgg acaactcctt ccaaatcaac 360 gatggtcttc gcattgctcg caaacttctg ttggacatca acgattcagg actgcccgca 420 gcaggcgaat tccttaacat gatcacccct cagtacctgg ctgacctgat gtcctggggt 480 gcaatcggtg cgcgtacgac cgaatcccaa gttcatcgcg aactggcgtc aggtctctcc 540 tgcccggttg gcttcaaaaa cggaaccgac ggaacaatca aggtcgcaat tgacgccatc 600 aatgcggcag gcgccccgca ctgtttcttg tcggtcacca aatggggcca cagcgcgatc 660 gtcaatactt caggtaatgg tgattgccac atcatccttc gaggaggtaa ggagccgaac 720 tactccgcaa agcatgtcgc agaggtcaag gagggtctga acaaagctgg cctgcctgcg 780 caggttatga ttgatttctc tcacgcaaac agctcaaagc agttcaagaa gcagatggat 840 gtttgcgccg atgtgtgcca gcagattgcc ggaggcgaaa aggcaattat tggtgtaatg 900 gttgaatccc acctcgttga gggcaaccaa tccctcgaat ccggtgagcc gctggcctat 960 ggcaagtcca tcaccgatgc ctgtatcggt tgggaggaca ccgatgcact gcttcgccaa 1020 cttgctaacg ccgtgaaagc tcgtcgcggt 1050 <210> 118 <211> 1113 <212> DNA <213> Saccharomyces cerevisiae CEN.PK2 <400> 118 atgagtgaat ctccaatgtt cgctgccaac ggcatgccaa aggtaaatca aggtgctgaa 60 gaagatgtca gaattttagg ttacgaccca ttagcttctc cagctctcct tcaagtgcaa 120 atcccagcca caccaacttc tttggaaact gccaagagag gtagaagaga agctatagat 180 attattaccg gtaaagacga cagagttctt gtcattgtcg gtccttgttc catccatgat 240 ctagaagccg ctcaagaata cgctttgaga ttaaagaaat tgtcagatga attaaaaggt 300 gatttatcca tcattatgag agcatacttg gagaagccaa gaacaaccgt cggctggaaa 360 ggtctaatta atgaccctga tgttaacaac actttcaaca tcaacaaggg tttgcaatcc 420 gctagacaat tgtttgtcaa cttgacaaat atcggtttgc caattggttc tgaaatgctt 480 gataccattt ctcctcaata cttggctgat ttggtctcct tcggtgccat tggtgccaga 540 accaccgaat ctcaactgca cagagaattg gcctccggtt tgtctttccc agttggtttc 600 aagaacggta ccgatggtac cttaaatgtt gctgtggatg cttgtcaagc cgctgctcat 660 tctcaccatt tcatgggtgt tactttgcat ggtgttgctg ctatcaccac tactaagggt 720 aacgaacact gcttcgttat tctaagaggt ggtaaaaagg gtaccaacta cgacgctaag 780 tccgttgcag aagctaaggc tcaattgcct gccggttcca acggtctaat gattgactac 840 tctcacggta actccaataa ggatttcaga aaccaaccaa aggtcaatga cgttgtttgt 900 gagcaaatcg ctaacggtga aaacgccatt accggtgtca tgattgaatc aaacatcaac 960 gaaggtaacc aaggcatccc agccgaaggt aaagccggct tgaaatatgg tgtttccatc 1020 actgatgctt gtataggttg ggaaactact gaagacgtct tgaggaaatt ggctgctgct 1080 gtcagacaaa gaagagaagt taacaagaaa tag 1113 <210> 119 <211> 1110 <212> DNA <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 119 atgttcatta aaaacgatca cgccggtgac aggaaacgct tggaagactg gagaatcaaa 60 ggttatgatc cattaacccc tccagatctg cttcaacatg aatttccaat ttcagccaaa 120 ggtgaggaaa acattatcaa ggcaagagac tccgtctgtg atattttgaa tggtaaagat 180 gatcgtttag ttatcgtgat cgggccatgt tccctacatg accccaaagc cgcttacgat 240 tacgctgaca gattggctaa aatttcagaa aagttgtcaa aagacttatt gattattatg 300 agagcgtatt tagaaaaacc aaggactacc gttggctgga aagggttgat taacgaccct 360 gatatgaata actcttttca aatcaataaa ggtctacgga tttcgagaga aatgttcata 420 agactggttg aaaaattacc cattgctggt gagatgttgg ataccatttc tccgcagttt 480 ttgagtgatt gtttctcctt gggtgccatc ggtgctagaa ctactgaatc ccaactgcac 540 agagaattag catccggtct atctttccct attggattta agaacggtac tgatggtggt 600 ttgcaagtcg ccatcgacgc tatgagagcc gctgcacatg atcattactt cctttctgtc 660 acaaagccag gtgtcactgc tatcgtgggc actgaaggta acaaggatac cttcctgatc 720 ttgagaggtg gtaagaacgg tactaacttt gacaaagaaa gtgttcaaaa tactaagaaa 780 caattagaaa aggccggttt gactgacgat tcacagaaaa gaatcatgat cgattgttca 840 cacgggaaca gtaataaaga tttcaagaac caaccgaagg ttgccaaatg catttatgac 900 caactgacgg aaggtgaaaa tagtctttgt ggtgttatga ttgagtccaa cataaatgaa 960 ggtagacaag atattcctaa agaaggtggc agagagggat tgaagtatgg ttgttctgta 1020 acggatgctt gtattggttg ggagaccacc gaacaggtat tggagctatt ggccgaaggt 1080 gttagaaaca gaagaaaagc cttgaagaaa 1110 <210> 120 <211> 1110 <212> DNA <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 120 atgagtgaat ctccaatgtt cgctgccaac ggcatgccaa aggtaaatca aggtgctgaa 60 gaagatgtca gaattttagg ttacgaccca ttagcttctc cagctctcct tcaagtgcaa 120 atcccagcca caccaacttc tttggaaact gccaagagag gtagaagaga agctatagat 180 attattaccg gtaaagacga cagagttctt gtcattgtcg gtccttgttc catccatgat 240 ctagaagccg ctcaagaata cgctttgaga ttaaagaaat tgtcagatga attaaaaggt 300 gatttatcca tcattatgag agcatacttg gagaagccaa gaacaaccgt cggctggaaa 360 ggtctaatta atgaccctga tgttaacaac actttcaaca tcaacaaggg tttgcaatcc 420 gctagacaat tgtttgtcaa cttgacaaat atcggtttgc caattggttc tgaaatgctt 480 gataccattt ctcctcaata cttggctgat ttggtctcct tcggtgccat tggtgccaga 540 accaccgaat ctcaactgca cagagaattg gcctccggtt tgtctttccc agttggtttc 600 aagaacggta ccgatggtac cttaaatgtt gctgtggatg cttgtcaagc cgctgctcat 660 tctcaccatt tcatgggtgt tactaagcat ggtgttgctg ctatcaccac tactaagggt 720 aacgaacact gcttcgttat tctaagaggt ggtaaaaagg gtaccaacta cgacgctaag 780 tccgttgcag aagctaaggc tcaattgcct gccggttcca acggtctaat gattgactac 840 tctcacggta actccaataa ggatttcaga aaccaaccaa aggtcaatga cgttgtttgt 900 gagcaaatcg ctaacggtga aaacgccatt accggtgtca tgattgaatc aaacatcaac 960 gaaggtaacc aaggcatccc agccgaaggt aaagccggct tgaaatatgg tgtttccatc 1020 actgatgctt gtataggttg ggaaactact gaagacgtct tgaggaaatt ggctgctgct 1080 gtcagacaaa gaagagaagt taacaagaaa 1110 <210> 121 <211> 1500 <212> DNA <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 121 atgactttac ctgaatcaag agacttttct tacttgtttt cggatgaaac caatgctcgt 60 aaaccatccc cattgaaaac ctgcatccat cttttccaag atcctaacat tatctttttg 120 ggtggtggcc tgccattaaa agattatttc ccatgggata atctatctgt agattcaccc 180 aagcctcctt ttccccaggg tattggagct ccaattgacg agcagaattg cataaaatac 240 accgtcaaca aagattacgc tgataaaagt gccaatcctt ccaacgatat tcctttgtca 300 agagctttgc aatacgggtt cagcgctggt caacctgaac tgttaaactt cattagagat 360 cataccaaga ttatccacga tttgaagtat aaggattggg acgttttagc cactgcaggt 420 aacacaaatg cctgggaatc tactttaaga gtcttttgta accgaggtga tgtcatctta 480 gttgaggcac attctttttc ctcttcattg gcttctgcag aggctcaagg tgtcattacc 540 ttccccgtgc caattgacgc tgatggtatc attcctgaaa aattagctaa agtcatggaa 600 aactggacac ctggtgctcc taaaccaaag ttgttataca ctattccaac gggccaaaat 660 ccaactggta cttccattgc agaccataga aaggaggcaa tttacaagat cgctcaaaag 720 tacgacttcc taattgtgga agatgaacct tattatttct tacaaatgaa tccctacatc 780 aaagacttga aggaaagaga gaaggcacaa agttctccaa agcaggacca tgacgaattt 840 ttgaagtctt tggcaaacac tttcctttcc ttggatacag aaggccgtgt tattagaatg 900 gattcctttt caaaagtttt ggccccaggg acaagattgg gttggattac tggttcatcc 960 aaaatcttga agccttactt gagtttgcat gaaatgacga ttcaagcccc agcaggtttt 1020 acacaagttt tggtcaacgc tacgctatcc aggtggggtc aaaagggtta cttggactgg 1080 ttgcttggcc tgcgtcatga atacactttg aaacgtgact gtgccatcga tgccctttac 1140 aagtatctac cacaatctga tgctttcgtg atcaatcctc caattgcagg tatgtttttc 1200 accgtgaaca ttgacgcatc tgtccaccct gagtttaaaa caaaatacaa ctcagaccct 1260 taccagctag aacagagtct ttaccacaaa gtggttgaac gcggtgtttt agtggttccc 1320 ggttcttggt tcaagagtga gggtgagacg gaacctcctc aacccgctga atctaaagaa 1380 gtcagtaatc caaacataat tttcttcaga ggtacctatg cagctgtctc tcctgagaaa 1440 ctgactgaag gtctgaagag attaggtgat actttatacg aagaatttgg tatttccaaa 1500 <210> 122 <211> 1539 <212> DNA <213> Saccharomyces cerevisiae (strain ATCC 204508 S288c) (Baker's yeast) <400> 122 atgactgctg gttctgcccc ccctgttgat tacacttcct taaagaagaa cttccaaccg 60 tttctctcca gaagagtaga aaatagatct ctgaaaagct tttgggatgc ttctgatatc 120 tcagatgacg tcattgagct agctggtgga atgccaaacg agagattttt tcctatcgaa 180 tctatggatt tgaaaatatc aaaagttcct tttaatgata acccaaaatg gcataattcg 240 tttaccacgg cgcatttgga cttgggatcc cccagtgagc tacccattgc acgttctttc 300 caatatgcag aaaccaaggg tttaccccct ctcttacatt ttgttaaaga ttttgtgtcc 360 agaattaatc gcccagcctt ttccgatgag acggagtcta actgggatgt catcctttct 420 ggcgggtcca acgattcaat gtttaaggtt tttgaaacaa tttgcgacga atcgaccact 480 gtgatgattg aagagtttac tttcaccccg gctatgtcca atgtggaggc tacaggagca 540 aaagtcatcc ccatcaagat gaacctgacc ttcgacagag agtcccaggg tattgatgtc 600 gaatatctaa cgcagttgct cgataattgg tcaactggac catacaaaga cttaaacaag 660 ccaagggtcc tatataccat tgcaacgggc caaaatccta ccgggatgtc tgtcccccag 720 tggaaaagag agaaaattta ccagttggcc caaagacacg atttcctcat tgttgaagat 780 gatccctacg gttatctgta ctttccttcc tataatccgc aagagccatt agaaaaccct 840 taccattcta gcgacctgac tactgaacgg tatttgaatg attttttaat gaaatcattc 900 ttgactttgg atacagatgc ccgtgtcatc cgtttggaga ctttttctaa aatttttgct 960 cctggattaa ggttatcctt catcgttgct aataaattcc ttttgcaaaa aatcttggat 1020 ttggccgaca ttactacaag ggcccccagt ggtacctcac aagctattgt ttattctaca 1080 ataaaggcaa tggctgagtc caacttatcg tcctctcttt ctatgaaaga agcaatgttt 1140 gagggttgga taagatggat aatgcagatt gcttctaaat acaatcatag gaaaaatctt 1200 actttgaaag ccttatacga aacagaatct taccaagctg gtcagtttac cgttatggaa 1260 ccctccgcgg gtatgttcat cattattaaa atcaattggg ggaatttcga tagacctgac 1320 gatttgccgc aacagatgga tattttagat aagttcttgc tgaagaatgg tgttaaagta 1380 gtgcttggtt ataaaatggc tgtttgccca aattattcaa agcagaattc agattttcta 1440 agactcacca tcgcctatgc aagggatgat gatcagttga ttgaagcttc caaaagaatc 1500 ggtagtggca taaaagaatt ttttgacaac tataaaagt 1539

Claims

조작된 미생물 세포로서, 조작된 미생물 세포는
(a) 이종성 티로신 디카복실라제 (TYDC)를 발현하고;
(b) 조작된 미생물 세포는 티라민 생합성 경로의 하나 이상의 상류 효소(들)의 증가된 활성을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것인 조작된 미생물 세포.
제1항에 있어서, 하나 이상의 상류 효소(들)는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제를 포함하는 것인 조작된 미생물 세포.
조작된 미생물 세포로서, 조작된 미생물 세포는
(a) 이종성 티로신 디카복실라제 (TYDC)를 발현하고;
(b) 조작된 미생물 세포는 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 및 티로신 아미노트랜스퍼라제로 이루어진 군으로부터 선택되는 하나 이상의 효소(들)의 증가된 활성을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이고;
조작된 미생물 세포는 티라민을 생성시키는 것인 조작된 미생물 세포.
제3항에 있어서, 조작된 미생물 세포는
(c) 피드백-이상조절된 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제 또는 피드백-이상조절된 코리스메이트 뮤타제
를 추가로 발현하는 것인 조작된 미생물 세포.
조작된 미생물 세포로서, 조작된 미생물 세포는
(a) 이종성 티로신 디카복실라제 (TYDC)를 발현하기 위한 수단; 및
(b) 티라민 생합성 경로의 하나 이상의 상류 효소(들)의 활성을 증가시키기 위한 수단
을 포함하는 것인 조작된 미생물 세포.
제5항에 있어서, 하나 이상의 상류 효소(들)는 3-데옥시-D-아라비노-헵툴로소네이트-7-포스페이트 (DAHP) 신타제를 포함하는 것인 조작된 미생물 세포.
조작된 미생물 세포로서, 조작된 미생물 세포는
(a) 이종성 티로신 디카복실라제 (TYDC)를 발현하기 위한 수단; 및
(b) 디히드로퀴네이트 신타제, 디히드로퀴네이트 디히드라타제, 시키메이트 디히드로게나제, 시키메이트 키나제, EPSP 신타제, 방향족 펜타기능성 효소, 코리스메이트 신타제, 코리스메이트 뮤타제, 프리페네이트 디히드라타제, 프리페네이트 아미노트랜스퍼라제, 아로게네이트 디히드로게나제, 페닐알라닌 히드록실라제, 페닐알라닌 아미노트랜스퍼라제, 프리페네이트 디히드로게나제, 및 티로신 아미노트랜스퍼라제로 이루어진 군으로부터 선택되는 하나 이상의 효소(들)의 활성을 증가시키기 위한 수단
을 포함하고, 상기 증가된 활성은 대조군 세포에 비해 증가된 것이고;
조작된 미생물 세포는 티라민을 생성시키는 것인 조작된 미생물 세포.
제7항에 있어서, 조작된 미생물 세포는
(c) 피드백-이상조절된 DAHP 신타제 또는 피드백-이상조절된 코리스메이트 뮤타제를 발현하기 위한 수단
을 추가로 발현하는 것인 조작된 미생물 세포.
제1항 내지 제8항 중 어느 한 항에 있어서, 조작된 미생물 세포는 기질의 발효에 의해 티라민을 생성시키고, 기질의 적어도 50%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는 것인 조작된 미생물 세포.
제4항, 제8항 또는 제9항 중 어느 한 항에 있어서, 조작된 미생물 세포는
(a) 이종성 TYDC; 및
(b) 피드백-이상조절된 DAHP 신타제
를 포함하는 것인 조작된 미생물 세포.
제3항 내지 제10항 중 어느 한 항에 있어서, 조작된 미생물 세포는 진균 세포를 포함하는 것인 조작된 미생물 세포.
제3항 내지 제11항 중 어느 한 항에 있어서, 조작된 미생물 세포는 효모 세포를 포함하는 것인 조작된 미생물 세포.
제8항에 있어서, 효모 세포는 사카로마이세스 (Saccharomyces) 속의 세포를 포함하는 것인 조작된 미생물 세포.
제13항에 있어서, 효모 세포는 세레비지아 (cerevisiae) 종의 세포인 조작된 미생물 세포.
제4항, 제8항 또는 제9항 내지 제14항 중 어느 한 항에 있어서, DAHP 신타제는 에스. 세레비지아 (S. cerevisiae) DAHP 신타제의 변이체인 조작된 미생물 세포.
제3항 내지 제15항 중 어느 한 항에 있어서, 이종성 TYDC는 파파베르 솜니페럼 (Papaver somniferum) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함하는 것인 조작된 미생물 세포.
제4항, 제8항 또는 제9항 내지 제16항 중 어느 한 항에 있어서,
(a) 이종성 TYDC는 피. 솜니페럼 (P. somniferum) 티로신/DOPA 디카복실라제 2를 포함하고;
(b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제인
조작된 미생물 세포.
제3항 내지 제17항 중 어느 한 항에 있어서, 조작된 미생물 세포는 대조군 세포에 비해 프리페네이트 디히드로게나제의 증가된 활성을 포함하는 것인 조작된 미생물 세포.
제18항에 있어서, 조작된 미생물 세포는 야생형 에스. 세레비지아 트랜스알돌라제 유전자의 추가 카피를 발현하는 것인 조작된 미생물 세포.
제2항 또는 제6항 중 어느 한 항에 있어서, 조작된 미생물 세포는 효모 세포를 포함하는 것인 조작된 미생물 세포.
제20항에 있어서, 효모 세포는 야로위아 (Yarrowia) 속의 세포를 포함하는 것인 조작된 미생물 세포.
제21항에 있어서, 효모 세포는 리폴리티카 (lipolytica) 종의 세포인 조작된 미생물 세포.
제21항 또는 제22항에 있어서, 이종성 TYDC는 엔테로코커스 패시움 (Enterococcus faecium) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함하는 것인 조작된 미생물 세포.
제21항 내지 제23항 중 어느 한 항에 있어서, DAHP 신타제는 에스. 세레비지아 유래 DAHP 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 DAHP 신타제를 포함하는 것인 조작된 미생물 세포.
제24항에 있어서,
(a) 이종성 TYDC는 이. 패시움 (E. faecium) Com15 유래 피리독살-의존성 디카복실라제 (TYDC)를 포함하고;
(b) DAHP 신타제는 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)를 포함하는 것인 조작된 미생물 세포.
파파베르 솜니페럼 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 효모 세포인 조작된 미생물 세포로서, 조작된 효모 세포는 티라민을 생성시키는 것인 조작된 미생물 세포.
제26항에 있어서, 조작된 효모 세포는 사카로마이세스 속의 세포인 조작된 미생물 세포.
제27항에 있어서, 조작된 효모 세포는 세레비지아 종의 세포인 조작된 미생물 세포.
제3항 내지 제10항 중 어느 한 항에 있어서, 조작된 미생물 세포는 박테리아 세포인 조작된 미생물 세포.
제29항에 있어서, 박테리아 세포는 코리네박테리아 (Corynebacteria) 속의 세포인 조작된 미생물 세포.
제30항에 있어서, 박테리아 세포는 글루타미컴 (glutamicum) 종의 세포인 조작된 미생물 세포.
제29항 내지 제31항 중 어느 한 항에 있어서, 박테리아 세포는 에스. 세레비지아 DAHP 신타제의 변이체인 피드백-이상조절된 DAHP 신타제를 포함하는 것인 조작된 미생물 세포.
제29항 내지 제32항 중 어느 한 항에 있어서, 이종성 TYDC는 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖거나 또는 자이고사카로마이세스 바일리 (Zygosaccharomyces bailii) 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함하는 것인 조작된 미생물 세포.
제32항 또는 제33항에 있어서,
(a) 이종성 TYDC는 이. 패시움 TYDC를 포함하고;
(b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제인
조작된 미생물 세포.
제32항 또는 제33항에 있어서,
(a) 이종성 TYDC는 지. 바일리 (Z. bailii) TYDC를 포함하고;
(b) 피드백-이상조절된 DAHP 신타제는 K229L 돌연변이를 추가로 포함하는 Aro4 유전자에 의해 코딩되는 에스. 세레비지아 DAHP 신타제인
조작된 미생물 세포.
제33항에 있어서, 대조군 세포에 비해, 코리스메이트 신타제 또는 프리프레네이트 디히드로게나제의 증가된 활성을 추가로 포함하는 것인 조작된 미생물 세포.
제36항에 있어서, 조작된 미생물 세포는 코리스메이트 신타제의 증가된 활성을 포함하고 이종성 코리스메이트 신타제를 발현하는 것인 조작된 미생물 세포.
제36항에 있어서, 조작된 미생물 세포는 프리페네이트 디히드로게나제의 증가된 활성을 포함하고 프리페네이트 디히드로게나제 유전자의 추가 카피를 발현하는 것인 조작된 미생물 세포.
제2항 또는 제6항에 있어서, 조작된 미생물 세포는 박테리아 세포를 포함하는 것인 조작된 미생물 세포.
제39항에 있어서, 박테리아 세포는 코리네박테리움 (Corynebacterium) 또는 바실러스 (Bacillus) 속의 세포를 포함하는 것인 조작된 미생물 세포.
제40항에 있어서, 박테리아 세포는 각각 글루타미컴 (glutamicum) 또는 서브틸리스 (subtilis) 종의 세포인 조작된 미생물 세포.
제40항 또는 제41항에 있어서, 이종성 TYDC는 엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 TYDC를 포함하는 것인 조작된 미생물 세포.
제40항 내지 제42항 중 어느 한 항에 있어서, DAHP 신타제는 에스. 세레비지아 유래 DAHP 신타제와 적어도 70%의 아미노산 서열 동일성을 갖는 DAHP 신타제를 포함하는 것인 조작된 미생물 세포.
제40항 내지 제43항 중 어느 한 항에 있어서, 조작된 미생물 세포는 대조군 세포에 비해 시키메이트 키나제의 증가된 활성을 포함하는 것인 조작된 미생물 세포.
제44항에 있어서, 시키메이트 키나제는 에스케리치아 콜라이 (Escherichia coli) 유래 시키메이트 키나제와 적어도 70%의 아미노산 서열 동일성을 갖는 시키메이트 키나제를 포함하는 것인 조작된 미생물 세포.
제45항에 있어서,
(a) 이종성 TYDC는 이. 패시움 Com15 유래 피리독살-의존성 디카복실라제 (TYDC)를 포함하고;
(b) DAHP 신타제는 에스. 세레비지아 S288c 유래 포스포-2-디히드로-3-데옥시헵토네이트 알돌라제 (DAHP 신타제)를 포함하고;
(c) 시키메이트 키나제는 이. 콜라이 (E. coli) K12 유래 시키메이트 키나제를 포함하는 것인 조작된 미생물 세포.
제13항 내지 제46항 중 어느 한 항에 있어서, 배양 시, 조작된 미생물 세포는 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 생성시키는 것인 조작된 미생물 세포.
제47항에 있어서, 조작된 미생물 세포는 적어도 2.5 g/배양 배지의 L 의 수준으로 티라민을 생성시키는 것인 조작된 미생물 세포.
엔테로코커스 패시움 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 박테리아 세포인 조작된 미생물 세포로서, 조작된 박테리아 세포는 티라민을 생성시키는 것인 조작된 미생물 세포.
제49항에 있어서, 박테리아 세포는 코리네박테리아 속의 것인 조작된 미생물 세포.
제50항에 있어서, 박테리아 세포는 글루타미컴 종의 것인 조작된 미생물 세포.
자이고사카로마이세스 바일리 유래 TYDC와 적어도 70%의 아미노산 서열 동일성을 갖는 이종성 티로신 디카복실라제 (TYDC)를 포함하는 박테리아 세포인 조작된 미생물 세포로서, 조작된 박테리아 세포는 티라민을 생성시키는 것인 조작된 미생물 세포.
제52항에 있어서, 박테리아 세포는 코리네박테리아 속의 것인 조작된 미생물 세포.
제53항에 있어서, 박테리아 세포는 글루타미컴 종의 것인 조작된 미생물 세포.
제13항 내지 제54항 중 어느 한 항에 따른 조작된 미생물 세포의 배양물.
제55항에 있어서, 티라민은 기질의 발효로부터 생성되고, 기질의 적어도 50%는 단백질 또는 아미노산 공급원으로부터 유래되지 않는 것인 배양물.
제56항에 있어서, 기질은 우레아, 암모늄 염, 암모니아, 및 이의 임의 조합으로 이루어진 군으로부터 선택되는 질소원 및 탄소원을 포함하는 것인 배양물.
제55항 내지 제57항 중 어느 한 항에 있어서, 조작된 미생물 세포는 배양물이 10 내지 500의 600 nm에서의 광학 밀도를 갖는 농도로 존재하는 것인 배양물.
제55항 내지 제58항 중 어느 한 항에 있어서, 배양물은 티라민을 포함하는 것인 배양물.
제55항 내지 제59항 중 어느 한 항에 있어서, 배양물은 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 포함하는 것인 배양물.
제55항 내지 제60항 중 어느 한 항에 있어서, 배양물은 적어도 2.5 g/배양 배지의 L 의 수준으로 티라민을 포함하는 것인 배양물.
제1항 내지 제54항 중 어느 한 항에 따른 조작된 미생물 세포를 배양하는 방법으로서, 방법은 비단백질 탄소 및 비단백질 질소 공급원을 포함하는 발효 기질의 존재 하에서 세포를 배양하는 단계를 포함하고, 조작된 미생물 세포는 티라민을 생성시키는 것인 배양 방법.
제62항에 있어서, 방법은 1 내지 100 g/L 범위의 초기 포도당 수준에서 이후 제어된 당류 공급이 후속되는, 유가식 배양을 포함하는 것인 배양 방법.
제62항 또는 제63항에 있어서, 발효 기질은 우레아, 암모늄 염, 암모니아, 및 이의 임의 조합으로 이루어진 군으로부터 선택되는 질소원 및 포도당을 포함하는 것인 배양 방법.
제62항 내지 제64항 중 어느 한 항에 있어서, 배양물은 배양 단계 동안 pH-제어되는 것인 배양 방법.
제62항 내지 제65항 중 어느 한 항에 있어서, 배양물은 배양 단계 동안 통기되는 것인 배양 방법.
제62항 내지 제66항 중 어느 한 항에 있어서, 조작된 미생물 세포는 100 ㎎/배양 배지의 L 를 초과하는 수준으로 티라민을 생성시키는 것인 배양 방법.
제62항 내지 제67항 중 어느 한 항에 있어서, 조작된 미생물 세포는 적어도 2.5 g/배양 배지의 L 의 수준으로 티라민을 생성시키는 것인 배양 방법.
제62항 내지 제68항 중 어느 한 항에 있어서, 방법은 배양물로부터 티라민을 회수하는 단계를 더 포함하는 것인 배양 방법.