[go: up one dir, main page]

KR102287346B1 - Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법 - Google Patents

Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법 Download PDF

Info

Publication number
KR102287346B1
KR102287346B1 KR1020140191130A KR20140191130A KR102287346B1 KR 102287346 B1 KR102287346 B1 KR 102287346B1 KR 1020140191130 A KR1020140191130 A KR 1020140191130A KR 20140191130 A KR20140191130 A KR 20140191130A KR 102287346 B1 KR102287346 B1 KR 102287346B1
Authority
KR
South Korea
Prior art keywords
leu
val
ala
gly
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
KR1020140191130A
Other languages
English (en)
Other versions
KR20160079573A (ko
Inventor
이진숙
강창덕
이승현
조광명
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020140191130A priority Critical patent/KR102287346B1/ko
Priority to US14/980,983 priority patent/US9885067B2/en
Publication of KR20160079573A publication Critical patent/KR20160079573A/ko
Application granted granted Critical
Publication of KR102287346B1 publication Critical patent/KR102287346B1/ko
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/56Lactic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01001Alcohol dehydrogenase (1.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01008Glycerol-3-phosphate dehydrogenase (NAD+) (1.1.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/02Oxidoreductases acting on the CH-OH group of donors (1.1) with a cytochrome as acceptor (1.1.2)
    • C12Y101/02003L-Lactate dehydrogenase (cytochrome) (1.1.2.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/02Oxidoreductases acting on the CH-OH group of donors (1.1) with a cytochrome as acceptor (1.1.2)
    • C12Y101/02004D-lactate dehydrogenase (cytochrome) (1.1.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/01004Aldehyde dehydrogenase (NADP+) (1.2.1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/01001Hexokinase (2.7.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/03Phosphoric monoester hydrolases (3.1.3)
    • C12Y301/03021Glycerol-1-phosphatase (3.1.3.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01001Pyruvate decarboxylase (4.1.1.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

모세포에 비하여 RGT1 단백질의 활성이 감소되어 있고, 증가된 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질의 생산능을 가진 재조합 효모 세포, 그를 제조하는 방법 및 그를 이용하여 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 생산하는 방법을 제공한다.

Description

RGT1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법{Yeast cell comprising reduced activity of RGT1, method for producing the yeast cell and method for producing a product using the same}
해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질의 생산능을 가진 재조합 효모 세포, 그를 제조하는 방법 및 상기 세포를 이용하여 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 생산하는 방법에 관한 것이다.
유기산 및 알콜과 같은 산물은 식품 및 의약품 및 화학 산업에서 빌딩 블록 물질 (building block material)로서 널리 사용되고 있다. 이들 물질은 석유로부터 생산하는 것이 알려져 있으나, 환경친화적인 미생물을 사용하여 생산하는 방법이 연구되고 있다.
미생물을 사용하여 산물을 생산하는 방법은 발효기간이 길고 산물을 분리하는데 많은 비용이 소요될 수 있다. 따라서, 상기 미생물은 효모를 포함할 수 있다. 미생물을 사용한 산물을 생산하는 방법에 있어서, 미생물의 산물 생산성을 향상시키는 것이 요구되고 있다.
실제로, 생산성 (productivity)을 증가시키기 위한 많은 접근법은 산 스트레스와 같은 생산 환경이 생산성을 한정한다는 가정에 의존한다. 균주 개발의 다른 중점 사항은, 산물 형성에 관련된 효소 활성이 증진된다는 의미에서, 산물 형성 자체 (product formation itself)에 관한 것이다. 일반적으로 증진된 효소 활성의 예는, 산물의 생산을 위하여 필요한 중간체 (intermediates)를 제공하는 해당과정과 같은 중심 대사경로를 포함할 수 있다.
따라서, 산물 생산능이 증가된 효모 및 그를 이용한 산물 생산 방법이 여전히 요구되고 있다.
일 양상은 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 효과적으로 생산할 수 있는 재조합 효모 세포를 제공한다.
다른 양상은 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 효과적으로 생산할 수 있는 재조합 효모 세포를 제조하는 방법을 제공한다.
다른 양상은 상기 재조합 효모 세포를 이용하여 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 효과적으로 생산하는 하는 방법을 제공한다.
본 명세서에서 사용된 용어 "활성 감소 (decrease in activity)" 또는 "감소된 활성 (decreased activity)"은 모세포 (예, 유전적으로 조작되지 않은 세포) 중에서 측정된 것보다 더 낮은 효소 또는 폴리펩티드의 활성을 갖는 세포를 나타낸다. 또한, "활성 감소 (decrease in activity)" 또는 "감소된 활성 (decreased activity)"은 본래의 (original) 또는 야생형 (wild-type)의 효소 또는 폴리펩티드보다 더 낮은 활성을 갖는 분리된 효소 또는 폴리펩티드를 나타낸다. 활성 감소 또는 감소된 활성은 활성이 없는 것 (no activity)을 포함한다. 예를 들면, 변형된 (예, 유전적으로 조작된) 세포 또는 효소에 대한 기질로부터 생성물로의 효소 전환 활성이 상기 변형을 갖지 않은 세포 또는 효소, 예를 들면, 모세포 또는 "야생형 (wild-type)"의 세포 또는 효소의 효소 전환활성에 비하여 약 20% 이상, 약 30% 이상, 약 40% 이상, 약 50% 이상, 약 55% 이상, 약 60% 이상, 약 70% 이상, 약 75% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 약 95% 이상, 또는 약 100% 감소된 것일 수 있다. 효소 또는 세포의 감소된 활성은 당업계에 공지된 임의의 방법을 사용하여 확인될 수 있다. 상기 활성 감소는 변형되지 않은 유전자를 갖는 세포, 예를 들면, 모세포 또는 야생형 세포에 비하여, 효소가 발현되더라도 효소의 활성이 없거나 감소된 경우, 효소를 코딩하는 유전자가 발현되지 않거나 발현되더라도 본래 유전자 조작이 되지 않은 유전자에 비하여 발현량이 감소된 경우를 포함한다. 상기 감소된 활성을 갖는 세포는, 유전적 변형을 갖지 않은 세포에 비하여 하나 이상의 효소 또는 폴리펩티드의 활성을 감소시키는 유전적 변형 (genetic modification)을 갖는 것일 수 있다.
용어 "모세포 (parent cell)"는 본래 세포 (original cell), 예를 들면, 조작된 효모 세포에 대하여 동일 타입의 유전적으로 조작되지 않은 세포를 나타낸다. 특정한 유전적 변형에 대하여, 상기 "모세포"는 상기 특정 유전적 변형 (genetic modification)을 갖지 않은 세포이지만, 다른 상항에 대하여는 동일한 것일 수 있다. 따라서, 상기 모세포는 주어진 단백질 (예를 들면, RGT1 단백질과 약 95% 이상의 서열 동일성을 갖는 단백질, 또는 HXK2 단백질과 약 95% 이상의 서열 동일성을 갖는 단백질)의 감소된 활성을 갖는 유전적으로 조작된 효모 세포를 생산하는데 출발 물질 (starting material)로 사용된 세포일 수 있다.
용어 "파괴 (disruption)"는 언급된 유전자 (referenced gene)의 발현이 감소되도록 하는 유전적 변형을 나타낸다. 상기 파괴는 언급된 유전자의 발현이 없도록 하는 유전적 변형 (이하, 유전자의 "불활성화 (inactivation)"라고 한다.) 또는 유전자의 발현은 있으나 감소된 수준으로 발현되도록 하는 유전적 변형 (이하, 유전자의 "감쇄 (attenuation)"라고 한다.)을 포함한다. 상기 불활성화는 유전자의 기능적 산물 (functional product)이 발현되지 않는 것뿐만 아니라 발현은 되지만 기능적 산물이 발현되지 않는 것을 포함한다. 상기 감쇄는 유전자의 기능적 산물의 발현양 감소를 포함한다. 즉, 상기 감쇄는 유전자의 순 발현량은 증가하였더라도 기능적 산물의 발현량이 감소되는 것을 포함한다. 여기서 유전자의 기능적 산물이란 모세포 또는 야생형 세포에서 상기 유전자의 산물 (예, 효소)이 갖는 생화학적 또는 생리적 기능 (예, 효소 활성)을 보유하고 있는 것을 말한다. 따라서, 상기 파괴는 유전자의 기능적 파괴 (functional disruption)를 포함한다. 상기 유전적 변형은 폴리펩티드를 코딩하는 폴리뉴클레오티드를 도입하는 변형, 모세포의 유전물질에 대한 하나 이상의 뉴클레오티드의 치환, 부가, 삽입, 또는 결실, 또는 모세포의 유전물질에 대한 화학적 변이를 포함한다. 그러한 유전적 변형은 언급된 종 (referenced species)에 대한 이질성 (heterologous), 동질성 (homologous), 또는 이질성 및 동질성 폴리펩티드를 위한 코딩 영역 (coding region) 및 그의 기능적 단편 (functional fragments thereof)에 대한 것을 포함한다. 또한, 상기 유전적 변형은 유전자 또는 오페론의 발현을 변경시키는 비코딩 조절 영역 (non-coding regulatory regions)의 변형을 포함한다. 비코딩 영역은 5'-비코딩 서열(5'-non coding sequence) 및/또는 3'-비코딩 서열(3'-non coding sequence)을 포함한다.
상기 유전자의 파괴는 상동 재조합, 지향된 돌연변이유발 (directed mutagenesis), 또는 분자 진화 (molecular evolution)와 같은 유전적 조작법에 의해 달성될 수 있다. 세포가 복수 개의 동일 유전자, 또는 유전자의 2 이상의 파라로그 (paralogs)를 포함한 경우, 하나 이상의 유전자는 파괴될 수 있다. 예를 들면, 상기 유전적 변형은 유전자의 일부 서열을 포함하는 벡터를 세포에 형질전환하고, 세포를 배양하여 상기 서열이 세포의 내인성 유전자와 상동 재조합이 일어나도록 하여 상기 유전자를 파괴되도록 한 후, 상동 재조합이 일어난 세포를 선별 마커를 사용하여 선별함으로써 이루어질 수 있다.
반면에, 본 명세서에서 사용된 용어 "활성 증가 (increase in activity)", 또는 "증가된 활성 (increased activity)"은 세포, 단백질, 또는 효소의 활성의 검출가능한 증가를 나타낼 수 있다. "활성 증가 (increase in activity)", 또는 "증가된 활성 (increased activity)"은 주어진 유전적 변형 (genetic modification)을 갖지 않은 세포, 단백질, 또는 효소 (예, 본래 또는 "야생형 (wild-type)"의 세포, 단백질, 또는 효소)와 같은, 동일한 타입의 비교 세포, 단백질, 또는 효소의 수준보다 더 높은 변형된 (예, 유전적으로 조작된) 세포, 단백질, 또는 효소의 활성을 나타낼 수 있다. "세포의 활성 (cell activity)"이란 세포의 특정 단백질 또는 효소의 활성을 나타낼 수 있다. 예를 들면, 상기 변형된 또는 조작된 세포, 단백질, 또는 효소의 활성은 동일 타입의 조작되지 않은 세포, 단백질, 또는 효소, 예를 들면, 야생형 세포, 단백질, 또는 효소의 활성보다 약 5% 이상, 약 10% 이상, 약 15% 이상, 약 20% 이상, 약 30% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 또는 약 100% 이상 증가된 것일 수 있다. 세포 중 특정 단백질 또는 효소의 활성은 모세포, 예를 들면, 조작되지 않은 세포 중의 동일 단백질 또는 효소의 활성보다 약 5% 이상, 약 10% 이상, 약 15% 이상, 약 20% 이상, 약 30% 이상, 약 50% 이상, 약 60% 이상, 약 70% 이상, 또는 약 100% 이상 증가된 것일 수 있다. 단백질 또는 효소의 증가된 활성을 갖는 세포는 당업계에 공지된 임의의 방법을 사용하여 확인될 수 있다. 상기 증가된 활성을 갖는 세포는, 유전적 변형을 갖지 않은 세포에 비하여 하나 이상의 효소 또는 폴리펩티드의 활성을 증가시키는 유전적 변형 (genetic modification)을 갖는 것일 수 있다.
폴리펩티드의 활성 증가는 폴리펩티드의 발현 증가 또는 비활성 (specific activity)의 증가에 의하여 얻어진 것일 수 있다. 상기 발현 증가는 폴리펩티드를 코딩하는 폴리뉴클레오티드가 세포에 도입되거나 세포 내 카피 수가 증가되거나, 또는 상기 폴리뉴클레오티드의 조절 영역의 변이에 의한 것일 수 있다. 상기 폴리뉴클레오티드의 조절 영역의 변이는 유전자의 발현 조절 서열의 변형을 갖는 것일 수 있다. 상기 조절 서열은 상기 유전자 발현을 위한 프로모터 서열 또는 전사 종결자 서열일 수 있다. 또한, 상기 조절 서열은 유전자 발현에 영향을 줄 수 있는 모티프를 코딩하는 서열일 수 있다. 상기 모티프는 예를 들면, 이차 구조-안정화 모티프, RNA 불안정화 모티프, 스플라이스-활성화 모티프, 폴리아데닐화 모티프, 아데닌-풍부 서열 (adenine-rich sequence), 또는 엔도뉴클레아제 인식 부위일 수 있다.
용어 "카피 수 증가 (copy number increase)"는 상기 유전자의 도입 또는 증폭에 의한 것일 수 있으며, 조작되지 않은 세포 또는 모세포에 존재하지 않는 유전자를 유전적 조작에 의해 갖게 되는 경우도 포함한다. 상기 유전자의 도입은 벡터와 같은 비히클을 매개하여 이루어질 수 있다. 상기 도입은 상기 유전자가 게놈에 통합되지 않은 임시적 (transient) 도입이거나 게놈에 삽입되는 것일 수 있다. 상기 도입은 예를 들면, 목적하는 폴리펩티드를 코딩하는 폴리뉴클레오티드가 삽입된 벡터를 상기 세포로 도입한 후, 상기 벡터가 세포 내에서 복제되거나 상기 폴리뉴클레오티드가 게놈으로 통합됨으로써 이루어질 수 있다.
본 명세서에서 사용된 용어 "유전자"는 특정 단백질을 발현하는 핵산 단편을 의미하며, 5'-비코딩 서열 (5'-non coding sequence) 및/또는 3'-비코딩 서열 (3'-non coding sequence)의 조절 서열 (regulatory sequence)을 포함하거나 포함하지 않을 수 있다.
본 발명에서 사용된 핵산 또는 폴리펩티드의 "서열 동일성 (sequence identity)"은 특정 비교 영역에서 양 서열을 최대한 일치되도록 얼라인시킨 후 서열간의 염기 또는 아미노산 잔기의 동일한 정도를 의미한다. 서열 동일성은 특정 비교 영역에서 2개의 서열을 최적으로 얼라인하여 비교함으로써 측정되는 값으로서, 비교 영역 내에서 서열의 일부는 대조 서열 (reference sequence)과 비교하여 부가 또는 삭제되어 있을 수 있다. 서열 동일성 백분율은 예를 들면, 비교 영역 전체에서 두 개의 최적으로 정렬된 서열을 비교하는 단계, 두 서열 모두에서 동일한 아미노산 또는 핵산이 나타나는 위치의 갯수를 결정하여 일치된 (matched) 위치의 갯수를 수득하는 단계, 상기 일치된 위치의 갯수를 비교 범위 내의 위치의 총 갯수 (즉, 범위 크기)로 나누는 단계, 및 상기 결과에 100을 곱하여 서열 동일성의 백분율을 수득하는 단계에 의해 계산될 수 있다. 상기 서열 동일성의 퍼센트는 공지의 서열 비교 프로그램을 사용하여 결정될 수 있으며, 상기 프로그램의 일례로 BLASTN(NCBI), CLC Main Workbench (CLC bio), MegAlignTM (DNASTAR Inc) 등을 들 수 있다.
여러 종의 동일하거나 유사한 기능이나 활성을 가지는 폴리펩티드 또는 폴리뉴클레오티드를 확인하는데 있어서 여러 수준의 서열 동일성을 사용할 수 있다. 예를 들어, 50%이상, 55%이상, 60%이상, 65%이상, 70%이상, 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100% 등을 포함하는 서열 동일성이 기준으로 사용될 수 있다.
본 명세서에 사용된 용어 "외인성 (exogenous)"은 언급된 분자 (referenced molecule) 또는 언급된 활성 (referenced activity)이 숙주 세포로 도입된 것을 의미한다. 분자는 예를 들면, 숙주 염색체 내로의 삽입에 의하는 것과 같은 코딩 핵산 (encoding nucleic acid)의 숙주 유전 물질 내로의 도입 또는 플라스미드와 같은 비염색체 유전물질로서 도입될 수 있다. 코딩 핵산의 발현과 관련하여, 상기 용어 "외인성"은 상기 코딩 핵산이 개체 내로 발현 가능한 형태로 도입된 것을 나타낸다. 생합성 활성과 관련하여, 상기 용어 "외인성"은 숙주 모세포에 도입된 활성을 나타낸다. 그 기원 (source)는 예를 들면, 숙주 모세포에 도입된 후 언급된 활성을 발현하는 동질성 (homologous) 또는 이질성 (heterologous) 코딩 핵산일 수 있다. 그러므로, 용어 "내인성 (endogenous)"은 상기 숙주 세포에 존재하는 언급된 분자 또는 활성을 나타낸다. 비슷하게, 코딩 핵산의 발현과 관련하여, 상기 용어 "내인성"은 개체 내에 포함된 코딩 핵산의 발현을 나타낸다. 용어 "이질성 (heterologous)"은 언급된 종 외의 다른 기원으로부터의 분자 또는 활성을 나타내고 용어 "동질성 (homologous)"은 숙주 모세포로부터의 분자 또는 활성을 나타낸다. 따라서, 코딩 핵산의 외인성 발현은 이질성 (heterologous) 또는 동질성 (homologous) 코딩 핵산 중 어느 하나 또는 둘 다를 이용할 수 있다.
또한, 본 명세서에서 사용된 용어 "유전적 조작 (genetic engineering)" 또는 "유전적으로 조작된 (genetically engineered)"은 세포에 대하여 하나 이상의 유전적 변형 (genetic modification)을 도입하는 행위 또는 그에 의하여 만들어진 세포를 나타낸다.
본 명세서에서 사용된 용어 "락테이트 (lactate)"는 "젖산 (lactic acid)" 또는 그의 염을 의미한다.
일 양상은 모세포에 비하여 RGT1 단백질의 활성이 감소되어 있고, 증가된 해당과정(glycolysis) 중간 산물 또는 해당과정 중간 산물 유래 물질의 생산능을 갖는 것인 재조합 효모 세포로서, 상기 효모 세포는 RGT1의 활성을 감소시키는 유전적 변형 (genetic modification)을 포함하는 것인 효모 세포를 제공한다.
상기 효모 세포에 있어서, RGT1 단백질은 글루코스에 반응하여 여러 글루코스 트랜스포터 (HXT) 유전자의 발현을 조절하는, 글루코스-반응성 전사 인자(glucose-responsive transcription factor) 또는 글루코스 트랜스포트 전사 조절자(glucose transport transcription regulator)일 수 있다. 또한, RGT1은 레스토어 글루코스 트랜스포트 단백질1(Restores glucose transport protein 1, RGT1)로 지칭될 수 있다. RGT1은 글루코스 농도가 낮은 경우, Mth1/Std1과의 결합을 통해 헥소스 트랜스포터 (hexose transporter, HXT)의 발현을 억제할 수 있고, 글루코스 농도가 높은 경우, PKA에 의해 HXT의 발현을 억제할 수 있다. 상기 헥소스 트랜스포터는 글루코스 또는 프럭토스와 같은 헥소스를 원형질막을 넘어 이동(translocate)할 수 있는 효소와 같은 단백질을 지칭할 수 있다. 상기 헥소스 트랜스포터는 예를 들면, HXT1, HXT2, HXT3, HXT4, HXT5, HXT6, HXT7, HXT8, HXT9, HXT10, HXT11, HXT12, HXT13, HXT14, HXT15, HXT16, HXT17, GAL2, SNF3, 또는 RGT2일 수 있다. RGT1 단백질은 서열번호 1의 아미노산 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것 또는 그의 효모 호몰로그(yeast homologue)일 수 있다. RGT1 단백질은 서열번호 2의 폴리뉴클레오티드 서열에 의하여 코딩될 수 있다. RGT1 유전자는 서열번호 1의 아미노산을 코딩하는 폴리뉴클레오티드 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다. 상기 RGT1 유전자는 서열번호 2의 폴리뉴클레오티드 서열(NM_001179604.3)을 갖는 것일 수 있다.
RGT를 코딩하는 유전자의 제거 또는 파괴 변이를 갖는 효모 세포는 글루코스 농도가 낮은 경우, Mth1/Std1과의 결합을 통한 HXT의 발현을 억제를 제거하고, HXT를 상시 발현하게 하여 글루코스 수송을 증가시킬 수 있다. 또한, 상기 효모 세포는 글루코스 농도가 높은 경우, PKA의 활성에 상관없이 HXT의 발현을 유도하여 글루코스 수송을 증가시킬 수 있다.
상기 효모 세포는 RGT1 단백질을 코딩하는 내인성 유전자 (endogenous gene)가 파괴(disruption)된 것일 수 있다. 상기 효모 세포는 그 모세포에 비하여 RGT1 단백질의 활성이 감소되기에 충분한 정도로 발현되도록, 상기 RGT1 단백질을 코딩하는 내인성 유전자가 파괴된 것일 수 있다.
상기 효모 세포에 있어서, 상기 효모 세포는 추가적으로 모세포에 비하여 HXK2 단백질의 활성이 감소되어 있고, HXK2의 활성을 감소시키는 유전적 변형을 포함하는 것일 수 있다.
HXK2 단백질은 헥소키나제 이소자임2(hexokinase isoenzyme 2, HXK2)일 수 있다. HXK2 단백질은 EC. 2.7.1.1에 속하는 효소일 수 있다. HXK2 단백질은 서열번호 3의 아미노산 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것 또는 그의 효모 호몰로그 (yeast homologue)일 수 있다. HXK2 단백질은 서열번호 4의 폴리뉴클레오티드 서열에 의하여 코딩될 수 있다. HXK2 유전자는 서열번호 3의 아미노산을 코딩하는 폴리뉴클레오티드 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다. 상기 HXK2는 서열번호 4의 폴리뉴클레오티드 서열을 갖는 것일 수 있다.
상기 효모 세포는 HXK2 단백질을 코딩하는 내인성 유전자 (endogenous gene)가 파괴(disruption)된 것일 수 있다. 상기 효모 세포는 그 모세포에 비하여 HXK2 단백질의 활성이 감소되기에 충분한 정도로 발현되도록, 상기 HXK2 단백질을 코딩하는 내인성 유전자가 파괴된 것일 수 있다.
상기 효모 세포는 모세포에 비하여 증가된 포도당 소비 속도로 포도당을 소비할 수 있는 능력을 갖는 것일 수 있다. 상기 포도당 소모는 해당과정을 통해 한 분자의 포도당이 두 분자의 피루브산을 형성하는 과정일 수 있다. 상기 효모 세포는 유전적으로 조작되지 않은 세포 또는 모세포에 비하여 증가된 해당과정(glycolysis) 중간 산물 또는 해당과정 중간 산물 유래 물질의 생산능을 갖는 것일 수 있다. 본 명세서에 있어서, 상기 생산은 세포 내에서 생산하는 것 또는 세포에서 생산된 후 분비되는 것일 수 있다.
본 명세서에 있어서 "유래 물질"이란 특정 물질로부터 생합성 과정에 의하여 형성되는 물질일 수 있다. "해당과정 중간 산물 유래 물질"이란 해당과정 중간 산물, 예를 들면 피루베이트로부터 생합성 과정에 의하여 형성되는 물질일 수 있다. "생합성 과정"은 세포 내에 자연적으로 존재하는 것뿐만 아니라 외부로부터 유전자의 도입에 의하여 새롭게 형성된 생합성 경로를 포함한다. 구체적으로, 상기 해당과정 중간 산물은 글루코스-6-포스페이트 (G6P), 프럭스토스-6-포스페이트 (F6P), 프럭스토스-1,6-비스포스페이트 (FBP), 디히드록시아세톤 포스페이트 (DHAP), 글리세르알데히드-3-포스페이트 (GAP), 1,3-비스포스포글리세레이트, 3-포스포글리세레이트, 2-포스포글리세레이트, 포스포에놀피루베이트 (PEP), 또는 피루베이트일 수 있다. 상기 해당과정 중간 산물 유래 물질은 디히드록시아세톤 포스페이트 (DHAP) 유래 물질, 글리세르알데히드-3-포스페이트 (GAP) 유래 물질, 또는 피루베이트 유래 물질인 것일 수 있다. 상기 "DHAP 유래 물질"은 글리세롤-3-포스페이트 (G3P), 글리세롤, 글리세롤 유래 산물 또는 그 조합일 수 있다. 상기 "피루베이트 유래 물질"은 알콜, 유기산, 또는 이들의 조합일 수 있다. 상기 "피루베이트 유래 물질"은 에탄올, 아세트산, 아세틸-CoA, 락테이트, TCA 회로의 중간 산물, 이들 유래 산물, 또는 그 조합인 것일 수 있다. TCA 회로의 중간 산물은 시트르산, 이타콘산, 이소시트레이트, 옥살로숙신네이트, 알파-케토글루타레이트, 숙신산, 숙신일-CoA, 푸마르산, 말레이트, 옥살로아세테이트, 또는 그 조합인 것일 수 있다. 상기 TCA 회로의 중간 산물 유래 물질은 숙신산 유래 산물일 수 있다. TCA 회로의 중간 산물 유래 물질은 숙신닐-CoA, 숙신산 세미알데히드 (succinic semialdehye: SSA), 4-히드록시부티레이트, 4-히드록시부티릴-CoA, 4-히드록시부티르알데히드, 1,3-부탄디올 (1,3-BDO), 1,4-부탄디올 (1,4-BDO), 부탄올, 또는 이소부탄올일 수 있다. 상기 효모 세포는 숙신산으로부터 1,4-BDO로 전환하는데 작용하는 효소를 코딩하는 유전자를 포함할 수 있다. 상기 효소는 예를 들면, CoA-의존성 succinate semialdehyde dehydrogenase, 4- hydroxybutyrate (4-HB) dehydrogenase, 4-hydroxybutyryl-CoA (4HB-CoA) transferase, aldehyde/alcohol dehydrogenase, 및 Clostridium acetobutylicum AdhE2일 수 있다.
상기 효모 세포는 사카로마이세스 (Saccharomyces), 자이고사카로마이세스 (Zygosaccharomyces), 피치아 (Pichia), 클루이베로마이세스 (Kluyveromyces), 캔디다 (Candida), 스키조사카로마이세스 (Shizosaccharomyces), 이사첸키아 (Issachenkia), 또는 한세눌라 (Hansenula)에 속하는 균주는 예를 들면, 사카로마이세스 세레비지애 (S. cerevisiae), 사카로마이세스 바야누스 (S. bayanus), 사카로마이세스 보울라디 (S. boulardii), 사카로마이세스 불데리 (S. bulderi), 사카로마이세스 카리오카누스 (S. cariocanus), 사카로마이세스 카리오쿠스 (S. cariocus), 사카로마이세스 체발리에리 (S. chevalieri), 사카로마이세스 다이레넨시스 (S. dairenensis), 사카로마이세스 엘립소이데우스 (S. ellipsoideus), 사카로마이세스 유바야뉴스 (S. eubayanus), 사카로마이세스 엑시거스 (S. exiguus), 사카로마이세스 플로렌티누스 (S. florentinus), 사카로마이세스 클루이베리 (S. kluyveri), 사카로마이세스 마티니에 (S. martiniae), 사카로마이세스 모나센시스 (S. monacensis), 사카로마이세스 노르벤시스 (S. norbensis), 사카로마이세스 파라독서스 (S. paradoxus), 사카로마이세스 파스토리아누스 (S. pastorianus), 사카로마이세스 스펜서로룸 (S. spencerorum), 사카로마이세스 투리센시스 (S. turicensis), 사카로마이세스 우니스포루스 (S. unisporus), 사카로마이세스 우바룸 (S. uvarum), 또는 사카로마이세스 조나투스 (S. zonatus)일 수 있다.
상기 효모 세포는, 피루베이트로부터 피루베이트 유래 물질을 합성하는 경로의 효소, DHAP로부터 글리세롤을 합성하는 경로, 또는 글리세롤로부터 글리세롤 유래 물질을 합성하는 경로의 효소의 활성이 증가된 것일 수 있다. DHAP로부터 글리세롤을 합성하는 경로는 DHAP와 NADH를 G3P와 NAD+로 전환하는 반응을 촉매하는 G3P 데히드로게나제 (G3P dehydrogenase: GPDH) 및 G3P를 글리세롤과 Pi로 전환시키는 반응을 촉매하는 G3Pase를 포함할 수 있다.
"피루베이트 유래 물질"에 대하여는 상기한 바와 같다. 상기 증가는 상기 효소를 코딩하는 폴리뉴클레오티드의 발현이 증가에 의한 것일 수 있다. 상기 효모 세포는, 피루베이트를 락테이트로 전환하는 효소의 활성, 또는 피루베이트를 에탄올로 전환하는 경로의 효소의 활성이 증가되어 있는 것일 수 있다. 상기 증가는 피루베이트를 락테이트로 전환하는 효소를 코딩하는 폴리뉴클레오티드의 발현, 또는 피루베이트를 에탄올로 전환하는 경로의 효소의 발현이 증가된 것에 의한 것일 수 있다. 피루베이트를 락테이트로 전환하는 효소를 코딩하는 폴리뉴클레오티드는 EC 1.1.1.27, 또는 EC 1.1.1.28로 분류되는 효소를 코딩하는 것일 수 있다. 피루베이트를 에탄올로 전환하는 경로의 효소는 피루베이트 데카르복실라제 및 알콜 데히드로게나제 중 하나 이상일 수 있다. 피루베이트 데카르복실라제는 EC 4.1.1.1로 분류되는 효소일 수 있다. 알콜 데히드로게나제 (ADH)는 EC. 1.1.1.2로 분류되는 효소일 수 있다.
상기 양상에 있어서, 상기 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소는 EC 1.1.2.27 또는 EC 1.1.1.28에 속하는 락테이트 데히드로게나제 (lactate dehydrogenase: LDH)인 것일 수 있다. 상기 LDH는 NAD(P)H-의존성일 수 있다. 또한, 상기 LDH는 D-락테이트 및/또는 L-락테이트에 작용하는 것일 수 있다. 상기 LDH는 서열번호 5의 아미노산 서열과 95% 이상의 서열 동일성을 갖는 것일 수 있다. 서열번호 5은 일본자라 (Pelodiscus sinensis japonicus)의 LDH이다.
상기 효모 세포는 상기 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소를 코딩하는 외인성 유전자 (exogenous gene)를 포함하는 것일 수 있다. 상기 LDH 외인성 유전자는, 상기 효모 세포에서 그 모세포에 비하여 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소의 활성이 증가되기에 충분한 양으로 발현된 것일 수 있다. 상기 LDH 외인성 유전자는 서열번호 5의 아미노산 서열과 95% 이상의 서열 동일성을 갖는 아미노산 서열을 코딩하는 것일 수 있다. 상기 LDH 외인성 유전자는 서열번호 6의 뉴클레오티드 서열과 95% 이상의 서열 동일성을 갖는 것일 수 있다. LDH 외인성 유전자는 효모 세포에서 발현되기에 적합한 코돈으로 변경된 서열, 최적화된 코돈을 갖는 서열로 변경될 수 있다. 이 코돈 변경은 단백질의 아미노산 서열이 바뀌지 않는 범위 내에서 적절히 이루어질 수 있다. 서열번호 6은 일본자라 (Pelodiscus sinensis japonicus)의 LDH 유전자이다.
상기 LDH 외인성 유전자는 세포의 게놈에 포함된 수 있다. 상기 LDH 외인성 유전자는 L-Ldh, D-Ldh 또는 둘 모두에 작용하는 효소를 코딩하는 것일 수 있다. 따라서, 상기 효모 세포는 L-젖산 또는 D-젖산 또는 그의 라세미 혼합물, 또는 그의 염을 생산할 수 있다. 상기 LDH 외인성 유전자는 박테리아, 효모, 진균, 및 동물, 예를 들면, 설치류, 포유동물, 양서류 (amphibian) 및 석형류 (Sauropsida)로부터 유래한 것을 포함할 수 있다. 상기 LDH 외인성 유전자는 일본자라 (Pelodiscus sinensis japonicus), 오리너구리 (Ornithorhynchus anatinus), 병코돌고래 (Tursiops truncatus), 노르웨이산집쥐 (Rattus norvegicus), 또는 개구리(Xenopus laevis)로부터 선택되는 1종 이상의 LDH를 코딩하는 폴리뉴클레오티드일 수 있다. 일본자라로부터 유래한 락테이트 데히드로게나제, 오리너구리로부터 유래한 락테이트 데히드로게나제, 병코돌고래로부터 유래한 락테이트 데히드로게나제, 및 노르웨이산집쥐로부터 유래한 락테이트 데히드로게나제는 각각 서열번호 5, 7, 8, 및 9의 아미노산 서열을 갖는 것일 수 있다. 상기 락테이트 데히드로게나제는 각각 서열번호 5, 7, 8, 및 9의 아미노산 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다. 상기 락테이트 데히드로게나제를 코딩하는 유전자는 서열번호 6, 10, 11, 또는 12의 뉴클레오티드 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다.
상기 LDH 외인성 유전자는 그를 포함하는 벡터로부터 발현될 수 있다. 상기 벡터는 복제개시점, 프로모터, LDH를 코딩하는 폴리뉴클레오티드, 및 터미네이터를 포함할 수 있다. 상기 복제 개시점은 효모 자가복제 서열 (autonomous replication sequence, ARS)을 포함할 수 있다. 상기 효모 자가복제서열은 효모 동원체 서열 (centrometric sequence, CEN)에 의해 안정화될 수 있다. 상기 프로모터는 CCW12 프로모터, CYC 프로모터, TEF1 프로모터, PGK1 프로모터, GPD 프로모터, 및 ADH 프로모터로 이루어진 군으로부터 선택된 것일 수 있다. 상기 CCW12 프로모터, CYC 프로모터, TEF1 프로모터, PGK1 프로모터, GPD 프로모터, 및 ADH 프로모터는 각각 서열번호 13, 14, 15, 16, 17, 및 18의 폴리뉴클레오티드 서열을 갖는 것일 수 있다. 상기 터미네이터는 PGK1 (phosphoglycerate kinase 1), CYC1 (cytochrome c transcription), 및 GAL1로 이루어진 군으로부터 선택되는 것일 수 있다. CYC1 터미네이터는 서열번호 19의 폴리뉴클레오티드 서열을 갖는 것일 수 있다. 상기 벡터는 선별 마커를 더 포함할 수 있다.
상기 효모 세포는 단일 LDH 유전자, 복수의 LDH 유전자 예를 들면, 2 내지 10 카피 수를 포함할 수 있다. 상기 효모 세포는, 예를 들면, 1 내지 10, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 2 내지 10, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 또는 2 내지 3 카피의 LDH 유전자를 포함할 수 있다. 상기 효모 세포가 복수의 LDH 유전자를 포함하는 경우, 각각의 유전자는 동일한 유전자의 카피이거나 둘 이상의 상이한 LDH 유전자의 카피를 포함할 수 있다. 외인성 LDH 유전자의 복수의 카피는 숙주 세포의 게놈 내에 동일한 유전자 좌 (locus), 또는 여러 유전자 좌에 포함될 수 있다.
상기 효모 세포의 일 예는 모세포에 비하여 RGT1 유전자가 파괴되어 있고, 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소(LDH)를 코딩하는 외인성 유전자를 포함하는 락테이트 생산능을 갖는 효모 세포일 수 있다.
또한, 상기 효모 세포의 일 예는 모세포에 비하여 RGT1 유전자 및 HXK2 유전자가 파괴되어 있고, 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소(LDH)를 코딩하는 외인성 유전자를 포함하는 락테이트 생산능을 갖는 효모 세포일 수 있다.
상기 양상에 있어서, 상기 효모 세포는 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소의 활성을 감소시키는 유전적 변형을 더 포함하고 있어서, 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소의 활성이 감소되어 있는 것일 수 있다.
상기 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소는 EC 1.1.1.1에 속하는 알콜 데히드로게나제 (alcohol dehygrogenase: ADH)인 것일 수 있다. ADH의 예는 ADH1, ADH2, ADH3, ADH4, ADH5, ADH6, 및 ADH7을 포함한다. 상기 알콜 데히드로게나제는 NADH 의존성인 것일 수 있다. ADH1 유전자 및 ADH1 단백질은 각각 서열번호 20의 폴리뉴클레오티드 서열 및 서열번호 21의 아미노산 서열을 갖는 것일 수 있다.
상기 효모 세포는 상기 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소를 코딩하는 내인성 유전자 (endogenous gene)가 파괴 (disruption)된 것일 수 있다. 상기 효모 세포는 그 모세포에 비하여 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소의 활성이 감소되기에 충분한 정도로 발현되도록 파괴된 것일 수 있다.
상기 양상에 따른 효모 세포는, 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소, 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소, 디히드록시아세톤 포스페이트(DHAP)를 글리세롤-3-포스페이트(G3P)로 전환하는 것을 촉매하는 효소, 글리세롤-3-포스페이트(G3P)를 글리세롤로 전환하는 것을 촉매하는 효소, 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소, 또는 그 조합의 활성을 감소시키는 유전적 변형(genetic modification)을 더 포함하는 것일 수 있다.
상기 효모 세포에 있어서, 상기 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소는 EC 4.1.1.1에 속하는 것이고, 상기 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소는 EC 1.1.2.4 또는 EC 1.1.2.3에 속하는 것이고, 상기 DHAP를 G3P로 전환하는 것을 촉매하는 효소는 EC 1.1.1.8에 속하는 것이고, 글리세롤-3-포스페이트(G3P)를 글리세롤로 전환하는 것을 촉매하는 효소는 EC 3.1.3.21에 속하는 것이고, 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소는 EC 1.2.1.3, EC 1.2.1.4, 또는 EC 1.2.1.5에 속하는 것일 수 있다.
상기 효모 세포에 있어서, 상기 피루베이트를 아세트알데히드로 전환을 촉매하는 효소를 코딩하는 유전자, 락테이트를 피루베이트로 전환을 촉매하는 효소를 코딩하는 유전자, 디히드록시아세톤 포스페이트(DHAP)를 글리세롤-3-포스페이트(G3P)로 전환을 촉매하는 효소를 코딩하는 유전자, 글리세롤-3-포스페이트를 글리세롤로 전환을 촉매하는 효소를 코딩하는 유전자, 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 또는 그 조합이 파괴 (disruption)되어 있는 것일 수 있다.
상기 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소는 피루베이트 데카르복실라제 (pyruvate decarboxylase: PDC)일 수 있다. 상기 PDC는 서열번호 22의 아미노산 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 가질 수 있다. 상기 PDC 유전자는 서열번호 23의 폴리뉴클레오티드 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다. PDC는 PDC1 (서열번호 23), PDC5, 및 PDC6를 포함한다. 상기 PDC는 혐기성 또는 호기성 조건에서 피루베이트를 아세트알데히드로 전환하는 것을 촉매할 수 있다. 상기 PDC 유전자는 LDH 유전자와의 치환에 의하여 파괴된 것일 수 있다. 상기 효모 세포는 PDC 유전자가 감쇄 (attenuation)된 것일 수 있다. 상기 효모 세포는 또한, PDC1 유전자, PDC5 유전자, 및 PDC6 유전자 중 하나 이상이 감쇄된 것일 수 있다. 또한, 상기 효모세포는 PDC1, PDC5, 및 PDC6 중 하나, 또는 두 종류를 코딩하는 유전자가 불활성화(inactivation)된 것일 수 있다. 예를 들면, PDC1 유전자, PDC5 유전자, PDC6 유전자, PDC1 유전자 및 PDC5 유전자, PDC1 유전자 및 PDC6 유전자, 또는 PDC5 유전자 및 PDC6 유전자가 불활성화된 것일 수 있다.
상기 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소는 락테이트 시트크롬-c 옥시도리덕타제 (lactate cytochrome-c oxidoreductase: CYB2)일 수 있다. 상기 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소는 시토크롬 c-의존성일 수 있다. 상기 CYB2는 D-락테이트에 작용하는 것인 EC 1.1.2.4, 또는 L-락테이트에 작용하는 것인 EC 1.1.2.3에 속하는 것일 수 있다. 상기 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소는 서열번호 24의 아미노산 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 가질 수 있다. 상기 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자는 서열번호 25의 폴리뉴클레오티드 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다. 상기 CYB2 유전자는 LDH 유전자에 의한 치환에 의하여 파괴된 것일 수 있다.
상기 DHAP를 G3P로 전환하는 것을 촉매하는 효소는 NAD-의존성 글리세롤-3-포스페이트 데히드로게나제 (NAD-dependent glycerol-3-phosphate dehydrogenase: GPD)일 수 있다. 상기 GPD는 NAD+-의존성 효소일 수 있다. 상기 GPD의 예는, 시토졸성 글리세롤-3-포스페이트 데히드로게나제이고, NADH의 NAD+로의 산화를 이용하여 디히록시아세톤 포스페이트 (DHAP)를 글리세롤-3-포스페이트로의 환원을 촉매하는 효소일 수 있다. 상기 GPD는 EC 1.1.1.8에 속하는 것일 수 있다. 상기 GPD의 예는 GPD1 및 GPD2를 포함한다. 상기 GPD는 서열번호 26의 아미노산 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다. 상기 GPD를 코딩하는 유전자는 서열번호 27의 폴리뉴클레오티드 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다. 상기 GPD 유전자는 LDH 유전자와의 치환에 의하여 파괴된 것일 수 있다.
글리세롤-3-포스페이트를 글리세롤로 전환하는 것을 촉매하는 효소는 글리세롤 포스페이트 포스파타제 (glycerol phosphate phosphatase: GPP)일 수 있다. GPP는 S. cerevisiae 유래의 GPP1 및 GPP2일 수 있다. 상기 GPP는 서열번호 28의 뉴클레오티드 서열 및 서열번호 29의 아미노산 서열을 가질 수 있다. 상기 GPP 유전자를 LDH 유전자와의 치환에 의하여 파괴된 것일 수 있다.
상기 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소는 아세트알데히드 데히드로게나제 (acetaldehyde dehydrogenase: ALD)일 수 있다. ALD는 NAD(P)+ 의존성일 수 있다. 상기 ALD는 서열번호 30의 아미노산 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 가질 수 있다. 상기 ALD 유전자는 서열번호 31의 폴리뉴클레오티드 서열과 75%이상, 80%이상, 85%이상, 90%이상, 95%이상, 96%이상, 97%이상, 98%이상, 99%이상 또는 100%의 서열 동일성을 갖는 것일 수 있다. ALD는 ALD6 (ALD1라고도 함), ALD2, ALD3, ALD4, 및 ALD5를 포함한다. 상기 ALD 유전자는 LDH 유전자와의 치환에 의하여 파괴된 것일 수 있다. 상기 효모 세포는 ALD 유전자가 감쇄 (attenuation)된 것일 수 있다. 상기 효모 세포는 또한, ALD6 유전자, ALD2 유전자, 및 ALD3 유전자 중 하나 이상이 감쇄된 것일 수 있다. 또한, 상기 효모세포는 ALD6 유전자, ALD2 유전자, 및 ALD3 유전자 중 하나, 또는 두 종류를 코딩하는 유전자가 불활성화 (inactivation)된 것일 수 있다.
상기 효모 세포에 있어서, 상기 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소는 피루베이트 데카르복실라제 (pyruvate decarboxylase: PDC)이고, 상기 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소는 락테이트 시트크롬-c 옥시도리덕타제 (lactate cytochrome-c oxidoreductase: CYB2)이고, 상기 DHAP를 G3P로 전환하는 것을 촉매하는 효소는 NAD-의존성 글리세롤-3-포스페이트 데히드로게나제 (NAD-dependent glycerol-3-phosphate dehydrogenase: GPD)이고, 글리세롤-3-포스페이트를 글리세롤로 전환하는 것을 촉매하는 효소는 글리세롤 포스페이트 포스파타제 (glycerol phosphate phosphatase: GPP)이고, 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소는 아세트알데히드 데히드로게나제 (acetaldehyde dehydrogenase)인 것일 수 있다.
일 양상에 따른 효모 세포는 그 모세포에 비하여 아세트알데히드를 아세틸-CoA로 전환하는 것을 촉매하는 효소의 활성이 증가되어 있는 것일 수 있다.
상기 아세트알데히드를 아세틸-CoA로 전환하는 것을 촉매하는 효소는 EC 1.2.1.10에 속하는 아세틸화 아세트알데히드 데히드로게나제 (acylating acetaldehyde dehydrogenase: A-ALD)인 것일 수 있다.
상기 아세트알데히드를 아세틸-CoA로 전환하는 것을 촉매하는 효소의 일 타입은 4-히드록시-2-케토발러레이트 이화(catabolism)에 관련된 이관능성 알돌라제-데히드로게나제 복합체 (bifunctional aldolase-dehydrogenase complex)의 일부인 단백질일 수 있다. 이러한 이관능성 효소는 페놀, 톨루엔, 나프탈렌, 비페닐, 및 다른 방향성 화합물의 분해에서 많은 박테리아 종에서 중간체인, 카테콜의 메타-절단 경로 (meta-cleavage pathway)의 최종 두 단계를 촉매한다. 4-히드록시-2-케토발러레이트는 먼저 4-히드록시-2-케토발러레이트 알돌라제에 의하여 피루베이트와 아세트알데히드로 전환되고, 다음으로 A-ALD에 의하여 아세트알데히드는 Acetly-CoA로 전환된다. A-ALD의 이 타입의 예는 Pseudomonas sp. CF600 (Genbank No: CAA43226)의 DmpF이다. 대장균의 MhpF 단백질은 DmpF에 대한 동족체이다. 상기 아세트알데히드를 아세틸-CoA로 전환하는 것을 촉매하는 효소의 다른 일 타입은 엄격하게 (strictly) 또는 선택적(facultative) 혐기성 미생물 유래의 acetyl-CoA와 acetaldehyde의 가역적 전환을 촉매하는 단백질이지만, 알콜 데히드로게나제 활성을 갖지 않은 것일 수 있다. 이 타입의 단백질의 예는 Clostridium kluyveri에서 보고된 것일 수 있다. A-ALD는 Clostridium kluyveri DSM 555 (Genbank No: EDK33116)의 게놈에 주석 (annotation)되어 있다. 동족 단백질 (homologous protein) AcdH가 Lactobacillus plantarum (Genbank No: NP_784141)의 게놈에서 확인되었다. 이 타입의 단백질의 다른 예는 Clostridium beijerinckii NRRL B593 (Genbank No: AAD31841)의 상기 유전자 산물이다. 상기 A-ALD의 일 예는, 대장균 유래의 MhpF 또는 그의 기능적 동족체 (functional homologue), 예를 들면, 대장균 및 S. typhimurium 유래의 EutE (예, 서열번호 32)의 폴리뉴클레오티드 서열을 갖는 EutE 유전자 및 서열번호 33의 아미노산 서열을 갖는 EutE 단백질), 또는 Pseudomonas sp . CF600 유래의 dmpF인 것일 수 있다. A-ALD는 NAD(P)+ 의존성일 수 있다. 상기 A-ALD는 하기 반응을 촉매하는 활성을 갖는 것일 수 있다.
아세트알데히드(Acetaldehyde) + CoA(coenzyme A) + NAD+ <=> acetyl-CoA + NADH + H+
상기 A-ALD는 다른 단백질과 복합체 (complex)를 형성하지 않고서 발현된 것일 수 있다. 상기 효모 세포는 예를 들면, EC 4.1.3.39에 속하는 외인성 효소 또는 그 유전자를 포함하지 않는 것일 수 있다.
상기 A-ALD는 대장균에서 유래한 것일 수 있다. 대장균에서, 상기 A-ALD 유전자 즉, mhpF는 mhpA, mhpB, mhpC, mhpD, mhpE 및 mhpF의 전사체 단위 (transcription unit)로 구성된 유닛 중의 하나일 수 있다. 통상, 다른 미생물에서는 MhpE와 MhpF는 하나의 복합체로 구성되어 존재하나, 대장균에서는 MhpF가 단독으로 존재가 가능하며, 활성을 나타낸다. 이때, 상기 아세트알데히드를 아세틸-CoA로 전환하는 것을 촉매하는 효소 MhpF는 서열번호 34의 아미노산 서열과 95% 이상의 서열 동일성을 갖는 것일 수 있다.
상기 효모 세포는 상기 아세트알데히드를 아세틸-CoA로 전환하는 것을 촉매하는 효소를 코딩하는 외인성 유전자 (exogenous gene)를 포함하는 것일 수 있다. 상기 A-ALD 외인성 유전자는, 상기 효모 세포에서 그 모세포에 비하여 아세트알데히드를 아세틸-CoA로 전환하는 것을 촉매하는 효소의 활성이 증가되기에 충분한 양으로 발현된 것일 수 있다. 상기 A-ALD 외인성 유전자는 서열번호 34의 아미노산 서열과 95% 이상의 서열 동일성을 갖는 아미노산 서열을 코딩하는 것일 수 있다. 상기 A-ALD 외인성 유전자는 서열번호 35 또는 서열번호 36의 뉴클레오티드 서열과 95% 이상의 서열 동일성을 갖는 것일 수 있다. 서열번호 35은 대장균 유래의 A-ALD 유전자의 뉴클레오티드 서열이다. A-ALD 외인성 유전자는 효모 세포에서 발현되기에 적합한 코돈으로 변경된 서열, 최적화된 코돈을 갖는 서열로 변경될 수 있다. 이 코돈 변경은 단백질의 아미노산 서열이 바뀌지 않는 범위 내에서 적절히 이루어질 수 있다. 서열번호 36은 대장균 유래의 A-ALD 유전자의 효모 세포에서 최적화된 코돈을 갖는 뉴클레오티드 서열의 일 예이다.
상기 외인성 유전자는 발현 벡터를 통하여 모세포 내로 도입된 것일 수 있다. 또한, 상기 외인성 유전자는 선형 폴리뉴클레오티드 형태로 모세포 내로 도입된 것일 수 있다. 또한, 상기 외인성 유전자는 세포 내에서 발현 벡터 (예, 플라스미드)로부터 발현되는 것일 수 있다. 또한, 상기 외인성 유전자는 안정적인 발현을 위하여 세포 내의 유전물질 (예, 염색체)에 삽입되어 발현되는 것일 수 있다. 또한, 상기 외인성 유전자는 유전자에 작동 가능하도록 연결된 외인성 프로모터에 의해 적절히 조절되는 것일 수 있다. 상기 프로모터는 ccw12, pdc1, tef1 또는 pgk1 유전자 유래의 프로모터 일 수 있다.
다른 양상은 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자를 도입하는 단계; 및 효모 세포에서 RGT1 단백질을 코딩하는 유전자를 파괴하는 단계;를 포함하는 락테이트 생산능을 가진 효모 세포를 제조하는 방법을 제공한다.
또한, 상기 락테이트 생산능을 가진 효모 세포를 제조하는 방법에 있어서, 효모 세포에서 HXK2 단백질을 코딩하는 유전자를 파괴하는 단계를 포함할 수 있다.
상기 락테이트를 생산하는 효모를 제조하는 방법에 있어서, 효모 세포에 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자를 도입하는 단계는 다음과 같다. 본 단계에 있어서, "효모 세포", "피루베이트를 락테이트로 전환하는 것을 촉매하는 효소", 및 "피루베이트를 락테이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자"에 대하여는 상기한 바와 같다.
"피루베이트를 락테이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자"는 도입되어 상기 효모 세포의 내인성 (endogenous) 유전물질 (예, 염색체)에 삽입되는 것일 수 있다. 이 경우 상기 양 유전자는 상기 효모 세포의 내인성 유전물질 (예, 염색체)의 특정 유전자 중 하나 이상의 위치에 삽입되어, 상기 하나 이상의 유전자를 파괴하는 것일 수 있다. 상기 특정 유전자는 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 디히드록시아세톤 포스페이트(DHAP)를 글리세롤-3-포스페이트(G3P)로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 글리세롤-3-포스페이트를 글리세롤로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 및 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소를 코딩하는 유전자를 포함할 수 있다. 상기 특정 유전자는 PDC, CYB2, GPD, GPP, 및 ADH 유전자를 포함할 수 있다.
상기 유전자는 상기 효모 세포의 내인성 유전물질에 삽입되지 않은 상태로 상기 효모 세포 내에 존재하는 것일 수 있다. 이 경우 상기 유전자는 플라스미드와 같은 벡터에 포함되어 상기 효모 세포의 내인성 유전물질과는 분리되어 위치하는 것일 수 있다.
상기 유전자는 발현가능한 형태로 효모 세포에 도입되고 발현되어, 그의 유전자 산물인 "피루베이트를 락테이트로 전환하는 것을 촉매하는 효소"를 효모 세포 내에서 생성하는 것일 수 있다. 상기 발현가능한 형태는 상기 유전자가 그의 발현 조절 서열과 작동가능하게 연결된 구조일 수 있다. 예를 들면, 외인성 인핸서 (enhancer), 오퍼레이터 (operator), 프로모터 (promoter), 및 전사 터미네이터 (transcription terminator) 중 하나 이상과 작동가능하게 연결되어 있어서, 그 자체적으로 효모 세포에서 발현가능하도록 되어 있거나 효모 세포의 조절 서열과 연결되어 발현가능하도록 되어 있는 것일 수 있다. 상기 프로모터는 CCW12 프로모터, CYC 프로모터, TEF1 프로모터, PGK1 프로모터, GPD 프로모터, 및 ADH 프로모터로 이루어진 군으로부터 선택된 것일 수 있다. 상기 CCW12 프로모터, CYC 프로모터, TEF1 프로모터, PGK1 프로모터, GPD 프로모터, 및 ADH 프로모터는 각각 서열번호 13, 14, 15, 16, 17, 및 18의 폴리뉴클레오티드 서열을 갖는 것일 수 있다. 상기 터미네이터는 PGK1 (phosphoglycerate kinase 1), CYC1 (cytochrome c transcription), 및 GAL1로 이루어진 군으로부터 선택되는 것일 수 있다. CYC1 터미네이터는 서열번호 19의 뉴클레오티드 서열을 갖는 것일 수 있다. 상기 벡터는 선별 마커를 더 포함할 수 있다.
상기 도입하는 단계는, 당업계에서 알려진 효모 세포에 유전물질을 도입하는 방법에 의하여 이루어질 수 있다 (R. Danile Gietz et al., Biotechniques 30:816-831, April 2001). 상기 도입하는 방법은 스페로플라스트 법 (spheroplast method), 온전한 효모 세포 형질전환법 (intact yeast cell transformation), 및 전기충격법 (electroporation)을 포함한다. 온전한 효모세포 형질 전환법은 효모 세포에 의한 플라스미드와 같은 DNA 섭취를 촉진하기 위해 PEG와 조합하여 특정 일가 알칼리 양이온 (Na+, K+, Rb+, Cs+ 및 Li+)을 사용하는 것일 수 있다. 예를 들면, PEG, LiAc, 담체(carrier) ssDNA 및 플라스미드 DNA를 함유하는 수성 용액에 열충격 (heat shock)을 가하는 것일 수 있다. 전기충격법은 효모 세포와 플라스미드 DNA와 같은 DNA 함유 혼합 매질 중에 전기 펄스를 제공하는 것을 포함한다.
따라서, 상기 도입하는 단계는 효모 세포와 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자를 적절한 액체 매질 중에서 접촉시키는 단계를 포함할 수 있다. 상기 효모 세포는 스페로플라스트 (spheroplast), 또는 온전한 효모 세포일 수 있다. 상기 액체 매질은 선택되는 형질전환 방법에 따라 달라질 수 있다. 상기 액체 매질은 예를 들면, 물, 수성 용액, 또는 버퍼일 수 있다. 상기 수성 매질은, 일가 알칼리 양이온 (Na+, K+, Rb+, Cs+ 및 Li+ 중 어느 하나 이상), 및 PEG를 포함하는 것일 수 있다. 상기 액체 매질은 담체 ssDNA를 포함할 수 있다. 상기 액체 매질은 PEG, LiAc, 및 담체 ssDNA 함유 수용액일 수 있다.
상기 접촉은 열충격 또는 전기펄스를 가하면서 이루어질 수 있다. 상기 열충격은 약 40 내지 약 45℃, 예를 들면, 약 42℃에서 배양하는 것일 수 있다. 상기 전기 펄스는 전기충격 큐벳 (electroporation cuvette) 내에서 또는 페트리 디쉬 내의 전극 사이에서 인가될 수 있다. 전기충격의 변수인 전기장 강도 (field strength) (kV/cm), 전기용량 (capacitance)(uF), 및 저항(resistance)은 세포 준비물의 특정 사항에 따라 다를 수 있다. 따라서, 효모 균주에 따라 형질전환 효율이 다를 수 있다. 주어진 효모 균주에 대하여, 당업계의 통상의 기술자는 세포에 따른 펄스의 변수를 조사하고 적절한 변수를 선택하여 충분한 수의 형질 전환체 (transformant)가 얻어지도록 할 수 있다.
상기 도입하는 단계에서, 상기 양 유전자는 모세포의 효모 세포의 내재적 유전물질과 상동성 서열 (homologous sequence)과 함께 벡터 중에 포함된 것일 수 있다. 상기 상동성 서열은 모세포의 효모 세포의 내재적 유전물질에 존재하는 표적 서열 (target sequence)에 상보적이어서, 상동 재조합 (homologous recombination)에 의하여 표적 서열과 치환될 수 있는 것일 수 있다. 상기 표적 서열은 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 디히드록시아세톤 포스페이트(DHAP)를 글리세롤-3-포스페이트(G3P)로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 글리세롤-3-포스페이트를 글리세롤로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 및 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소를 코딩하는 유전자를 포함한다. 상기 특정 유전자는 PDC, CYB2, GPD, GPP, 및 ADH 유전자를 포함한다. 상기 벡터는 표적 서열의 5' 말단 영역과 3' 말단 영역에 각각 상동성인 두 개의 서열을 포함하는 것일 수 있다. 이 경우, 상기 도입하는 단계는 상기 접촉 동안 또는 접촉 후에 효모 세포를 선택 압력 (selection pressure) 하에서 배양하는 것을 포함할 수 있다. 상기 선택 압력은 상동 재조합이 일어난 세포만 선별될 수 있도록 하는 물질 또는 상태를 나타낸다. 상기 선택 압력은 항생제 존재하에서 배양하는 것을 포함한다. 이 경우, 상기 벡터는 항생제를 분해하는 효소를 코딩하는 유전자를 포함하는 것일 수 있다.
상기 락테이트를 생산하는 효모를 제조하는 방법에 있어서, 효모 세포에서 RGT1 단백질, 또는 RGT1 단백질 및 HXK2 단백질을 각각 코딩하는 유전자를 파괴하는 단계는 다음과 같다.
상기 파괴하는 단계는 효모 세포와 RGT1 단백질, 또는 RGT1 단백질 및 HXK2 단백질을 각각 코딩하는 유전자와 상동성 서열을 포함하는 폴리뉴클레오티드를 적절한 액체 매질 중에서 접촉시키는 단계를 포함할 수 있다. 상기 상동성 서열은 상기 유전자의 전체 또는 일부와 상동성인 것일 수 있다. 상기 상동성 서열은 상기 유전자의 코딩 영역 또는 발현 조절 영역에 상동성인 것일 수 있다. 상기 유전자와 상동성 서열을 포함하는 폴리뉴클레오티드는 다른 유전자, 예를 들면, LDH 유전자와 같은 락테이트 생합성을 촉진하는데 관련되는 효소를 코딩하는 유전자에 연결된 것일 수 있다. 상기 유전자와 상동성 서열을 포함하는 폴리뉴클레오티드는 플라스미드와 같은 벡터에 포함된 것일 수 있다. 상기 상동성 서열은 RGT1 단백질, 또는 RGT1 단백질 및 HXK2 단백질을 각각 코딩하는 유전자를 상동 재조합 (homologous recombination)에 의하여 치환하는데 사용될 수 있다. 상기 벡터는 표적 서열의 5' 말단 영역과 3' 말단 영역에 각각 상동성인 두 개의 서열을 포함하는 것일 수 있다. 이 경우, 상기 파괴하는 단계는 상기 접촉 동안 또는 접촉 후에 효모 세포를 선택 압력 (selection pressure) 하에서 배양하는 것을 포함할 수 있다. 상기 선택 압력은 상동 재조합이 일어난 세포만 선별될 수 있도록 하는 물질 또는 상태를 나타낸다. 상기 선택 압력은 항생제 존재하에서 배양하는 것을 포함한다. 이 경우, 상기 벡터는 항생제를 분해하는 효소를 코딩하는 유전자를 포함하는 것일 수 있다.
그 외에 상기 파괴하는 단계에 있어서, 상기 접촉시키는 단계는 달리 언급이 없으면, 당업계에서 알려진 효모 세포에 유전물질을 도입하는 방법의 조건하에서 이루어질 수 있다. 상기 도입하는 방법은 스페로플라스트 법 (spheroplast method), 온전한 효모 세포 형질전환법 (intact yeast cell transformation), 및 전기충격법 (electroporation)을 포함한다. 온전한 효모세포 형질 전환법은 효모 세포에 의한 플라스미드와 같은 DNA 섭취를 촉진하기 위해 PEG와 조합하여 특정 일가 알칼리 양이온 (Na+, K+, Rb+, Cs+ 및 Li+)을 사용하는 것일 수 있다. 예를 들면, PEG, LiAc, 담체 ssDNA 및 플라스미드 DNA를 함유하는 수성 용액에 열충격 (heat shock)을 가하는 것일 수 있다. 전기충격법은 효모 세포와 플라스미드 DNA와 같은 DNA 함유 혼합 매질 중에 전기 펄스를 제공하는 것을 포함한다.
상기 효모 세포는 스페로플라스트 (spheroplast), 또는 온전한 효모 세포일 수 있다. 상기 액체 매질은 선택되는 형질전환 방법에 따라 달라질 수 있다. 상기 액체 매질은 예를 들면, 물, 수성 용액, 또는 버퍼일 수 있다. 상기 수성 매질은, 일가 알칼리 양이온 (Na+, K+, Rb+, Cs+ 및 Li+ 중 어느 하나 이상), 및 PEG를 포함하는 것일 수 있다. 상기 액체 매질은 담체 ssDNA를 포함할 수 있다. 상기 액체 매질은 PEG, LiAc, 및 담체 ssDNA 함유 수용액일 수 있다.
상기 접촉은 열충격 또는 전기펄스를 가하면서 이루어질 수 있다. 상기 열충격은 약 40 내지 약 45℃, 예를 들면, 약 42℃에서 배양하는 것일 수 있다. 상기 전기 펄스는 전기충격 큐벳 (electroporation cuvette) 내에서 또는 페트리 디쉬 내의 전극 사이에서 인가될 수 있다. 전기충격의 변수인 전기장 강도 (field strength) (kV/cm), 전기용량 (capacitance)(uF), 및 저항(resistance)은 세포 준비물의 특정 사항에 따라 다를 수 있다. 따라서, 효모 균주에 따라 형질전환 효율이 다를 수 있다. 주어진 효모 균주에 대하여, 당업계의 통상의 기술자는 세포에 따른 펄스의 변수를 조사하고 적절한 변수를 선택하여 충분한 수의 형질 전환체 (transformant)가 얻어지도록 할 수 있다.
상기 접촉하는 단계에서, 각각의 상기 유전자는 모세포의 효모 세포의 내재적 유전물질과 상동성 서열 (homologous sequence)과 함께 벡터 중에 포함된 것일 수 있다. 상기 상동성 서열은 모세포의 효모 세포의 내재적 유전물질에 존재하는 표적 서열 (target sequence)에 상보적이어서, 상동 재조합 (homologous recombination)에 의하여 표적 서열과 치환될 수 있는 것일 수 있다. 상기 표적 서열은 RGT1 단백질, 또는 RGT1 단백질 및 HXK2 단백질을 각각 코딩하는 유전자를 포함한다. 상기 표적 서열은 또한, 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 디히드록시아세톤 포스페이트(DHAP)를 글리세롤-3-포스페이트(G3P)로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 글리세롤-3-포스페이트를 글리세롤로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 및 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소를 코딩하는 유전자를 포함한다. 상기 특정 유전자는 PDC, CYB2, GPD, GPP, 및 ADH 유전자를 포함한다. 상기 벡터는 표적 서열의 5' 말단 영역과 3' 말단 영역에 각각 상동성인 두 개의 서열을 포함하는 것일 수 있다. 이 경우, 상기 접촉 동안 또는 접촉 후에 효모 세포를 선택 압력 (selection pressure) 하에서 배양하는 것을 포함할 수 있다. 상기 선택 압력은 상동 재조합이 일어난 세포만 선별될 수 있도록 하는 물질 또는 상태를 나타낸다. 상기 선택 압력은 항생제 존재하에서 배양하는 것을 포함한다. 이 경우, 상기 벡터는 항생제를 분해하는 효소를 코딩하는 유전자를 포함하는 것일 수 있다.
다른 양상은 상기한 효모 세포를 배지 중에서 배양하여 배양물을 얻는 단계; 및 상기 배양물로부터 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 회수하는 단계;를 포함하는, 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 생산하는 하는 방법을 제공한다.
상기 방법은 상기 효모 세포를 배양하는 단계를 포함한다. 상기 "효모 세포"에 대하여는 상기한 바와 같다.
상기 배양은 탄소원, 예를 들면, 글루코스를 함유하는 배지에서 수행될 수 있다. 효모 세포 배양에 사용되는 배지는 적절한 보충물을 함유한 최소 또는 복합 배지와 같은, 숙주 세포의 성장에 적합한 임의의 통상적인 배지일 수 있다. 적합한 배지는 상업적인 판매자로부터 입수 가능하고 또는 공지된 제조법에 따라 제조될 수 있다. 상기 배양에 사용되는 배지는 특정한 효모 세포의 요구조건을 만족시킬 수 있는 배지일 수 있다. 상기 배지는 탄소원, 질소원, 염, 미량 원소, 및 이들의 조합으로 이루어진 군으로부터 선택되는 배지일 수 있다.
상기 유전적으로 조작된 효모 세포에서 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질, 예를 들면 피루베이트 또는 락테이트와 같은 피루베이트 유래 물질을 수득하기 위하여 배양 조건을 적절히 조절할 수 있다. 상기 세포는 증식을 위하여 호기성 조건에서 배양할 수 있다. 그 후 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 생산하기 위하여 상기 세포를 미세호기 조건 또는 혐기 조건에서 배양할 수 있다. 용어 "혐기 조건 (anaerobic conditions)"은 산소가 없는 환경을 나타낸다. 용어 "미세호기 조건 (microaerobic conditions)"은 배양 또는 성장 조건에 참조되어 사용되는 경우, 배지 중의 용존산소 (dissolved oxygen: DO) 농도가 액체 배지 중의 용존 산소에 대한 포화 (saturation)의 0% 보다 크고 약 10%이하로 유지되는 것을 의미한다. 미세호기 조건은 또한, 1% 미만의 산소를 가진 분위기 (atmosphere)로 유지된 봉인된 챔버 (sealed chamber) 내에 액체 배지 중 또는 고체 아가 플레이트 상에서 세포를 성장시키거나 유지시키는 (resting) 것을 포함한다. 산소의 농도는 예를 들면, 배양물을 N2/CO2 혼합물 또는 다른 적당한 비산소 기체로 스파징함으로써 유지될 수 있다. 상기 산소 조건은 용존산소 (dissolved oxygen: DO) 농도가 0% 내지 10%, 예를 들면 0 내지 8%, 0 내지 6%, 0 내지 4%, 또는 0 내지 2%로 유지하는 것을 포함한다.
용어 "배양 조건"은 효모 세포를 배양하기 위한 조건을 의미한다. 이러한 배양 조건은 예를 들어, 효모 세포가 이용하는 탄소원, 질소원 또는 산소 조건일 수 있다. 상기 탄소원은 임의의 효모 세포가 자화할 수 있는 탄소원 (assimilable carbon source)일 수 있다. 상기 탄소원은 단당류, 이당류 또는 다당류가 포함된다. 상기 탄소원은 글루코오즈, 프럭토오즈, 만노오즈, 또는 갈락토오즈일 수 있다. 효모 세포가 이용할 수 있는 질소원은 유기 질소 화합물, 또는 무기 질소 화합물일 수 있다. 질소원의 예는 아미노산, 아미드, 아민, 질산염, 또는 암모늄염일 수 있다.
상기 배지는 pH 3 내지 5로 유지하는 버퍼제(buffering agent)를 포함하는 것일 수 있다. 상기 버퍼제는 비카르보네이트(bicarbonate)일 수 있다. 상기 배양은 배지의 pH를 pH 3 내지 5에서 유지하면서 수행되는 것일 수 있다. 배지의 pH를 pH 3 내지 5에서 유지하는 것은 배지 중에 버퍼제를 포함시키는 것에 의하거나, 배양 중에 배지 중에 산을 첨가하거나 염기를 첨가함으로써 이루어질 수 있다. 예를 들면, 배지의 pH를 모니터링하고 pH가 pH 5를 초과하는 경우, 염기를 배지 중에서 첨가하고, pH가 pH 3보다 아래로 내려가는 경우, 산을 배지 중에 첨가할 수 있다.
상기 배양물은 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질, 예를 들면 피루베이트 또는 락테이트와 같은 피루베이트 유래 물질을 함유할 수 있다.
배양물로부터의 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질, 예를 들면 피루베이트 또는 락테이트와 같은 피루베이트 유래 물질의 분리는 당해 기술분야에서 알려진 통상적인 방법에 의하여 분리될 수 있다. 이러한 분리 방법은 원심분리, 여과, 이온교환크로마토그래피 또는 결정화일 수 있다. 예를 들면, 배양물을 저속 원심분리하여 바이오매스를 제거하고 얻어진 상등액을, 이온교환크로마토그래피를 통하여 분리할 수 있다.
일 양상에 따른 재조합 효모 세포는 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 효과적으로 생산할 수 있다.
다른 양상에 다른 재조합 효모 세포를 제조하는 방법은 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 효과적으로 생산할 수 있다.
다른 양상에 따른 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 효과적으로 생산하는 하는 방법에 따르면 상기 재조합 효모 세포를 이용하여 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 효과적으로 생산할 수 있다.
도 1은 pJ1214-mhpF 벡터의 개열도를 나타낸 도면이다.
도 2는 p416-ldh-HPH 벡터 개열도를 나타낸 도면이다.
도 3은 pUC19-Trp1-Pcyc1 벡터를 나타내는 도면이다.
이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1: RGT1 유전자가 파괴된 효모 균주로부터 락테이트 생산
1. 균주의 제작
본 실시예에서 사용된 S. cerevisiae 균주는 다음과 같이 준비하였다.
(1) S. cerevisiae CEN . PK2 -1D( Δ adh1 :: ldh )의 제조
(1.1) adh1 유전자 결실용 카세트의 제조
'ldh 카세트'를 포함하는 벡터를 제조하기 위하여, S. cerevisiae CEN . PK2 -1D 게놈 DNA를 주형으로 하고, 서열번호 37 및 38의 프라이머 세트를 프라이머로 사용한 PCR에 의하여, CCW12 유전자 프로모터 (promoter) (이하, "P CCW12" 또는 "CCW12 프로모터"라고도 함)를 증폭하고 이 CCW12 유전자 프로모터 증폭 산물 (서열번호 13)과 합성된 ldh 유전자 (서열번호 6)(DNA2.0 Inc., 미국)를 각각 SacI/XbaI과 BamHI/SalI로 절단하고, 동일한 효소로 절단된 pRS416 벡터 (ATCC87521TM)와 서로 연결하였다. pRS416 vector는 T7 프로모터, 박테리아에서 암피실린 저항성, 효모에서 URA3 카세트 (선택 마커), 및 제한효소 클로닝 부위를 갖는 효모 센트로미어 셔틀 플라스미드 (yeast centromere shuttle plasmid)이다.
또한, pCEP4 플라스미드 (invitrogen, Cat. no. V044-50)를 주형으로 하고, 서열번호 39 및 40의 프라이머 세트를 프라이머로 사용한 PCR에 의하여, "HPH 카세트" 서열 (서열번호 41)을 증폭하였다. 증폭된 "HPH 카세트"와 상기 pRS416 vector를 각각 SacI 효소를 사용하여 절단하고 서로 연결하여, 'ldh 카세트'와 "HPH 카세트"가 작동가능하게 연결된 구조를 포함하는 벡터 p416-ldh-HPH를 제조하였다. 도 2는 p416-ldh-HPH 벡터 개열도를 나타낸 도면이다. 도 2에서."P CCW12" 및 "C2 LDH"는 각각 CCW12 프로모터 및 LDH orf를 나타낸다. pCEP4 plasmid는 다중클로닝 부위 (multiple cloning site)에 삽입된 재조합 유전자의 높은 수준의 전사를 위한 cytomegalovirus (CMV) immediate early enhance/promoter를 사용하는 에피좀성 포유동물 발현 벡터 (episomal mammalian expression vector)이다. pCEP4는 트란스펙션된 세포 (transfected cell)에서 안정된 선택을 위한 히그로마이신 B 저항성 유전자 (hygromycin B resistance gene)를 갖는다. 여기서 'ldh 카세트'는 ldh 유전자 및 그 조절 영역을 포함하고 있어, ldh 유전자가 발현될 수 있도록 하는 영역을 나타낸다. 상기 ldh 유전자는 CCW12 프로모터 하에서 전사되도록 하였다. 또한, 'HPH (hygromycin B phosphotransferase) 카세트'는 히그로마이신 B 저항성 유전자 (hygromycin B resistance gene) 및 그 조절 영역을 포함하고 있어, 히그로마이신 B 저항성 유전자가 발현될 수 있도록 하는 영역을 나타낸다.
adh1 결실용 카세트는 p416-ldh-HPH 벡터를 주형으로 하고, 서열번호 42와 서열번호 43의 프라이머 세트를 프라이머로 사용한 PCR에 의하여 제작하였다. 서열번호 42 및 서열번호 43에서, 각각 1-51번 서열은 S.cerevisiae 게놈 중의 상동 서열과 상동 재조합되어 adh1 유전자와 치환될 부분을 나타낸다.
adh1 결실용 카세트는 추후 S. cerevisiae CEN . PK2 -1D 게놈에서 알코올 데히드로게나제 (alcohol dehydrogenase, adh1)를 코딩하는 유전자를 ldh-HPH 카세트로 치환하여, adh1을 불활성화시키는 동시에 ldh 유전자를 도입하는데 사용된다.
(1.2) S. cerevisiae CEN . PK2 -1D( Δ adh1 :: ldh )의 제조
S.cerevisiae CEN . PK2 -1D로부터 adh1 유전자를 ldh 유전자로 치환하기 위하여, (1.1.2)에서 제작된 "adh1 결실용 카세트"를 S. cerevisiae CEN . PK2 -1D 균주를 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 히그로마이신 200ug/mL이 포함된 YPD 배지 (Yeast extract 1 (w/v)%, peptone 1 (w/v)%, 및 포도당 2 (w/v)%) 중 30℃에서 3일 동안 배양하여 염색체상의 adh1 유전자가 ldh 유전자로 교체시켜, S.cerevisiae CEN . PK2 -1D(Δadh1::ldh) 균주를 제조하였다.
(2) S. cerevisiae CEN . PK2 -1D (ㅿ adh1 :: ldh ,ㅿ pdc1 :: ldh ,ㅿ cyb2 :: ldh ,ㅿgpd1::ldh) 균주의 제조
(2.1) pdc1 , cyb2 gpd1 을 결실시키기 위한 벡터의 제작
피루베이트 데카르복실라제 1 (pyruvate decarboxylase1: Pdc1) 결실용 카세트는 p416-ldh-HPH를 주형으로 하고 서열번호 44 및 45의 프라이머 세트를 프라이머로 한 PCR에 의하여 증폭된 증폭 산물을 SacI로 절단하고, 이를 동일한 효소로 절단된 pUC57-Ura3HA 벡터 (DNA2.0 Inc.: 서열번호 46)와 서로 연결하여 pUC57-ura3HA-ldh를 제작하였다. 다음으로서, pUC57-ura3HA-ldh를 주형으로 하고 서열번호 47 및 48의 프라이머 세트를 프라이머로 사용한 PCR에 의하여 pdc1 결실용 카세트를 제작하였다. 서열번호 47 및 서열번호 48에서 1-42번 및 1-44번 서열은 각각 S.cerevisiae의 상동 서열과 상동 재조합되어 pdc1 유전자와 치환될 부분을 나타낸다.
또한, L-락테이트 시토크롬-C 옥시도리덕타제 (L-lactate cytochrome-c oxidoreductase, cyb2) 유전자 결실용 카세트는 결실용 벡터인 pUC57-ura3HA-ldh를 주형으로 하고, 서열번호 49 및 50의 프라이머 세트를 프라이머로 사용한 PCR에 의하여 증폭하였다. 서열번호 49 및 서열번호 50에서 각각 1-45번 서열은 S.cerevisiae의 상동 서열과 상동 재조합되어 cyb2 유전자와 치환될 부분을 나타낸다.
또한, 글리세롤-3-포스페이트 데히드로게나제 (glycerol-3-phosphate dehydrogenase1: gpd1) 유전자 결실용 카세트는 결실용 벡터인 pUC57-ura3HA-ldh를 주형으로 하고, 서열번호 51 및 52의 프라이머 세트를 프라이머로 사용한 PCR에 의하여 증폭하였다. 서열번호 52에서 1-50번 서열은 S. cerevisiae의 염색체의 상동 서열과 재조합되어 gpd1 유전자와 치환될 부분을 나타낸다.
(2.2) S. cerevisiae CEN . PK2 -1D (ㅿ adh1 :: ldh ,ㅿ pdc1 :: ldh ,ㅿ cyb2 :: ldh ,ㅿgpd1::ldh) 균주의 제조
먼저, S. cerevisiae CEN . PK2 -1D(Δadh1::ldh)로부터 pdc1 유전자를 ldh 유전자로 치환하기 위하여, (2.1)에서 제작된 "pdc1 결실용 카세트"를 (1)에서 얻어진 S.cerevisiae CEN . PK2 -1D(Δadh1::ldh)에 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 열충격 후 선택 마커인 Ura-drop out 배지 중 30℃에서 3일 동안 배양하여 염색체상의 pdc1 유전자를 ldh 유전자로 교체시켰다. 제조된 균주의 유전형을 분석하기 위하여, 제조된 균주의 게놈을 주형으로 하고, 서열번호 53 및 54의 프라이머 세트로 사용한 PCR에 의하여 pdc1 유전자 결실 여부를 확인하였다.
그 결과, S. cerevisiae CEN . PK2 -1D(Δadh1::ldh, Δpdc1::ldh) 균주가 제조된 것을 확인하였다.
다음으로, S. cerevisiae CEN . PK2 -1D (Δadh1::ldh, Δpdc1::ldh) 균주로부터 cyb2 유전자를 ldh로 치환하기 위하여, (2.1)에서 제작된 "cyb2 결실용 카세트"를 상기 균주에 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 열충격 후 선택 마커인 Ura-drop out 배지 중 30℃에서 3일 동안 배양하여 염색체상의 cyb2 유전자를 ldh 유전자로 교체시켰다. 제조된 균주의 유전형을 분석하기 위하여, 제조된 균주의 게놈을 주형으로 하고, 서열번호 55 및 56의 프라이머 세트로 사용한 PCR에 의하여 cyb2 유전자 결실 여부를 확인하였다.
그 결과, S. cerevisiae CEN . PK2 -1D(Δadh1::ldh,Δpdc1::ldh,Δcyb2::ldh) 균주가 제조된 것을 확인하였다.
다음으로, S. cerevisiae CEN . PK2 -1D(Δadh1::ldh,Δpdc1::ldh,Δcyb2::ldh) 균주로부터 gpd1 유전자를 ldh로 치환하기 위하여, (2.1)에서 제작된 "gpd1 결실용 카세트"를 상기 균주에 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 열충격 후 선택 마커인 Ura-drop out 배지 중 30℃에서 3일 동안 배양하여 염색체상의 gpd1 유전자를 ldh 유전자로 교체시켰다. 제조된 균주의 유전형을 분석하기 위하여, 제조된 균주의 게놈을 주형으로 하고, 서열번호 57 및 58의 프라이머 세트로 사용한 PCR에 의하여 gpd1 유전자 결실 여부를 확인하였다.
그 결과, S. cerevisiae CEN . PK2 -1D(Δadh1::ldh,Δpdc1::ldh,Δcyb2::ldh,Δgpd1:ldh) 균주가 제조된 것을 확인하였다.
(3) S. cerevisiae CEN . PK2 -1D (ㅿ adh1 :: ldh ,ㅿ pdc1 :: ldh ,ㅿ cyb2 :: ldh ,ㅿgpd1::ldh,mhpF,ㅿ ald6 , EutE ) 균주의 제조
(3.1) mhpF 를 삽입하기 위한 벡터의 제작 및 도입
S. cerevisiae CEN . PK2 -1D (ㅿadh1::ldh,ㅿpdc1::ldh,ㅿcyb2::ldh,ㅿgpd1::ldh)에서 acetaldehyde로부터 acetyl-CoA로 전환하는 경로를 강화하기 위하여, MhpF 유전자를 삽입하였다.
구체적으로, 대장균에서 유래한 MhpF 유전자 (서열번호 35)를 S.cerevisiae 중에서 벡터로부터 발현시키기 위하여 S. cerevisiae에서 자주 사용되는 코돈으로 최적화된 MhpF 유전자 (서열번호 36)(DNA2.0 Inc., 미국)를 합성하였다. 합성된 MhpF 유전자는 5' 말단에 TEF1 프로모터 서열 (서열번호 15)이 연결되어 있어, TEF1 프로모터에 의하여 전사가 조절되도록 하였다. 이 합성된 TEF1 프로모터-MhpF 유전자가 포함된 pJ1214-mhpF (DNA2.0 Inc., 미국)를 제공받았다. pJ1214 (DNA2.0 Inc., 미국)는 S. cerevisiae에 대한 발현 벡터로서 URA3 마커를 포함하고 2um Ori 서열을 포함하고 있다. 도 1은 pJ1214-mhpF 벡터의 개열도를 나타낸 도면이다. 도 1에서, P TEF는 TEF 프로모터를 나타낸다. pJ1214-mhpF 벡터의 뉴클레오티드 서열은 서열번호 59에 기재되어 있다.
pJ1214-mhpF의 MhpF 유전자와 'HIS3 카세트'를 각각 SalI 제한 효소를 사용하여, 'pUC19 벡터'(NEB, N3041)에 연결하여, pUC19-His-MhpF 벡터 (서열번호 60)를 제조하였다. 상기 HIS3 카세트는 pRS413 (ATCC8758)을 주형으로 서열번호 61의 프라이머 및 서열번호 62의 프라이머를 프라이머로 사용한 PCR에 의하여 증폭하여 얻은 증폭 산물이다. pUC19-His-MhpF 벡터에서 mhpF는 GPD 프로모터 하에서 발현된다.
제조된 pUC19-His-MhpF 벡터를 주형으로 하고, leu2 상동 재조합 서열 및 프로모터가 결합된 서열번호 63 및 64의 프라이머를 프라이머로 사용한 PCR에 의하여 mhpF 삽입용 카세트를 얻었다. 여기서, 상동 재조합되는 leu2는 모균주에서 돌연변이 되어 있어 기능적 단백질을 발현하지 못하는 부위이다.
이렇게 제작한 mhpF 삽입용 카세트를 S. cerevisiae CEN . PK2 -1D(ㅿadh1::ldh,ㅿpdc1::ldh,ㅿcyb2::ldh,ㅿgpd1::ldh)에 도입하였다. 도입은 일반적인 열충격 형질전환 (heat shock transformation)에 의하여 수행되었으며, 형질도입 후 histidine drop out 배지 (Yeast nitrogen base without amino acids (Sigma-Aldrich: Cat. no. Y0626) 6.7 g/L, 및 Yeast synthetic drop-out without histidine (Sigma-Aldrich: Cat. no. Y1751) 1.9 g/L, glucose 2 (w/v)%)에서 세포를 배양하여 염색체 (chromosome) 상의 Leu2 ORF가 상기 카세트로 치환되도록 하였다.
그 결과 얻어진 균주에 대하여 Leu2 locus에의 mhpF 유전자의 도입을 확인하기 위하여, 상기 세포의 게놈을 주형으로 하고 서열번호 65 및 66의 프라이머 세트를 프라이머로 사용한 PCR에 의하여 유전자 결실 및 유전자 도입 여부를 확인하였다. 그 결과, S. cerevisiae CEN . PK2 -1D (ㅿadh1::ldh,ㅿpdc1::ldh,ㅿcyb2::ldh,ㅿgpd1::ldh, mhpF)를 제조하였다.
(3.2) ald6 를 결실하기 위한 벡터의 제작 및 도입
아세트알데히드 데히드로게나제6 (acetaldehyde dehydrogenase 6: ald6) 유전자 결실용 카세트는 결실용 벡터인 pUC57-ura3HA를 주형으로 하고, 서열번호 67 및 68의 프라이머 세트를 프라이머로 사용한 PCR에 의하여 증폭하였다. 서열번호 67 및 68의 서열은 S. cerevisiae의 염색체의 상동 서열과 재조합되어 ald6 유전자와 치환될 부분을 포함한다.
S. cerevisiae CEN . PK2 -1D(ㅿadh1::ldh,ㅿpdc1::ldh,ㅿcyb2::ldh,ㅿgpd1::ldh, mhpF) 균주로부터 ald6 유전자를 결실하기 위하여, 제작된 "ald6 결실용 카세트"를 상기 균주에 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 열충격 후 선택 마커인 Minimal Ura-drop out 배지 중 30℃에서 3일 동안 배양하여 염색체상의 ald6 유전자를 결실시켰다. 제조된 균주의 유전형을 분석하기 위하여, 제조된 균주의 게놈을 주형으로 하고, 서열번호 69 및 70의 프라이머 세트로 사용한 PCR에 의하여 ald6 유전자 결실 여부를 확인하였다.
그 결과, S. cerevisiae CEN . PK2 -1D (ㅿadh1::ldh,ㅿpdc1::ldh,ㅿcyb2::ldh,ㅿgpd1::ldh, mhpF, Δald6) 균주가 제조된 것을 확인하였다.
(3.3) EutE 를 도입하기 위한 벡터의 제작 및 도입
(3.3.1) 효모 이목적 ( dual function ) 과발현 벡터 pCS - Ex1 의 제작
효모 과발현 벡터로 널리 사용되고 있는 pRS426GPD 벡터로부터 서열번호 71과 서열번호 72의 프라이머 조합을 이용하여 PCR을 수행하여 689 bp의 DNA 조각 (GPD 프로모터)을 얻었다. 이 DNA 조각을 KpnI으로 처리한 pCtB1 벡터 (Genbank Accession Number KJ922019)와 섞어 In-fusion 키트 (Clonetech, cat. 639650)를 이용하여 클로닝한 후, 통상적인 방법을 통해 클로닝용 대장균주인 TOP10 균주 (Invitrogen, cat. C4040-06)에 도입하였다. 도입 후 균주를 카나마이신이 50ug/ml 농도로 포함된 LB 한천 배지 (Bacto Tryptone 10 g/L, Yeast Extract 5 g/L, NaCl 10 g/L, 및 Bacto Agar 15 g/L)에 도말하고 배양하여 형성된 콜로니들 중에서 플라스미드 DNA를 분리하여 그 중 플라스미드 서열이 서열번호 73과 같은 플라스미드를 확인하였다. 그 결과, 효모 이목적 과발현 벡터인 pCS-Ex1 벡터를 얻었다. 여기서, 이목적이란 유전자의 게놈 삽입 후 발현 목적 및 벡터 상에서의 유전자 발현 목적을 나타낸다.
(3.3.2) 효모 이목적 대장균 eutE 유전자 과발현 벡터의 제작 
대장균 MG1655 균주의 게놈 DNA로부터 서열번호 74와 서열번호 75의 프라이머 조합을 이용하여 PCR을 수행하여 1447 bp의 DNA 조각, 즉 EutE 유전자를 얻었다. 이 DNA 조각을 KpnI과 SacI으로 처리한 pCS-Ex1 벡터와 섞어 In-fusion 키트 (Clonetech cat. 639650)를 이용하여 클로닝한 후, 통상적인 방법을 통해 클로닝용 대장균주인 TOP10 균주 (Invitrogen cat. C4040-06)에 도입하였다. 도입 후 균주를 카나마이신이 50ug/ml 농도로 포함된 LB 한천 배지에 도말하고 배양하여 형성된 콜로니들 중에서 플라스미드 DNA를 분리하여 그 중 플라스미드 서열이 서열번호 76과 같은 플라스미드를 확인하였다. 그 결과, 효모 이목적 대장균 eutE 유전자 과발현 벡터인 MD1040 벡터를 얻었다.
(3.3.3) 대장균 eutE 유전자가 과발현된 효모의 제작 
제작된 MD1040 벡터로부터 서열번호 77과 서열번호 78의 프라이머 조합을 이용하여 PCR을 수행하여 3985bp의 DNA 조각을 얻었다. 이 조각을 통상적인 방법으로 S.cerevisiae CEN . PK2 -1D(ㅿadh1::ldh,ㅿpdc1::ldh,ㅿcyb2::ldh,ㅿgpd1::ldh, mhpF,ㅿald6)에 도입한 후 우라실이 포함되어 있지 않은 최소 배지인 SD-URA 한천배지 (Yeast nitrogen base without amino acids (Sigma-Aldrich: Cat. no. Y0626) 6.7 g/L, Yeast synthetic drop-out without uracil(Sigma-Aldrich: Cat. no. Y1501) 1.9 g/L, D-glucose 20g/L, 및 Bacto Agar 20g/L)에 도말하였다. 사흘 후 형성되는 콜로니들 중에서, 서열번호 79과 서열번호 80의 프라이머 조합을 이용하여 PCR을 수행했을 때 4357bp의 DNA 조각을 확인할 수 있는 콜로니를 선별하였다. 자연형 균주의 게놈 DNA에서는 서열번호 79과 서열번호 80의 프라이머 조합을 이용하여 PCR을 수행하면 2300bp의 DNA 조각을 얻을 수 있다. 얻어진 클론을 YPD 배지 (Bacto Peptone 20g/L, Yeast Extract 10g/L, 및 D-glucose 20g/L)에 접종하여 30℃에서 230rpm으로 교반하여 배양한 후, 5-FOA가 포함된 역선별배지 (Yeast nitrogen base without amino acids (Sigma-Aldrich: Cat. no. Y0626) 6.7 g/L, Yeast synthetic drop-out without uracil(Sigma-Aldrich: Cat. no. Y1501) 1.9 g/L, Uracil 0.1g/L, D-glucose 20g/L, 5-fluoroorotic acid (5-FOA) 1g/L, 및 Bacto Agar 20g/L)에 도말하였다. 사흘 후 형성되는 콜로니들 중에서, 서열번호 C3과 서열번호 C4 프라이머 조합을 이용하여 PCR을 수행했을 때 2963 bp의 DNA 조각을 확인할 수 있는 콜로니를 선별하였다. 그 결과, S. cerevisiae CEN . PK2 -1D (ㅿadh1::ldh,ㅿpdc1::ldh,ㅿcyb2::ldh,ㅿgpd1::ldh, mhpF,ㅿald6, EutE) (이하 "SP1130"이라고도 한다)를 제조하였다.
(4) S. cerevisiae CEN . PK2 -1D SP1130 (ㅿ RGT1 )의 제작
(4.1) RGT1 유전자를 결실하기 위한 벡터의 제작 및 도입
RGT1 유전자 결실용 카세트는 결실용 벡터인 상술한 pUC57-Ura3HA 벡터를 주형으로 하고, 서열번호 81 및 82의 프라이머 세트를 프라이머로 사용한 PCR에 의하여 RGT1 유전자 결실용 카세트를 제작하였다. 서열번호 81 및 82의 서열은 S. cerevisiae의 염색체 상동 서열과 재조합되어 RGT1 유전자와 치환될 부분을 포함한다.
실시예 1의 (3)에서 제조한 상기 S. cerevisiae CEN.PK2-1D SP1130 균주로부터 RGT1 유전자를 결실하기 위하여, 제작된 "RGT1 유전자 결실용 카세트"를 상기 균주에 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 열충격 후 선택 마커인 Minimal Ura-drop out 배지 중 30℃에서 3일 동안 배양하여 염색체상의 RGT1 유전자를 결실시켰다. 제조된 균주의 유전형을 분석하기 위하여, 제조된 균주의 게놈을 주형으로 하고, 서열번호 83 및 84의 프라이머 세트로 사용한 PCR에 의하여 RGT1 유전자 결실 여부를 확인하였다.
그 결과, S. cerevisiae CEN.PK2-1D SP1130(ㅿRGT1) 균주가 제조된 것을 확인하였다.
(5) S. cerevisiae CEN . PK2 -1D SP1130 ( P cyc1 HXK2 RGT1 )의 제작
(5.1) P cyc1 단편의 준비 및 재조합 벡터의 제작
또한, CYC1 프로모터(Pcyc1) (서열번호 85)를 포함하는 DNA 단편을 얻기 위해, Qiagen(사)의 Genomic-tip 시스템을 이용하여 사카로마이세스 세레비지애 야생주인 CEN.PK2-1D의 염색체 DNA(gDNA)를 추출하고, 상기 gDNA를 주형으로 PCR HL premix kit(BIONEER사 제품, 이하 동일함)를 사용하여 중합효소 연쇄반응을 수행하였다. Pcyc1를 증폭시키기 위한 PCR은 서열번호 86 및 87의 프라이머를 사용하여 94℃에서 30초의 변성(denaturation), 52℃에서 30초의 어닐링(annealing), 및 72℃에서 30초의 신장(elongation)으로 이루어진 사이클을 30회 반복 수행하였다. 상기 PCR 결과물을 EcoRI으로 절단하여 DNA 단편(이하, "Pcyc1 카세트"이라 명명함)을 0.8% 아가로스 겔(agarose gel)에서 전기영동한 후 용리(鎔離)하여 수득하였다.
pUC19-Trp1 벡터 (Appl Environ Microbiol. 2002 May;68(5):2095-100) 플라스미드 및 수득한 Pcyc1 카세트를 제한효소 EcoRI으로 처리하고 라이게이션(ligation)시켜서 pUC19-Trp1-Pcyc1 벡터를 제작하였다. 도 3은 pUC19-Trp1-Pcyc1 벡터를 나타내는 도면이다.
(5.2) S. cerevisiae CEN . PK2 -1D SP1130 ( P cyc1 HXK2 )의 제작
PHXK2를 Pcyc1로 교체하기 위해, 실시예 1의 5.1에서 제작된 Pcyc1 카세트 HXT 유전자 프로모터 시퀀스를 포함하도록 서열번호 88 및 89의 프라이머 로 증폭한 뒤 이를 50% 폴리에틸렌글리콜, 단일 가닥 담체 DNA (single stranded carrier DNA)와 혼합한 다음 약 42℃ 수조에서 약 30분 동안 반응 후 사카로마이세스 세레비지애 CEN.PK2-1D SP1130 배양액을트립토판 무첨가 최소 고체배지 (YSD, 6.7 g/L yeast nitrogen base without amino acids, 1.4 g/L Amino acid dropout mix (-trp))에 도말하여 30℃에서 3일 이상 배양하였다. 상기 플레이트에서 형성된 콜로니 (변이 균주) 10개를 선별해 다시 트립토판 무첨가 최소 고체배지에 옮김과 동시에 같은 성분의 액체 배지에 배양해 균주로부터 상용 키트 (Gentra Puregene Cell kit, Qiagen, USA)를 이용하여 게놈 DNA를 분리하였다. 상기 분리된 변이주의 게놈 DNA를 주형으로 하여 PHXK2의 Pcyc1로의 교체를 확인하기 위해 서열번호 90 및 91의 프라이머를 이용하여 PCR을 수행한 다음, 수득된 PCR 산물을 전기영동을 실시하여 PHXK2의 Pcyc1로의 교체를 확인하였다. 그 결과, S. cerevisiae CEN.PK2-1D SP1130 (Pcyc1HXK2) 을 수득하였다.
(5.3) S. cerevisiae CEN . PK2 -1D SP1130 ( P cyc1 HXK2 RGT1 )의 제작
실시예 1의 (5.2)에서 제조한 상기 S. cerevisiae CEN.PK2-1D SP1130 (Pcyc1HXK2) 로부터 RGT1 유전자를 결실하기 위하여, 실시예 1의 (4.1)에서 제작된 "RGT1 유전자 결실용 카세트"를 상기 균주에 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 열충격 후 선택 마커인 Minimal Ura-drop out 배지 중 30℃에서 3일 동안 배양하여 염색체상의 RGT1 유전자를 결실시켰다. 제조된 균주의 유전형을 분석하기 위하여, 제조된 균주의 게놈을 주형으로 하고, 서열번호 83 및 84의 프라이머 세트로 사용한 PCR에 의하여 RGT1 유전자 결실 여부를 확인하였다.
그 결과, S. cerevisiae CEN.PK2-1D SP1130(Pcyc1HXK2ㅿRGT1) 균주가 제조된 것을 확인하였다.
(6) S. cerevisiae CEN . PK2 -1D SP1130 (ㅿ HXK2 RGT1 )의 제작
(6.1) HXK2 유전자를 결실하기 위한 벡터의 제작 및 도입
HXK2 유전자 결실용 카세트는 결실용 벡터인 상술한 pUC57-Ura3HA 벡터를 주형으로 하고, 서열번호 92 및 93의 프라이머 세트를 프라이머로 사용한 PCR에 의하여 HXK2 유전자 결실용 카세트를 제작하였다. 서열번호 92 및 93의 서열은 S. cerevisiae의 염색체 상동 서열과 재조합되어 RGT1 유전자와 치환될 부분을 포함한다.
실시예 1의 (3)에서 제조한 상기 S. cerevisiae CEN.PK2-1D SP1130 균주로부터 HXK2 유전자를 결실하기 위하여, 제작된 "HXK2 유전자 결실용 카세트"를 상기 균주에 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 열충격 후 선택 마커인 Minimal Ura-drop out 배지 중 30℃에서 3일 동안 배양하여 염색체상의 HXK2 유전자를 결실시켰다. 제조된 균주의 유전형을 분석하기 위하여, 제조된 균주의 게놈을 주형으로 하고, 서열번호 94 및 95의 프라이머 세트로 사용한 PCR에 의하여 HXK2 유전자 결실 여부를 확인하였다.
그 결과, S. cerevisiae CEN.PK2-1D SP1130(ㅿHXK2) 균주가 제조된 것을 확인하였다.
(6.2) S. cerevisiae CEN . PK2 -1D SP1130 (ㅿ RGT1 HXK2 )의 제작
실시예 1의 (6.1)에서 제조한 상기 S. cerevisiae CEN.PK2-1D SP1130 (ㅿHXK2) 로부터 RGT1 유전자를 결실하기 위하여, 실시예 1의 (4.1)에서 제작된 "RGT1 유전자 결실용 카세트"를 상기 균주에 열충격 형질전환 (heat shock transformation)에 의하여 도입하고, 열충격 후 선택 마커인 Minimal Ura-drop out 배지 중 30℃에서 3일 동안 배양하여 염색체상의 RGT1 유전자를 결실시켰다. 제조된 균주의 유전형을 분석하기 위하여, 제조된 균주의 게놈을 주형으로 하고, 서열번호 83 및 84의 프라이머 세트로 사용한 PCR에 의하여 RGT1 유전자 결실 여부를 확인하였다.
2. 제작된 효모 세포의 성장, 포도당 소모량 및 락테이트 생산량 확인
제조된 S. cerevisiae CEN . PK2 -1D SP1130(ㅿrgt1) 및 SP1130(Pcyc1HXK2 ㅿrgt1)균주 균주를 YPD 고체 배지 (Yeast extract 1 (w/v)%, peptone 1 (w/v)%, 및 포도당 2 (w/v)%)를 포함한 플레이트에 각각 도말하여 30℃에서 24 시간 이상 배양한 후, 125 ml 플라스크 중의 20 g/l 포도당을 포함한 25 ml YPD 액체 배지에 상기 균주를 접종하고 호기 조건에서 30℃에서 16 시간 동안 배양하였다. 상기 미세호기 조건은 플라스크를 통풍(ventilation)이 안되는 전용 뚜껑으로 밀폐한 뒤 90 rpm으로 교반한 상태를 나타낸다. 대조군 실험은 S. cerevisiae CEN . PK2 -1D SP1130 균주를 사용한 것을 제외하고는 동일하게 하였다.
상기 배양액 중 세포 농도를 분광 광도계를 사용하여 OD600 값을 측정하고, 배양액을 원심분리하여 상층액을 버리고 세포를 125 ml 플라스크 중의 60 g/l 포도당이 포함된 새로운 YPD 액체 배지에 OD600 값이 0.5가 되도록 접종하였다. 상기 플라스크를 교반 반응기 (shaking incubator)에 넣고 배양액을 90 rpm으로 교반하면서 36℃에서 24 시간 이상 동안 배양하였다. 상기 플라스크는 통풍이 되지 않는 전용 뚜껑으로 밀폐된 상태이었다.
배양 중 주기적으로 시료를 채취하고, 시료를 약 13,000rpm에서 약 10 분 동안 원심분리한, 상등액의 각종 대사 산물 및 락테이트와 포도당의 농도를 액체 크로마토그래피(HPLC)를 사용하여 분석하였다. 상기 배양 상등액을 0.45 um 시린지 필터를 사용하여 여과한 후, L-락테이트, 및 포도당을 HPLC 기기 (Waters e2695 Separation Module instrument equipped with a Waters 2414 Differential Refractometer and a Waters 2998 Photodiode Array Detector (Waters, Milford, MA))를 사용하여 정량하였다. HPLC 칼럼은 물 중 2.5mM H2SO4로 60℃에서 0.5mL/min 유속으로 평형화된 Aminex HPX-87H Organic Acid Analysis Column (300mmx7.8mm;Bio-Rad)을 사용하였다.
표 1은 YPD 배지 중에서 미세호기 조건에서 배양 48 시간 배양한 후 측정된 배지 중의 세포농도, 포도당 농도, 및 락테이트 농도를 나타낸다.
균주 세포성장
(최대 OD600)
포도당 소비
(g/L)
락테이트 생산
(g/L)
에탄올 생산
(g/L)
SP1130 2.26 28.63 22.29 0.86
SP1130(Pcyc1HXK2) 2.62 31.52 24.75 1.18
SP1130(ㅿrgt1) 2.46 36.16 27.06 0.99
SP1130(Pcyc1HXK2 ㅿrgt1) 2.75 38.00 29.86 0.79
SP1130(ㅿHXK2) 2.77 32.56 25.12 1.21
SP1130(ㅿHXK2 ㅿrgt1) 2.91 39.12 29.45 1.10
표 1에서, SP1130(ㅿrgt1) 및 SP1130(Pcyc1HXK2 ㅿrgt1) 균주는 각각의 대조군 SP1130 및 SP1130(Pcyc1HXK2) 균주 대비, 포도당 소비가 각각 26% 및 21% 증가하였고, 락테이트 생산은 각각 21% 및 21% 증가하였다. 따라서, RGT1 유전자가 파괴된 경우, 또는 RGT1 유전자 및 HXK2 유전자의 활성이 감소된 경우, S. cerevisiae는 그렇지 않은 경우에 비하여 포도당 소비 및 락테이트 생산성이 예기치 않게 높았다.
3. RGT1 HXT2 의 활성이 감소된 세포에서의 HXT 유전자들의 RNA 발현량 분석
S. cerevisiae CEN.PK2-1D SP1130 (Pcyc1HXK2 ㅿRGT1) 균주의 HXT1, HXT2, HXT3, HXT4, 및 HXT7 유전자의 발현량을 qRT-PCT을 이용하여 확인하였다. 상대적 발현량 비교는 ㅿㅿCT 방법을 이용하였으며, TAF10을 기준 유전자(reference gene)로 사용하였으며, 3번 해당 분석을 반복하였다. 구체적으로, 125 ml의 플라스크에서 상기 S. cerevisiae CEN.PK2-1D SP1130 (Pcyc1HXK2 ㅿRGT1) 균주의 배양 후 24시간, 32시간, 및 48 시간에 샘플링 후 RNeasy mini kit (Qiagen co.)를 이용 total RNA를 추출하였다. 추출한 RNA를 주형으로 SuperScript® III First-Strand Synthesis System (Invitrogen)을 사용하여 cDNA를 합성한 후, 각각의 HXT 유전자에 특이적으로 결합하는 프라이머, 구체적으로 HXT1, HXT2, HXT3, HXT4, 및 HXT7 유전자에 특이적으로 결합하는 정방향 프라이머 및 역방향 프라이머(각각 서열번호 96 내지 105)를 IQ SYBR Green Supermix (Bio-rad)에 제조사에서 제시된 프로토콜에 따라 혼합한 후, qRT-PCR 반응 측정기 (CFX96 realtime PCR detection system, Bio-rad)을 이용하여 그 상대적 발현양을 확인하였다.
표 2는 S. cerevisiae CEN.PK2-1D SP1130 (Pcyc1HXK2 ㅿRGT1) 균주와 S.cerevisiae CEN.PK2-1D SP1130 (Pcyc1HXK2) 균주의 HXT1, HXT2, HXT3, HXT4, 및 HXT7 RNA의 발현량을 상대적 발현값으로 나타낸다.
RNA의 종류 균주 배양 후 24시간 배양 후 36시간 배양후 48시간
HXT1
SP1130 (Pcyc1HXK2) 16.41 1.00 2.30
SP1130 (Pcyc1HXK2 ㅿRGT1) 37.82 12.20 2.41
HXT2
SP1130 (Pcyc1HXK2) 1.03 1.00 1.02
SP1130 (Pcyc1HXK2 ㅿRGT1) 57.43 49.25 5.73
HXT3
SP1130 (Pcyc1HXK2) 1.00 4.67 2.20
SP1130 (Pcyc1HXK2 ㅿRGT1) 5.03 18.30 21.74
HXT4
SP1130 (Pcyc1HXK2) 0.00 1.00 0.00
SP1130 (Pcyc1HXK2 ㅿRGT1) 8.09 0.88 50.88
HXT7
SP1130 (Pcyc1HXK2) 1.00 1.26 0.00
SP1130 (Pcyc1HXK2 ㅿRGT1) 7.46 3.24 1.99
표 2에 나타낸 바와 같이, HXT1은 RGT1의 활성이 감소된 균주(SP1130 (Pcyc1HXK2 ㅿRGT1))가 그 모세포(SP1130 (Pcyc1HXK2))에 비하여, 배양 초기에 HXT1의 발현량이 높음을 알 수 있다. 또한, HXT2는 RGT1의 활성이 감소된 균주가 그 모세포에 비하여, lag phase에 일시적으로 많이 발현되는 것을 알 수 있다. 또한 HXT3은 RGT1의 활성이 감소된 균주가 그 모세포에 비하여, 성장 정지(growth arrest)에 많이 발현되는 것을 알 수 있다. 또한, HXT4는 RGT1의 활성이 감소된 균주가 그 모세포에 비하여, 성장기에 많이 발현되는 것을 알 수 있다. 또한, HXT7은 RGT1의 활성이 감소된 균주가 그 모세포에 비하여, 정지기(stationary phase)에 진입할 때 많이 발현되는 것을 알 수 있다. 살펴본 바와 같이, RGT1의 활성이 감소된 균주는 그 모세포에 비하여 HXT의 발현량을 실제로 높이는 것을 확인하였다.
<110> Samsung Electronics Co., Ltd. <120> Yeast cell comprising reduced activity of RGT1, method for producing the yeast cell and method for producing a product using the same <130> PN107770 <160> 105 <170> KopatentIn 2.0 <210> 1 <211> 1170 <212> PRT <213> Saccharomyces cerevisiae <400> 1 Met Asn Glu Leu Asn Thr Val Ser Thr Asn Ser Ser Asp Ser Thr Lys 1 5 10 15 Asn Gly Gly Thr Ser Asn Ser Pro Asp Asp Met Asp Ser Ala Ala Ala 20 25 30 Ala Ser His Ala Ile Lys Lys Arg Thr Lys Ala Ser Arg Ala Cys Asp 35 40 45 Gln Cys Arg Lys Lys Lys Ile Lys Cys Asp Tyr Lys Asp Glu Lys Gly 50 55 60 Val Cys Ser Asn Cys Gln Arg Asn Gly Asp Arg Cys Ser Phe Asp Arg 65 70 75 80 Val Pro Leu Lys Arg Gly Pro Ser Lys Gly Tyr Thr Arg Ser Thr Ser 85 90 95 His Pro Arg Thr Asn Glu Ile Gln Asp His Asn Asn Ser Arg Ser Tyr 100 105 110 Asn Thr Phe Asp Asn Ser Asn Asn Thr Leu Asn Asn Asn Thr Gly Asn 115 120 125 Ser Gly Asp Asn Gly Ile Asn Ser Asn Thr Val Pro Ser Thr Pro Ser 130 135 140 Arg Ser Asn Ser Val Leu Leu Pro Pro Leu Thr Gln Tyr Ile Pro Gln 145 150 155 160 Ala Gly Gly Ile Pro Pro Ser Phe Gln Asn Pro Ala Ile Gln Ser Thr 165 170 175 Met Pro Ala Gly Asn Ile Gly Gln Gln Gln Phe Trp Lys Val Pro Tyr 180 185 190 His Glu Phe Gln His Gln Arg Lys Gly Ser Ile Asp Ser Leu Gln Ser 195 200 205 Asp Ile Ser Val Arg Thr Leu Asn Pro Asn Glu Gln Leu Ser Tyr Asn 210 215 220 Thr Val Gln Gln Ser Pro Ile Thr Asn Lys His Thr Asn Asp Ser Gly 225 230 235 240 Asn Ala Asn Gly Ser Val Thr Gly Ser Gly Ser Ala Ser Gly Ser Gly 245 250 255 Gly Tyr Trp Ser Phe Ile Arg Thr Ser Gly Leu Leu Ala Pro Thr Asp 260 265 270 Asp His Asn Gly Glu Gln Thr Arg Arg Ser Ser Ser Ile Pro Ser Leu 275 280 285 Leu Arg Asn Thr Ser Asn Ser Leu Leu Leu Gly Gly Gln Pro Gln Leu 290 295 300 Pro Pro Pro Gln Gln Gln Ser Gln Pro Gln Ala His Gln Gln Lys Leu 305 310 315 320 Gln Gln Gly Gln Asn Leu Tyr Ser Tyr Ser Gln Phe Ser Gln Gln Gln 325 330 335 Pro Tyr Asn Pro Ser Ile Ser Ser Phe Gly Gln Phe Ala Ala Asn Gly 340 345 350 Phe His Ser Arg Gln Gly Ser Val Ala Ser Glu Ala Met Ser Pro Ser 355 360 365 Ala Pro Ala Met Phe Thr Ser Thr Ser Thr Asn Pro Val Asn Val Ala 370 375 380 Gln Gln Thr Gln Arg Pro Gln Gly Gln Gln Val Pro Gln Phe Ser Ser 385 390 395 400 Glu Leu Asp Gly Asn Lys Arg Arg Gln Ser Ala Pro Val Ser Val Thr 405 410 415 Leu Ser Thr Asp Arg Leu Asn Gly Asn Glu Asn Asn Asn Gly Glu Ile 420 425 430 Asn Asn Asn Asn Gly Ser Asn Asn Ser Gly Ser Ser Lys Asp Thr Ser 435 440 445 Gln His Ser Gln Glu Ser Val Thr Thr Pro Ala Ala Leu Glu Ala Ser 450 455 460 Ser Pro Gly Ser Thr Pro Gln Arg Ser Thr Lys Lys Arg Arg Lys Ser 465 470 475 480 Tyr Val Ser Lys Lys Thr Lys Pro Lys Arg Asp Ser Ser Ile Ser Ile 485 490 495 Thr Ser Lys Asp Ser Ala His Pro Met Thr Thr Ser Ser Thr Ile Ala 500 505 510 Tyr Gly Gln Ile Ser Asp Val Asp Leu Ile Asp Thr Tyr Tyr Glu Phe 515 520 525 Ile His Val Gly Phe Pro Ile Ile Pro Leu Asn Lys Thr Thr Leu Thr 530 535 540 Ser Asp Leu Leu Leu Val Asn Thr Gln Pro Ile Ser Asn Ile His Glu 545 550 555 560 Val Asn Ser Tyr Val Ile Leu Trp Phe Arg Asn Ser Leu Glu Leu Leu 565 570 575 Val Arg Val Ala Leu Lys Gln Lys Pro Gly Gly Lys Phe Phe Asp Asn 580 585 590 Ile Val Gly Val Ala Leu Ser Pro Ser Asn Asp Asn Asn Lys Ala Gly 595 600 605 Phe Thr Thr Ala Thr Ala Arg Asp Asp Ala Glu Lys Thr Arg Arg Asp 610 615 620 Ser His Asn Glu Val Gln Asp Thr Leu Glu Val Gln Ser Val Phe Ile 625 630 635 640 Ala Ala Leu Asn Glu Cys Phe Gln Lys Ile Val Asp Ile His Pro Lys 645 650 655 Phe Arg Glu Asn Asn Asp Gln Ile Ser Pro Lys Ile Lys Val Ile Tyr 660 665 670 Leu Ser Thr Phe Ile Leu Leu Asn Tyr Ile Leu Ala Phe Val Gly Tyr 675 680 685 Asp Asn Ser Phe Val Leu Gly Met Ser Val Thr Ile Phe Asn Glu Phe 690 695 700 Lys Leu Tyr Lys Leu Leu Leu Phe Pro Glu Pro Asp Ile Asn Asp Val 705 710 715 720 Lys Pro Pro Val Asp Glu Glu Val Ser Thr Gly Asn Gly Asn Thr Lys 725 730 735 Thr Ser Glu Phe Glu Ile Gly Ser Glu Ser Ala Gly His Met Asn Pro 740 745 750 Ser Asn Ser Pro Asn Ser Met Asp Glu Asn Ile Ser His Tyr Ser Val 755 760 765 Leu Phe Lys Arg Leu Tyr Val Leu Leu Ser Val Phe Asp Ser Leu Gln 770 775 780 Ser Cys Ala Phe Gly Gly Pro Lys Leu Leu Asn Ile Ser Ile Gln Gly 785 790 795 800 Ser Thr Glu Arg Phe Phe Ser Asn Asp Leu Gly Ser Lys Trp Cys Leu 805 810 815 Glu Gln Ser Gln Leu Arg Leu Lys Ser Val Leu Gln Ser Leu Lys Leu 820 825 830 Gly Glu Leu Met Ser Glu Leu Thr Arg Asn Arg Ile Ser Met Asn Gly 835 840 845 Asn Arg Lys Pro Gly Phe Asp Ile Thr Asn Ser Ser Ser Leu Leu Ser 850 855 860 Glu Tyr Val Glu Thr Gln Pro Leu Ser Val Ala Gln Leu Phe Cys Lys 865 870 875 880 Leu Leu Ile Gly Lys His Asn Phe Ile Asn Cys Leu Leu Ser Leu Tyr 885 890 895 Asp Ser Glu Ala Gly Val Tyr Ser Asp Leu Thr Leu Asp Leu Ser Ser 900 905 910 Lys Ile Ala Asp Ser Leu Cys Ser Leu Ile Ser Ile Ile Leu Gln Val 915 920 925 Leu Thr Leu Ile Leu Arg Leu Asn Pro Thr Asn Ser Ile Asp Phe Asn 930 935 940 Tyr Arg Pro Pro Asn Pro Pro Ala Asn Asn Pro Thr Val Gln Glu Gly 945 950 955 960 Pro Ser Ala Met Gly Ser Ser Pro Val Ala Gly Asn Leu Ser Ala Ala 965 970 975 Pro Pro Ser Glu Gly Asn Pro Asp Phe Tyr Lys Lys Leu Leu Gly Leu 980 985 990 Lys Gln Asp Thr Gly Thr Ile Leu Ser Asp Leu Cys Arg Gly Ile Ile 995 1000 1005 Ser Pro Phe Ala Ile Ala Ile Leu His Glu Val Tyr Asn Ile Thr Glu 1010 1015 1020 Leu Val Lys Gln Met Pro Thr Ser Leu Ile Ser Ile Met Met Thr Ala 1025 1030 1035 1040 Thr Thr Thr Gln Asn Thr Gln Asp Thr Lys Lys Ser Gln Asp Leu Val 1045 1050 1055 Met Lys Leu Ser Asn Ser Met Asn Glu Val Val Gln Ile Thr Ser Val 1060 1065 1070 Leu Thr Met Ile Lys Pro Phe Lys Ile Phe Glu His Glu Leu Asn Lys 1075 1080 1085 Pro Ile Met Ser Leu Thr Gly Gly Leu Ser Ser Thr Thr Arg Asn Asp 1090 1095 1100 Val Met Trp Pro Lys Ser Gly Gln Gly Leu Arg Glu Ser Ser Val Met 1105 1110 1115 1120 Lys Thr Leu Leu Asp Glu Arg Arg Thr Ser Gly Thr Gln Pro Thr Thr 1125 1130 1135 Ala Pro Val Ala Ala Glu Glu Pro Arg Leu Glu Asn Val Ala Leu Glu 1140 1145 1150 Asn Phe Val Ser Ile Gly Trp Lys Leu Leu Asp Asp Ser Glu Leu Gly 1155 1160 1165 Trp Tyr 1170 <210> 2 <211> 3513 <212> DNA <213> Saccharomyces cerevisiae <400> 2 atgaacgagc tgaacactgt ttcgactaac tccagtgact ccaccaagaa cggtggtaca 60 tccaatagtc ccgacgatat ggactccgca gcagcagcaa gtcacgcaat aaagaaaaga 120 acaaaggcct cccgggcctg cgatcagtgt cgtaaaaaga agattaaatg tgactacaaa 180 gatgaaaagg gggtctgctc aaactgccaa aggaatggag accgttgtag ttttgatagg 240 gttcctttga aaaggggacc ctcgaaaggc tatacgagga gcaccagcca tccaaggact 300 aacgaaatac aagaccacaa taactcaagg tcgtataata cgtttgataa tagtaacaat 360 accctgaata ataatacggg caatagcggc gacaacggta taaacagtaa cacagttcca 420 agtacccctt cgagatctaa ttcagtttta ttgcccccac tgacacagta cattccccag 480 gctggtggca ttcctcctag tttccaaaat ccagcgatac aatcaactat gcccgcgggt 540 aatattggcc aacagcagtt ttggaaagtg ccctaccatg agtttcaaca ccaaagaaaa 600 ggatctatcg attctttgca aagtgatata tcggtaagaa cattaaatcc caacgagcag 660 ttgtcttata acaccgttca acagtctccc ataacgaata aacatactaa tgattctgga 720 aatgcaaacg gaagtgtcac cggctcaggc agtgcctctg gtagtggtgg ttattggtcc 780 tttataagaa cttctggttt actagctcct actgatgatc ataatgggga acagacaaga 840 agatcaagtt ccataccttc tttgctacga aatacttcaa attctctttt actaggtggc 900 cagcctcagc ttcccccacc tcagcaacaa tcgcagccac aagcacacca acaaaagttg 960 caacaaggac agaacctata ctcgtattct caattttccc agcagcaacc gtacaaccca 1020 tcgatatcat cttttggcca gttcgctgct aatggttttc attctagaca aggatcagtc 1080 gccagcgagg ctatgtctcc cagtgcacct gccatgttta ctagcacatc tacaaacccc 1140 gtaaatgttg cacagcaaac acaaagacct caaggacagc aggtaccgca attttcatct 1200 gagttggatg gaaataaaag gcgacaatca gcccccgtat cagtaacatt atccacggac 1260 aggctgaatg gtaatgagaa taataatggt gaaattaaca acaataatgg cagcaataat 1320 agcggttctt ctaaggatac atctcaacat tcccaagaat ctgtaactac accagcggct 1380 ttggaagcat ccagccctgg atcaacgcca cagagaagta caaaaaaacg cagaaaaagt 1440 tacgtatcta agaagacaaa accaaagaga gattcatcta tatctataac atcgaaagat 1500 tctgctcacc caatgaccac ttcatcaact atcgcgtatg gacagatatc cgatgtagat 1560 ctaatagaca cctactatga gttcatacat gtaggatttc cgatcatacc tttaaacaaa 1620 acgaccttga ccagtgactt attgttagtt aacacacagc caatttccaa tatacacgaa 1680 gtcaattcat atgttatttt gtggtttaga aattcattgg aattgttagt tcgtgttgct 1740 ctgaaacaaa agccaggtgg caagtttttc gataatattg ttggcgtggc tttgtcgcca 1800 agtaatgaca acaacaaagc tgggttcact acagccacgg caagggatga tgctgaaaaa 1860 acaagacgtg attcacataa tgaagtacag gatactttgg aagtgcaaag cgtttttatt 1920 gccgccctca atgaatgttt ccaaaaaatc gtggatattc atcccaaatt cagagaaaac 1980 aacgaccaaa tttcgccgaa gatcaaagtc atttatttat ctacttttat tcttttaaat 2040 tacattttgg catttgttgg atacgataac tcatttgtac ttggaatgtc ggtgacaatt 2100 tttaacgaat ttaaattata caaacttcta ttatttccgg agccggatat aaatgatgtg 2160 aagcctccag ttgatgaaga ggtcagcact ggtaatggga atacaaaaac gtccgaattt 2220 gaaattggat ctgaaagtgc tgggcatatg aatccatcca attcaccaaa ttccatggac 2280 gaaaacatta gtcactattc agtgttgttt aaaagattat acgttttgct ttcagtgttt 2340 gattctttac aaagctgtgc attcggtggt cccaagctat taaacatttc catccaaggt 2400 tctacagaaa gatttttttc taatgatttg ggctcaaaat ggtgcctgga acaaagccaa 2460 ttgagactga aaagcgtctt gcaaagcttg aaattgggtg aattgatgag tgagcttacc 2520 aggaatagaa tatcaatgaa cggcaatagg aagcctgggt tcgatattac gaactcgtct 2580 tcactcttat cggaatatgt ggaaactcaa cctctatccg tagcacagtt attttgcaag 2640 ctattaattg gcaaacacaa tttcatcaat tgcttattat cattatacga ttcagaagca 2700 ggagtctatt cagatttgac attggatttg agttcgaaaa tagcagactc tctgtgctca 2760 ttgatatcaa taattttgca agtattgacg ttgatattaa gactgaatcc tacgaacagt 2820 attgatttta attatagacc accgaaccca cccgctaata atccgacagt gcaagagggc 2880 ccatctgcta tgggctcgtc tccagtcgct gggaacctta gcgctgcacc tccatcggag 2940 gggaatccag atttttacaa gaaattacta ggcctgaaac aagacactgg cactatcctt 3000 tcagaccttt gccgggggat aatttccccc tttgctattg ctatcctgca cgaggtctac 3060 aacatcactg aactggtcaa gcagatgcct acatcactca ttagcattat gatgacggca 3120 actacaacgc agaatactca ggacaccaag aagtcgcagg acctggtcat gaagctgtca 3180 aactcgatga atgaagtagt tcaaatcacc agcgtgctga caatgatcaa gccattcaag 3240 atcttcgagc acgagcttaa taagcccata atgtccctga caggaggact ttcgtccacg 3300 accagaaacg acgtcatgtg gccaaagtcg ggccaaggcc tccgcgagtc atcagtcatg 3360 aagacattgc ttgatgaacg ccgtacttct ggtacacaac cgacaacggc gccagtagcc 3420 gcagaggaac ccaggcttga gaacgttgcc ctggaaaatt tcgttagtat cggctggaag 3480 ctgttggacg attccgagtt aggctggtat tga 3513 <210> 3 <211> 486 <212> PRT <213> Saccharomyces cerevisiae <400> 3 Met Val His Leu Gly Pro Lys Lys Pro Gln Ala Arg Lys Gly Ser Met 1 5 10 15 Ala Asp Val Pro Lys Glu Leu Met Gln Gln Ile Glu Asn Phe Glu Lys 20 25 30 Ile Phe Thr Val Pro Thr Glu Thr Leu Gln Ala Val Thr Lys His Phe 35 40 45 Ile Ser Glu Leu Glu Lys Gly Leu Ser Lys Lys Gly Gly Asn Ile Pro 50 55 60 Met Ile Pro Gly Trp Val Met Asp Phe Pro Thr Gly Lys Glu Ser Gly 65 70 75 80 Asp Phe Leu Ala Ile Asp Leu Gly Gly Thr Asn Leu Arg Val Val Leu 85 90 95 Val Lys Leu Gly Gly Asp Arg Thr Phe Asp Thr Thr Gln Ser Lys Tyr 100 105 110 Arg Leu Pro Asp Ala Met Arg Thr Thr Gln Asn Pro Asp Glu Leu Trp 115 120 125 Glu Phe Ile Ala Asp Ser Leu Lys Ala Phe Ile Asp Glu Gln Phe Pro 130 135 140 Gln Gly Ile Ser Glu Pro Ile Pro Leu Gly Phe Thr Phe Ser Phe Pro 145 150 155 160 Ala Ser Gln Asn Lys Ile Asn Glu Gly Ile Leu Gln Arg Trp Thr Lys 165 170 175 Gly Phe Asp Ile Pro Asn Ile Glu Asn His Asp Val Val Pro Met Leu 180 185 190 Gln Lys Gln Ile Thr Lys Arg Asn Ile Pro Ile Glu Val Val Ala Leu 195 200 205 Ile Asn Asp Thr Thr Gly Thr Leu Val Ala Ser Tyr Tyr Thr Asp Pro 210 215 220 Glu Thr Lys Met Gly Val Ile Phe Gly Thr Gly Val Asn Gly Ala Tyr 225 230 235 240 Tyr Asp Val Cys Ser Asp Ile Glu Lys Leu Gln Gly Lys Leu Ser Asp 245 250 255 Asp Ile Pro Pro Ser Ala Pro Met Ala Ile Asn Cys Glu Tyr Gly Ser 260 265 270 Phe Asp Asn Glu His Val Val Leu Pro Arg Thr Lys Tyr Asp Ile Thr 275 280 285 Ile Asp Glu Glu Ser Pro Arg Pro Gly Gln Gln Thr Phe Glu Lys Met 290 295 300 Ser Ser Gly Tyr Tyr Leu Gly Glu Ile Leu Arg Leu Ala Leu Met Asp 305 310 315 320 Met Tyr Lys Gln Gly Phe Ile Phe Lys Asn Gln Asp Leu Ser Lys Phe 325 330 335 Asp Lys Pro Phe Val Met Asp Thr Ser Tyr Pro Ala Arg Ile Glu Glu 340 345 350 Asp Pro Phe Glu Asn Leu Glu Asp Thr Asp Asp Leu Phe Gln Asn Glu 355 360 365 Phe Gly Ile Asn Thr Thr Val Gln Glu Arg Lys Leu Ile Arg Arg Leu 370 375 380 Ser Glu Leu Ile Gly Ala Arg Ala Ala Arg Leu Ser Val Cys Gly Ile 385 390 395 400 Ala Ala Ile Cys Gln Lys Arg Gly Tyr Lys Thr Gly His Ile Ala Ala 405 410 415 Asp Gly Ser Val Tyr Asn Arg Tyr Pro Gly Phe Lys Glu Lys Ala Ala 420 425 430 Asn Ala Leu Lys Asp Ile Tyr Gly Trp Thr Gln Thr Ser Leu Asp Asp 435 440 445 Tyr Pro Ile Lys Ile Val Pro Ala Glu Asp Gly Ser Gly Ala Gly Ala 450 455 460 Ala Val Ile Ala Ala Leu Ala Gln Lys Arg Ile Ala Glu Gly Lys Ser 465 470 475 480 Val Gly Ile Ile Gly Ala 485 <210> 4 <211> 1461 <212> DNA <213> Saccharomyces cerevisiae <400> 4 atggttcatt taggtccaaa aaaaccacaa gccagaaagg gttccatggc cgatgtgcca 60 aaggaattga tgcaacaaat tgagaatttt gaaaaaattt tcactgttcc aactgaaact 120 ttacaagccg ttaccaagca cttcatttcc gaattggaaa agggtttgtc caagaagggt 180 ggtaacattc caatgattcc aggttgggtt atggatttcc caactggtaa ggaatccggt 240 gatttcttgg ccattgattt gggtggtacc aacttgagag ttgtcttagt caagttgggc 300 ggtgaccgta cctttgacac cactcaatct aagtacagat taccagatgc tatgagaact 360 actcaaaatc cagacgaatt gtgggaattt attgccgact ctttgaaagc ttttattgat 420 gagcaattcc cacaaggtat ctctgagcca attccattgg gtttcacctt ttctttccca 480 gcttctcaaa acaaaatcaa tgaaggtatc ttgcaaagat ggactaaagg ttttgatatt 540 ccaaacattg aaaaccacga tgttgttcca atgttgcaaa agcaaatcac taagaggaat 600 atcccaattg aagttgttgc tttgataaac gacactaccg gtactttggt tgcttcttac 660 tacactgacc cagaaactaa gatgggtgtt atcttcggta ctggtgtcaa tggtgcttac 720 tacgatgttt gttccgatat cgaaaagcta caaggaaaac tatctgatga cattccacca 780 tctgctccaa tggccatcaa ctgtgaatac ggttccttcg ataatgaaca tgtcgttttg 840 ccaagaacta aatacgatat caccattgat gaagaatctc caagaccagg ccaacaaacc 900 tttgaaaaaa tgtcttctgg ttactactta ggtgaaattt tgcgtttggc cttgatggac 960 atgtacaaac aaggtttcat cttcaagaac caagacttgt ctaagttcga caagcctttc 1020 gtcatggaca cttcttaccc agccagaatc gaggaagatc cattcgagaa cctagaagat 1080 accgatgact tgttccaaaa tgagttcggt atcaacacta ctgttcaaga acgtaaattg 1140 atcagacgtt tatctgaatt gattggtgct agagctgcta gattgtccgt ttgtggtatt 1200 gctgctatct gtcaaaagag aggttacaag accggtcaca tcgctgcaga cggttccgtt 1260 tacaacagat acccaggttt caaagaaaag gctgccaatg ctttgaagga catttacggc 1320 tggactcaaa cctcactaga cgactaccca atcaagattg ttcctgctga agatggttcc 1380 ggtgctggtg ccgctgttat tgctgctttg gcccaaaaaa gaattgctga aggtaagtcc 1440 gttggtatca tcggtgctta a 1461 <210> 5 <211> 332 <212> PRT <213> Pelodiscus sinensis japonicus LDH protein <400> 5 Met Ser Val Lys Glu Leu Leu Ile Gln Asn Val His Lys Glu Glu His 1 5 10 15 Ser His Ala His Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly 20 25 30 Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu 35 40 45 Ala Leu Val Asp Val Ile Glu Asp Lys Leu Arg Gly Glu Met Leu Asp 50 55 60 Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly 65 70 75 80 Lys Asp Tyr Ser Val Thr Ala His Ser Lys Leu Val Ile Ile Thr Ala 85 90 95 Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg 100 105 110 Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser 115 120 125 Pro Asp Cys Met Leu Leu Val Val Ser Asn Pro Val Asp Ile Leu Thr 130 135 140 Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys His Arg Val Ile Gly 145 150 155 160 Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu 165 170 175 Lys Leu Gly Ile His Ser Leu Ser Cys His Gly Trp Ile Ile Gly Glu 180 185 190 His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Val Asn Val Ala Gly 195 200 205 Val Ser Leu Lys Ala Leu Tyr Pro Asp Leu Gly Thr Asp Ala Asp Lys 210 215 220 Glu His Trp Lys Glu Val His Lys Gln Val Val Asp Ser Ala Tyr Glu 225 230 235 240 Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp Ala Ile Gly Leu Ser Val 245 250 255 Ala Asp Leu Ala Glu Thr Val Met Lys Asn Leu Arg Arg Val His Pro 260 265 270 Ile Ser Thr Met Val Lys Gly Met Tyr Gly Val Ser Ser Asp Val Phe 275 280 285 Leu Ser Val Pro Cys Val Leu Gly Tyr Ala Gly Ile Thr Asp Val Val 290 295 300 Lys Met Thr Leu Lys Ser Glu Glu Glu Glu Lys Leu Arg Lys Ser Ala 305 310 315 320 Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu Gln Phe 325 330 <210> 6 <211> 999 <212> DNA <213> Pelodiscus sinensis japonicus LDH gene <400> 6 atgtccgtaa aggaactact tatacaaaac gtccataagg aggagcattc tcacgctcac 60 aataagataa cagttgtagg agtaggtgca gtaggtatgg catgtgctat ttcgatatta 120 atgaaagact tggctgatga actagccttg gttgatgtga ttgaggataa gttacgtgga 180 gaaatgttag atttgcaaca tggttcattg ttcttgagaa cccccaaaat tgtctcgggt 240 aaggattatt cagtcactgc tcattctaaa ctggttatca ttacagcagg tgcaagacag 300 caagaagggg agagcagact aaatctggtt caacgtaatg tcaacatctt caagtttatc 360 atcccgaacg tagtaaaata cagtccagac tgcatgttgc ttgttgtgag taatccagtt 420 gacatcttaa cctatgttgc gtggaaaatc agtgggtttc caaaacatag ggtgattggc 480 tcaggatgca accttgatag cgccaggttt aggtatctaa tgggagaaaa attaggtatt 540 cactccttat cttgtcatgg ctggataata ggcgaacatg gtgattcttc ggtacctgtt 600 tggtccgggg ttaatgtggc tggtgttagt ttaaaagcat tatatcctga cctgggtact 660 gatgccgata aagaacattg gaaagaagtg cacaaacaag tggttgattc tgcttacgaa 720 gttattaaac ttaagggcta cacttcttgg gctataggtc tatcagtagc tgatttggca 780 gaaaccgtta tgaaaaattt aagaagagtc cacccaattt ccacgatggt caagggtatg 840 tacggtgtta gctctgacgt cttcttatct gttccttgtg ttttgggata tgcgggaatt 900 acagacgtcg tgaagatgac attgaaatca gaggaagagg aaaaactaag aaagtcagcc 960 gatactctgt ggggcattca aaaggaattg cagttttaa 999 <210> 7 <211> 332 <212> PRT <213> Ornithorhynchus anatinus LDH protein <400> 7 Met Ala Gly Val Lys Glu Gln Leu Ile Gln Asn Leu Leu Lys Glu Glu 1 5 10 15 Tyr Ala Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly 20 25 30 Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu 35 40 45 Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp 50 55 60 Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly 65 70 75 80 Lys Asp Tyr Ser Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala 85 90 95 Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg 100 105 110 Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser 115 120 125 Pro Asn Cys Lys Leu Leu Val Val Ser Asn Pro Val Asp Ile Leu Thr 130 135 140 Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly 145 150 155 160 Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu 165 170 175 Arg Leu Gly Ile His Ser Thr Ser Cys His Gly Trp Val Ile Gly Glu 180 185 190 His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Val Asn Val Ala Gly 195 200 205 Val Ser Leu Lys Asn Leu His Pro Asp Leu Gly Thr Asp Ala Asp Lys 210 215 220 Glu Gln Trp Lys Asp Val His Lys Gln Val Val Asp Ser Ala Tyr Glu 225 230 235 240 Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp Ala Ile Gly Leu Ser Val 245 250 255 Ala Asp Leu Ala Glu Ser Ile Val Lys Asn Leu Arg Arg Val His Pro 260 265 270 Ile Ser Thr Met Ile Lys Gly Leu Tyr Gly Ile Lys Asp Glu Val Phe 275 280 285 Leu Ser Val Pro Cys Val Leu Gly Gln Asn Gly Ile Ser Asp Val Val 290 295 300 Lys Ile Thr Leu Lys Ser Glu Glu Glu Ala His Leu Lys Lys Ser Ala 305 310 315 320 Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu Gln Phe 325 330 <210> 8 <211> 332 <212> PRT <213> Tursiops truncates LDH protein <400> 8 Met Ala Thr Val Lys Asp Gln Leu Ile Gln Asn Leu Leu Lys Glu Glu 1 5 10 15 His Val Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly 20 25 30 Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu 35 40 45 Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp 50 55 60 Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly 65 70 75 80 Lys Asp Tyr Ser Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala 85 90 95 Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg 100 105 110 Asn Val Asn Ile Phe Lys Phe Ile Val Pro Asn Ile Val Lys Tyr Ser 115 120 125 Pro His Cys Lys Leu Leu Val Val Ser Asn Pro Val Asp Ile Leu Thr 130 135 140 Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly 145 150 155 160 Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu 165 170 175 Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Ile Leu Gly Glu 180 185 190 His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Val Asn Val Ala Gly 195 200 205 Val Ser Leu Lys Asn Leu His Pro Glu Leu Gly Thr Asp Ala Asp Lys 210 215 220 Glu His Trp Lys Ala Ile His Lys Gln Val Val Asp Ser Ala Tyr Glu 225 230 235 240 Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp Ala Val Gly Leu Ser Val 245 250 255 Ala Asp Leu Ala Glu Ser Ile Met Lys Asn Leu Arg Arg Val His Pro 260 265 270 Ile Ser Thr Met Ile Lys Gly Leu Tyr Gly Ile Lys Glu Asp Val Phe 275 280 285 Leu Ser Val Pro Cys Ile Leu Gly Gln Asn Gly Ile Ser Asp Val Val 290 295 300 Lys Val Thr Leu Thr Pro Glu Glu Gln Ala Cys Leu Lys Lys Ser Ala 305 310 315 320 Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu Gln Phe 325 330 <210> 9 <211> 332 <212> PRT <213> Rattus norvegicus LDH protein <400> 9 Met Ala Ala Leu Lys Asp Gln Leu Ile Val Asn Leu Leu Lys Glu Glu 1 5 10 15 Gln Val Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly 20 25 30 Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu 35 40 45 Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp 50 55 60 Leu Gln His Gly Ser Leu Phe Leu Lys Thr Pro Lys Ile Val Ser Ser 65 70 75 80 Lys Asp Tyr Ser Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala 85 90 95 Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg 100 105 110 Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser 115 120 125 Pro Gln Cys Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr 130 135 140 Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly 145 150 155 160 Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu 165 170 175 Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu 180 185 190 His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Val Asn Val Ala Gly 195 200 205 Val Ser Leu Lys Ser Leu Asn Pro Gln Leu Gly Thr Asp Ala Asp Lys 210 215 220 Glu Gln Trp Lys Asp Val His Lys Gln Val Val Asp Ser Ala Tyr Glu 225 230 235 240 Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp Ala Ile Gly Leu Ser Val 245 250 255 Ala Asp Leu Ala Glu Ser Ile Met Lys Asn Leu Arg Arg Val His Pro 260 265 270 Ile Ser Thr Met Ile Lys Gly Leu Tyr Gly Ile Lys Glu Asp Val Phe 275 280 285 Leu Ser Val Pro Cys Ile Leu Gly Gln Asn Gly Ile Ser Asp Val Val 290 295 300 Lys Val Thr Leu Thr Pro Asp Glu Glu Ala Arg Leu Lys Lys Ser Ala 305 310 315 320 Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu Gln Phe 325 330 <210> 10 <211> 1140 <212> DNA <213> Ornithorhynchus anatinus <400> 10 ttccaagatg gccggcgtca aggaacagct gatccagaat cttctcaaag aggagtacgc 60 ccctcaaaat aagatcaccg tggttggagt tggtgctgtg ggcatggcct gtgccatcag 120 catcttgatg aaggatttgg ctgatgagct cgcccttgtt gatgtcattg aggataagct 180 gaagggagaa atgatggatc ttcagcatgg cagccttttc ctcaggactc caaagatcgt 240 ctctggcaaa gactacagcg tgactgccaa ctccaagctg gttatcatca ccgccggggc 300 ccgtcagcag gagggagaga gccgtctgaa tctggtccag cgcaatgtca acatctttaa 360 attcatcatt cccaacgttg tcaagtacag ccccaactgc aagctgcttg tggtgtccaa 420 tccagtggat attttgacct acgtggcctg gaagatcagt ggcttcccca agaaccgagt 480 tatcggaagc ggctgcaatc tggattctgc ccgcttccgc tatctgatgg gagagaggct 540 gggcatccac tccacaagct gtcacggctg ggtcatcgga gaacacggag actctagtgt 600 tcccgtgtgg agcggggtga acgttgccgg tgtctctctg aagaacctgc accccgattt 660 gggaactgat gcagacaagg agcagtggaa ggatgttcat aagcaggtgg ttgacagtgc 720 ctacgaggtc atcaaactga agggctacac ctcctgggcc atcggcctct cggtagccga 780 tctggcagaa agcatcgtga agaatcttag gcgggtgcac cccatttcca ccatgattaa 840 gggcctgtac gggatcaaag atgaagtctt cctcagcgtc ccctgtgtct tgggccagaa 900 cggcatctcg gacgtggtga agataaccct gaagtccgag gaggaggctc atctgaagaa 960 gagcgcagac accctgtggg gaattcagaa ggaactgcag ttttaaggct tttcaacatc 1020 ctagctgtct actgggtaac ggtagttagg ggattgggta tcccccactt ttgaagtagg 1080 ttagctgtct actgggtaac ggtagttagg ggattgggta tcccccactt ttgaagtagg 1140 1140 <210> 11 <211> 1527 <212> DNA <213> Tursiops truncatus <400> 11 acgtgtactc ccgattcctt tcggttctaa gtccaatatg gcaactgtca aggatcagct 60 gattcagaat cttcttaagg aagaacatgt cccccagaat aagattacag tggttggtgt 120 tggtgctgtt ggcatggcct gtgccatcag tatcttaatg aaggacttgg cagatgaact 180 tgctcttgtt gatgtcatag aagacaaact gaagggagag atgatggatc tccaacatgg 240 cagccttttc cttagaacac caaaaatcgt ctctggcaaa gactatagtg tgacagcaaa 300 ctccaagctg gttattatca cagctggggc acgtcagcaa gagggagaaa gccgtcttaa 360 tttggtccaa cgtaatgtga acatctttaa attcatcgtt cctaatattg taaaatacag 420 cccacactgc aagttgcttg ttgtttccaa tccagtggat atcttgacct atgtggcttg 480 gaagataagc ggctttccca aaaaccgtgt tattggaagt ggttgcaatt tggattcagc 540 ccggttccgt tacctcatgg gggaaaggct gggagttcac ccattaagct gtcatggatg 600 gatccttggg gagcatggag actctagtgt gcctgtatgg agtggagtga atgttgctgg 660 tgtctccctg aagaatctgc accccgaatt aggcactgat gccgataagg aacattggaa 720 agcaattcac aaacaggtgg ttgacagtgc ttatgaggtg atcaaactga aaggctacac 780 atcctgggcc gttggactat ctgtggcaga tttggcagaa agtataatga agaatcttag 840 gcgggtgcat ccgatttcca ccatgattaa gggtttgtat ggaataaaag aggatgtctt 900 ccttagtgtt ccttgcatct tgggacagaa tggaatctca gatgttgtga aagtgactct 960 gactcctgag gaacaggcct gtttgaagaa gagtgcagat acactttggg ggatccagaa 1020 agagctgcag ttttaaagtc taatatcata ccacttcact gtctaggcta caataggatt 1080 ttagttggag gttgtgcata ttgtccttta tatctgatct gtgactaaag cagtaatgtt 1140 aagacagcct aggaaaaaca tcaatttcct aacattagca ataggaatgg ttcataaaac 1200 cctgcagctg tatcctgatg ctgcatggca cttatcttgt gttgtcctaa attggttcgt 1260 gtaaaatagt tctacttcct caagaggtac cactgacagt gttgcagatg ctgcagttgc 1320 ccttcaaacc agatgtgtat ttaactctgt gttatataac ttctggttcc tttagccaag 1380 atgcctagtc caactttttt ctctccaatt aatcacattc tgggattgat tataaatcca 1440 gtattgcatg tcttgtgcat aactgttcta aagaatctta ttttatgtac tatatgtatc 1500 agaatagtat acattgccat gtaatgt 1527 <210> 12 <211> 1609 <212> DNA <213> Rattus norvegicus <400> 12 gtgtgctgga gccactgtcg ccgatctcgc gcacgctact gctgctgctc gcccgtcgtc 60 ccccatcgtg cactaagcgg tcccaaaaga ttcaaagtcc aagatggcag ccctcaagga 120 ccagctgatt gtgaatcttc ttaaggaaga acaggtcccc cagaacaaga ttacagttgt 180 tggggttggt gctgttggca tggcttgtgc catcagtatc ttaatgaagg acttggctga 240 tgagcttgcc cttgttgatg tcatagaaga taagctaaag ggagagatga tggatcttca 300 gcatggcagc cttttcctta agacaccaaa aattgtctcc agcaaagatt atagtgtgac 360 tgcaaactcc aagctggtca ttatcaccgc gggggcccgt cagcaagagg gagagagccg 420 gctcaatttg gtccagcgaa acgtgaacat cttcaagttc atcattccaa atgttgtgaa 480 atacagtcca cagtgcaaac tgctcatcgt ctcaaaccca gtggatatct tgacctacgt 540 ggcttggaag atcagcggct tccccaaaaa cagagttatt ggaagtggtt gcaatctgga 600 ttcggctcgg ttccgttacc tgatgggaga aaggctggga gttcatccac tgagctgtca 660 cgggtgggtc ctgggagagc atggcgactc cagtgtgcct gtgtggagtg gtgtgaacgt 720 cgccggcgtc tccctgaagt ctctgaaccc gcagctgggc acggatgcag acaaggagca 780 gtggaaggat gtgcacaagc aggtggttga cagtgcatac gaagtgatca agctgaaagg 840 ttacacatcc tgggccattg gcctctccgt ggcagacttg gccgagagca taatgaagaa 900 ccttaggcgg gtgcatccca tttccaccat gattaagggt ctctatggaa tcaaggagga 960 tgtcttcctc agcgtcccat gtatcctggg acaaaatgga atctcagatg ttgtgaaggt 1020 gacactgact cctgacgagg aggcccgcct gaagaagagt gcagataccc tctggggaat 1080 ccagaaggag ctgcagttct aaagtcttcc cagtgtccta gcacttcact gtccaggctg 1140 cagcagggtt tctatggaga ccacgcactt ctcatctgag ctgtggttag tccagttggt 1200 ccagttgtgt tgaggtggtc tgggggaaat ctcagttcca cagctctacc ctgctaagtg 1260 gtacttgtgt agtggtaacc tggttagtgt gacaatccca ctgtctccaa gacacactgc 1320 caactgcatg caggctttga ttaccctgtg agcctgctgc attgctgtgc tacgcaccct 1380 caccaaacat gcctaggcca tgagttccca gttagttata agctggctcc agtgtgtaag 1440 tccatcgtgt atatcttgtg cataaatgtt ctacaggata ttttctgtat tatatgtgtc 1500 tgtagtgtac attgcaatat tacgtgaaat gtaagatctg catatggatg atggaaccaa 1560 ccactcaagt gtcatgccaa ggaaaacacc aaataaacct tgaacagtg 1609 <210> 13 <211> 292 <212> DNA <213> Artificial Sequence <220> <223> CCW12 promoter <400> 13 ttcgcggcca cctacgccgc tatctttgca acaactatct gcgataactc agcaaatttt 60 gcatattcgt gttgcagtat tgcgataatg ggagtcttac ttccaacata acggcagaaa 120 gaaatgtgag aaaattttgc atcctttgcc tccgttcaag tatataaagt cggcatgctt 180 gataatcttt ctttccatcc tacattgttc taattattct tattctcctt tattctttcc 240 taacatacca agaaattaat cttctgtcat tcgcttaaac actatatcaa ta 292 <210> 14 <211> 289 <212> DNA <213> Artificial Sequence <220> <223> CYC promoter <400> 14 atttggcgag cgttggttgg tggatcaagc ccacgcgtag gcaatcctcg agcagatccg 60 ccaggcgtgt atatatagcg tggatggcca ggcaacttta gtgctgacac atacaggcat 120 atatatatgt gtgcgacgac acatgatcat atggcatgca tgtgctctgt atgtatataa 180 aactcttgtt ttcttctttt ctctaaatat tctttcctta tacattagga cctttgcagc 240 ataaattact atacttctat agacacgcaa acacaaatac acacactaa 289 <210> 15 <211> 401 <212> DNA <213> Artificial Sequence <220> <223> TEF1 promoter <400> 15 atagcttcaa aatgtttcta ctcctttttt actcttccag attttctcgg actccgcgca 60 tcgccgtacc acttcaaaac acccaagcac agcatactaa atttcccctc tttcttcctc 120 tagggtgtcg ttaattaccc gtactaaagg tttggaaaag aaaaaagaga ccgcctcgtt 180 tctttttctt cgtcgaaaaa ggcaataaaa atttttatca cgtttctttt tcttgaaaat 240 tttttttttg atttttttct ctttcgatga cctcccattg atatttaagt taataaacgg 300 tcttcaattt ctcaagtttc agtttcattt ttcttgttct attacaactt tttttacttc 360 ttgctcatta gaaagaaagc atagcaatct aatctaagtt t 401 <210> 16 <211> 798 <212> DNA <213> Artificial Sequence <220> <223> PGK1 promoter <400> 16 ctttcctctt tttattaacc ttaattttta ttttagattc ctgacttcaa ctcaagacgc 60 acagatatta taacatctgc ataataggca tttgcaagaa ttactcgtga gtaaggaaag 120 agtgaggaac tatcgcatac ctgcatttaa agatgccgat ttgggcgcga atcctttatt 180 ttggcttcac cctcatacta ttatcagggc cagaaaaagg aagtgtttcc ctccttcttg 240 aattgatgtt accctcataa agcacgtggc ctcttatcga gaaagaaatt accgtcgctc 300 gtgatttgtt tgcaaaaaga acaaaactga aaaaacccag acacgctcga cttcctgtct 360 tcctattgat tgcagcttcc aatttcgtca cacaacaagg tcctagcgac ggctcacagg 420 ttttgtaaca agcaatcgaa ggttctggaa tggcgggaaa gggtttagta ccacatgcta 480 tgatgcccac tgtgatctcc agagcaaagt tcgttcgatc gtactgttac tctctctctt 540 tcaaacagaa ttgtccgaat cgtgtgacaa caacagcctg ttctcacaca ctcttttctt 600 ctaaccaagg gggtggttta gtttagtaga acctcgtgaa acttacattt acatatatat 660 aaacttgcat aaattggtca atgcaagaaa tacatatttg gtcttttcta attcgtagtt 720 tttcaagttc ttagatgctt tctttttctc ttttttacag atcatcaagg aagtaattat 780 ctacttttta caacaaat 798 <210> 17 <211> 655 <212> DNA <213> Artificial Sequence <220> <223> GPD promoter <400> 17 agtttatcat tatcaatact cgccatttca aagaatacgt aaataattaa tagtagtgat 60 tttcctaact ttatttagtc aaaaaattag ccttttaatt ctgctgtaac ccgtacatgc 120 ccaaaatagg gggcgggtta cacagaatat ataacatcgt aggtgtctgg gtgaacagtt 180 tattcctggc atccactaaa tataatggag cccgcttttt aagctggcat ccagaaaaaa 240 aaagaatccc agcaccaaaa tattgttttc ttcaccaacc atcagttcat aggtccattc 300 tcttagcgca actacagaga acaggggcac aaacaggcaa aaaacgggca caacctcaat 360 ggagtgatgc aacctgcctg gagtaaatga tgacacaagg caattgaccc acgcatgtat 420 ctatctcatt ttcttacacc ttctattacc ttctgctctc tctgatttgg aaaaagctga 480 aaaaaaaggt tgaaaccagt tccctgaaat tattccccta cttgactaat aagtatataa 540 agacggtagg tattgattgt aattctgtaa atctatttct taaacttctt aaattctact 600 tttatagtta gtcttttttt tagttttaaa acaccagaac ttagtttcga cggat 655 <210> 18 <211> 1468 <212> DNA <213> Artificial Sequence <220> <223> ADH promoter <400> 18 gccgggatcg aagaaatgat ggtaaatgaa ataggaaatc aaggagcatg aaggcaaaag 60 acaaatataa gggtcgaacg aaaaataaag tgaaaagtgt tgatatgatg tatttggctt 120 tgcggcgccg aaaaaacgag tttacgcaat tgcacaatca tgctgactct gtggcggacc 180 cgcgctcttg ccggcccggc gataacgctg ggcgtgaggc tgtgcccggc ggagtttttt 240 gcgcctgcat tttccaaggt ttaccctgcg ctaaggggcg agattggaga agcaataaga 300 atgccggttg gggttgcgat gatgacgacc acgacaactg gtgtcattat ttaagttgcc 360 gaaagaacct gagtgcattt gcaacatgag tatactagaa gaatgagcca agacttgcga 420 gacgcgagtt tgccggtggt gcgaacaata gagcgaccat gaccttgaag gtgagacgcg 480 cataaccgct agagtacttt gaagaggaaa cagcaatagg gttgctacca gtataaatag 540 acaggtacat acaacactgg aaatggttgt ctgtttgagt acgctttcaa ttcatttggg 600 tgtgcacttt attatgttac aatatggaag ggaactttac acttctccta tgcacatata 660 ttaattaaag tccaatgcta gtagagaagg ggggtaacac ccctccgcgc tcttttccga 720 tttttttcta aaccgtggaa tatttcggat atccttttgt tgtttccggg tgtacaatat 780 ggacttcctc ttttctggca accaaaccca tacatcggga ttcctataat accttcgttg 840 gtctccctaa catgtaggtg gcggagggga gatatacaat agaacagata ccagacaaga 900 cataatgggc taaacaagac tacaccaatt acactgcctc attgatggtg gtacataacg 960 aactaatact gtagccctag acttgatagc catcatcata tcgaagtttc actacccttt 1020 ttccatttgc catctattga agtaataata ggcgcatgca acttcttttc tttttttttc 1080 ttttctctct cccccgttgt tgtctcacca tatccgcaat gacaaaaaaa tgatggaaga 1140 cactaaagga aaaaattaac gacaaagaca gcaccaacag atgtcgttgt tccagagctg 1200 atgaggggta tctcgaagca cacgaaactt tttccttcct tcattcacgc acactactct 1260 ctaatgagca acggtatacg gccttccttc cagttacttg aatttgaaat aaaaaaaagt 1320 ttgctgtctt gctatcaagt ataaatagac ctgcaattat taatcttttg tttcctcgtc 1380 attgttctcg ttccctttct tccttgtttc tttttctgca caatatttca agctatacca 1440 agcatacaat caactccaag ctggccgc 1468 <210> 19 <211> 252 <212> DNA <213> Artificial Sequence <220> <223> CYC1 terminator <400> 19 tcatgtaatt agttatgtca cgcttacatt cacgccctcc ccccacatcc gctctaaccg 60 aaaaggaagg agttagacaa cctgaagtct aggtccctat ttattttttt atagttatgt 120 tagtattaag aacgttattt atatttcaaa tttttctttt ttttctgtac agacgcgtgt 180 acgcatgtaa cattatactg aaaaccttgc ttgagaaggt tttgggacgc tcgaaggctt 240 taatttgcgg cc 252 <210> 20 <211> 1047 <212> DNA <213> S.cerevisiae <400> 20 atgtctatcc cagaaactca aaaaggtgtt atcttctacg aatcccacgg taagttggaa 60 tacaaagata ttccagttcc aaagccaaag gccaacgaat tgttgatcaa cgttaaatac 120 tctggtgtct gtcacactga cttgcacgct tggcacggtg actggccatt gccagttaag 180 ctaccattag ttggtggtca cgaaggtgcc ggtgtcgttg tcggcatggg tgaaaacgtt 240 aagggctgga agatcggtga ctacgccggt atcaaatggt tgaacggttc ttgtatggcc 300 tgtgaatact gtgaattggg taacgaatcc aactgtcctc acgctgactt gtctggttac 360 acccacgacg gttctttcca agaatacgct accgctgacg ctgttcaagc cgctcacatt 420 cctcaaggta ctgacttggc tgaagtcgcc ccagttttgt gtgctggtat caccgtctac 480 aaggctttga agtctgctaa cttgatggcc ggtcactggg ttgctatctc cggtgctgct 540 ggtggtctag gttctttggc tgttcaatac gccaaggcta tgggttacag agtcttgggt 600 attgacggtg gtgaaggtaa ggaagaatta ttcagatcca tcggtggtga agtcttcatt 660 gacttcacta aggaaaagga cattgtcggt gctgttctaa aggccactga cggtggtgct 720 cacggtgtca tcaacgtttc cgtttccgaa gccgctattg aagcttccac cagatacgtt 780 agagctaacg gtaccaccgt tttggtcggt atgccagctg gtgccaagtg ttgttctgat 840 gtcttcaacc aagtcgtcaa gtccatctct attgttggtt cttacgtcgg taacagagct 900 gacaccagag aagctttgga cttcttcgcc agaggtttga tcaagtctcc aatcaaggtt 960 gtcggcttgt ctaccttgcc agaaatttac gaaaagatgg aaaagggtca aatcgttggt 1020 agatacgttg ttgacacttc taaataa 1047 <210> 21 <211> 348 <212> PRT <213> S.cerevisiae <400> 21 Met Ser Ile Pro Glu Thr Gln Lys Gly Val Ile Phe Tyr Glu Ser His 1 5 10 15 Gly Lys Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys Ala Asn 20 25 30 Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu 35 40 45 His Ala Trp His Gly Asp Trp Pro Leu Pro Val Lys Leu Pro Leu Val 50 55 60 Gly Gly His Glu Gly Ala Gly Val Val Val Gly Met Gly Glu Asn Val 65 70 75 80 Lys Gly Trp Lys Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn Gly 85 90 95 Ser Cys Met Ala Cys Glu Tyr Cys Glu Leu Gly Asn Glu Ser Asn Cys 100 105 110 Pro His Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Gln 115 120 125 Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala His Ile Pro Gln Gly Thr 130 135 140 Asp Leu Ala Gln Val Ala Pro Ile Leu Cys Ala Gly Ile Thr Val Tyr 145 150 155 160 Lys Ala Leu Lys Ser Ala Asn Leu Met Ala Gly His Trp Val Ala Ile 165 170 175 Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Lys 180 185 190 Ala Met Gly Tyr Arg Val Leu Gly Ile Asp Gly Gly Glu Gly Lys Glu 195 200 205 Glu Leu Phe Arg Ser Ile Gly Gly Glu Val Phe Ile Asp Phe Thr Lys 210 215 220 Glu Lys Asp Ile Val Gly Ala Val Leu Lys Ala Thr Asp Gly Gly Ala 225 230 235 240 His Gly Val Ile Asn Val Ser Val Ser Glu Ala Ala Ile Glu Ala Ser 245 250 255 Thr Arg Tyr Val Arg Ala Asn Gly Thr Thr Val Leu Val Gly Met Pro 260 265 270 Ala Gly Ala Lys Cys Cys Ser Asp Val Phe Asn Gln Val Val Lys Ser 275 280 285 Ile Ser Ile Val Gly Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu 290 295 300 Ala Leu Asp Phe Phe Ala Arg Gly Leu Val Lys Ser Pro Ile Lys Val 305 310 315 320 Val Gly Leu Ser Thr Leu Pro Glu Ile Tyr Glu Lys Met Glu Lys Gly 325 330 335 Gln Ile Val Gly Arg Tyr Val Val Asp Thr Ser Lys 340 345 <210> 22 <211> 563 <212> PRT <213> S.cerevisia <400> 22 Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln 1 5 10 15 Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser 20 25 30 Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn 35 40 45 Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Ile 50 55 60 Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser 65 70 75 80 Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu 85 90 95 His Val Val Gly Val Pro Ser Ile Ser Ala Gln Ala Lys Gln Leu Leu 100 105 110 Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met 115 120 125 Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Ala Thr 130 135 140 Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln 145 150 155 160 Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val 165 170 175 Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn 180 185 190 Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Ala Leu Val 195 200 205 Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg 210 215 220 His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe 225 230 235 240 Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Gln His 245 250 255 Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val 260 265 270 Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu 275 280 285 Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys 290 295 300 Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr 305 310 315 320 Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Thr 325 330 335 Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg 340 345 350 Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu 355 360 365 Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val 370 375 380 Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe 385 390 395 400 Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly 405 410 415 Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile 420 425 430 Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln 435 440 445 Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro 450 455 460 Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile 465 470 475 480 His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu 485 490 495 Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val 500 505 510 Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn 515 520 525 Asp Asn Ser Lys Ile Arg Met Ile Glu Ile Met Leu Pro Val Phe Asp 530 535 540 Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn 545 550 555 560 Ala Lys Gln <210> 23 <211> 1692 <212> DNA <213> S.cerevisiae <400> 23 atgtctgaaa ttactttggg taaatatttg ttcgaaagat taaagcaagt caacgttaac 60 accgttttcg gtttgccagg tgacttcaac ttgtccttgt tggacaagat ctacgaagtt 120 gaaggtatga gatgggctgg taacgccaac gaattgaacg ctgcttacgc cgctgatggt 180 tacgctcgta tcaagggtat gtcttgtatc atcaccacct tcggtgtcgg tgaattgtct 240 gctttgaacg gtattgccgg ttcttacgct gaacacgtcg gtgttttgca cgttgttggt 300 gtcccatcca tctctgctca agctaagcaa ttgttgttgc accacacctt gggtaacggt 360 gacttcactg ttttccacag aatgtctgcc aacatttctg aaaccactgc tatgatcact 420 gacattgcta ccgccccagc tgaaattgac agatgtatca gaaccactta cgtcacccaa 480 agaccagtct acttaggttt gccagctaac ttggtcgact tgaacgtccc agctaagttg 540 ttgcaaactc caattgacat gtctttgaag ccaaacgatg ctgaatccga aaaggaagtc 600 attgacacca tcttggcttt ggtcaaggat gctaagaacc cagttatctt ggctgatgct 660 tgttgttcca gacacgacgt caaggctgaa actaagaagt tgattgactt gactcaattc 720 ccagctttcg tcaccccaat gggtaagggt tccattgacg aacaacaccc aagatacggt 780 ggtgtttacg tcggtacctt gtccaagcca gaagttaagg aagccgttga atctgctgac 840 ttgattttgt ctgtcggtgc tttgttgtct gatttcaaca ccggttcttt ctcttactct 900 tacaagacca agaacattgt cgaattccac tccgaccaca tgaagatcag aaacgccact 960 ttcccaggtg tccaaatgaa attcgttttg caaaagttgt tgaccactat tgctgacgcc 1020 gctaagggtt acaagccagt tgctgtccca gctagaactc cagctaacgc tgctgtccca 1080 gcttctaccc cattgaagca agaatggatg tggaaccaat tgggtaactt cttgcaagaa 1140 ggtgatgttg tcattgctga aaccggtacc tccgctttcg gtatcaacca aaccactttc 1200 ccaaacaaca cctacggtat ctctcaagtc ttatggggtt ccattggttt caccactggt 1260 gctaccttgg gtgctgcttt cgctgctgaa gaaattgatc caaagaagag agttatctta 1320 ttcattggtg acggttcttt gcaattgact gttcaagaaa tctccaccat gatcagatgg 1380 ggcttgaagc catacttgtt cgtcttgaac aacgatggtt acaccattga aaagttgatt 1440 cacggtccaa aggctcaata caacgaaatt caaggttggg accacctatc cttgttgcca 1500 actttcggtg ctaaggacta tgaaacccac agagtcgcta ccaccggtga atgggacaag 1560 ttgacccaag acaagtcttt caacgacaac tctaagatca gaatgattga aatcatgttg 1620 ccagtcttcg atgctccaca aaacttggtt gaacaagcta agttgactgc tgctaccaac 1680 gctaagcaat aa 1692 <210> 24 <211> 591 <212> PRT <213> S.cerevisiae <400> 24 Met Leu Lys Tyr Lys Pro Leu Leu Lys Ile Ser Lys Asn Cys Glu Ala 1 5 10 15 Ala Ile Leu Arg Ala Ser Lys Thr Arg Leu Asn Thr Ile Arg Ala Tyr 20 25 30 Gly Ser Thr Val Pro Lys Ser Lys Ser Phe Glu Gln Asp Ser Arg Lys 35 40 45 Arg Thr Gln Ser Trp Thr Ala Leu Arg Val Gly Ala Ile Leu Ala Ala 50 55 60 Thr Ser Ser Val Ala Tyr Leu Asn Trp His Asn Gly Gln Ile Asp Asn 65 70 75 80 Glu Pro Lys Leu Asp Met Asn Lys Gln Lys Ile Ser Pro Ala Glu Val 85 90 95 Ala Lys His Asn Lys Pro Asp Asp Cys Trp Val Val Ile Asn Gly Tyr 100 105 110 Val Tyr Asp Leu Thr Arg Phe Leu Pro Asn His Pro Gly Gly Gln Asp 115 120 125 Val Ile Lys Phe Asn Ala Gly Lys Asp Val Thr Ala Ile Phe Glu Pro 130 135 140 Leu His Ala Pro Asn Val Ile Asp Lys Tyr Ile Ala Pro Glu Lys Lys 145 150 155 160 Leu Gly Pro Leu Gln Gly Ser Met Pro Pro Glu Leu Val Cys Pro Pro 165 170 175 Tyr Ala Pro Gly Glu Thr Lys Glu Asp Ile Ala Arg Lys Glu Gln Leu 180 185 190 Lys Ser Leu Leu Pro Pro Leu Asp Asn Ile Ile Asn Leu Tyr Asp Phe 195 200 205 Glu Tyr Leu Ala Ser Gln Thr Leu Thr Lys Gln Ala Trp Ala Tyr Tyr 210 215 220 Ser Ser Gly Ala Asn Asp Glu Val Thr His Arg Glu Asn His Asn Ala 225 230 235 240 Tyr His Arg Ile Phe Phe Lys Pro Lys Ile Leu Val Asp Val Arg Lys 245 250 255 Val Asp Ile Ser Thr Asp Met Leu Gly Ser His Val Asp Val Pro Phe 260 265 270 Tyr Val Ser Ala Thr Ala Leu Cys Lys Leu Gly Asn Pro Leu Glu Gly 275 280 285 Glu Lys Asp Val Ala Arg Gly Cys Gly Gln Gly Val Thr Lys Val Pro 290 295 300 Gln Met Ile Ser Thr Leu Ala Ser Cys Ser Pro Glu Glu Ile Ile Glu 305 310 315 320 Ala Ala Pro Ser Asp Lys Gln Ile Gln Trp Tyr Gln Leu Tyr Val Asn 325 330 335 Ser Asp Arg Lys Ile Thr Asp Asp Leu Val Lys Asn Val Glu Lys Leu 340 345 350 Gly Val Lys Ala Leu Phe Val Thr Val Asp Ala Pro Ser Leu Gly Gln 355 360 365 Arg Glu Lys Asp Met Lys Leu Lys Phe Ser Asn Thr Lys Ala Gly Pro 370 375 380 Lys Ala Met Lys Lys Thr Asn Val Glu Glu Ser Gln Gly Ala Ser Arg 385 390 395 400 Ala Leu Ser Lys Phe Ile Asp Pro Ser Leu Thr Trp Lys Asp Ile Glu 405 410 415 Glu Leu Lys Lys Lys Thr Lys Leu Pro Ile Val Ile Lys Gly Val Gln 420 425 430 Arg Thr Glu Asp Val Ile Lys Ala Ala Glu Ile Gly Val Ser Gly Val 435 440 445 Val Leu Ser Asn His Gly Gly Arg Gln Leu Asp Phe Ser Arg Ala Pro 450 455 460 Ile Glu Val Leu Ala Glu Thr Met Pro Ile Leu Glu Gln Arg Asn Leu 465 470 475 480 Lys Asp Lys Leu Glu Val Phe Val Asp Gly Gly Val Arg Arg Gly Thr 485 490 495 Asp Val Leu Lys Ala Leu Cys Leu Gly Ala Lys Gly Val Gly Leu Gly 500 505 510 Arg Pro Phe Leu Tyr Ala Asn Ser Cys Tyr Gly Arg Asn Gly Val Glu 515 520 525 Lys Ala Ile Glu Ile Leu Arg Asp Glu Ile Glu Met Ser Met Arg Leu 530 535 540 Leu Gly Val Thr Ser Ile Ala Glu Leu Lys Pro Asp Leu Leu Asp Leu 545 550 555 560 Ser Thr Leu Lys Ala Arg Thr Val Gly Val Pro Asn Asp Val Leu Tyr 565 570 575 Asn Glu Val Tyr Glu Gly Pro Thr Leu Thr Glu Phe Glu Asp Ala 580 585 590 <210> 25 <211> 1776 <212> DNA <213> S.cerevisiae <400> 25 atgctaaaat acaaaccttt actaaaaatc tcgaagaact gtgaggctgc tatcctcaga 60 gcgtctaaga ctagattgaa cacaatccgc gcgtacggtt ctaccgttcc aaaatccaag 120 tcgttcgaac aagactcaag aaaacgcaca cagtcatgga ctgccttgag agtcggtgca 180 attctagccg ctactagttc cgtggcgtat ctaaactggc ataatggcca aatagacaac 240 gagccgaaac tggatatgaa taaacaaaag atttcgcccg ctgaagttgc caagcataac 300 aagcccgatg attgttgggt tgtgatcaat ggttacgtat acgacttaac gcgattccta 360 ccaaatcatc caggtgggca ggatgttatc aagtttaacg ccgggaaaga tgtcactgct 420 atttttgaac cactacatgc tcctaatgtc atcgataagt atatagctcc cgagaaaaaa 480 ttgggtcccc ttcaaggatc catgcctcct gaacttgtct gtcctcctta tgctcctggt 540 gaaactaagg aagatatcgc tagaaaagaa caactaaaat cgctgctacc tcctctagat 600 aatattatta acctttacga ctttgaatac ttggcctctc aaactttgac taaacaagcg 660 tgggcctact attcctccgg tgctaacgac gaagttactc acagagaaaa ccataatgct 720 tatcatagga tttttttcaa accaaagatc cttgtagatg tacgcaaagt agacatttca 780 actgacatgt tgggttctca tgtggatgtt cccttctacg tgtctgctac agctttgtgt 840 aaactgggaa accccttaga aggtgaaaaa gatgtcgcca gaggttgtgg ccaaggtgtg 900 acaaaagtcc cacaaatgat atctactttg gcttcatgtt cccctgagga aattattgaa 960 gcagcaccct ctgataaaca aattcaatgg taccaactat atgttaactc tgatagaaag 1020 atcactgatg atttggttaa aaatgtagaa aagctgggtg taaaggcatt atttgtcact 1080 gtggatgctc caagtttagg tcaaagagaa aaagatatga agctgaaatt ttccaataca 1140 aaggctggtc caaaagcgat gaagaaaact aatgtagaag aatctcaagg tgcttcgaga 1200 gcgttatcaa agtttattga cccctctttg acttggaaag atatagaaga gttgaagaaa 1260 aagacaaaac tacctattgt tatcaaaggt gttcaacgta ccgaagatgt tatcaaagca 1320 gcagaaatcg gtgtaagtgg ggtggttcta tccaatcatg gtggtagaca attagatttt 1380 tcaagggctc ccattgaagt cctggctgaa accatgccaa tcctggaaca acgtaacttg 1440 aaggataagt tggaagtttt cgtggacggt ggtgttcgtc gtggtacaga tgtcttgaaa 1500 gcgttatgtc taggtgctaa aggtgttggt ttgggtagac cattcttgta tgcgaactca 1560 tgctatggtc gtaatggtgt tgaaaaagcc attgaaattt taagagatga aattgaaatg 1620 tctatgagac tattaggtgt tactagcatt gcggaattga agcctgatct tttagatcta 1680 tcaacactaa aggcaagaac agttggagta ccaaacgacg tgctgtataa tgaagtttat 1740 gagggaccta ctttaacaga atttgaggat gcatga 1776 <210> 26 <211> 391 <212> PRT <213> S.cerevisiae <400> 26 Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn 1 5 10 15 Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu 20 25 30 Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr 35 40 45 Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe 50 55 60 Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu 65 70 75 80 Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu 85 90 95 Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile 100 105 110 Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln 115 120 125 Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His 130 135 140 Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly 145 150 155 160 Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys 165 170 175 Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His 180 185 190 Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly 195 200 205 Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg 210 215 220 Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile 225 230 235 240 Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu 245 250 255 Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly 260 265 270 Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg 275 280 285 Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr 290 295 300 Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr 305 310 315 320 Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln 325 330 335 Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu 340 345 350 Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln 355 360 365 Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu 370 375 380 Glu Leu Asp Leu His Glu Asp 385 390 <210> 27 <211> 1176 <212> DNA <213> S.cerevisiae <400> 27 atgtctgctg ctgctgatag attaaactta acttccggcc acttgaatgc tggtagaaag 60 agaagttcct cttctgtttc tttgaaggct gccgaaaagc ctttcaaggt tactgtgatt 120 ggatctggta actggggtac tactattgcc aaggtggttg ccgaaaattg taagggatac 180 ccagaagttt tcgctccaat agtacaaatg tgggtgttcg aagaagagat caatggtgaa 240 aaattgactg aaatcataaa tactagacat caaaacgtga aatacttgcc tggcatcact 300 ctacccgaca atttggttgc taatccagac ttgattgatt cagtcaagga tgtcgacatc 360 atcgttttca acattccaca tcaatttttg ccccgtatct gtagccaatt gaaaggtcat 420 gttgattcac acgtcagagc tatctcctgt ctaaagggtt ttgaagttgg tgctaaaggt 480 gtccaattgc tatcctctta catcactgag gaactaggta ttcaatgtgg tgctctatct 540 ggtgctaaca ttgccaccga agtcgctcaa gaacactggt ctgaaacaac agttgcttac 600 cacattccaa aggatttcag aggcgagggc aaggacgtcg accataaggt tctaaaggcc 660 ttgttccaca gaccttactt ccacgttagt gtcatcgaag atgttgctgg tatctccatc 720 tgtggtgctt tgaagaacgt tgttgcctta ggttgtggtt tcgtcgaagg tctaggctgg 780 ggtaacaacg cttctgctgc catccaaaga gtcggtttgg gtgagatcat cagattcggt 840 caaatgtttt tcccagaatc tagagaagaa acatactacc aagagtctgc tggtgttgct 900 gatttgatca ccacctgcgc tggtggtaga aacgtcaagg ttgctaggct aatggctact 960 tctggtaagg acgcctggga atgtgaaaag gagttgttga atggccaatc cgctcaaggt 1020 ttaattacct gcaaagaagt tcacgaatgg ttggaaacat gtggctctgt cgaagacttc 1080 ccattatttg aagccgtata ccaaatcgtt tacaacaact acccaatgaa gaacctgccg 1140 gacatgattg aagaattaga tctacatgaa gattag 1176 <210> 28 <211> 753 <212> DNA <213> S.cerevisiae <400> 28 atgcctttga ccacaaaacc tttatctttg aaaatcaacg ccgctctatt cgatgttgac 60 ggtaccatca tcatctctca accagccatt gctgctttct ggagagattt cggtaaagac 120 aagccttact tcgatgccga acacgttatt cacatctctc acggttggag aacttacgat 180 gccattgcca agttcgctcc agactttgct gatgaagaat acgttaacaa gctagaaggt 240 gaaatcccag aaaagtacgg tgaacactcc atcgaagttc caggtgctgt caagttgtgt 300 aatgctttga acgccttgcc aaaggaaaaa tgggctgtcg ccacctctgg tacccgtgac 360 atggccaaga aatggttcga cattttgaag atcaagagac cagaatactt catcaccgcc 420 aatgatgtca agcaaggtaa gcctcaccca gaaccatact taaagggtag aaacggtttg 480 ggtttcccaa ttaatgaaca agacccatcc aaatctaagg ttgttgtctt tgaagacgca 540 ccagctggta ttgctgctgg taaggctgct ggctgtaaaa tcgttggtat tgctaccact 600 ttcgatttgg acttcttgaa ggaaaagggt tgtgacatca ttgtcaagaa ccacgaatct 660 atcagagtcg gtgaatacaa cgctgaaacc gatgaagtcg aattgatctt tgatgactac 720 ttatacgcta aggatgactt gttgaaatgg taa 753 <210> 29 <211> 250 <212> PRT <213> S.cerevisiae <400> 29 Met Pro Leu Thr Thr Lys Pro Leu Ser Leu Lys Ile Asn Ala Ala Leu 1 5 10 15 Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln Pro Ala Ile Ala Ala 20 25 30 Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His 35 40 45 Val Ile His Ile Ser His Gly Trp Arg Thr Tyr Asp Ala Ile Ala Lys 50 55 60 Phe Ala Pro Asp Phe Ala Asp Glu Glu Tyr Val Asn Lys Leu Glu Gly 65 70 75 80 Glu Ile Pro Glu Lys Tyr Gly Glu His Ser Ile Glu Val Pro Gly Ala 85 90 95 Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala 100 105 110 Val Ala Thr Ser Gly Thr Arg Asp Met Ala Lys Lys Trp Phe Asp Ile 115 120 125 Leu Lys Ile Lys Arg Pro Glu Tyr Phe Ile Thr Ala Asn Asp Val Lys 130 135 140 Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu 145 150 155 160 Gly Phe Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val 165 170 175 Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys 180 185 190 Lys Ile Val Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu 195 200 205 Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly 210 215 220 Glu Tyr Asn Ala Glu Thr Asp Glu Val Glu Leu Ile Phe Asp Asp Tyr 225 230 235 240 Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp 245 250 <210> 30 <211> 500 <212> PRT <213> S.cerevisiae <400> 30 Met Thr Lys Leu His Phe Asp Thr Ala Glu Pro Val Lys Ile Thr Leu 1 5 10 15 Pro Asn Gly Leu Thr Tyr Glu Gln Pro Thr Gly Leu Phe Ile Asn Asn 20 25 30 Lys Phe Met Lys Ala Gln Asp Gly Lys Thr Tyr Pro Val Glu Asp Pro 35 40 45 Ser Thr Glu Asn Thr Val Cys Glu Val Ser Ser Ala Thr Thr Glu Asp 50 55 60 Val Glu Tyr Ala Ile Glu Cys Ala Asp Arg Ala Phe His Asp Thr Glu 65 70 75 80 Trp Ala Thr Gln Asp Pro Arg Glu Arg Gly Arg Leu Leu Ser Lys Leu 85 90 95 Ala Asp Glu Leu Glu Ser Gln Ile Asp Leu Val Ser Ser Ile Glu Ala 100 105 110 Leu Asp Asn Gly Lys Thr Leu Ala Leu Ala Arg Gly Asp Val Thr Ile 115 120 125 Ala Ile Asn Cys Leu Arg Asp Ala Ala Ala Tyr Ala Asp Lys Val Asn 130 135 140 Gly Arg Thr Ile Asn Thr Gly Asp Gly Tyr Met Asn Phe Thr Thr Leu 145 150 155 160 Glu Pro Ile Gly Val Cys Gly Gln Ile Ile Pro Trp Asn Phe Pro Ile 165 170 175 Met Met Leu Ala Trp Lys Ile Ala Pro Ala Leu Ala Met Gly Asn Val 180 185 190 Cys Ile Leu Lys Pro Ala Ala Val Thr Pro Leu Asn Ala Leu Tyr Phe 195 200 205 Ala Ser Leu Cys Lys Lys Val Gly Ile Pro Ala Gly Val Val Asn Ile 210 215 220 Val Pro Gly Pro Gly Arg Thr Val Gly Ala Ala Leu Thr Asn Asp Pro 225 230 235 240 Arg Ile Arg Lys Leu Ala Phe Thr Gly Ser Thr Glu Val Gly Lys Ser 245 250 255 Val Ala Val Asp Ser Ser Glu Ser Asn Leu Lys Lys Ile Thr Leu Glu 260 265 270 Leu Gly Gly Lys Ser Ala His Leu Val Phe Asp Asp Ala Asn Ile Lys 275 280 285 Lys Thr Leu Pro Asn Leu Val Asn Gly Ile Phe Lys Asn Ala Gly Gln 290 295 300 Ile Cys Ser Ser Gly Ser Arg Ile Tyr Val Gln Glu Gly Ile Tyr Asp 305 310 315 320 Glu Leu Leu Ala Ala Phe Lys Ala Tyr Leu Glu Thr Glu Ile Lys Val 325 330 335 Gly Asn Pro Phe Asp Lys Ala Asn Phe Gln Gly Ala Ile Thr Asn Arg 340 345 350 Gln Gln Phe Asp Thr Ile Met Asn Tyr Ile Asp Ile Gly Lys Lys Glu 355 360 365 Gly Ala Lys Ile Leu Thr Gly Gly Glu Lys Val Gly Asp Lys Gly Tyr 370 375 380 Phe Ile Arg Pro Thr Val Phe Tyr Asp Val Asn Glu Asp Met Arg Ile 385 390 395 400 Val Lys Glu Glu Ile Phe Gly Pro Val Val Thr Val Ala Lys Phe Lys 405 410 415 Thr Leu Glu Glu Gly Val Glu Met Ala Asn Ser Ser Glu Phe Gly Leu 420 425 430 Gly Ser Gly Ile Glu Thr Glu Ser Leu Ser Thr Gly Leu Lys Val Ala 435 440 445 Lys Met Leu Lys Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asp Phe 450 455 460 Asp Ser Arg Val Pro Phe Gly Gly Val Lys Gln Ser Gly Tyr Gly Arg 465 470 475 480 Glu Met Gly Glu Glu Val Tyr His Ala Tyr Thr Glu Val Lys Ala Val 485 490 495 Arg Ile Lys Leu 500 <210> 31 <211> 1503 <212> DNA <213> S.cerevisiae <400> 31 atgactaagc tacactttga cactgctgaa ccagtcaaga tcacacttcc aaatggtttg 60 acatacgagc aaccaaccgg tctattcatt aacaacaagt ttatgaaagc tcaagacggt 120 aagacctatc ccgtcgaaga tccttccact gaaaacaccg tttgtgaggt ctcttctgcc 180 accactgaag atgttgaata tgctatcgaa tgtgccgacc gtgctttcca cgacactgaa 240 tgggctaccc aagacccaag agaaagaggc cgtctactaa gtaagttggc tgacgaattg 300 gaaagccaaa ttgacttggt ttcttccatt gaagctttgg acaatggtaa aactttggcc 360 ttagcccgtg gggatgttac cattgcaatc aactgtctaa gagatgctgc tgcctatgcc 420 gacaaagtca acggtagaac aatcaacacc ggtgacggct acatgaactt caccacctta 480 gagccaatcg gtgtctgtgg tcaaattatt ccatggaact ttccaataat gatgttggct 540 tggaagatcg ccccagcatt ggccatgggt aacgtctgta tcttgaaacc cgctgctgtc 600 acacctttaa atgccctata ctttgcttct ttatgtaaga aggttggtat tccagctggt 660 gtcgtcaaca tcgttccagg tcctggtaga actgttggtg ctgctttgac caacgaccca 720 agaatcagaa agctggcttt taccggttct acagaagtcg gtaagagtgt tgctgtcgac 780 tcttctgaat ctaacttgaa gaaaatcact ttggaactag gtggtaagtc cgcccatttg 840 gtctttgacg atgctaacat taagaagact ttaccaaatc tagtaaacgg tattttcaag 900 aacgctggtc aaatttgttc ctctggttct agaatttacg ttcaagaagg tatttacgac 960 gaactattgg ctgctttcaa ggcttacttg gaaaccgaaa tcaaagttgg taatccattt 1020 gacaaggcta acttccaagg tgctatcact aaccgtcaac aattcgacac aattatgaac 1080 tacatcgata tcggtaagaa agaaggcgcc aagatcttaa ctggtggcga aaaagttggt 1140 gacaagggtt acttcatcag accaaccgtt ttctacgatg ttaatgaaga catgagaatt 1200 gttaaggaag aaatttttgg accagttgtc actgtcgcaa agttcaagac tttagaagaa 1260 ggtgtcgaaa tggctaacag ctctgaattc ggtctaggtt ctggtatcga aacagaatct 1320 ttgagcacag gtttgaaggt ggccaagatg ttgaaggccg gtaccgtctg gatcaacaca 1380 tacaacgatt ttgactccag agttccattc ggtggtgtta agcaatctgg ttacggtaga 1440 gaaatgggtg aagaagtcta ccatgcatac actgaagtaa aagctgtcag aattaagttg 1500 taa 1503 <210> 32 <211> 1404 <212> DNA <213> E.coli <400> 32 atgaatcaac aggatattga acaggtggtg aaagcggtac tgctgaaaat gcaaagcagt 60 gacacgccgt ccgccgccgt tcatgagatg ggcgttttcg cgtccctgga tgacgccgtt 120 gcggcagcca aagtcgccca gcaagggtta aaaagcgtgg caatgcgcca gttagccatt 180 gctgccattc gtgaagcagg cgaaaaacac gccagagatt tagcggaact tgccgtcagt 240 gaaaccggca tggggcgcgt tgaagataaa tttgcaaaaa acgtcgctca ggcgcgcggc 300 acaccaggcg ttgagtgcct ctctccgcaa gtgctgactg gcgacaacgg cctgacccta 360 attgaaaacg caccctgggg cgtggtggct tcggtgacgc cttccactaa cccggcggca 420 accgtaatta acaacgccat cagcctgatt gccgcgggca acagcgtcat ttttgccccg 480 catccggcgg cgaaaaaagt ctcccagcgg gcgattacgc tgctcaacca ggcgattgtt 540 gccgcaggtg ggccggaaaa cttactggtt actgtggcaa atccggatat cgaaaccgcg 600 caacgcttgt tcaagtttcc gggtatcggc ctgctggtgg taaccggcgg cgaagcggta 660 gtagaagcgg cgcgtaaaca caccaataaa cgtctgattg ccgcaggcgc tggcaacccg 720 ccggtagtgg tggatgaaac cgccgacctc gcccgtgccg ctcagtccat cgtcaaaggc 780 gcttctttcg ataacaacat catttgtgcc gacgaaaagg tactgattgt tgttgatagc 840 gtagccgatg aactgatgcg tctgatggaa ggccagcacg cggtgaaact gaccgcagaa 900 caggcgcagc agctgcaacc ggtgttgctg aaaaatatcg acgagcgcgg aaaaggcacc 960 gtcagccgtg actgggttgg tcgcgacgca ggcaaaatcg cggcggcaat cggccttaaa 1020 gttccgcaag aaacgcgcct gctgtttgtg gaaaccaccg cagaacatcc gtttgccgtg 1080 actgaactga tgatgccggt gttgcccgtc gtgcgcgtcg ccaacgtggc ggatgccatt 1140 gcgctagcgg tgaaactgga aggcggttgc caccacacgg cggcaatgca ctcgcgcaac 1200 atcgaaaaca tgaaccagat ggcgaatgct attgatacca gcattttcgt taagaacgga 1260 ccgtgcattg ccgggctggg gctgggcggg gaaggctgga ccaccatgac catcaccacg 1320 ccaaccggtg aaggggtaac cagcgcgcgt acgtttgtcc gtctgcgtcg ctgtgtatta 1380 gtcgatgcgt ttcgcattgt ttaa 1404 <210> 33 <211> 467 <212> PRT <213> E.coli <400> 33 Met Asn Gln Gln Asp Ile Glu Gln Val Val Lys Ala Val Leu Leu Lys 1 5 10 15 Met Gln Ser Ser Asp Thr Pro Ser Ala Ala Val His Glu Met Gly Val 20 25 30 Phe Ala Ser Leu Asp Asp Ala Val Ala Ala Ala Lys Val Ala Gln Gln 35 40 45 Gly Leu Lys Ser Val Ala Met Arg Gln Leu Ala Ile Ala Ala Ile Arg 50 55 60 Glu Ala Gly Glu Lys His Ala Arg Asp Leu Ala Glu Leu Ala Val Ser 65 70 75 80 Glu Thr Gly Met Gly Arg Val Glu Asp Lys Phe Ala Lys Asn Val Ala 85 90 95 Gln Ala Arg Gly Thr Pro Gly Val Glu Cys Leu Ser Pro Gln Val Leu 100 105 110 Thr Gly Asp Asn Gly Leu Thr Leu Ile Glu Asn Ala Pro Trp Gly Val 115 120 125 Val Ala Ser Val Thr Pro Ser Thr Asn Pro Ala Ala Thr Val Ile Asn 130 135 140 Asn Ala Ile Ser Leu Ile Ala Ala Gly Asn Ser Val Ile Phe Ala Pro 145 150 155 160 His Pro Ala Ala Lys Lys Val Ser Gln Arg Ala Ile Thr Leu Leu Asn 165 170 175 Gln Ala Ile Val Ala Ala Gly Gly Pro Glu Asn Leu Leu Val Thr Val 180 185 190 Ala Asn Pro Asp Ile Glu Thr Ala Gln Arg Leu Phe Lys Phe Pro Gly 195 200 205 Ile Gly Leu Leu Val Val Thr Gly Gly Glu Ala Val Val Glu Ala Ala 210 215 220 Arg Lys His Thr Asn Lys Arg Leu Ile Ala Ala Gly Ala Gly Asn Pro 225 230 235 240 Pro Val Val Val Asp Glu Thr Ala Asp Leu Ala Arg Ala Ala Gln Ser 245 250 255 Ile Val Lys Gly Ala Ser Phe Asp Asn Asn Ile Ile Cys Ala Asp Glu 260 265 270 Lys Val Leu Ile Val Val Asp Ser Val Ala Asp Glu Leu Met Arg Leu 275 280 285 Met Glu Gly Gln His Ala Val Lys Leu Thr Ala Glu Gln Ala Gln Gln 290 295 300 Leu Gln Pro Val Leu Leu Lys Asn Ile Asp Glu Arg Gly Lys Gly Thr 305 310 315 320 Val Ser Arg Asp Trp Val Gly Arg Asp Ala Gly Lys Ile Ala Ala Ala 325 330 335 Ile Gly Leu Lys Val Pro Gln Glu Thr Arg Leu Leu Phe Val Glu Thr 340 345 350 Thr Ala Glu His Pro Phe Ala Val Thr Glu Leu Met Met Pro Val Leu 355 360 365 Pro Val Val Arg Val Ala Asn Val Ala Asp Ala Ile Ala Leu Ala Val 370 375 380 Lys Leu Glu Gly Gly Cys His His Thr Ala Ala Met His Ser Arg Asn 385 390 395 400 Ile Glu Asn Met Asn Gln Met Ala Asn Ala Ile Asp Thr Ser Ile Phe 405 410 415 Val Lys Asn Gly Pro Cys Ile Ala Gly Leu Gly Leu Gly Gly Glu Gly 420 425 430 Trp Thr Thr Met Thr Ile Thr Thr Pro Thr Gly Glu Gly Val Thr Ser 435 440 445 Ala Arg Thr Phe Val Arg Leu Arg Arg Cys Val Leu Val Asp Ala Phe 450 455 460 Arg Ile Val 465 <210> 34 <211> 316 <212> PRT <213> E.coli <400> 34 Met Ser Lys Arg Lys Val Ala Ile Ile Gly Ser Gly Asn Ile Gly Thr 1 5 10 15 Asp Leu Met Ile Lys Ile Leu Arg His Gly Gln His Leu Glu Met Ala 20 25 30 Val Met Val Gly Ile Asp Pro Gln Ser Asp Gly Leu Ala Arg Ala Arg 35 40 45 Arg Met Gly Val Ala Thr Thr His Glu Gly Val Ile Gly Leu Met Asn 50 55 60 Met Pro Glu Phe Ala Asp Ile Asp Ile Val Phe Asp Ala Thr Ser Ala 65 70 75 80 Gly Ala His Val Lys Asn Asp Ala Ala Leu Arg Glu Ala Lys Pro Asp 85 90 95 Ile Arg Leu Ile Asp Leu Thr Pro Ala Ala Ile Gly Pro Tyr Cys Val 100 105 110 Pro Val Val Asn Leu Glu Ala Asn Val Asp Gln Leu Asn Val Asn Met 115 120 125 Val Thr Cys Gly Gly Gln Ala Thr Ile Pro Met Val Ala Ala Val Ser 130 135 140 Arg Val Ala Arg Val His Tyr Ala Glu Ile Ile Ala Ser Ile Ala Ser 145 150 155 160 Lys Ser Ala Gly Pro Gly Thr Arg Ala Asn Ile Asp Glu Phe Thr Glu 165 170 175 Thr Thr Ser Arg Ala Ile Glu Val Val Gly Gly Ala Ala Lys Gly Lys 180 185 190 Ala Ile Ile Val Leu Asn Pro Ala Glu Pro Pro Leu Met Met Arg Asp 195 200 205 Thr Val Tyr Val Leu Ser Asp Glu Ala Ser Gln Asp Asp Ile Glu Ala 210 215 220 Ser Ile Asn Glu Met Ala Glu Ala Val Gln Ala Tyr Val Pro Gly Tyr 225 230 235 240 Arg Leu Lys Gln Arg Val Gln Phe Glu Val Ile Pro Gln Asp Lys Pro 245 250 255 Val Asn Leu Pro Gly Val Gly Gln Phe Ser Gly Leu Lys Thr Ala Val 260 265 270 Trp Leu Glu Val Glu Gly Ala Ala His Tyr Leu Pro Ala Tyr Ala Gly 275 280 285 Asn Leu Asp Ile Met Thr Ser Ser Ala Leu Ala Thr Ala Glu Lys Met 290 295 300 Ala Gln Ser Leu Ala Arg Lys Ala Gly Glu Ala Ala 305 310 315 <210> 35 <211> 951 <212> DNA <213> E.coli <400> 35 atgagtaagc gtaaagtcgc cattatcggt tctggcaaca ttggtaccga tctgatgatt 60 aaaattttgc gtcacggtca gcatctggag atggcggtga tggttggcat tgatcctcag 120 tccgacggtc tggcgcgcgc cagacgtatg ggcgtcgcca ccacccatga aggggtgatc 180 ggactgatga acatgcctga atttgctgat atcgacattg tatttgatgc gaccagcgcc 240 ggtgctcatg tgaaaaacga tgccgcttta cgcgaagcga aaccggatat tcgcttaatt 300 gacctgacgc ctgctgccat cggcccttac tgcgtgccgg tggttaacct cgaggcgaac 360 gtcgatcaac tgaacgtcaa catggtcacc tgcggcggcc aggccaccat tccaatggtg 420 gcggcagttt cacgcgtggc gcgtgttcat tacgccgaaa ttatcgcttc tatcgccagt 480 aaatctgccg gacctggcac gcgtgccaat atcgatgaat ttacggaaac cacttcccga 540 gccattgaag tggtgggcgg cgcggcaaaa gggaaggcga ttattgtgct taacccagca 600 gagccaccgt tgatgatgcg tgacacggtg tatgtattga gcgacgaagc ttcacaagat 660 gatatcgaag cctcaatcaa tgaaatggct gaggcggtgc aggcttacgt accgggttat 720 cgcctgaaac agcgcgtgca gtttgaagtt atcccgcagg ataaaccggt caatttaccg 780 ggcgtggggc aattctccgg actgaaaaca gcggtctggc tggaagtcga aggcgcagcg 840 cattatctgc ctgcctatgc gggcaacctc gacattatga cttccagtgc gctggcgaca 900 gcggaaaaaa tggcccagtc actggcgcgc aaggcaggag aagcggcatg a 951 <210> 36 <211> 954 <212> DNA <213> Artificial Sequence <220> <223> S.cerevisiae codon optimized mhpF gene <400> 36 atgtcaaagc gaaaagtagc tatcataggt tcaggtaata ttggtactga tttgatgatc 60 aaaatcctga gacatggcca gcacttggag atggccgtca tggttggtat cgacccacaa 120 tccgatggct tagctagagc taggagaatg ggtgttgcca caactcacga aggggttatt 180 ggcttaatga acatgccaga atttgcagac atcgatatag tttttgatgc tactagtgca 240 ggggcacatg tgaaaaacga cgcggcttta agagaagcca agccagatat tagattaatt 300 gatcttaccc ctgctgctat aggtccttac tgcgttcctg tagttaacct tgaagctaat 360 gtggaccagt tgaacgtgaa tatggttaca tgtggtggcc aagctaccat accaatggtt 420 gctgctgtct ctagagtggc cagagtacat tatgccgaga tcattgcgtc tatcgcatct 480 aagtctgccg gtcctggaac aagggctaac atcgatgagt tcactgagac aacctctaga 540 gctatcgaag tagtaggagg cgcagcaaaa ggtaaagcga tcattgtttt gaatcctgcc 600 gaaccacctt tgatgatgag agatacggtc tacgtgctat cagatgaagc ttcccaggat 660 gacattgaag ctagcattaa tgagatggca gaagccgttc aagcatacgt gccaggatat 720 agactcaaac aaagagtcca atttgaggtc attccacaag acaagccagt taatctccca 780 ggggtcggtc aattctcagg actaaaaact gctgtttggt tagaagtaga aggagctgct 840 cattacctac cagcctacgc cggtaatttg gatataatga catcttccgc tcttgcaaca 900 gcagaaaaga tggcacaaag tctggcccgt aaggcaggag aagcggcata ataa 954 <210> 37 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 37 cgagctcttc gcggccacct acgccgctat c 31 <210> 38 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 38 gctctagata ttgatatagt gtttaagcga at 32 <210> 39 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 39 cggccatggc gggagctcgc atgcaag 27 <210> 40 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 40 cgggatatca ctagtgagct cgctccgc 28 <210> 41 <211> 2321 <212> DNA <213> Artificial Sequence <220> <223> HPH cassette <400> 41 gccgggagag ctcgcatgca agtaacctat tcaaagtaat atctcataca tgtttcatga 60 gggtaacaac atgcgactgg gtgagcatat gttccgctga tgtgatgtgc aagataaaca 120 agcaaggcag aaactaactt cttcttcatg taataaacac accccgcgtt tatttaccta 180 tctctaaact tcaacacctt atatcataac taatatttct tgagataagc acactgcacc 240 cataccttcc ttaaaaacgt agcttccagt ttttggtggt tccggcttcc ttcccgattc 300 cgcccgctaa acgcatattt ttgttgcctg gtggcatttg caaaatgcat aacctatgca 360 tttaaaagat tatgtatgct cttctgactt ttcgtgtgat gaggctcgtg gaaaaaatga 420 ataatttatg aatttgagaa caattttgtg ttgttacggt attttactat ggaataatca 480 atcaattgag gattttatgc aaatatcgtt tgaatatttt tccgaccctt tgagtacttt 540 tcttcataat tgcataatat tgtccgctgc ccctttttct gttagacggt gtcttgatct 600 acttgctatc gttcaacacc accttatttt ctaactattt tttttttagc tcatttgaat 660 cagcttatgg tgatggcaca tttttgcata aacctagctg tcctcgttga acataggaaa 720 aaaaaatata taaacaaggc tctttcactc tccttgcaat cagatttggg tttgttccct 780 ttattttcat atttcttgtc atattccttt ctcaattatt attttctact cataacctca 840 cgcaaaataa cacagtcaaa tcctcgagat gaaaaagcct gaactcaccg cgacgtctgt 900 cgagaagttt ctgatcgaaa agttcgacag cgtctccgac ctgatgcagc tctcggaggg 960 cgaagaatct cgtgctttca gcttcgatgt aggagggcgt ggatatgtcc tgcgggtaaa 1020 tagctgcgcc gatggtttct acaaagatcg ttatgtttat cggcactttg catcggccgc 1080 gctcccgatt ccggaagtgc ttgacattgg ggaattcagc gagagcctga cctattgcat 1140 ctcccgccgt gcacagggtg tcacgttgca agacctgcct gaaaccgaac tgcccgctgt 1200 tctgcagccg gtcgcggagg ccatggatgc gatcgctgcg gccgatctta gccagacgag 1260 cgggttcggc ccattcggac cgcaaggaat cggtcaatac actacatggc gtgatttcat 1320 atgcgcgatt gctgatcccc atgtgtatca ctggcaaact gtgatggacg acaccgtcag 1380 tgcgtccgtc gcgcaggctc tcgatgagct gatgctttgg gccgaggact gccccgaagt 1440 ccggcacctc gtgcacgcgg atttcggctc caacaatgtc ctgacggaca atggccgcat 1500 aacagcggtc attgactgga gcgaggcgat gttcggggat tcccaatacg aggtcgccaa 1560 catcttcttc tggaggccgt ggttggcttg tatggagcag cagacgcgct acttcgagcg 1620 gaggcatccg gagcttgcag gatcgccgcg gctccgggcg tatatgctcc gcattggtct 1680 tgaccaactc tatcagagct tggttgacgg caatttcgat gatgcagctt gggcgcaggg 1740 tcgatgcgac gcaatcgtcc gatccggagc cgggactgtc gggcgtacac aaatcgcccg 1800 cagaagcgcg gccgtctgga ccgatggctg tgtagaagta ctcgccgata gtggaaaccg 1860 acgccccagc actcgtccgg atcgggagat gggggaggct aactgaggat ccgtagatac 1920 attgatgcta tcaatcaaga gaactggaaa gattgtgtaa ccttgaaaaa cggtgaaact 1980 tacgggtcca agattgtcta cagattttcc tgatttgcca gcttactatc cttcttgaaa 2040 atatgcactc tatatctttt agttcttaat tgcaacacat agatttgctg tataacgaat 2100 tttatgctat tttttaaatt tggagttcag tgataaaagt gtcacagcga atttcctcac 2160 atgtagggac cgaattgttt acaagttctc tgtaccacca tggagacatc aaaaattgaa 2220 aatctatgga aagatatgga cggtagcaac aagaatatag cacgagccgc ggagcgagct 2280 cggccgcact agtgatatcc cgcggccatg gcggccggga g 2321 <210> 42 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 42 acaatatttc aagctatacc aagcatacaa tcaactatct catatacaat gggccgcaaa 60 ttaaagcctt cgagc 75 <210> 43 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 43 aatcataaga aattcgctta tttagaagtg tcaacaacgt atctaccaac gactaaaggg 60 aacaaaagct ggagc 75 <210> 44 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 44 gaaacagcta tgaccatg 18 <210> 45 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 45 gacatgacga gctcgaattg ggtaccggcc gc 32 <210> 46 <211> 4173 <212> DNA <213> Artificial Sequence <220> <223> pUC57-Ura3HA vector <400> 46 gatgacggtg aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa 60 gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg 120 ggctggctta actatgcggc atcagagcag attgtactga gagtgcacca tatgcggtgt 180 gaaataccgc acagatgcgt aaggagaaaa taccgcatca ggcgccattc gccattcagg 240 ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg 300 aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga 360 cgttgtaaaa cgacggccag tgaattcgag ctcggtacct cgcgaatgca tctagatatc 420 ggatcccgac gagctgcacc gcggtggcgg ccgtatcttt tacccatacg atgttcctga 480 ctatgcgggc tatccctatg acgtcccgga ctatgcagga tcctatccat atgacgttcc 540 agattacgct gctcagtgcg gccgcctgag agtgcaccat accacagctt ttcaattcaa 600 ttcatcattt tttttttatt cttttttttg atttcggttt ctttgaaatt tttttgattc 660 ggtaatctcc gaacagaagg aagaacgaag gaaggagcac agacttagat tggtatatat 720 acgcatatgt agtgttgaag aaacatgaaa ttgcccagta ttcttaaccc aactgcacag 780 aacaaaaacc tgcaggaaac gaagataaat catgtcgaaa gctacatata aggaacgtgc 840 tgctactcat cctagtcctg ttgctgccaa gctatttaat atcatgcacg aaaagcaaac 900 aaacttgtgt gcttcattgg atgttcgtac caccaaggaa ttactggagt tagttgaagc 960 attaggtccc aaaatttgtt tactaaaaac acatgtggat atcttgactg atttttccat 1020 ggagggcaca gttaagccgc taaaggcatt atccgccaag tacaattttt tactcttcga 1080 agacagaaaa tttgctgaca ttggtaatac agtcaaattg cagtactctg cgggtgtata 1140 cagaatagca gaatgggcag acattacgaa tgcacacggt gtggtgggcc caggtattgt 1200 tagcggtttg aagcaggcgg cagaagaagt aacaaaggaa cctagaggcc ttttgatgtt 1260 agcagaattg tcatgcaagg gctccctatc tactggagaa tatactaagg gtactgttga 1320 cattgcgaag agcgacaaag attttgttat cggctttatt gctcaaagag acatgggtgg 1380 aagagatgaa ggttacgatt ggttgattat gacacccggt gtgggtttag atgacaaggg 1440 agacgcattg ggtcaacagt atagaaccgt ggatgatgtg gtctctacag gatctgacat 1500 tattattgtt ggaagaggac tatttgcaaa gggaagggat gctaaggtag agggtgaacg 1560 ttacagaaaa gcaggctggg aagcatattt gagaagatgc ggccagcaaa actaaaaaac 1620 tgtattataa gtaaatgcat gtatactaaa ctcacaaatt agagcttcaa tttaattata 1680 tcagttatta ccctatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca 1740 tcaggaaatt gtagcggccg cgaatttgag cttatctttt acccatacga tgttcctgac 1800 tatgcgggct atccctatga cgtcccggac tatgcaggat cctatccata tgacgttcca 1860 gattacgcta ctagcggggg gcccggtgac gggcccgtcg actgcagagg cctgcatgca 1920 agcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt 1980 ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc 2040 taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 2100 cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct 2160 tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 2220 gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 2280 atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 2340 ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 2400 cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 2460 tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 2520 gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 2580 aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 2640 tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 2700 aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 2760 aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa gccagttacc 2820 ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 2880 ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 2940 atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 3000 atgagattat caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa 3060 tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag 3120 gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 3180 tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 3240 gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 3300 cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 3360 gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 3420 atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 3480 aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 3540 atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 3600 aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 3660 aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 3720 gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 3780 gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 3840 gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 3900 ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 3960 ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 4020 atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 4080 gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 4140 atcacgaggc cctttcgtct cgcgcgtttc ggt 4173 <210> 47 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 47 gcttataaaa ctttaactaa taattagaga ttaaatcgct taaggtttcc cgactggaaa 60 gc 62 <210> 48 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 48 ctactcataa cctcacgcaa aataacacag tcaaatcaat caaaccagtc acgacgttgt 60 aaaa 64 <210> 49 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 49 ccgaaatgat tccctttcct gcacaacacg agatctttca cgcatccagt cacgacgttg 60 taaaa 65 <210> 50 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 50 aaagtagcct taaagctagg ctataatcat gcatcctcaa attctaggtt tcccgactgg 60 aaagc 65 <210> 51 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 51 ccctatgtct ctggccgatc acgcgccatt gtccctcaga aacaaatcaa ccagtcacga 60 cgttgtaaaa 70 <210> 52 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 52 tagaagcaac tgtgccgaca gcctctgaat gagtggtgtt gtaaccaccc aggtttcccg 60 actggaaagc 70 <210> 53 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 53 ggacgtaaag ggtagcctcc 20 <210> 54 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 54 gaagcggacc cagacttaag cc 22 <210> 55 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 55 cgcaagaacg tagtatccac atgcc 25 <210> 56 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 56 ggatatttac agaacgatgc g 21 <210> 57 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 57 tcaatgagac tgttgtcctc ctact 25 <210> 58 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 58 tacatccttg tcgagccttg ggca 24 <210> 59 <211> 5999 <212> DNA <213> Artificial Sequence <220> <223> pJ1214-mhpF vector <400> 59 atgcagctca gattctttgt ttgaaaaatt agcgctctcg cgttgcattt ttgttttaca 60 aaaatgaagc acagattctt cgttggtaaa atagcgcttt cgcgttgcat ttctgttctg 120 taaaaatgca gctcagattc tttgtttgaa aaattagcgc tctcgcgttg catttttgtt 180 ctacaaaatg aagcacagat gcttcgttca ggtggcactt ttcggggaaa tgtgcgcgga 240 acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa 300 ccctgatatt ggtcagaatt ggttaattgg ttgtaacact gacccctatt tgtttatttt 360 tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 420 aatattgaaa aaggaagaat atgagtattc aacatttccg tgtcgccctt attccctttt 480 ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 540 ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 600 tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 660 tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 720 actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 780 gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 840 acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 900 gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 960 acgagcgtga caccacgatg cctgtagcga tggcaacaac gttgcgcaaa ctattaactg 1020 gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 1080 ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatccg 1140 gagccggtga gcgtggttct cgcggtatca tcgcagcgct ggggccagat ggtaagccct 1200 cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1260 agatcgctga gataggtgcc tcactgatta agcattggta actcatgacc aaaatccctt 1320 aacgtgagtt acgcgcgcgt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 1380 atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 1440 gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 1500 tggcttcagc agagcgcaga taccaaatac tgttcttcta gtgtagccgt agttagccca 1560 ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 1620 ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 1680 ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 1740 aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 1800 cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 1860 gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 1920 ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 1980 cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 2040 tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 2100 cgctcggggt cgtgcaggta tagcttcaaa atgtttctac tcctttttta ctcttccaga 2160 ttttctcgga ctccgcgcat cgccgtacca cttcaaaaca cccaagcaca gcatactaaa 2220 tttcccctct ttcttcctct agggtgtcgt taattacccg tactaaaggt ttggaaaaga 2280 aaaaagtgac cgcctcgttt ctttttcttc gtcgaaaaag gcaataaaaa tttttatcac 2340 gtttcttttt cttgaaaatt tttttttttg atttttttct ctttcgatga cctcccattg 2400 atatttaagt taataaacgg acttcaattt ctcaagtttc agtttcattt ttcttgttct 2460 attacaactt tttttacttc ttgctcatta gaaagaaagc atagcaatct aatctaagtt 2520 taaaatgtca aagcgaaaag tagctatcat aggttcaggt aatattggta ctgatttgat 2580 gatcaaaatc ctgagacatg gccagcactt ggagatggcc gtcatggttg gtatcgaccc 2640 acaatccgat ggcttagcta gagctaggag aatgggtgtt gccacaactc acgaaggggt 2700 tattggctta atgaacatgc cagaatttgc agacatcgat atagtttttg atgctactag 2760 tgcaggggca catgtgaaaa acgacgcggc tttaagagaa gccaagccag atattagatt 2820 aattgatctt acccctgctg ctataggtcc ttactgcgtt cctgtagtta accttgaagc 2880 taatgtggac cagttgaacg tgaatatggt tacatgtggt ggccaagcta ccataccaat 2940 ggttgctgct gtctctagag tggccagagt acattatgcc gagatcattg cgtctatcgc 3000 atctaagtct gccggtcctg gaacaagggc taacatcgat gagttcactg agacaacctc 3060 tagagctatc gaagtagtag gaggcgcagc aaaaggtaaa gcgatcattg ttttgaatcc 3120 tgccgaacca cctttgatga tgagagatac ggtctacgtg ctatcagatg aagcttccca 3180 ggatgacatt gaagctagca ttaatgagat ggcagaagcc gttcaagcat acgtgccagg 3240 atatagactc aaacaaagag tccaatttga ggtcattcca caagacaagc cagttaatct 3300 cccaggggtc ggtcaattct caggactaaa aactgctgtt tggttagaag tagaaggagc 3360 tgctcattac ctaccagcct acgccggtaa tttggatata atgacatctt ccgctcttgc 3420 aacagcagaa aagatggcac aaagtctggc ccgtaaggca ggagaagcgg cataataaat 3480 catgtaatta gttatgtcac gcttacattc acgccctccc cccacatccg ctctaaccga 3540 aaaggaagga gttagacaac ctgaagtcta ggtccctatt tattttttta tagttatgtt 3600 agtattaaga acgttattta tatttcaaat ttttcttttt tttctgtaca gacgcgtgta 3660 cgcatgtaac attatactga aaaccttgct tgagaaggtt ttgggacgct cgaaggcttt 3720 aatttgcggc ccctcacctg cacgcaaaaa gcttttcaat tcaattcatc attttttttt 3780 tattcttttt tttgatttcg gtttctttga aatttttttg attcggtaat ctccgaacag 3840 aaggaagaac gaaggaagga gcacagactt agattggtat atatacgcat atgtagtgtt 3900 gaagaaacat gaaattgccc agtattctta acccaactgc acagaacaaa aaccagcagg 3960 aaacgaagat aaatcatgtc gaaagctaca tataaggaac gtgctgctac tcatcctagt 4020 cctgttgctg ccaagctatt taatatcatg cacgaaaagc aaacaaactt gtgtgcttca 4080 ttggatgttc gtaccaccaa ggaattactg gagttagttg aagcattagg tcccaaaatt 4140 tgtttactaa aaacacatgt ggatatcttg actgattttt ccatggaggg cacagttaag 4200 ccgctaaagg cattatccgc caagtacaat tttttactct tcgaagatag aaaatttgct 4260 gacattggta atacagtcaa attgcagtac tctgcgggtg tatacagaat agcagaatgg 4320 gcagacatta cgaatgcaca cggtgtggtg ggcccaggta ttgttagcgg tttgaagcag 4380 gcggcagaag aagtaacaaa ggaacctaga ggccttttga tgttagcaga attgtcatgc 4440 aagggctccc tatctactgg agaatatact aagggtactg ttgacattgc gaaaagcgac 4500 aaagattttg ttatcggctt tattgctcaa agagacatgg gtggaagaga tgaaggttac 4560 gattggttga ttatgacacc cggtgtgggt ttagatgaca agggagatgc attgggtcaa 4620 cagtatagaa ccgtggatga tgttgtctct acaggatctg acattattat tgttggaaga 4680 ggactatttg caaagggaag ggatgctaag gtagagggtg aacgttacag aaaagcaggc 4740 tgggaagcat atttgagaag atgcggccag caaaactaaa aaactgtatt ataagtaaat 4800 gcatgtatac taaactcaca aattagagct tcaatttaat tatatcagtt attacccacg 4860 ctatgatcca atatcaaagg aaatgatagc attgaaggat gagactaatc caattgagga 4920 gtggcagcat atagaacagc taaagggtag tgctgaagga agcatacgat accccgcatg 4980 gaatgggata atatcacagg aggtactaga ctacctttca tcctacataa atagacgcat 5040 ataagtacgc atttaagcat aaacacgcac tatgccgttc ttctcatgta tatatatata 5100 caggcaacac gcagatatag gtgcgacgtg aacagtgagc tgtatgtgcg cagctcgcgt 5160 tgcattttcg gaagcgctcg ttttcggaaa cgctttgaag ttcctattcc gaagttccta 5220 ttctctagaa agtataggaa cttcagagcg cttttgaaaa ccaaaagcgc tctgaagtcg 5280 cactttcaaa aaaccaaaaa cgcaccggac tgtaacgagc tactaaaata ttgcgaatac 5340 cgcttccaca aacattgctc aaaagtatct ctttgctata tatctctgtg ctatatccct 5400 atataaccta cccatccacc tttcgctcct tgaacttgca tctaaactcg acctctacat 5460 tttttatgtt tatctctagt attactcttt agacaaaaaa attgtagtaa gaactattca 5520 tagagtgaat cgaaaacaat acgaaaatgt aaacatttcc tatacgtagt atatagagac 5580 aaaatagaag aaaccgttca taattttctg accaatgaag aatcatcaac gctatcactt 5640 tctgttcaca aagtatgcgc aatccacatc ggtatagaat ataatcgggg atgcctttat 5700 cttgaaaaaa tgcacccgca gcttcgctag taatcagtaa acgcgggaag tggagtcagg 5760 ctttttttat ggaagagaaa atagacacca aagtagcctt cttctaacct taacggacct 5820 acagtgcaaa aagttatcaa gagactgcat tatagagcgc acaaaggaga aaaaaagtaa 5880 tctaagatgc tttgttagaa aaatagcgct ctcgggatgc atttttgtag aacaaaaaag 5940 aagtatagat tctttgttgg taaaatagcg ctctcgcgtt gcatttctgt tctgtaaaa 5999 <210> 60 <211> 5779 <212> DNA <213> Artificial Sequence <220> <223> pUC19-His-MhpF <400> 60 tcgacctgca ggcatgcaag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 60 tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 120 ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 180 tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 240 ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 300 ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 360 gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 420 gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 480 cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 540 ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 600 tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 660 gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 720 tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 780 ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 840 ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct 900 ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 960 accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 1020 tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 1080 cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 1140 taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 1200 caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 1260 gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 1320 gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag 1380 ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 1440 attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 1500 gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 1560 tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 1620 agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 1680 gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 1740 actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 1800 tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 1860 attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 1920 tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 1980 tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 2040 aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 2100 tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 2160 cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta 2220 acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt 2280 gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc 2340 gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggctggctt 2400 aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg tgaaataccg 2460 cacagatgcg taaggagaaa ataccgcatc aggcgccatt cgccattcag gctgcgcaac 2520 tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga 2580 tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa 2640 acgacggcca gtgaattcga gctcagttta tcattatcaa tactcgccat ttcaaagaat 2700 acgtaaataa ttaatagtag tgattttcct aactttattt agtcaaaaaa ttagcctttt 2760 aattctgctg taacccgtac atgcccaaaa tagggggcgg gttacacaga atatataaca 2820 tcgtaggtgt ctgggtgaac agtttattcc tggcatccac taaatataat ggagcccgct 2880 ttttaagctg gcatccagaa aaaaaaagaa tcccagcacc aaaatattgt tttcttcacc 2940 aaccatcagt tcataggtcc attctcttag cgcaactaca gagaacaggg gcacaaacag 3000 gcaaaaaacg ggcacaacct caatggagtg atgcaacctg cctggagtaa atgatgacac 3060 aaggcaattg acccacgcat gtatctatct cattttctta caccttctat taccttctgc 3120 tctctctgat ttggaaaaag ctgaaaaaaa aggttgaaac cagttccctg aaattattcc 3180 cctacttgac taataagtat ataaagacgg taggtattga ttgtaattct gtaaatctat 3240 ttcttaaact tcttaaattc tacttttata gttagtcttt tttttagttt taaaacacca 3300 gaacttagtt tcgacggatt ctagaactag tggatccatg tcaaagcgaa aagtagctat 3360 cataggttca ggtaatattg gtactgattt gatgatcaaa atcctgagac atggccagca 3420 cttggagatg gccgtcatgg ttggtatcga cccacaatcc gatggcttag ctagagctag 3480 gagaatgggt gttgccacaa ctcacgaagg ggttattggc ttaatgaaca tgccagaatt 3540 tgcagacatc gatatagttt ttgatgctac tagtgcaggg gcacatgtga aaaacgacgc 3600 ggctttaaga gaagccaagc cagatattag attaattgat cttacccctg ctgctatagg 3660 tccttactgc gttcctgtag ttaaccttga agctaatgtg gaccagttga acgtgaatat 3720 ggttacatgt ggtggccaag ctaccatacc aatggttgct gctgtctcta gagtggccag 3780 agtacattat gccgagatca ttgcgtctat cgcatctaag tctgccggtc ctggaacaag 3840 ggctaacatc gatgagttca ctgagacaac ctctagagct atcgaagtag taggaggcgc 3900 agcaaaaggt aaagcgatca ttgttttgaa tcctgccgaa ccacctttga tgatgagaga 3960 tacggtctac gtgctatcag atgaagcttc ccaggatgac attgaagcta gcattaatga 4020 gatggcagaa gccgttcaag catacgtgcc aggatataga ctcaaacaaa gagtccaatt 4080 tgaggtcatt ccacaagaca agccagttaa tctcccaggg gtcggtcaat tctcaggact 4140 aaaaactgct gtttggttag aagtagaagg agctgctcat tacctaccag cctacgccgg 4200 taatttggat ataatgacat cttccgctct tgcaacagca gaaaagatgg cacaaagtct 4260 ggcccgtaag gcaggagaag cggcataata aatcctcgag tcatgtaatt agttatgtca 4320 cgcttacatt cacgccctcc ccccacatcc gctctaaccg aaaaggaagg agttagacaa 4380 cctgaagtct aggtccctat ttattttttt atagttatgt tagtattaag aacgttattt 4440 atatttcaaa tttttctttt ttttctgtac agacgcgtgt acgcatgtaa cattatactg 4500 aaaaccttgc ttgagaaggt tttgggacgc tcgaaggctt taatttgcgg ccggtaccca 4560 attcgagctc ggtacccggg gatcctctag agtcgacaat tcccgtttta agagcttggt 4620 gagcgctagg agtcactgcc aggtatcgtt tgaacacggc attagtcagg gaagtcataa 4680 cacagtcctt tcccgcaatt ttctttttct attactcttg gcctcctcta gtacactcta 4740 tattttttta tgcctcggta atgattttca tttttttttt tcccctagcg gatgactctt 4800 tttttttctt agcgattggc attatcacat aatgaattat acattatata aagtaatgtg 4860 atttcttcga agaatatact aaaaaatgag caggcaagat aaacgaaggc aaagatgaca 4920 gagcagaaag ccctagtaaa gcgtattaca aatgaaacca agattcagat tgcgatctct 4980 ttaaagggtg gtcccctagc gatagagcac tcgatcttcc cagaaaaaga ggcagaagca 5040 gtagcagaac aggccacaca atcgcaagtg attaacgtcc acacaggtat agggtttctg 5100 gaccatatga tacatgctct ggccaagcat tccggctggt cgctaatcgt tgagtgcatt 5160 ggtgacttac acatagacga ccatcacacc actgaagact gcgggattgc tctcggtcaa 5220 gcttttaaag aggccctact ggcgcgtgga gtaaaaaggt ttggatcagg atttgcgcct 5280 ttggatgagg cactttccag agcggtggta gatctttcga acaggccgta cgcagttgtc 5340 gaacttggtt tgcaaaggga gaaagtagga gatctctctt gcgagatgat cccgcatttt 5400 cttgaaagct ttgcagaggc tagcagaatt accctccacg ttgattgtct gcgaggcaag 5460 aatgatcatc accgtagtga gagtgcgttc aaggctcttg cggttgccat aagagaagcc 5520 acctcgccca atggtaccaa cgatgttccc tccaccaaag gtgttcttat gtagtgacac 5580 cgattattta aagctgcagc atacgatata tatacatgtg tatatatgta tacctatgaa 5640 tgtcagtaag tatgtatacg aacagtatga tactgaagat gacaaggtaa tgcatcattc 5700 tatacgtgtc attctgaacg aggcgcgctt tccttttttc tttttgcttt ttcttttttt 5760 ttctcttgaa ctcgacggg 5779 <210> 61 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 61 cctcctgagt cgacaattcc cgttttaaga g 31 <210> 62 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 62 cgaccgtggt cgacccgtcg agttcaagag 30 <210> 63 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 63 tatatatttc aaggatatac cattctaatg tctgccccta agaagatcgt gctgcaaggc 60 gattaag 67 <210> 64 <211> 67 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 64 gagaatcttt ttaagcaagg attttcttaa cttcttcggc gacagcatcg gctcgtatgt 60 tgtgtgg 67 <210> 65 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 65 gtttcgtcta ccctatgaac 20 <210> 66 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 66 ccaataggtg gttagcaatc g 21 <210> 67 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 67 caagaaacat ctttaacata cacaaacaca tactatcaga atacccagtc acgacgttgt 60 aaaa 64 <210> 68 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 68 gtattttgtg tatatgacgg aaagaaatgc aggttggtac attacaggtt tcccgactgg 60 aaagc 65 <210> 69 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 69 gcatcgggaa cgtatgtaac attg 24 <210> 70 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 70 tgacgtaaga ccaagtaag 19 <210> 71 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 71 ctatagggcg aattggctag cttatcatta tcaatactcg ccatttcaaa gaata 55 <210> 72 <211> 66 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 72 ctcgaggggg ggcccggtac ctcgaaacta agttctggtg ttttaaaact aaaaaaaaga 60 ctaact 66 <210> 73 <211> 6110 <212> DNA <213> Artificial Sequence <220> <223> pCS-Ex1 vector <400> 73 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtacgcatt taagcataaa cacgcactat gccgttcttc tcatgtatat 180 atatatacag gcaacacgca gatataggtg cgacgtgaac agtgagctgt atgtgcgcag 240 ctcgcgttgc attttcggaa gcgctcgttt tcggaaacgc tttgaagttc ctattccgaa 300 gttcctattc tctagctaga aagtatagga acttcagagc gcttttgaaa accaaaagcg 360 ctctgaagac gcactttcaa aaaaccaaaa acgcaccgga ctgtaacgag ctactaaaat 420 attgcgaata ccgcttccac aaacattgct caaaagtatc tctttgctat atatctctgt 480 gctatatccc tatataacct acccatccac ctttcgctcc ttgaacttgc atctaaactc 540 gacctctaca ttttttatgt ttatctctag tattactctt tagacaaaaa aattgtagta 600 agaactattc atagagtgaa tcgaaaacaa tacgaaaatg taaacatttc ctatacgtag 660 tatatagaga caaaatagaa gaaaccgttc ataattttct gaccaatgaa gaatcatcaa 720 cgctatcact ttctgttcac aaagtatgcg caatccacat cggtatagaa tataatcggg 780 gatgccttta tcttgaaaaa atgcacccgc agcttcgcta gtaatcagta aacgcgggaa 840 gtggagtcag gcttttttta tggaagagaa aatagacacc aaagtagcct tcttctaacc 900 ttaacggacc tacagtgcaa aaagttatca agagactgca ttatagagcg cacaaaggag 960 aaaaaaagta atctaagatg ctttgttaga aaaatagcgc tctcgggatg catttttgta 1020 gaacaaaaaa gaagtataga ttctttgttg gtaaaatagc gctctcgcgt tgcatttctg 1080 ttctgtaaaa atgcagctca gattctttgt ttgaaaaatt agcgctctcg cgttgcattt 1140 ttgttttaca aaaatgaagc acagattctt cgttggtaaa atagcgcttt cgcgttgcat 1200 ttctgttctg taaaaatgca gctcagattc tttgtttgaa aaattagcgc tctcgcgttg 1260 catttttgtt ctacaaaatg aagcacagat gcttcgttaa tgtgctgcaa ggcgattaag 1320 ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca gtgaattgta 1380 atacgactca ctatagggcg aattggctag cttatcatta tcaatactcg ccatttcaaa 1440 gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa aaaattagcc 1500 ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca cagaatatat 1560 aacatcgtag gtgtctgggt gaacagttta ttcctggcat ccactaaata taatggagcc 1620 cgctttttaa gctggcatcc agaaaaaaaa agaatcccag caccaaaata ttgttttctt 1680 caccaaccat cagttcatag gtccattctc ttagcgcaac tacagagaac aggggcacaa 1740 acaggcaaaa aacgggcaca acctcaatgg agtgatgcaa cctgcctgga gtaaatgatg 1800 acacaaggca attgacccac gcatgtatct atctcatttt cttacacctt ctattacctt 1860 ctgctctctc tgatttggaa aaagctgaaa aaaaaggttg aaaccagttc cctgaaatta 1920 ttcccctact tgactaataa gtatataaag acggtaggta ttgattgtaa ttctgtaaat 1980 ctatttctta aacttcttaa attctacttt tatagttagt ctttttttta gttttaaaac 2040 accagaactt agtttcgagg taccgggccc cccctcgagg tcgacggtat cgataagctt 2100 gatatcgaat tcctgcagcc cgggggatcc actagttcta gagcggccgc caccgcggtg 2160 gagctcggtt ctgcttatcc ttacgacgtg cctgactacg cctgaacccg atgcaaatga 2220 gacgatcgtc tattcctggt ccggttttct ctgccctctc ttctattcac tttttttata 2280 ctttatataa aattatataa atgacataac tgaaacgcca cacgtcctct cctattcgtt 2340 aacgcctgtc tgtagcgctg ttactgaagc tgcgcaagta gttttttcac cgtataggcc 2400 ctctttttct ctctctttct ttctctcccg cgctgatctc ttcttcgaaa cacagagtgc 2460 accataccac cttttcaatt catcattttt tttttattct tttttttgat ttcggtttcc 2520 ttgaaatttt tttgattcgg taatctccga acagaaggaa gaacgaagga aggagcacag 2580 acttagattg gtatatatac gcatatgtag tgttgaagaa acatgaaatt gcccagtatt 2640 cttaacccaa ctgcacagaa caaaaacctc caggaaacga agataaatca tgtcgaaagc 2700 tacatataag gaacgtgctg ctactcatcc tagtcctgtt gctgccaagc tatttaatat 2760 catgcacgaa aagcaaacaa acttgtgtgc ttcattggat gttcgtacca ccaaggaatt 2820 actggagtta gttgaagcat taggtcccaa aatttgttta ctaaaaacac atgtggatat 2880 cttgactgat ttttccatgg agggcacagt taagccgcta aaggcattat ccgccaagta 2940 caatttttta ctcttcgaag acagaaaatt tgctgacatt ggtaatacag tcaaattgca 3000 gtactctgcg ggtgtataca gaatagcaga atgggcagac attacgaatg cacacggtgt 3060 ggtgggccca ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa caaaggaacc 3120 tagaggcctt ttgatgttag cagaattgtc atgcaagggc tccctatcta ctggagaata 3180 tactaagggt actgttgaca ttgcgaagag cgacaaagat tttgttatcg gctttattgc 3240 tcaaagagac atgggtggaa gagatgaagg ttacgattgg ttgattatga cacccggtgt 3300 gggtttagat gacaagggag acgcattggg tcaacagtat agaaccgtgg atgatgtggt 3360 ctctacagga tctgacatta ttattgttgg aagaggacta tttgcaaagg gaagggatgc 3420 taaggtagag ggtgaacgtt acagaaaagc aggctgggaa gcatatttga gaagatgcgg 3480 ccagcaaaac taatcatgta attagttatg tcacgcttac attcacgccc tccccccaca 3540 tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt 3600 tttatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg 3660 tacagacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa ggttttggga 3720 cgctcgaagg ctttaatttg cgtctgtagc gctgttactg aagctgcgca agtagttttt 3780 tcaccgtata ggccctcttt ttctctctct ttctttctct cccgcgctga tctcttcttc 3840 gaaacatcat gaataaaaag aaaaaggaaa tcaagaaaaa aaagccataa tttatcccac 3900 attttttttt attgtcgctg ttcacaccgc ataacgaaga tattggctag ctaaccagct 3960 tttgttccct ttagtgaggg ttaatttcga gcttggcgta atcatggtca tagctgtttc 4020 ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt 4080 gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc 4140 ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg 4200 ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct 4260 cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 4320 cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 4380 accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 4440 acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 4500 cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 4560 acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 4620 atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 4680 agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 4740 acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 4800 gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg 4860 gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 4920 gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 4980 gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 5040 acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga 5100 tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt 5160 ctgacatcag aagaactcgt caagaaggcg atagaaggcg atgcgctgcg aatcgggagc 5220 ggcgataccg taaagcacga ggaagcggtc agcccattcg ccgccaagct cttcagcaat 5280 atcacgggta gccaacgcta tgtcctgata gcggtccgcc acacccagcc ggccacagtc 5340 gatgaatcca gaaaagcggc cattttccac catgatattc ggcaagcagg catcgccatg 5400 ggtcacgacg agatcctcgc cgtcgggcat gctcgccttg agcctggcga acagttcggc 5460 tggcgcgagc ccctgatgct cttcgtccag atcatcctga tcgacaagac cggcttccat 5520 ccgagtacgt gctcgctcga tgcgatgttt cgcttggtgg tcgaatgggc aggtagccgg 5580 atcaagcgta tgcagccgcc gcattgcatc agccatgatg gatactttct cggcaggagc 5640 aaggtgagat gacaggagat cctgccccgg cacttcgccc aatagcagcc agtcccttcc 5700 cgcttcagtg acaacgtcga gcacagctgc gcaaggaacg cccgtcgtgg ccagccacga 5760 tagccgcgct gcctcgtctt gcagttcatt cagggcaccg gacaggtcgg tcttgacaaa 5820 aagaaccggg cgcccctgcg ctgacagccg gaacacggcg gcatcagagc agccgattgt 5880 ctgttgtgcc cagtcatagc cgaatagcct ctccacccaa gcggccggag aacctgcgtg 5940 caatccatct tgttcaattc gagtgcattc aacatcagcc atactcttcc tttttcaata 6000 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 6060 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 6110 <210> 74 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 74 accagaactt agtttcgaga aacaatgaat caacaggata ttgaacaggt ggtga 55 <210> 75 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 75 gtaaggataa gcagaaccgt taaacaatgc gaaacgcatc gactaataca 50 <210> 76 <211> 7413 <212> DNA <213> Artificial Sequence <220> <223> MD1040 vector <400> 76 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtacgcatt taagcataaa cacgcactat gccgttcttc tcatgtatat 180 atatatacag gcaacacgca gatataggtg cgacgtgaac agtgagctgt atgtgcgcag 240 ctcgcgttgc attttcggaa gcgctcgttt tcggaaacgc tttgaagttc ctattccgaa 300 gttcctattc tctagctaga aagtatagga acttcagagc gcttttgaaa accaaaagcg 360 ctctgaagac gcactttcaa aaaaccaaaa acgcaccgga ctgtaacgag ctactaaaat 420 attgcgaata ccgcttccac aaacattgct caaaagtatc tctttgctat atatctctgt 480 gctatatccc tatataacct acccatccac ctttcgctcc ttgaacttgc atctaaactc 540 gacctctaca ttttttatgt ttatctctag tattactctt tagacaaaaa aattgtagta 600 agaactattc atagagtgaa tcgaaaacaa tacgaaaatg taaacatttc ctatacgtag 660 tatatagaga caaaatagaa gaaaccgttc ataattttct gaccaatgaa gaatcatcaa 720 cgctatcact ttctgttcac aaagtatgcg caatccacat cggtatagaa tataatcggg 780 gatgccttta tcttgaaaaa atgcacccgc agcttcgcta gtaatcagta aacgcgggaa 840 gtggagtcag gcttttttta tggaagagaa aatagacacc aaagtagcct tcttctaacc 900 ttaacggacc tacagtgcaa aaagttatca agagactgca ttatagagcg cacaaaggag 960 aaaaaaagta atctaagatg ctttgttaga aaaatagcgc tctcgggatg catttttgta 1020 gaacaaaaaa gaagtataga ttctttgttg gtaaaatagc gctctcgcgt tgcatttctg 1080 ttctgtaaaa atgcagctca gattctttgt ttgaaaaatt agcgctctcg cgttgcattt 1140 ttgttttaca aaaatgaagc acagattctt cgttggtaaa atagcgcttt cgcgttgcat 1200 ttctgttctg taaaaatgca gctcagattc tttgtttgaa aaattagcgc tctcgcgttg 1260 catttttgtt ctacaaaatg aagcacagat gcttcgttaa tgtgctgcaa ggcgattaag 1320 ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca gtgaattgta 1380 atacgactca ctatagggcg aattggctag cttatcatta tcaatactcg ccatttcaaa 1440 gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa aaaattagcc 1500 ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca cagaatatat 1560 aacatcgtag gtgtctgggt gaacagttta ttcctggcat ccactaaata taatggagcc 1620 cgctttttaa gctggcatcc agaaaaaaaa agaatcccag caccaaaata ttgttttctt 1680 caccaaccat cagttcatag gtccattctc ttagcgcaac tacagagaac aggggcacaa 1740 acaggcaaaa aacgggcaca acctcaatgg agtgatgcaa cctgcctgga gtaaatgatg 1800 acacaaggca attgacccac gcatgtatct atctcatttt cttacacctt ctattacctt 1860 ctgctctctc tgatttggaa aaagctgaaa aaaaaggttg aaaccagttc cctgaaatta 1920 ttcccctact tgactaataa gtatataaag acggtaggta ttgattgtaa ttctgtaaat 1980 ctatttctta aacttcttaa attctacttt tatagttagt ctttttttta gttttaaaac 2040 accagaactt agtttcgaga aacaatgaat caacaggata ttgaacaggt ggtgaaagcg 2100 gtactgctga aaatgcaaag cagtgacacg ccgtccgccg ccgttcatga gatgggcgtt 2160 ttcgcgtccc tggatgacgc cgttgcggca gccaaagtcg cccagcaagg gttaaaaagc 2220 gtggcaatgc gccagttagc cattgctgcc attcgtgaag caggcgaaaa acacgccaga 2280 gatttagcgg aacttgccgt cagtgaaacc ggcatggggc gcgttgaaga taaatttgca 2340 aaaaacgtcg ctcaggcgcg cggcacacca ggcgttgagt gcctctctcc gcaagtgctg 2400 actggcgaca acggcctgac cctaattgaa aacgcaccct ggggcgtggt ggcttcggtg 2460 acgccttcca ctaacccggc ggcaaccgta attaacaacg ccatcagcct gattgccgcg 2520 ggcaacagcg tcatttttgc cccgcatccg gcggcgaaaa aagtctccca gcgggcgatt 2580 acgctgctca accaggcgat tgttgccgca ggtgggccgg aaaacttact ggttactgtg 2640 gcaaatccgg atatcgaaac cgcgcaacgc ttgttcaagt ttccgggtat cggcctgctg 2700 gtggtaaccg gcggcgaagc ggtagtagaa gcggcgcgta aacacaccaa taaacgtctg 2760 attgccgcag gcgctggcaa cccgccggta gtggtggatg aaaccgccga cctcgcccgt 2820 gccgctcagt ccatcgtcaa aggcgcttct ttcgataaca acatcatttg tgccgacgaa 2880 aaggtactga ttgttgttga tagcgtagcc gatgaactga tgcgtctgat ggaaggccag 2940 cacgcggtga aactgaccgc agaacaggcg cagcagctgc aaccggtgtt gctgaaaaat 3000 atcgacgagc gcggaaaagg caccgtcagc cgtgactggg ttggtcgcga cgcaggcaaa 3060 atcgcggcgg caatcggcct taaagttccg caagaaacgc gcctgctgtt tgtggaaacc 3120 accgcagaac atccgtttgc cgtgactgaa ctgatgatgc cggtgttgcc cgtcgtgcgc 3180 gtcgccaacg tggcggatgc cattgcgcta gcggtgaaac tggaaggcgg ttgccaccac 3240 acggcggcaa tgcactcgcg caacatcgaa aacatgaacc agatggcgaa tgctattgat 3300 accagcattt tcgttaagaa cggaccgtgc attgccgggc tggggctggg cggggaaggc 3360 tggaccacca tgaccatcac cacgccaacc ggtgaagggg taaccagcgc gcgtacgttt 3420 gtccgtctgc gtcgctgtgt attagtcgat gcgtttcgca ttgtttaacg gttctgctta 3480 tccttacgac gtgcctgact acgcctgaac ccgatgcaaa tgagacgatc gtctattcct 3540 ggtccggttt tctctgccct ctcttctatt cacttttttt atactttata taaaattata 3600 taaatgacat aactgaaacg ccacacgtcc tctcctattc gttaacgcct gtctgtagcg 3660 ctgttactga agctgcgcaa gtagtttttt caccgtatag gccctctttt tctctctctt 3720 tctttctctc ccgcgctgat ctcttcttcg aaacacagag tgcaccatac caccttttca 3780 attcatcatt ttttttttat tctttttttt gatttcggtt tccttgaaat ttttttgatt 3840 cggtaatctc cgaacagaag gaagaacgaa ggaaggagca cagacttaga ttggtatata 3900 tacgcatatg tagtgttgaa gaaacatgaa attgcccagt attcttaacc caactgcaca 3960 gaacaaaaac ctccaggaaa cgaagataaa tcatgtcgaa agctacatat aaggaacgtg 4020 ctgctactca tcctagtcct gttgctgcca agctatttaa tatcatgcac gaaaagcaaa 4080 caaacttgtg tgcttcattg gatgttcgta ccaccaagga attactggag ttagttgaag 4140 cattaggtcc caaaatttgt ttactaaaaa cacatgtgga tatcttgact gatttttcca 4200 tggagggcac agttaagccg ctaaaggcat tatccgccaa gtacaatttt ttactcttcg 4260 aagacagaaa atttgctgac attggtaata cagtcaaatt gcagtactct gcgggtgtat 4320 acagaatagc agaatgggca gacattacga atgcacacgg tgtggtgggc ccaggtattg 4380 ttagcggttt gaagcaggcg gcagaagaag taacaaagga acctagaggc cttttgatgt 4440 tagcagaatt gtcatgcaag ggctccctat ctactggaga atatactaag ggtactgttg 4500 acattgcgaa gagcgacaaa gattttgtta tcggctttat tgctcaaaga gacatgggtg 4560 gaagagatga aggttacgat tggttgatta tgacacccgg tgtgggttta gatgacaagg 4620 gagacgcatt gggtcaacag tatagaaccg tggatgatgt ggtctctaca ggatctgaca 4680 ttattattgt tggaagagga ctatttgcaa agggaaggga tgctaaggta gagggtgaac 4740 gttacagaaa agcaggctgg gaagcatatt tgagaagatg cggccagcaa aactaatcat 4800 gtaattagtt atgtcacgct tacattcacg ccctcccccc acatccgctc taaccgaaaa 4860 ggaaggagtt agacaacctg aagtctaggt ccctatttat ttttttatag ttatgttagt 4920 attaagaacg ttatttatat ttcaaatttt tctttttttt ctgtacagac gcgtgtacgc 4980 atgtaacatt atactgaaaa ccttgcttga gaaggttttg ggacgctcga aggctttaat 5040 ttgcgtctgt agcgctgtta ctgaagctgc gcaagtagtt ttttcaccgt ataggccctc 5100 tttttctctc tctttctttc tctcccgcgc tgatctcttc ttcgaaacat catgaataaa 5160 aagaaaaagg aaatcaagaa aaaaaagcca taatttatcc cacatttttt tttattgtcg 5220 ctgttcacac cgcataacga agatattggc tagctaacca gcttttgttc cctttagtga 5280 gggttaattt cgagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 5340 ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 5400 taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 5460 aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 5520 attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 5580 cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 5640 gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 5700 ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 5760 agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 5820 tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 5880 ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 5940 gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 6000 ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 6060 gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 6120 aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 6180 aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 6240 ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 6300 gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 6360 gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 6420 tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacat cagaagaact 6480 cgtcaagaag gcgatagaag gcgatgcgct gcgaatcggg agcggcgata ccgtaaagca 6540 cgaggaagcg gtcagcccat tcgccgccaa gctcttcagc aatatcacgg gtagccaacg 6600 ctatgtcctg atagcggtcc gccacaccca gccggccaca gtcgatgaat ccagaaaagc 6660 ggccattttc caccatgata ttcggcaagc aggcatcgcc atgggtcacg acgagatcct 6720 cgccgtcggg catgctcgcc ttgagcctgg cgaacagttc ggctggcgcg agcccctgat 6780 gctcttcgtc cagatcatcc tgatcgacaa gaccggcttc catccgagta cgtgctcgct 6840 cgatgcgatg tttcgcttgg tggtcgaatg ggcaggtagc cggatcaagc gtatgcagcc 6900 gccgcattgc atcagccatg atggatactt tctcggcagg agcaaggtga gatgacagga 6960 gatcctgccc cggcacttcg cccaatagca gccagtccct tcccgcttca gtgacaacgt 7020 cgagcacagc tgcgcaagga acgcccgtcg tggccagcca cgatagccgc gctgcctcgt 7080 cttgcagttc attcagggca ccggacaggt cggtcttgac aaaaagaacc gggcgcccct 7140 gcgctgacag ccggaacacg gcggcatcag agcagccgat tgtctgttgt gcccagtcat 7200 agccgaatag cctctccacc caagcggccg gagaacctgc gtgcaatcca tcttgttcaa 7260 ttcgagtgca ttcaacatca gccatactct tcctttttca atattattga agcatttatc 7320 agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 7380 gggttccgcg cacatttccc cgaaaagtgc cac 7413 <210> 77 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 77 aatcttgtgc tattgcagtc ctcttttata tacagtataa tacgactcac tatagggcg 59 <210> 78 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 78 atgcgaattg cgtaattcac ggcgataacg tagtattaat taaccctcac taaagggaac 60 60 <210> 79 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 79 gcccacaact tatcaagtg 19 <210> 80 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 80 ttataagaca agcgcaggg 19 <210> 81 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 81 atgaacgagc tgaacactgt ttcgactaac tccagtgact ccaccccagt cacgacgttg 60 taaaa 65 <210> 82 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 82 tcaataccag cctaactcgg aatcgtccaa cagcttccag ccgataggtt tcccgactgg 60 aaagc 65 <210> 83 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 83 cacgcttctt cgattctcac att 23 <210> 84 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 84 ctgaggagaa gggagaacct ga 22 <210> 85 <211> 296 <212> DNA <213> Artificial Sequence <220> <223> cyc1 promoter <400> 85 tttggcgagc gttggttggt ggatcaagcc cacgcgtagg caatcctcga gcagatccgc 60 caggcgtgta tatatagcgt ggatggccag gcaactttag tgctgacaca tacaggcata 120 tatatatgtg tgcgacgaca catgatcata tggcatgcat gtgctctgta tgtatataaa 180 actcttgttt tcttcttttc tctaaatatt ctttccttat acattaggac ctttgcagca 240 taaattacta tacttctata gacacacaaa cacaaataca cacactaaat taataa 296 <210> 86 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 86 cggaattcat ttggcgagcg ttggttg 27 <210> 87 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 87 cggaattctt agtgtgtgta tttgtgtttg c 31 <210> 88 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 88 atacatccta ttattcttga aaaaaagtgc ggggctccag agctccaacc ctatctcggt 60 ctat 64 <210> 89 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 89 tttatttaat tagcgtactt attatgtgtg gagaattata ttcctttatt aatttagtgt 60 gtgta 65 <210> 90 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 90 gcgtgatacc tattacgtat tacgt 25 <210> 91 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 91 ttggctcaga gataccttgt ggg 23 <210> 92 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 92 cagagtatac tgctctttct aatgcctttt ccatcatgtt actacccagt cacgacgttg 60 taaaa 65 <210> 93 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 93 ttaagcaccg atgataccaa cggacttacc ttcagcaatt cttttaggtt tcccgactgg 60 aaagc 65 <210> 94 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 94 ccagagctcc acattggtga c 21 <210> 95 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 95 ggcaccttct tgttgttcaa actt 24 <210> 96 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> HXT1 forward primer <400> 96 actggtgcca tcaacttcta c 21 <210> 97 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> HXT1 reverse primer <400> 97 aacaccttcg gcgtacatat c 21 <210> 98 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> HXT2 forward primer <400> 98 tccactttcg tggccttata c 21 <210> 99 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> HXT2 reverse primer <400> 99 gacaccgaca gtagagaaga taac 24 <210> 100 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HXT3 forward primer <400> 100 gtcgctccta aggaaatgag ag 22 <210> 101 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HXT3 reverse primer <400> 101 ggaggttgga cacatcttgt at 22 <210> 102 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> HXT4 forward primer <400> 102 tcaggtctcc tcgtgctata a 21 <210> 103 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HXT4 reverse primer <400> 103 ggaggttgga cacatcttgt at 22 <210> 104 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HXT7 forward primer <400> 104 catctctctg ctgttgactc ag 22 <210> 105 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HXT7 reverse primer <400> 105 tgctcttcac cttcaccata ag 22

Claims (20)

  1. 모세포에 비하여 레스토어 글루코스 트랜스포트 단백질1(Restores glucose transport protein 1, RGT1)의 활성이 감소되어 있고, 증가된 해당과정(glycolysis) 중간 산물 또는 해당과정 중간 산물 유래 물질의 생산능을 갖는 것인 재조합 효모 세포로서, 상기 효모 세포는 RGT1의 활성을 감소시키는 유전적 변형 (genetic modification)을 포함하는 것인 효모 세포.
  2. 청구항 1에 있어서, 상기 유전적 변형은 RGT1을 코딩하는 유전자의 파괴(disruption) 변이인 것인 효모 세포.
  3. 청구항 1에 있어서, 추가적으로 모세포에 비하여 헥소키나제 이소자임2(hexokinase isoenzyme 2, HXK2) 단백질의 활성이 감소되어 있고, HXK2의 활성을 감소시키는 유전적 변형을 포함하는 것인 효모 세포.
  4. 청구항 3에 있어서, 상기 HXK2의 활성을 감소시키는 유전적 변형은 HXK2를 코딩하는 유전자의 파괴 변이를 갖는 것인 효모 세포.
  5. 청구항 1에 있어서, 모세포에 비하여 증가된 포도당 소비 속도로 포도당을 소비할 수 있는 능력을 갖는 것인 효모 세포.
  6. 청구항 1에 있어서, 상기 해당과정 중간 산물은 디히드록시아세톤 포스페이트(DHAP), 글리세르알데히드-3-포스페이트(GAP), 또는 피루베이트인 것인 효모 세포.
  7. 청구항 1에 있어서, 상기 해당과정 중간 산물 유래 물질은 DHAP로부터 유래된 물질, 또는 피루베이트로부터 유래된 물질이고, 상기 DHAP로부터 유래된 물질은 글리세롤-3-포스페이트 (G3P), 또는 글리세롤이고, 상기 피루베이트 유래 물질은 아세틸-CoA, 에탄올, 아세트산, 락테이트, TCA 회로의 중간 산물, 이들 유래 산물, 또는 그 조합인 것인 효모 세포.
  8. 청구항 7에 있어서, TCA 회로의 중간 산물은 시트르산, 이타콘산, 이소시트레이트, 옥살로숙신네이트, 알파-케토글루타레이트, 숙신산, 숙신일-CoA, 푸마르산, 말레이트, 옥살로아세테이트, 또는 그 조합이고, TCA 회로의 중간 산물 유래 물질은 1,3-부탄디올(1,3-BDO), 1,4-부탄디올(1,4-BDO), 부탄올, 또는 이소부탄올인 것인 효모 세포.
  9. 청구항 1에 있어서, 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소를 코딩하는 외인성 (exogenous) 유전자를 더 포함하는 것인 효모 세포.
  10. 청구항 1에 있어서, RGT1은 서열번호 1의 아미노산 서열을 갖는 것인 효모 세포.
  11. 청구항 3에 있어서, HXK2은 서열번호 3의 아미노산 서열을 갖는 것인 효모 세포.
  12. 청구항 1에 있어서, 효모 세포는 사카로마이세스 (Saccharomyces), 자이고사카로마이세스 (Zygosaccharomyces), 피치아 (Pichia), 클루이베로마이세스 (Kluyveromyces), 캔디다 (Candida), 스키조사카로마이세스 (Shizosaccharomyces), 이사첸키아 (Issachenkia), 또는 한세눌라 (Hansenula)에 속하는 균주인 것인 효모 세포.
  13. 청구항 1에 있어서, 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소, 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소, 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소, 디히드록시아세톤 포스페이트(DHAP)를 글리세롤-3-포스페이트(G3P)로 전환하는 것을 촉매하는 효소, 글리세롤-3-포스페이트(G3P)를 글리세롤로 전환하는 것을 촉매하는 효소, 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소, 또는 그 조합의 활성을 감소시키는 유전적 변형(genetic modification)을 더 포함하는 것인 효모 세포.
  14. 청구항 13에 있어서, 상기 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소는 EC 1.1.1.1에 속하는 것이고, 상기 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소는 EC 4.1.1.1에 속하는 것이고, 상기 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소는 EC 1.1.2.4 또는 EC 1.1.2.3에 속하는 것이고, 상기 DHAP를 G3P로 전환하는 것을 촉매하는 효소는 EC 1.1.1.8에 속하는 것이고, 글리세롤-3-포스페이트(G3P)를 글리세롤로 전환하는 것을 촉매하는 효소는 EC 3.1.3.21에 속하는 것이고, 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소는 EC 1.2.1.4에 속하는 것인 효모 세포.
  15. 청구항 13에 있어서, 상기 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소는 알콜 데히드로게나제 (alcohol dehygrogenase: ADH)이고, 상기 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소는 피루베이트 데카르복실라제 (pyruvate decarboxylase: PDC)이고, 상기 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소는 락테이트 시트크롬-c 옥시도리덕타제 (lactate cytochrome-c oxidoreductase: CYB2)이고, 상기 DHAP를 G3P로 전환하는 것을 촉매하는 효소는 NAD-의존성 글리세롤-3-포스페이트 데히드로게나제 (NAD-dependent glycerol-3-phosphate dehydrogenase: GPD)이고, 글리세롤-3-포스페이트를 글리세롤로 전환하는 것을 촉매하는 효소는 글리세롤 포스페이트 포스파타제 (glycerol phosphate phosphatase: GPP)이고, 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소는 아세트알데히드 데히드로게나제 (acetaldehyde dehydrogenase)인 것인 효모 세포.
  16. 청구항 13에 있어서, 상기 아세트알데히드를 에탄올로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 상기 피루베이트를 아세트알데히드로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 락테이트를 피루베이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 디히드록시아세톤 포스페이트(DHAP)를 글리세롤-3-포스페이트(G3P)로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 글리세롤-3-포스페이트를 글리세롤로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 아세트알데히드를 아세테이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자, 또는 그 조합이 파괴(disruption)된 것인 효모 세포.
  17. 청구항 1의 효모 세포를 배지 중에서 배양하여 배양물 (culture)를 얻는 단계; 및
    상기 배양물로부터 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 분리하는 단계;를 포함하는, 해당과정 중간 산물 또는 해당과정 중간 산물 유래 물질을 생산하는 방법.
  18. 청구항 17에 있어서, 상기 배양은 미호기성 조건에서 배양하는 것인 방법.
  19. 효모 세포에 피루베이트를 락테이트로 전환하는 것을 촉매하는 효소를 코딩하는 유전자를 도입하는 단계; 및 효모 세포에서 RGT1 단백질을 코딩하는 유전자를 파괴하는 단계;를 포함하는 락테이트 생산능을 가진 효모 세포를 제조하는 방법.
  20. 청구항 19에 있어서, 효모 세포에서 HXK2 단백질을 코딩하는 유전자를 파괴하는 단계를 포함하는 것인 방법.
KR1020140191130A 2014-12-26 2014-12-26 Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법 Expired - Fee Related KR102287346B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140191130A KR102287346B1 (ko) 2014-12-26 2014-12-26 Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법
US14/980,983 US9885067B2 (en) 2014-12-26 2015-12-28 Yeast cell having decreased RGT1 activity, method of producing the same, and method of producing product using the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140191130A KR102287346B1 (ko) 2014-12-26 2014-12-26 Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법

Publications (2)

Publication Number Publication Date
KR20160079573A KR20160079573A (ko) 2016-07-06
KR102287346B1 true KR102287346B1 (ko) 2021-08-06

Family

ID=56407361

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140191130A Expired - Fee Related KR102287346B1 (ko) 2014-12-26 2014-12-26 Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법

Country Status (2)

Country Link
US (1) US9885067B2 (ko)
KR (1) KR102287346B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3645702A4 (en) * 2017-06-30 2021-11-03 Zimitech, Inc. MICROORGANISMS MODIFIED FOR IMPROVED USE OF OLIGOSACCHARIDES
EP3898935A4 (en) * 2018-12-21 2022-10-12 PTT Global Chemical Public Company Limited MANIPULATED MICROBIAL STRAIN FOR IMPROVED FRUCOSE UTILIZATION

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110039327A1 (en) 2007-05-18 2011-02-17 Aaron Adriaan Winkler Organic acid production by fungal cells

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0002460D0 (sv) 2000-06-29 2000-06-29 Roslyn Bill Modified yeast
EP2128262A1 (en) * 2008-05-28 2009-12-02 Università Degli Studi Di Milano - Bicocca Improved yeast strains for organic acid production
JP2011193788A (ja) 2010-03-19 2011-10-06 Toyota Central R&D Labs Inc 発酵能力が向上された酵母及びその利用
AU2012214520A1 (en) 2011-02-07 2013-08-22 The Board Of Trustees Of The University Of Illinois Enhanced cellodextrin metabolism
JP6295512B2 (ja) 2012-03-15 2018-03-20 株式会社豊田中央研究所 酵母における外来遺伝子の発現産物の生産方法、酵母における発現調節剤及びその利用
KR101576186B1 (ko) * 2012-06-26 2015-12-10 한국생명공학연구원 에탄올 생산 경로가 봉쇄된 클루이베로마이세스 막시아누스 균주 및 이의 용도

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110039327A1 (en) 2007-05-18 2011-02-17 Aaron Adriaan Winkler Organic acid production by fungal cells

Also Published As

Publication number Publication date
US20160208270A1 (en) 2016-07-21
KR20160079573A (ko) 2016-07-06
US9885067B2 (en) 2018-02-06

Similar Documents

Publication Publication Date Title
KR102303832B1 (ko) 내산성을 갖는 효모 세포, 상기 효모 세포를 제조하는 방법 및 이의 용도
AU2021203937B2 (en) Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves
EP2181195A2 (de) Fermentative gewinnung von aceton aus erneuerbaren rohstoffen mittels neuen stoffwechselweges
CN101297042A (zh) 四碳醇的发酵生产
BRPI0719748A2 (pt) Microrganismo modificados por engenharia para produzir n-butanol e métodos relacionados
CN110088275A (zh) 改进的无甘油的乙醇生产
CN107250163A (zh) 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株
KR20180053684A (ko) Fdca의 진균 제조
KR20190121030A (ko) 유기산 내성 효모 유래 신규 프로모터 및 이를 이용한 목적유전자의 발현방법
CN108473968A (zh) 生产植物鞘氨醇或二氢神经鞘氨醇的方法
KR20180084135A (ko) 감소된 clr2 활성을 갖는 사상 진균에서 단백질을 생산하는 방법
KR102227976B1 (ko) Nadh 데히드로게나제가 불활성화된 효모 세포 및 그를 이용한 락테이트를 생산하는 방법
CA2699150A1 (en) Plasmids from thermophilic organisms, vectors derived therefrom, and uses thereof
CN113227351A (zh) 用于改善糖果利用的工程微生物菌株
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法
KR20160012561A (ko) Erg5의 활성이 증가되도록 유전적으로 조작된, 내산성을 갖는 효모 세포 및 그를 이용하여 락테이트를 생산하는 방법
KR102277898B1 (ko) 산물 생산능이 향상된 효모 및 그를 이용한 산물을 생산하는 방법
KR102311681B1 (ko) 내산성을 갖는 효모 세포, 그를 이용하여 유기산을 생산하는 방법 및 상기 내산성 효모 세포를 생산하는 방법
KR102287346B1 (ko) Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법
KR102384227B1 (ko) Nadph 생성이 증가된 유전적으로 조작된 효모 세포, 효모 세포 중 nadph 수준을 증가시키는 방법, 상기 효모 세포를 제조하는 방법 및 상기 효모 세포를 이용하여 락테이트를 생산하는 방법
KR20180081817A (ko) 감소된 clr1 활성을 갖는 사상 진균에서 단백질을 생산하는 방법
AU2004288072B2 (en) Promoter in the presence of organic acid and utilization thereof
KR102287347B1 (ko) Rim15 및 igo2의 활성이 감소된 락테이트 생산능을 갖는 효모 세포, 그를 제조하는 방법 및 그를 사용하여 락테이트를 생산하는 방법
KR102255306B1 (ko) 아세트알데히드 데히드로게나제를 포함하는 락테이트 생산능을 갖는 유전적으로 조작된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 락테이트를 생산하는 방법
JP4700395B2 (ja) 酸性条件下で使用するためのプロモーター及びその利用

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20141226

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20191218

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 20141226

Comment text: Patent Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20210127

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20210507

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20210802

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20210803

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
PC1903 Unpaid annual fee

Termination category: Default of registration fee

Termination date: 20250513