[go: up one dir, main page]

KR102638505B1 - 개선된 단백질 발현 스트레인 - Google Patents

개선된 단백질 발현 스트레인 Download PDF

Info

Publication number
KR102638505B1
KR102638505B1 KR1020207001925A KR20207001925A KR102638505B1 KR 102638505 B1 KR102638505 B1 KR 102638505B1 KR 1020207001925 A KR1020207001925 A KR 1020207001925A KR 20207001925 A KR20207001925 A KR 20207001925A KR 102638505 B1 KR102638505 B1 KR 102638505B1
Authority
KR
South Korea
Prior art keywords
protein
host cell
fungal host
gsh1
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020207001925A
Other languages
English (en)
Other versions
KR20200019731A (ko
Inventor
크리스토퍼 존 아서 핀니스
퍼 크리스토퍼 노르데이드
제니퍼 마리 맥클로런
Original Assignee
알부메딕스 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 알부메딕스 리미티드 filed Critical 알부메딕스 리미티드
Publication of KR20200019731A publication Critical patent/KR20200019731A/ko
Application granted granted Critical
Publication of KR102638505B1 publication Critical patent/KR102638505B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/02Acid—amino-acid ligases (peptide synthases)(6.3.2)
    • C12Y603/02002Glutamate-cysteine ligase (6.3.2.2)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 원하는 단백질의 생산을 위해 개선된 숙주 스트레인을 제공한다.

Description

개선된 단백질 발현 스트레인
서열 목록에 대한 참조
본 출원은 종이와 컴퓨터로 판독 가능한 형태의 서열 목록을 포함한다. 종이 및 컴퓨터로 판독 가능 형태의 서열 목록은 본원의 일부이거나 본원에 참고로 포함된다.
발명의 분야
본 발명은 주로 모 스트레인보다 실질적으로 더 높은 수준에서 단백질을 발현하는 균류(fungal) 스트레인의 개발에 관한 것이다.
약 30년 동안, 원하는 이종 단백질이 미생물에서 생산되어 왔다. 그러나, 필요한 코딩 서열을 도입하고 발현을 획득하였지만, 상업적 생산을 위한 공정을 최적화하기 위해 수행해야 할 것이 여전히 많이 남아있다. 하나의 관심 분야는 스트레인 개선, 즉, 예를 들어 단백질을 더 높은 수율 또는 더 나은 순도로 제조할 수 있게하는 숙주 미생물의 스트레인을 발견 또는 제조하는 것에 관한 것이다.
수율을 증가시키기 위해, 우수한 발현 시스템이 고안되면, 코딩 서열의 카피 수를 증가시키기 위해, 또는 mRNA의 양 또는 안정성을 증가시키기 위해, 또는 단백질의 폴딩 및/또는 분비를 개선시키기 위해, 또는 단백질의 분해를 감소시키기 위해 시도하려는 예상을 할 수 있다. 그러나, 제한 인자(들)를 목표로 하는 경우에만 발현 증가의 원하는 효과를 볼 수 있을 것이다.
따라서, 이종 단백질과 같은 원하는 단백질의 수율을 증가시킬 수 있는 숙주 스트레인이 요구된다.
본 발명자들은 놀랍게도 균류 세포에서 GSH1의 돌연변이가 이종 단백질의 이러한 증가된 수율을 초래한다는 것을 확인하였다.
사카로마이세스 세레비지애(Saccharomyces cerevisiae)에서 GSH1 유전자의 생성물은 γ-글루타밀시스테인 합성효소(Gsh1p)이다. 이 효소는 글루타티온(L-γ-glutamylcysteinylglycine; GSH)의 합성에서 첫 번째 및 속도 제한 단계를 촉매한다. 두 번째 단계는 글루타티온 합성효소(Gsh2p)에 의해 촉매된다. 글루타티온은 여러 생합성 경로와 해독 반응, 및 효모 미토콘드리아 게놈의 유지에서 보조 인자로서 산화 스트레스로부터 세포를 보호하는 것을 포함하여 많은 중요한 역할을 하는 필수 분자이다(Ayer et al(2010) Free Radical Biology & Medicine 49 1956- 1968)). 글루타티온을 함유하는 배지에서 성장하지 않는 한 GSH1 유전자에 대해 결실된 효모 세포는 산화 조건 및 중금속에 대한 노출과 같은 다양한 스트레스 조건에 과민하며 결국 성장 정지를 겪는다(Spector et al(2001) The Journal of Biological Chemistry 276(10) 7011-7016). 글루타티온은 산화 스트레스시에 핵을 보호하는 것으로도 알려져있다(Hatem et al(2014) Free Radical Biology & Medicine 67 103-114). Biterova 및 Barycki(2009)(The Journal of Biological Chemistry 284, 32700-32708)는 글루타티온 생합성의 기전 및 인간 글루타메이트 시스테인 리가아제의 변이체가 관찰된 상태(예: R127C, P158L, H370L 및 P414L)를 조사하기 위해 Ghs1(글루타메이트 시스테인 리가아제라고도 알려짐)의 결정 구조를 분석하였다.
이전에(PCT/US2016/068239), NOT4의 돌연변이(MOT2라고도 알려짐)는 숙주 스트레인에서 생성된 이종 단백질의 수율 증가를 초래한다는 것이 확인되었다. 본 발명자들은 이제 NOT4GSH1 돌연변이를 조합하면 놀랍게도 수율이 추가로 증가함을 확인하였다.
Not4는 유비퀴틴-라이게이팅 효소이며 Ccr4-Not 복합체의 일부이다. Ccr4-Not 복합체는 진핵 세포에서 보존되며, 효모에서는 9개의 핵심 소단위: Ccr4, Caf1, Caf40, Caf130, Not1, Not2, Not3, Not4 및 Not5로 구성되어 있다(Collart, 2003, Global control of gene expression in yeast by the Ccr4-Not complex. Gene 313: 1-16; Bai et al, 1999, The CCR4 and Caf1 proteins of the Ccr4-Not complex are physically and functionally separated from Not2, Not4, and Not5. Mol. Cell. Biol. 19: 6642-6651). 이 복합체는 환경으로부터의 신호를 번역하고, 신호에 경제적으로 반응하기 위해 모든 수준의 유전자 발현을 조정할 수 있는 중앙 스위치보드로서 기능하는 것으로 제시되었다(Collart, 2012, The Ccr4-Not complex. Gene 492(1): 42-53). RNA 폴리머라아제 II 복합체의 조립에는 Not 단백질(Not1, Not2, Not3, Not4)이 필요하다고 생각되는데, 이는 전사 조절에 있어서의 포괄적인 역할을 시사한다(Collart, 1994, Not1(cdc39), Not2(cdc36), Not3, 및 Not4 encode a global-negative regulator of transcription that differentially affects tata-element utilization. Genes & Development 8(5): 525-537; 상기 인용된 바와 같은 Collart,, 2012). 공-결정 구조는 Not4의 C-말단 영역이 Ccr4-Not 복합체의 스캐폴드 단백질인 Not1의 HEAT-반복 영역 주위를 어떻게 감싸는지 제시하였다(Bhaskar, 2015, Architecture of the ubiquitylation module of the yeast Ccr4-Not complex. Structure 23(5): 921-8).
발명의 개요
본 발명은
a. 변형된 Gsh1 단백질 또는 이의 호모로그, 및/또는
b. 변형된 활성 수준의 Gsh1 단백질 또는 이의 호모로그 및/또는
c. 변형된 GSH1 유전자 또는 이의 호모로그, 및/또는
d. 변형된 발현 수준의 GSH1 유전자 또는 이의 호모로그
를 갖는 균류 숙주를 제공한다.
본 발명은 또한
e. 변형된 Not4 단백질 또는 이의 호모로그, 및/또는
f. 변형된 활성 수준의 Not4 단백질 또는 이의 호모로그 및/또는
g. 변형된 NOT4 유전자 또는 이의 호모로그, 및/또는
h. 변형된 발현 수준의 NOT4 유전자 또는 이의 호모로그
를 추가로 갖는 균류 숙주 세포를 제공한다.
본 발명은 또한 균류 숙주 세포가 감소된 활성 수준 및/또는 발현 수준의 Gsh1 단백질 또는 이의 호모로그를 가지며, 그리고 선택적으로 감소된 활성 수준 및/또는 발현 수준의 Not4 단백질 또는 이의 호모로그를 추가로 갖는 것을 특징으로 하는 이종 단백질과 같은 원하는 단백질을 코딩하는 폴리뉴클레오티드 서열을 함유하는 균류 숙주 세포의 배양물을 제공한다.
본 발명은 또한 균류 숙주 세포로부터 이종 단백질과 같은 원하는 단백질을 생산하는 방법을 제공한다.
본 발명은 균류 숙주 세포로부터 원하는 폴리펩티드의 생산 수율을 변형시키는 방법을 제공한다.
본 발명은 또한 이종 단백질과 같은 원하는 단백질을 제공한다. 알부민 또는 이의 변이체, 단편 및/또는 융합체가 바람직한 원하는 단백질이다.
본 발명은 또한 원하는 단백질을 포함하는 약학 조성물과 같은 조성물을 제공한다.
본 발명은 또한 유효량의 조성물을 환자에게 투여하는 것을 포함하는 환자 치료 방법을 제공한다.
본 발명은 또한 상기 언급된 특성 또는 특성들을 갖는 균류 숙주 세포를 제조하는 방법을 제공한다.
본 발명은 또한 SEQ ID NO: 2와 적어도 50% 동일성 및 SEQ ID NO: 2의 47, 48, 49, 50, 51, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 409, 451, 452, 453, 454 및 455로부터 선택된 하나 이상의 위치에 상응하는 위치에서 돌연변이를 포함하는 Gsh1 단백질 또는 이의 호모로그를 제공한다.
본 발명은 또한 본 발명의 Gsh1 변이체를 코딩하는 폴리뉴클레오티드를 제공한다.
실시예 및/또는 바람직한 구현 섹션에서만 기술된 것을 포함하여 본원에 기술된 임의의 구현들은 명시적으로 부인되지 않거나 조합이 부적절하지 않은 한 임의의 다른 구현들과 결합될 수 있도록 의도된다.
도 1은 20개의 아미노산의 클래스 및 이들 사이의 관계를 나타내는 벤 다이어그램이다.
도 2는 플라스미드 pDB5438의 구성을 나타낸다.
도 3은 플라스미드 pDB2305의 구성을 나타내고, "HSA"는 재조합 인간 알부민을 의미하고, "mFL"은 리더 서열이다.
도 4는 플라스미드 pDB2244의 구성을 나타내고, "rHA"는 재조합 인간 알부민을 의미하고, "FL"은 리더 서열이다.
도 5는 플라스미드 YCp50의 구성을 나타낸다.
도 6은 플라스미드 pDB5862의 구성을 나타낸다. "알부민 변이체(albumin variant)"는 SEQ ID NO: 45를 코딩하는 핵산이다. "mFL"은 리더 서열이다.
도 7은 플라스미드 pDB3936의 구성을 나타낸다.
도 8은 플라스미드 pDB5912의 구성을 나타낸다. "mFL"은 리더 서열이다.
도 9는 플라스미드 pDB3029의 구성을 나타낸다. "Inv"는 리더 서열이다.
알부민: 용어 "알부민(albumin)"은 인간 혈청 알부민(HSA) 또는 HSA 도메인과 동일하고 그리고/또는 매우 유사한 3차 구조를 가지며, HSA 또는 관련 도메인과 유사한 특성을 갖는 단백질을 의미한다. 유사한 3차 구조는 예를 들어 "모알부민(parent albumin)" 하에 언급된 종으로부터의 알부민의 구조이다. 알부민의 주요 특성 중 일부는 i) 혈장 부피(oncotic activity)를 조절하는 능력, ii) 약 19일±5일의 긴 혈장 반감기, iii) gp60에 대한 바인딩, 알본딘으로도 알려짐 iv) FcRn에 대한 바인딩, v) 리간드-바인딩, 예를 들어 빌리루빈, 지방산, 헤민 및 티록신을 포함하는 산성, 친유성 화합물과 같은 내인성 분자의 바인딩(또한 본원에 참고문헌 포함된 Kragh-Hansen et al, 2002, Biol. Pharm. Bull. 25, 695의 표 1 참조), vi) 작은 유기 화합물과 산성 또는 전기 음성 특징의 결합, 예, 와파린(warfarin), 디아제팜, 이부프로펜 및 파클리탁셀과 같은 약물(또한 본원에 참고문헌으로 포함된 Kragh-Hansen et al, 2002, Biol. Pharm. Bull. 25, 695의 표 1 참조). 단백질 또는 단편을 알부민으로 특성화하기 위해 이들 특성 모두를 충족시킬 필요는 없다. 예를 들어, 단편이 특정 리간드 또는 유기 화합물의 결합을 담당하는 도메인을 포함하지 않는 경우, 이러한 단편의 변이체는 역시 이러한 특성을 가질 것으로 예상되지 않을 것이다.
대립 유전자 변이체: 용어 "대립 유전자 변이체(allelic variant)"는 동일한 염색체 유전자좌를 점유하는 유전자의 둘 이상의 대안적 형태 중 어느 하나를 의미한다. 대립 유전자 변이는 돌연변이를 통해 자연적으로 발생하며, 집단 내에서 다형성을 초래할 수 있다. 유전자 돌연변이는 침묵할 수 있거나(코딩된 폴리펩티드의 변화 없음), 아미노산 서열이 변경된 폴리펩티드를 코딩할 수 있다. 폴리펩티드의 대립 유전자 변이체는 유전자의 대립 유전자 변이체에 의해 코딩된 폴리펩티드이다.
cDNA: 용어 "cDNA"는 진핵 세포 또는 원핵 세포로부터 수득된 성숙하고 스플라이싱된 mRNA 분자로부터 역전사에 의해 제조될 수 있는 DNA 분자를 의미한다. cDNA에는 상응하는 게놈 DNA에 존재할 수 있는 인트론 서열이 결여되어 있다. 처음의 1차 RNA 전사체는 mRNA의 전구체이며, 이는 성숙 스플라이싱된 mRNA로 나타나기 전에 스플라이싱을 포함하는 일련의 단계를 통해 처리된다.
코딩 서열: "코딩 서열(coding sequence)"이라는 용어는 폴리펩티드의 아미노산 서열을 직접 지정하는 폴리뉴클레오티드를 의미한다. 코딩 서열의 경계는 일반적으로 오픈 리딩 프레임에 의해 결정되며, 이는 ATG, GTG 또는 TTG와 같은 시작 코돈으로 시작하고, TAA, TAG 또는 TGA와 같은 정지 코돈으로 끝난다. 코딩 서열은 게놈 DNA, cDNA, 합성 DNA 또는 이들의 조합일 수 있다.
조절 서열: "조절 서열(control sequences)"이라는 용어는 본 발명의 폴리펩티드를 코딩하는 폴리뉴클레오티드의 발현에 필요한 핵산 서열을 의미한다. 각각의 조절 서열은 폴리펩티드를 코딩하는 폴리뉴클레오티드에 대해 네이티브(즉, 동일한 유전자로부터) 또는 외래(즉, 다른 유전자로부터) 또는 서로에 대해 네이티브 또는 외래일 수 있다. 이러한 조절 서열은 이에 한정하는 것은 아니나, 리더, 폴리아데닐화 서열, 프로펩티드 서열, 프로모터, 신호 펩티드 서열 및 전사 종결자를 포함한다. 최소한, 조절 서열은 프로모터, 및 전사 및 번역 정지 신호를 포함한다. 조절 서열은 폴리펩티드를 코딩하는 폴리뉴클레오티드의 코딩 영역과 조절 서열의 결찰을 용이하게 하는 특정 제한 부위를 도입할 목적으로 링커가 함께 제공될 수 있다.
발현: 용어 "발현(expression)"은 이에 한정하는 것은 아니나, 전사, 전사-후 변형, 번역, 번역-후 변형 및 분비를 포함하는 폴리펩티드의 생산에 관련된 임의의 단계를 포함한다.
발현 카세트: 용어 "발현 카세트(expression cassette)"는 폴리펩티드를 코딩하는 폴리뉴클레오티드 및 이의 발현을 제공하는 업스트림 및 다운스트림 조절 서열을 의미한다.
발현 숙주: 용어 "발현 숙주(expression host)"는 원하는 단백질, 특히 이종 단백질을 발현하는 임의의 숙주 세포를 의미한다.
발현 벡터: 용어 "발현 벡터(expression vector)"는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하고 이의 발현을 제공하는 조절 서열에 작동 가능하게 연결된 선형 또는 원형 DNA 분자를 의미한다.
단편: 용어 "단편(fragment)"은 성숙한 폴리펩티드의 아미노 및/또는 카르복실 말단 및/또는 성숙한 폴리펩티드의 내부 영역에서 결실된 하나 이상의 (여러) 아미노산을 갖는 폴리펩티드를 의미한다. 단편은 폴리펩티드로부터 유래된 하나의 중단되지 않은 서열로 이루어질 수 있거나, 폴리펩티드의 상이한 부분으로부터 유래된 둘 이상의 서열을 포함할 수 있다. 알부민과 관련하여, 단편은 대략 20개 초과의 아미노산 잔기, 바람직하게는 30개 초과의 아미노산 잔기, 보다 바람직하게는 40개 초과의 아미노산 잔기, 보다 바람직하게는 50개 초과의 아미노산 잔기, 보다 바람직하게는 75개 아미노산 잔기, 보다 바람직하게는 100개 초과의 아미노산 잔기, 더욱 바람직하게는 200개 초과의 아미노산 잔기, 더욱 바람직하게는 300개 초과의 아미노산 잔기, 더욱 더 바람직하게는 400개 초과의 아미노산 잔기 및 가장 바람직하게는 500개 초과의 아미노산 잔기의 크기를 가질 수 있다. 바람직한 구현으로, 단편은 하나 이상의 알부민 도메인에 상응한다. 본 발명의 바람직한 알부민 도메인은 SEQ ID NO: 10의 1 내지 194 아미노산 잔기 ± 1 내지 15 아미노산으로 구성된 HSA 도메인 I과 적어도 70, 75, 80, 85, 90, 95, 96, 97, 98, 99, 99.5% 또는 100% 동일성; SEQ ID NO: 10의 192 내지 387 아미노산 잔기 ± 1 내지 15 아미노산으로 구성된 HSA 도메인 II와 적어도 70, 75, 80, 85, 90, 95, 96, 97, 98, 99, 99.5% 또는 100% 동일성 및 SEQ ID NO: 10의 381 내지 585 아미노산 잔기 ± 1 내지 15 아미노산으로 구성된 HSA 도메인 III과 적어도 70, 75, 80, 85, 90, 95, 96, 97, 98, 99, 99.5% 또는 100% 동일성을 갖는 도메인 또는 예를 들어, 서로 융합된 도메인 I 및 II, 도메인 II 및 III 또는 도메인 1 및 III과 같이 이들 도메인의 하나 이상(여러 개)의 조합을 갖는 도메인이다. 알부민 도메인의 정확한 경계에 대해 일반적으로 허용되는 관례는 존재하지 않으며, 상기 도메인의 N-말단 및/또는 C-말단에서 위에서 언급한 범위의 중복 및 아미노산, 바람직하게 1 내지 15개의 아미노산, 보다 바람직하게 1 내지 10개의 아미노산, 가장 바람직하게 1 내지 5개의 아미노산으로부터의 다양한 길이의 플러스 또는 마이너스 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 또는 15의 허용은 각 도메인에 대해 최대 30개의 아미노산, 바람지하게 최대 20개의 아미노산, 보다 바람직하게 10개의 아미노산의 길이의 총 편차가 이러한 사실을 반영하며, 하나 또는 다른 도메인에 속하는 도메인들 사이의 경계 내에 있는 아미노산 잔기들에 대해서는 일부 의견이 갈릴 수 있다. 같은 이유로, 상기 수치와 다른 알부민 도메인의 아미노산 잔기에 대한 언급을 찾을 수 있지만, 당업자는 문헌의 교시 및 상기 교시를 기초로 알부민 도메인을 식별하는 방법을 이해할 것이다. 비인간 알부민의 해당 도메인은 EMBOSS 패키지, 바람직하게는 버전 3.0.0 이상, 보다 바람직하게는 버전 5.0.0 이상의 Needle 프로그램에서 구현된 Needleman-Wunsch 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)을 사용하여 HSA와 정렬하여 식별할 수 있다(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277). 사용되는 선택적 파라미터는 갭 오픈 패널티 10, 갭 확장 패널티 0.5 및 EBLOSUM62(EMBOSS 버전의 BLOSUM62) 대체 매트릭스이다. 대안적인 정렬 툴, 예를 들어 본원에 기술된 MUSCLE가 또한 사용될 수 있다. 도메인은 또한 Dockal 또는 Kjeldsen: Dockal et al(Journal of Biological Chemistry, 1999, Vol. 274 (41): 29303-29310)에 따라 정의될 수 있다: 도메인 I: 아미노산 1 내지 197, 도메인 II: SEQ ID NO: 10의 아미노산 189 내지 385, 도메인 III: SEQ ID NO: 10의 아미노산 381 내지 585. Kjeldsen et al(Protein Expression and Purification, 1998, Vol 13: 163-169)는 도메인을 다음과 같이 정의한다: 도메인 I: 아미노산 1 내지 192, 도메인 II: 아미노산 193 내지 382, 도메인 III: 아미노산 383 내지 585. 각 도메인 자체는 2개의 상동성 서브도메인, 즉 1-105, 120-194, 195-291, 316-387, 388-491 및 512-585로 구성되며, 잔기 Lys106 내지 Glu119, Glu292 내지 Va1315 및 Glu492 내지 Ala511을 포함하는 플렉서블 인터-서브도메인 링커 영역을 갖는다.
따라서, 본 발명에서, 하기 도메인 정의가 바람직하다. 아미노산 수는 SEQ ID NO: 10(HSA)의 것과 상응한다. 그러나, 이러한 수를 사용하면, 당업자는 다른 알부민 서열 내의 상응하는 도메인을 확인할 수 있다. 도메인 I은 아미노산 1에서 시작하거나 시작하지 않을 수 있으며, 아미노산 192, 193, 194, 195, 196 또는 197 중 어느 것에서, 바람직하게 아미노산 192, 194 또는 197 중 어느 것에서 종료하거나 종료하지 않을 수 있다. 도메인 II는 아미노산 189, 190, 191, 192 또는 193, 바람직하게는 아미노산 189, 192 또는 193 중 어느 것에서 시작하거나 시작하지 않을 수 있고, 아미노산 382, 383, 384, 385, 386 또는 387, 바람직하게 382, 285 또는 387 중 어느 것에서 종료하거나 종료하지 않을 수 있다. 도메인 III은 아미노산 381, 382 또는 383에서 시작하거나 시작하지 않을 수 있고, 바람직하게는 아미노산 381 또는 383에서 시작하거나 시작하지 않을 수 있으며, 아미노산 585에서 종료하거나 종료하지 않을 수 있다. 비인간 알부민 내의 도메인은 HSA와 동일하거나 상이한 아미노산 길이 및/또는 잔기 수를 가질 수 있다. 예를 들어, HSA의 도메인 I, II 및 III에 상응하는 도메인을 확인하기 위해 HSA 및 하나 이상(여러 개)의 다른 알부민, 단편, 유도체, 변이체 및/또는 융합체를 사용하여 다중 정렬 또는 페어-와이즈 정렬이 제조될 수 있다.
융합 파트너: 본원에서, 융합 파트너는 알부민 또는 이의 변이체 및/또는 이의 단편에 유전자 융합될 수 있는 비-알부민 모이어티이다.
이종 단백질: 이종 단백질은 숙주 세포에 의해 자연적으로 생성된 것이 아니며, 바람직하게, 선별 마커(예를 들어, 항생제 내성 마커, 영양 요구성 선변가능한 마커), 샤프론(chaperones), FLP, REP1 또는 REP2와 같은 단백질을 포함하지 않는다.
숙주 세포: 용어 "숙주 세포(host cell)"는 본 발명의 폴리뉴클레오티드를 포함하는 핵산 구조물 또는 발현 벡터로 형질 전환, 형질 감염, 형질 도입 등에 민감한 임의의 세포 유형을 의미한다. 용어 "숙주 세포"는 복제 동안 발생하는 돌연변이로 인해 모세포와 동일하지 않은 모세포의 어느 자손을 포함한다.
성숙 폴리펩티드: 용어 "성숙 폴리펩티드(mature polypeptide)"는 번역 및 N-말단 프로세싱, C-말단 절단, 글리코실화, 인산화 등과 같은 어느 번역-후 변형 이후에 최종 형태의 폴리펩티드를 의미한다. 인간 알부민의 성숙 서열은 SEQ ID NO: 10에 제공되며, 한편 미성숙 형태의 예는 SEQ ID NO: 12에 제공된다.
돌연변이: 용어 "돌연변이(mutant)"는 변이체를 코딩하는 폴리뉴클레오티드를 의미한다.
핵산 구조물: 용어 "핵산 구조물(nucleic acid construct)"은 자연 발생 유전자로부터 분리되거나, 또는 그렇지 않으면 하나 이상의 조절 서열을 포함하는 자연 또는 합성적으로 존재하지 않는 방식으로 핵산의 세그먼트를 함유하도록 변형된, 단일 또는 이중 가닥의 핵산 분자를 의미한다.
작동가능하게 연결된: 용어 "작동가능하게 연결된(operably linked)"은 조절 서열이 코딩 서열의 발현을 지시하도록 조절 서열이 폴리뉴클레오티드의 코딩 서열에 대해 적절한 위치에 배치되는 구성을 의미한다.
모 또는 모알부민: 용어 "모(parent)" 또는 "모알부민(parent albumin)"은 본 발명의 알부민 변이체를 생성하기 위해 변형이 이루어진 알부민을 의미한다. 모는 자연 발생(야생형) 폴리펩티드 또는 이의 대립 유전자 또는 이의 변이체일 수 있다. 바람직한 구현으로, 모알부민은 야생성 알부민, 보다 바람직하게 SEQ ID NO: 12(UNIPROT: P02768.2) 또는 이의 성숙 서열(SEQ ID NO: 10)에 기재된 바와 같은 호모 사피엔스(Homo sapiens)의 야생형 알부민이다. 대안적인 야생형 알부민은 표 1에 나타낸 비-제한적 리스트에서 선택될 수 있다.
[표 1]
*서열 동일성은 본원에 기술된 바와 같이 10의 갭 오픈 패널티, 0.5의 갭 확장 패널티를 사용하여 EBLOSUM62의 Needle 프로그램(EMBOSS suite of programs, version 6.1.0)에서 구현된 Needleman-Wunsch 알고리즘을 사용하여 계산되었다.
바람직하게는 모알부민은 성숙 알부민이다. 다른 구현으로, 모알부민은 SEQ ID NO: 10과 적어도 70%, 보다 바람직하게는 75%, 더욱 바람직하게는 적어도 80%, 더욱 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5% 또는 적어도 99.8% 동일하며, 알부민의 주요 특성 또는 HSA와 같이 알부민으로서 유사한 3차 구조 중 적어도 하나를 유지한다. 알부민의 주요 특성은 Sleep, 2015, "Albumin and its application in drug delivery", Expert Opinion on Drug Delivery 12(5): 793-812(본원에 참고문헌으로 편입됨)에 요약되어 있다.
서열 동일성: 2개의 아미노산 서열 사이 또는 2개의 뉴클레오티드 서열 사이의 관련성은 파라미터 "서열 동일성(sequence identity)"에 의해 기술된다.
본 발명의 목적에 있어서, 2개의 아미노산 서열 사이의 서열 동일성은 EMBOSS 패키지(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), 바람직하게는 버전 5.0.0 이상의 Needle 프로그램에서 구현되는 바와 같은 Needleman-Wunsch 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)을 사용하여 결정된다. 사용되는 파라미터는 10의 갭 오픈 패널티, 0.5의 갭 확장 패널티, 및 EBLOSUM62(BLOSUM62의 EMBOSS 버전) 대체 매트릭스이다. "가장 긴 동일성(longest identity)"(nobrief 옵션을 사용하여 획득됨)으로 표시된 Needle의 출력은 퍼센트 동일성으로 사용되며, 다음과 같이 계산된다:
(동일한 잔기 × 100) / (정렬의 길이 - 정렬 내 총 갭의 수)
본 발명의 목적에 있어서, 2개의 데옥시리보뉴클레오티드 서열 사이의 서열 동일성은 EMBOSS 패키지(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, 상기 참조), 바람직하게는 버전 5.0.0 이상의 Needle 프로그램에서 구현되는 바와 같은 Needleman-Wunsch 알고리즘(Needleman and Wunsch, 1970, 상기 참조)을 사용하여 결정된다. 사용되는 파라미터는 10의 갭 오픈 패널티, 0.5의 갭 확장 패널티, 및 EBLOSUM62(NCBI NUC4.4의 EMBOSS 버전) 대체 매트릭스이다. "가장 긴 동일성(longest identity)"(-노브리프(-nobrief) 옵션을 사용하여 획득됨)으로 표시된 Needle의 출력은 퍼센트 동일성으로 사용되며, 다음과 같이 계산된다:
(동일한 데옥시리보뉴클레오티드 x 100) / (정렬의 길이 - 정렬 내 총 갭의 수)
변이체: 용어 "변이체(variant)"는 하나 이상의(여러) 위치에서 변경, 즉, 치환, 삽입, 및/또는 결실을 포함하는, 예를 들어, 알부민과 같은 모폴리펩티드로부터 유래된 폴리펩티드를 의미한다. 치환은 다른 아미노산으로 위치를 차지하는 아미노산의 대체를 의미하고; 결실은 위치를 차지하는 아미노산의 제거를 의미하고; 그리고 삽입은 위치를 차지하는 아미노산에 인접한 1-3개의 아미노산을 첨가하는 것을 의미한다. 변형된 폴리펩티드(변이체)는 예를 들어, 알부민과 같은 모폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변형에 의해 인간 개입을 통해 얻어질 수 있다. 변이체 알부민은 SEQ ID NO: 10과 적어도 70%, 보다 바람직하게는 적어도 75%, 더욱 바람직하게는 적어도 80%, 더욱 바람직하게는 적어도 85%, 더욱 더 바람직하게는 적어도 90%, 가장 바람직하게는 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5% 또는 적어도 99.8% 동일하며, 모알부민의 주요 특성 또는 HSA와 같이 유사한 3차 구조 중 적어도 하나를 유지한다. 일반적으로, HSA의 변이체 또는 단편은 HSA 리간드 바인딩 활성(예, 빌리루빈-바인딩)의 적어도 10%(바람직하게 적어도 50%, 60%, 70%, 80%, 90% 또는 95%) 및 HSA의 온코틱 활성(oncotic activity)의 적어도 80%(바람직하게 적어도 70%, 80%, 90% 또는 95%)(중량 대 중량)를 가질 것이다. 알부민, 알부민 변이체 또는 알부민의 단편의 콜로이드 삼투압으로도 알려진 온코틱 활성은 Hoefs, J.C.(1992) Hepatology 16:396-403(본원에 참고문헌으로 편입됨)에 의해 기술된 방법에 의해 결정될 수 있다. 빌리루빈 바인딩은 HSA에 비해 527nm에서 형광 증가에 의해 측정될 수 있다. 빌리루빈(1.0mg)을 50마이크로L의 1M NaOH에 용해시키고, 탈미네랄화된 물로 1.0mL로 희석한다. 빌리루빈 스톡을 100mM Tris-HCI pH 8.5, 1mM EDTA로 희석하여 형광계 큐벳에 0.6nmol의 빌리루빈/mL를 제공한다. 형광은 0 내지 5mol:mol의 HSA:빌리루빈 비율 범위에 걸쳐 HSA로 적정하는 동안 448nm에서의 여기 및 527nm(10nm 슬릿 폭)에서의 방출에 의해 측정된다. 변이체는 모알부민과 비교할 때 FcRn에 대한 바인딩 친화도 및/또는 변경된 혈장 반감기를 가질 수 있다.
변이체 Gsh1 단백질과 관련하여, 활성이 알부민 활성보다는 Gsh1 활성인 것을 제외하고는 동일한 원리가 적용된다. 모Gsh1 단백질은 SEQ ID NO: 2와 적어도 50, 60, 70, 80 또는 90% 동일성을 가질 수 있고, 더욱 바람직하게는 SEQ ID NO: 2와 100% 동일성을 가질 수 있다. 변이체 Gsh1 단백질은 SEQ ID NO: 2와 적어도 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 또는 적어도 99% 동일성을 가질 수 있다.
변이체 Not4 단백질과 관련하여, 활성이 알부민 활성이 아닌 Not4 활성인 것을 제외하고는 동일한 원리가 적용된다. 모Not4 단백질은 SEQ ID NO: 6과 적어도 50, 60, 70, 80 또는 90% 동일성을 가질 수 있고, 더욱 바람직하게는 SEQ ID NO: 6과 100%의 동일성을 가질 수 있다. 변이체 Not4 단백질은 SEQ ID NO: 6과 적어도 50, 60, 70, 80, 85, 90, 95, 96, 97, 98, 또는 적어도 99% 동일성을 가질 수 있다.
변이체 폴리펩티드 서열은 바람직하게 자연에서 발견되지 않는 것이다.
벡터: 용어 "벡터(vector)"는 폴리펩티드를 코딩하는 폴리뉴클레오티드를 포함하고 이의 발현을 위해 제공하는 조절 서열에 작동 가능하게 연결된 선형 또는 원형 DNA 분자를 의미한다. 벡터는 플라스미드를 포함한다. 벡터는 발현 벡터를 포함한다.
야생형: 용어 "야생형(wild-type)"(WT) 알부민은 동물 또는 인간에서 자연적으로 발견되는 알부민과 동일한 아미노산 서열을 갖는 알부민을 의미한다. SEQ ID NO: 10은 호모 사피엔스(Homo sapiens)의 야생형 알부민의 예이다. "야생형" 인간 알부민(HSA) 서열은 GenBank 등록 번호 AAA98797.1로 주어진다(Minghetti et al. "Molecular structure of the human albumin gene is revealed by nucleotide sequence within q11-22 of chromosome 4", J. Biol. Chem. 261 (15), 6747-6757 (1986), 본원에 참고문헌으로 편입됨). 야생형 알부민의 예는 (상기) 표 1에 제공되어 있다.
아미노산 위치 지정을 위한 컨벤션
본 발명의 목적에 있어서, SEQ ID NO: 2에 개시된 폴리펩티드는 Gsh1 단백질의 호모로그에서 상응하는 아미노산 잔기를 결정하는데 사용된다. Gsh1 단백질의 호모로그의 아미노산 서열은 SEQ ID NO: 2에 개시된 폴리펩티드와 정렬되고, 정렬에 기초하여, SEQ ID NO: 2에 개시된 폴리펩티드의 임의의 아미노산 잔기에 상응하는 아미노산 위치 번호는 EMBOSS 패키지(EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), 바람직하게는 버전 5.0.0 이상의 Needle 프로그램에서 구현되는 바와 같은 Needleman-Wunsch 알고리즘(Needleman and Wunsch, 1970, J. Mol. Biol. 48: 443-453)을 사용하여 결정된다. 사용되는 파라미터는 10의 갭 오픈 패널티, 0.5의 갭 확장 패널티, 및 EBLOSUM62(BLOSUM62의 EMBOSS 버전) 대체 매트릭스이다. 동일한 원리가 SEQ ID NO: 6에 기초하여, Not4에 대해 사용될 수 있다.
Gsh1 단백질의 호모로그에서 상응하는 아미노산 잔기의 확인은 이에 한정하는 것은 아니나, MUSCLE(로그-예측에 의한 다중 서열 비교; 버전 3.5 이상; Edgar, 2004, Nucleic Acids Research 32: 1792-1797), MAFFT(버전 6.857 이상; Katoh and Kuma, 2002, Nucleic Acids Research 30: 3059-3066; Katoh et al., 2005, Nucleic Acids Research 33: 511-518; Katoh and Toh, 2007, Bioinformatics 23: 372-374; Katoh et al., 2009, Methods in Molecular Biology 537: 39-64; Katoh and Toh, 2010, Bioinformatics 26: 1899-1900), 및 ClustalW를 사용하는 EMBOSS EMMA(1.83 이상; Thompson et al., 1994, Nucleic Acids Research 22: 4673-4680)를 포함하는 여러 컴퓨터 프로그램을 사용하여, 이들의 각 디폴트 파라미터를 사용는 다중 폴리펩티드 서열의 정렬에 의해 결정될 수있다. SEQ ID NO: 6에 기초하여, Not4와 관련하여 동일한 원리가 사용될 수 있다.
본 발명의 폴리펩티드를 기술함에 있어서, 하기 기재된 명명법은 용이한 참조를 위해 적합화된다. 허용되는 IUPAC 단일 문자 또는 3문자 아미노산 약어가 사용된다.
치환. 아미노산 치환의 경우, 다음과 같은 명명법이 사용된다: 본래의 아미노산, 위치, 치환된 아미노산. 따라서, 위치 226에서 트레오닌의 알라닌으로의 치환은 "Thr226Ala" 또는 "T226A"로 지정된다. 다중 돌연변이는 추가 마크("+")에 의해 구분되며, 예를 들어 "Gly205Arg + Ser411Phe" 또는 "G205R + S411F"은, 각각 위치 205 및 411에서 글리신(G)의 아르기닌(R) 및 세린(S)의 페닐알라닌(F)으로의 치환을 나타낸다.
결실. 아미노산 결실의 경우, 다음의 명명법이 사용된다: 본래의 아미노산, 위치, *. 따라서, 위치 195에서 글리신의 결실은 "Gly195*" 또는 "G195*"로 지정된다. 다중 삭제는 추가 마크("+")에 의해, 예를 들어, "Gly195* + Ser411*" 또는 "G195* + S411*")로 구분된다.
삽입. 상술한 바와 같이, 삽입은 위치('명명된(또는 본래의) 아미노산', 'X')를 차지하는 아미노산의 N-측('업스트림', 'X-1') 또는 C-측('다운스트림', 'X+1')에 대한 것일 수 있다.
본래의 아미노산('X')의 C-측('다운스트림', 'X+1')에 대한 아미노산 삽입에 있어서, 다음과 같은 명명법이 사용된다: 본래의 아미노산, 위치, 본래의 아미노산, 삽입된 아미노산. 따라서, 위치 195에서 글리신 후 리신의 삽입은 "Gly195GlyLys" 또는 "G195GK"로 지정된다. 다중 아미노산의 삽입은 [본래의 아미노산, 위치, 본래의 아미노산, 삽입된 아미노산 #1, 삽입된 아미노산 #2; 등]으로 지정된다. 예를 들어, 위치 195에서 글리신 후 리신 및 알라닌의 삽입은 "Gly195GlyLysAla" 또는 "G195GKA"로 표시된다.
이러한 경우, 삽입된 아미노산 잔기(들)는 삽입된 아미노산 잔기(들) 앞에 있는 아미노산 잔기의 위치 번호에 소문자를 추가함으로써 번호가 매겨진다. 위의 예에서 서열은 다음과 같다:
본래의 아미노산(X)의 N-측('업스트림', 'X-1')에 대한 아미노산 삽입에 있어서, 다음과 같은 명명법이 사용된다: 본래의 아미노산, 위치, 삽입된 아미노산, 본래의 아미노산. 따라서, 위치 195에서 글리신(G) 앞에 리신(K)의 삽입은 "Gly195LysGly"또는 "G195KG"로 지정된다. 다중 아미노산의 삽입은 [본래의 아미노산, 위치, 삽입된 아미노산 #1, 삽입된 아미노산 #2; 등, 본래의 아미노산]으로 지정된다. 예를 들어, 위치 195에서 글리신 앞에 라이신(K) 및 알라닌(A)의 삽입은 "Gly195LysAlaGly" 또는 "G195KAG"로 표시된다. 이러한 경우, 삽입된 아미노산 잔기(들)는 삽입된 아미노산 잔기(들) 다음에 아미노산 잔기의 위치 번호에 프라임으로 소문자를 추가함으로써 번호가 매겨진다. 위의 예에서 순서는 다음과 같다.
다중 변경. 다중 변경을 포함하는 폴리펩티드는 추가 마크("+")에 의해 구분되며, 예를 들어 "Arg170Tyr + Gly195Glu" 또는 "R170Y + G195E"는 위치 170 및 195에서 아르기닌 및 글리신이, 각각 티로신 및 글루탐산으로 치환된 것을 나타낸다.
다양한 변경. 다양한 변경이 한 위치에 도입될 수 있는 경우, 다양한 변경은 콤마로 구분되며, 예를 들어 "Arg170Tyr,Glu"는 위치 170에서 아르기닌이 티로신 또는 글루탐산으로 치환된 것을 나타낸다. 따라서 "Tyr167Gly,Ala+Arg170Gly,Ala"는 다음 변경을 나타낸다:
"Tyr167Gly+Arg170Gly", "Tyr167Gly+Arg170Ala", "Tyr167Ala+Arg170Gly" 및 "Tyr167Ala+Arg170Ala".
발명의 상세한 설명
본 발명의 제1견지는
a. 변형된 Gsh1 단백질 또는 이의 호모로그, 및/또는
b. 변형된 활성 수준의 Gsh1 단백질 또는 이의 호모로그, 및/또는
c. 변형된 GSH1 유전자 또는 이의 호모로그, 및/또는
d. 변형된 발현 수준의 GSH1 유전자 또는 이의 호모로그
를 갖는 균류 숙주를 제공한다.
변형된 Gsh1 단백질은, 예를 들어 SEQ ID NO: 2와 같은 야생형 Gsh1 단백질과 같은 레퍼런스 Gsh1 단백질에 대해 변형될 수 있다. 바람직하게, 변형된 Gsh1 단백질 또는 이의 호모로그는 SEQ ID NO: 2와 적어도 50% 동일성을 가지며, 보다 바람직하게 SEQ ID NO: 2와 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99, 99.1, 99.2, 99.3, 99.4, 99.5, 99.6, 99.7, 99.8 또는 적어도 99.9% 동일성을 갖는다. 변형된 Gsh1 단백질 또는 이의 호모로그는 SEQ ID NO: 2와 최대 99.9, 99.8, 99.7, 99.6, 99.5, 99.4, 99.3, 99.2, 99.1, 99, 98, 97, 96, 95, 90, 85, 80, 75, 70, 65, 또는 최대 60% 동일성을 갖거나 또는 갖지 않을 수 있다. 보다 바람직하게, 변형된 Gsh1 단백질은 SEQ ID NO: 4를 포함하거나 이로 구성된다.
변형된 수준의 Gsh1 단백질 또는 이의 호모로그는 감소된 발현 수준의 Gsh1 단백질 또는 이의 호모로그 및/또는 감소된 활성 수준의 Gsh1 단백질 또는 이의 호모로그인 것이 바람직하다. 바람직하게 변형된, 예를 들어 감소된, 수준은 Gsh1 단백질이 SEQ ID NO: 2를 포함하거나 이로 구성된 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포에서의 수준에 상대적인 것이다. 레펀런스 균류 숙주의 Gsh1 단백질은 SEQ ID NO: 2와 같은 야생형 Gsh1 서열일 수 있다. 적합한 레퍼런스 균류 숙주 세포는 S. 세레비지애(S. cerevisiae) S288C 또는 S. 세레비지애(S. cerevisiae) DXY1이다. S288C는 유전자형 MATα SUC2 gal2 mal2 mel flo1 flo8-1 hap1 ho bio1 bio6을 갖는다. DXY1은 유전자형 leu2-3, leu2-122, can1, pra1, ubc4, ura3:yap3(Kerry-Williams et al. (1998) Yeast 14:161-169, 본원에 참고문헌을 편입됨)을 갖는다. 다른 적합한 레퍼런스 균류 숙주 세포는 GSH1 유전자 또는 Gsh1 단백질 또는 이의 호모로그를 제외하고 숙주 세포와 동일한 세포를 포함한다. 예를 들어, 레퍼런스의 GSH1 유전자는 야생형(예, SEQ ID NO: 1)이거나 또는 레퍼런스의 GSH1 유전자는 야생형 Gsh1 단백질(예, SEQ ID NO: 2)을 코딩하거나 또는 레퍼런스에 의해 코딩된 Gsh1 단백질은 야생형(예, SEQ ID NO: 2)일 수 있다. 바람직하게, 본 발명의 숙주 세포는 GSH1 유전자 또는 Gsh1 단백질 또는 이의 호모로그를 제외하고는 모스트레인과 동일하다. 레퍼런스 균류 숙주는 또한 "상응하는(corresponding)" 균류 숙주로 지칭될 수 있다. 레퍼런스 균류 숙주는 모균류 숙주일 수 있다.
감소된 수준의 Gsh1 단백질 및/또는 활성 수준의 Gsh1 단백질은 예를 들어, GSH1 유전자를 돌연변이 또는 결실시킴으로써 달성될 수 있으며, 따라서 유전자의 오픈 리딩 프레임을 제거 또는 변경함으로써; 프로모터 서열 및/또는 종결자 서열과 같은 GSH1 유전자의 조절 서열을 돌연변이시키거나 변경시킴으로써; 예를 들어, 안티센스 mRNA와 같은 적합한 간섭 RNA를 도입함으로써 GSH1 유전자의 전사를 차단 또는 감소시킴으로써; 적합한 전사 활성화 유전자를 도입, 조절 또는 변형시킴으로써 또는 Gsh1 단백질 또는 이의 호모로그의 활성 수준을 차단하는 제제를 도입함으로써, 돌연변이된 Gsh1 단백질 또는 이의 호모로그 또는 Gsh1 단백질 또는 이의 호모로그의 완전한 부재를 일으킬 수 있다. 단백질 수준 및 단백질 활성을 측정하는 방법은 당업계에 잘 알려져 있다.
Gsh1 단백질 또는 이의 호모로그의 변형된 활성 수준은 감소될 수 있고, 따라서 야생형 균류 숙주 세포와 같은 모 또는 레퍼런스 균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준의 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 96, 97, 또는 98 내지 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98 또는 99%로 감소될 수 있다. 예를 들어, 균류 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 감소된 것과 같은 변형된 활성 수준은 상술한 바와 같은 모균류 숙주 세포 또는 야생형 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준에 상대적일 수 있다. 결과적으로, 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 활성 수준은 레퍼런스 균류 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 활성 수준의 최대 99%가 될 수 있으며, 예를 들어, 레퍼런스 균류 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 활성 수준의 최대 98, 97, 96, 95, 80, 70, 60, 50, 40, 30, 20, 또는 최대 10%일 수 있다. Gsh1 단백질 또는 이의 호모로그의 활성 수준은 0으로 감소하거나 또는 실질적으로 0으로 감소될 수 있다.
Gsh1 단백질 또는 이의 호모로그의 변형된 발현 수준(양)은 감소될 수 있고, 따라서 야생형 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 발현 수준의 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98 내지 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 96, 97, 98, 99%로 감소될 수 있다. 균류 숙주 세포에서 Ggh1 단백질 또는 이의 호모로그의 예를 들어, 감소된 것과 같은 변형된 발현 수준은 상술한 바와 같이 모균류 숙주 세포 또는 야생형 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 발현 수준에 상대적일 수 있다. 결과적으로, 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 발현 수준은 레퍼런스 균류 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 발현 수준의 최대 99%가 될 수 있으며, 예를 들어, 레퍼런스 균류 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 발현 수준의 최대 98, 97, 96, 95, 90, 80, 70, 60, 50, 40, 30, 20, 또는 최대 10%일 수 있다. Gsh1 단백질 또는 이의 호모로그의 발현 수준은 0으로 감소하거나 또는 실질적으로 0으로 감소될 수 있다.
균류 숙주 세포는 기능적 GSH1 유전자 또는 이의 호모로그 또는 Gsh1 단백질 또는 이의 호모로그가 결여될 수 있다. 예를 들어, 균류 숙주 세포는 변형된 GSH1 유전자를 함유할 수 있으며, 이는 Gsh1 단백질 또는 이의 호모로그의 발현 수준을 감소시키거나, 또는 Gsh1 단백질 또는 이의 호모로그의 활성 수준을 감소시킬 수 있다. 균류 숙주 세포는, 예를 들어 결실로 인해 GSH1 유전자 또는 이의 호모로그가 결여 될 수 있고, 그리고/또는 Gsh1 단백질 또는 이의 호모로그가 결여될 수 있다.
GSH1 활성은 Volohonsky et al Chemico-Biological Interactions 140(2002) 49-65(본원에 참고문헌으로 편입됨), 특히 섹션 2.8.1에 의해 개시된 것과 같은 분석법을 사용하여 측정될 수 있다. Gsh1 발현 수준은, 예를 들어 단백질의 양을 측정하기 위한 ELISA에 의해 또는 RNA 수준을 측정하기 위한 정량적 RT-PCR에 의해 측정될 수 있다.
균류 숙주 세포는 SEQ ID NO: 2의 47, 48, 49, 50, 51, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 409, 451, 452, 453, 454 및 455로부터 선택된 위치에 상응하는 위치, 바람직하게
SEQ ID NO: 2의 위치 47, 48, 49, 50 및 51 중 어느 하나에 상응하는 위치, 바람직하게 위치 49에 상응하는 위치;
SEQ ID NO: 2의 위치 120, 121, 122, 123, 124, 125, 126, 127, 128, 129 또는 130 중 어느 하나에 상응하는 위치, 바람직하게 위치 123, 124, 125, 126 또는 127에 상응하는 위치, 보다 바람직하게 위치 125에 상응하는 위치; 또는
SEQ ID NO: 2의 위치 409에 상응하는 위치;
SEQ ID NO: 2의 위치 451, 452, 453, 454 또는 455 중 어느 하나에 상응하는 위치, 바람직하게 위치 453에 상응하는 위치
에서 돌연변이를 포함하는 변형된 Gsh1 단백질 또는 이의 호모로그를 가질 수 있다.
가장 바람직하게, 균류 숙주 세포는 SEQ ID NO: 2의 위치 125에 상응하는 위치에서 돌연변이를 포함하는 변형된 Gsh1 단백질 또는 이의 호모로그를 갖는다.
돌연변이는 하나 이상의(예, 여러) 위치에서 치환, 삽입 및/또는 결실일 수 있다. 치환이 바람직하다.
균류 숙주 세포는 변형된 Gsh1 단백질 또는 이의 호모로그를 코딩하는 폴리뉴클레오티드 서열, 예를 들어 SEQ ID NO: 3을 포함할 수 있다. 유전자 코드의 퇴화로 인해, 다른 폴리뉴클레오티드 서열이 또한 적합한 변형된 Gsh1 단백질 또는 이의 호모로그를 코딩할 수 있다.
아미노산은 다양한 잘 알려진 부류에 속한다. 따라서, 일부 아미노산은 다른 아미노산보다 더 밀접한 관련이 있다. 본원에 사용된 "보존적 아미노산 치환(conservative amino acid substitutions)"은 동일한 그룹 내에서 이루어지고, 전형적으로 단백질 기능에 실질적으로 영향을 미치지 않는 치환을 지칭한다. "보존 적 치환(conservative substitution)"은 도 1에 도시된 것과 같은 그룹 내에서 의도된다. 이것은 보존 수준을 시각화할 수 있는 하나의 시스템을 제공하는 벤 다이어그램이다. 일반적으로, 낮은 보존의 치환은 출발 아미노산과 생성된 치환 사이에 많은 경계(선)가 있는 것들이다. "보존적 아미노산 치환"은 다음과 같은 동일한 그룹 내에서 이루어진 치환을 포함한다:
방향족 아미노산: F, H, W, Y;
지방족 아미노산: I, L, V;
소수성 아미노산: A, C, F, H, I, K, L, M, T, V, W, Y;
하전된 아미노산: 예를 들어, D, E, H, K, R;
양으로 하전된 아미노산: H, K, R; 또는
음으로 하전된 아미노산: D, E;
극성 아미노산: C, D, E, H, K, N, Q, R, S, T, W, Y;
작은 아미노산: 예를 들어, A, C, D, G, N, P, S, T, V;
아주 작은(tiny) 아미노산: A, C, G, S.
대안적으로, "보존적 치환"은 하기 그룹 내에 있을 수 있다:
지방족 측쇄를 갖는 아미노산: G, A, V, L, I;
방향족 측쇄를 갖는 아미노산: F, Y, W;
황-함유 측쇄를 갖는 아미노산: C, M;
지방족 하이드록실 측쇄를 갖는 아미노산: S, T;
염기성 측쇄를 갖는 아미노산: K, R, H;
산성 아미노산 및 이의 아미드 유도체: D, E, N, Q.
치환은 당업계에 공지된 기술, 예컨대 미국특허 제4,302,386호(본원에 참고문헌으로 편입됨)에 개시된 바와 같은 부위 특이적 돌연변이 유발에 의해 이루어질 수 있다.
비-보존적 아미노 치환은 하나의 그룹에서 다른 그룹으로, 예를 들어 방향족 측쇄를 갖는 그룹에서 지방족 측쇄를 갖는 그룹으로 이루어진 치환을 지칭할 수 있다.
균류 숙주 세포는 변형된 Gsh1 단백질 또는 이의 호모로그를 포함할 수 있으며, 여기서 SEQ ID NO: 2에 대해, 돌연변이는 아미노산, 바람직하게는 A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 및 Y로부터 선택된 비-보존 아미노산으로의 치환이다.
SEQ ID NO: 2의 위치 125에 상응하는 위치에서의 돌연변이는 R과 같은 고유 아미노산에서 A, C, D, E, F, G, H, I, L, M, N, P, Q, S, T, V, W 또는 Y와 같은 비-고유 아미노산으로의 치환, 바람직하게는 C, D, E 또는 G, 보다 바람직하게는 G로의 치환일 수 있다. 치환은 양으로 하전된 아미노산으로부터 지방족, 방향족, 소수성, 소(small), 아주 작은(tiny), 극성 또는 음으로 하전된 아미노산, 바람직하게는 음으로 하전된 아미노산, 작은 아미노산으로의 치환일 수 있다. 특히 바람직한 치환은 R에서 G로이다. K로의 치환은 덜 바람직하다.
SEQ ID NO: 2의 위치 49에 상응하는 위치에서의 돌연변이는 D와 같은 고유 아미노산에서 A, C, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y와 같은 비-고유 아미노산으로의 치환, 바람직하게는 H, K 또는 R, 보다 바람직하게는 K 또는 R로의 치환일 수 있다. 치환은 음으로 하전된 아미노산으로부터 양으로 하전된 아미노산으로의 치환일 수 있다. E로의 치환은 덜 바람직하다.
SEQ ID NO: 2의 위치 409에 상응하는 위치에서의 돌연변이는 H와 같은 고유 아미노산에서 A, C, D, E, F, G, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y와 같은 비-고유 아미노산으로의 치환, 바람직하게는 A, I, L, V, M, F, W, Y, 더욱 바람직하게는 A, I, L, V, 가장 바람직하게 L로의 치환일 수 있다. 치환은 방향족 아미노산으로부터 지방족 아미노산으로 이루어질 수 있다. 특히 바람직한 치환은 H에서 L로의 치환이다.
SEQ ID NO: 2의 위치 P453에 상응하는 위치에서의 돌연변이는 P와 같은 고유 아미노산에서 A, C, D, E, F, G, H, I, K, L, M, N, Q, R, S, T, V, W 또는 Y와 같은 비-고유 아미노산으로의 치환, 바람직하게는 A, I, L, V, M, F, W, Y, 더욱 바람직하게는 A, I, L, V, 가장 바람직하게는 L로의 치환일 수 있다. 치환은 방향족 아미노산으로부터 지방족 아미노산으로 이루어질 수 있다. 특히 바람직한 치환은 P에서 L로의 치환이다.
바람직한 변형 Gsh1 단백질은 SEQ ID NO: 2의 R125에 상응하는 위치에서의 돌연변이를 포함한다.
바람직한 변형된 Gsh1 단백질은 SEQ ID NO: 4를 포함하거나 이로 구성되며, 즉 돌연변이 R125G를 포함한다. 이러한 변형된 Gsh1 단백질은 Gsh1 단백질을 코딩하는 뉴클레오티드 서열(예를 들어, SEQ ID NO: 1)을 사용하여 제공될 수 있고, 단일 뉴클레오티드 다형성(SNP) A373G를 포함하는 뉴클레오티드 서열은, 예를 들어 SEQ ID NO: 3을 사용하여 제공될 수 있다.
대안적으로, 변형된 수준은 증가된 수준일 수 있다. Gsh1 단백질 또는 이의 호모로그의 증가된 수준 또는 증가된 활성 수준은 원하는 단백질(이종 단백질과 같은)의 수율을 감소시키는 것으로 보인다. 이러한 감소된 수율은, 예를 들어 원하는 단백질이 숙주 세포의 생존력에 해로운 경우에 바람직할 수 있다. 증가된 수준은 모숙주와 같은 레퍼런스 숙주에서 수준의 적어도 101, 102, 103, 104, 105, 110, 120, 130, 140, 150, 175 또는 200%일 수 있다.
위치 R125는 위치 D49와의 염 다리(salt bridge) 상호작용에 관여하는 것으로 제안된다. 이 상호작용을 방해하기 위해 어느 아미노산의 돌연변이가 사용될 수 있다. R125를 D 또는 E로, 또는 D49에서 R 또는 K로 돌연변이시키면, 위치 125와 49 사이의 상호작용을 불안정하게 할 것으로 예상되는 정전기 반발 효과가 발생할 수 있다. 그러나, R125에서 K로 및/또는 D49에서 E(글루타메이트)로의 돌연변이는 상호작용을 유지할 수 있다.
Gsh1 단백질은 숙주 세포에 외인성이거나 숙주 세포에 내인성일 수 있다. Gsh1 단백질이 숙주 세포에 외인성인 경우, 숙주 세포는 숙주 세포에 내인성인 Gsh1 단백질을 유지하거나 Gsh1 단백질이 결여될 수 있다.
본 발명의 제1견지에 따른 균류 숙주는 추가로
변형된 Not4 단백질 또는 이의 호모로그, 및/또는
변형된 활성 수준의 Not4 단백질 또는 이의 호모로그, 및/또는
변형된 NOT4 유전자 또는 이의 호모로그, 및/또는
변형된 발현 수준의 NOT4 유전자 또는 이의 호모로그
를 가질 수 있다.
NOT4MOT2로도 알려져 있다. 변형된 Not4 단백질은, 예를 들어 SEQ ID NO: 6과 같은 야생형 Not4 단백질과 같은 레퍼런스 Not4 단백질에 대해 변형될 수 있다. 바람직하게, 변형된 Not4 단백질 또는 이의 호모로그는 SEQ ID NO: 6과 적어도 70% 동일성을 가지며, 더욱 바람직하게는 SEQ ID NO: 6과 적어도 75, 80, 85, 90, 95, 96, 97, 98, 99, 99.1, 99.2, 99.3, 99.4, 99.5, 99.6, 99.7, 99.8 또는 적어도 99.9% 동일성을 갖는다. 변형된 Not4 단백질 또는 이의 호모로그는 SEQ ID NO: 6과 최대 99.9, 99.8, 99.7, 99.6, 99.5, 99.4, 99.3, 99.2, 99.1, 99, 98, 97, 96, 95, 90, 85, 80, 75, 70, 65, 또는 최대 60% 동일성을 갖거나 갖지 않을 수 있다. 더욱 바람직하게, 변형된 Not4 단백질은 SEQ ID NO: 8을 포함하거나 이로 구성된다.
변형된 수준의 Not4 단백질 또는 이의 호모로그는 감소된 발현 수준의 Not4 단백질 또는 이의 호모로그 또는 감소된 활성 수준의 Not4 단백질 또는 이의 호모로그인 것이 바람직하다. 바람직하게는 변형된, 예를 들어 감소된, 수준은 Not4 단백질이 SEQ ID NO: 6을 포함하거나 이로 구성되는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포에서의 수준에 상대적이다. 레퍼런스 균류의 Not4 단백질은 SEQ ID NO: 6과 같은 야생형 Not4 서열일 수 있다. 적절한 레퍼런스 균류 숙주 세포는 상기 기술된 바와 같이 S. 세레비지애(S. cerevisiae) S288C 또는 S. 세레비지애(S. cerevisiae) DXY1이다. 다른 적절한 레퍼런스 균류 숙주 세포는 NOT4 유전자 또는 Not4 단백질 또는 이의 호모로그를 제외하고 숙주 세포와 동일한 세포를 포함한다. 예를 들어, 레퍼런스의 NOT4 유전자는 야생형(예, SEQ ID NO: 5)이거나 또는 레퍼런스의 NOT4 유전자는 야생형 Not4 단백질(예, SEQ ID NO: 6)이거나 또는 레퍼런스에 의해 코딩되는 Not4 단백질은 야생형(예, SEQ ID NO: 6)일 수 있다. 바람직하게, 본 발명의 숙주 세포는 NOT4 유전자 또는 Not4 단백질 또는 이의 호모로그를 제외하고 모스트레인과 동일하다. 레퍼런스 균류 숙주는 또한 "상응하는(corresponding)" 균류 숙주로 지칭될 수 있다. 레퍼런스 균류 숙주는 모균류 숙주일 수 있다.
Not4 단백질의 감소된 수준 또는 Not4 단백질의 활성 수준은, 예를 들어 NOT4 유전자를 돌연변이 또는 결실시킴으로써, 이에 따라 돌연변이된 Not4 단백질 또는 이의 호모로그 또는 Not4 단백질 또는 이의 호모로그의 완전한 결여가 일어나며; 유전자의 오픈 리딩 프레임을 제거하거나 변경함으로써, 프로모터 서열 및/또는 종결자 서열과 같은 NOT4 유전자의 조절 서열을 돌연변이시키거나 변경시킴으로써; 예를 들어, 안티센스 mRNA와 같은 적합한 간섭 RNA를 도입하거나, 적합한 전사 활성화 유전자를 도입, 조절 또는 변형시킴으로써 또는 Not4 단백질 또는 이의 호모로그의 활성 수준을 차단하는 제제를 도입함으로써 NOT4 유전자의 전사를 차단 또는 감소시킴으로써, 달성될 수 있다. 단백질 수준을 측정하는 방법은 당업계에 잘 알려져 있다.
Not4 단백질 또는 이의 호모로그의 변형된 활성 수준은 감소될 수 있으며, 이에 따라 야생형 균류 숙주 세포와 같은 모균류 숙주 세포 또는 레퍼런스 균류 숙주 세포의 NOt4 단백질 또는 이의 호모로그의 활성 수준의 0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 96, 97 또는 98%를 형성할 수 있다. 균류 숙주 세포에서 Not4 단백질 또는 이의 호모로그의 변형된, 예를 들어 감소된 활성 수준은 상기 기술한 바와 같이 모균류 숙주 세포 또는 야생성 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준에 상대적일 수 있다. 결과적으로, 숙주 세포에서 Not4 단백질 또는 이의 호모로그의 활성 수준은 레퍼런스 균류 숙주 세포에서 Not4 단백질 또는 이의 호모로그의 활성 수준의 최대 99%일 수 있으며, 예를 들어 레퍼런스 균류 숙주 세포에서 Not4 단백질 또는 이의 호모로그의 활성 수준의 최대 98, 97, 96, 95, 90, 80, 70, 60, 50, 40, 30, 20, 또는 최대 10%일 수 있다. Not4 단백질 또는 이의 호모로그의 활성 수준은 0 또는 실질적으로 0으로 감소될 수 있다.
Not4 단백질 또는 이의 호모로그의 변형된 발현 수준(양)은 감소될 수 있으며, 이에 따라 야생형 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포의 NOt4 단백질 또는 이의 호모로그의 발현 수준의 0, 10, 20, 30, 40, 50, 60, 70, 80 또는 90 내지 10, 20, 30, 40, 50, 60, 70, 80, 90, 95, 96, 97, 또는 98%를 형성할 수 있다. 균류 숙주 세포에서 Not4 단백질 또는 이의 호모로그의 변형된, 예를 들어 감소된 발현 수준은 상기 기술한 바와 같이 모균류 숙주 세포 또는 야생성 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 발현 수준에 상대적일 수 있다. 결과적으로, 숙주 세포에서 Not4 단백질 또는 이의 호모로그의 발현 수준은 레퍼런스 균류 숙주 세포에서 Not4 단백질 또는 이의 호모로그의 발현 수준의 최대 99%일 수 있으며, 예를 들어 레퍼런스 균류 숙주 세포에서 Not4 단백질 또는 이의 호모로그의 발현 수준의 최대 98, 97, 96, 95, 90, 80, 70, 60, 50, 40, 30, 20, 또는 최대 10%일 수 있다. Not4 단백질 또는 이의 호모로그의 발현 수준은 0 또는 실질적으로 0으로 감소될 수 있다.
균류 숙주 세포는 기능성 NOT4 유전자 또는 이의 호모로그 또는 Not4 단백질 또는 이의 호모로그가 결여될 수 있다. 예를 들어, 균류 숙주 세포는 Not4 단백질 또는 이의 호모로그의 발현 수준을 감소시키거나, 또는 Not4 단백질 또는 이의 호모로그의 활성 수준을 감소시킬 수 있는 변형된 NOT4 유전자를 함유할 수 있다. 균류 숙주 세포는, 예를 들어 결실로 인해 NOT4 유전자 또는 이의 호모로그가 결여될 수 있고, 그리고/또는 Not4 단백질 또는 이의 호모로그가 결여될 수 있다.
Not4 발현 수준은, 예를 들어 단백질의 양을 측정하기 위해 ELISA 또는 RNA 수준을 측정하기 위해 정량적 RT-PCR에 의해 측정될 수 있다.
변형된 Not4 단백질, 또는 이의 호모로그는 Not1 단백질 또는 이의 호모로그와의 상호작용이 변경되도록 돌연변이될 수 있다. 예를 들어, Not4 단백질의 N-말단 영역, 또는 이의 호모로그는, SEQ ID NO: 6의 위치 426 내지 439에 상응하는 α-헬릭스 함유 아미노산과 같이 돌연변이될 수 있다.
따라서, 본 발명은 또한 야생형 Not4 단백질(예, SEQ ID NO: 6)과 야생형 Not 1 단백질(예, SEQ ID NO: 13) 사이의 상호작용보다는 Not1과의 소수성 상호작용과 같은 더 약한 상호작용을 갖는 Not4 단백질 또는 이의 호모로그를 추가로 갖는 균류 숙주 세포를 제공한다.
균류 숙주 세포는 SEQ ID NO: 6의 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469 또는 470으로부터 선택되는 위치에 상응하는 위치에서, 바람직하게는
SEQ ID NO: 6의 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438 또는 439에 상응하는 위치, 바람직하게 위치 429, 430, 434 또는 437, 가잘 바람직하게 위치 429;
SEQ ID NO: 6의 460, 461, 462, 463, 464, 465, 466, 467, 468, 469 또는 470에 상응하는 위치, 바람직하게 위치 463, 464 또는 466, 또는
SEQ ID NO: 6의 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455 또는 456에 상응하는 위치, 바람직하게 위치 442, 445, 447 또는 452
로부터 선택된 위치에 상응하는 위치에서 돌연변이를 포함하는 변형된 Not4 단백질 또는 이의 호모로그를 가질 수 있다.
돌연변이는 하나 이상의(예를 들어, 여러개의) 위치에서의 치환, 삽입 및/또는 결실일 수 있다. 치환이 바람직하다.
균류 숙주 세포는, 예를 들어 SEQ ID NO: 7과 같이 변형된 Not4 단백질 또는 이의 호모로그를 코딩하는 폴리뉴클레오티드 서열을 포함할 수 있다. 유전자 코드의 퇴화로 인해, 다른 폴리뉴클레오티드 서열은 또한 적절한 변형된 Not4 단백질 또는 이의 호모로그를 코딩할 수 있다.
균류 숙주 세포는 변형된 Not4 단백질 또는 이의 호모로그를 포함할 수 있으며, 여기서 SEQ ID NO: 6과 관련하여, 돌연변이는 아미노산, 바람직하게는 A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 및 Y로부터 선택된, 비-보존 아미노산으로의 치환이다.
SEQ ID NO: 6의 위치 429에 상응하는 위치에서의 돌연변이는 F와 같은 고유 아미노산으로부터 A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, 또는 Y와 같은 비-고유 아미노산으로, 바람직하게 G, A, V, L, 또는 I으로, 보다 바람직하게 V, L 또는 I으로, 가장 바람직하게 I로의 치환일 수 있다.
SEQ ID NO: 6의 위치 430에 상응하는 위치에서의 돌연변이는 L과 같은 고유 아미노산으로부터 A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, 또는 Y와 같은 어느 비-고유 아미노산으로의 치환일 수 있다. 치환은 비-보존 아미노산으로의 치환일 수 있다.
위치 434에 상응하는 위치에서의 돌연변이는 L과 같은 고유 아미노산으로부터 A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, 또는 Y와 같은 어느 비-고유 아미노산으로의 치환일 수 있다. 치환은 비-보존 아미노산으로의 치환일 수 있다.
SEQ ID NO: 6의 위치 437에 상응하는 위치에서의 돌연변이는 L과 같은 고유 아미노산으로부터 A, C, D, E, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W, 또는 Y와 같은 어느 비-고유 아미노산으로의 치환일 수 있다. 치환은 비-보존 아미노산일 수 있다.
바람직한 변형된 Not4 단백질은 SEQ ID NO: 6의 F429에 상응하는 위치에서의 돌연변이를 포함한다.
바람직한 변형된 Not4 단백질은 SEQ ID NO: 8을 포함하거나 구성되며, 즉 돌연변이 F429I를 포함한다. 이러한 변형된 Not4 단백질은 Not4 단백질을 코딩하는 뉴클레오티드 서열(예, SEQ ID NO: 5)을 코딩하는 뉴클레오티드 서열을 이용하여 제공될 수 있으며, 상기 뉴클레오티드 서열은, 예를 들어 SEQ ID NO: 7과 같은 SNP T1285A를 포함한다.
대안적으로, 변형된 수준이 증가될 수 있다. Not4 단백질 또는 이의 호모로그의 증가된 수준 또는 증가된 활성은 원하는 단백질(이종 단백질과 같은)의 수율을 감소시키는 것으로 보인다. 이러한 감소된 수율은, 예를 들어 원하는 단백질이 숙주 세포의 생존력에 해로운 경우에 바람직할 수 있다. 증가된 수준은 모숙주와 같은 레퍼런스 숙주에서 수준의 적어도 101, 102, 103, 104, 105, 110, 120, 130, 140, 150, 175 또는 200%일 수 있다.
Not4 단백질은 숙주 세포에 외인성이거나 숙주 세포에 내인성일 수 있다. Not4 단백질이 숙주 세포에 외인성인 경우, 숙주 세포는 숙주 세포에 내인성인 Not4 단백질을 유지하거나 Not4 단백질이 결여될 수 있다.
균류 숙주는 (1) 변형된 수준의 Gsh1 단백질 또는 이의 호모로그 및/또는 변형된 활성 수준의 Gsh1 단백질 또는 이의 호모로그, 및/또는 변형된 GSH1 유전자 또는 이의 호모로그, 및/또는 변형된 발현 수준의 GSH1 유전자 또는 이의 호모로그 및 (2) 변형된 수준의 Not4 단백질 또는 이의 호모로그 및/또는 변형된 활성 수준의 Not4 단백질 또는 이의 호모로그, 및/또는 변형된 NOT4 유전자 또는 이의 호모로그, 및/또는 변형된 발현 수준의 NOT4 유전자 또는 이의 호모로그 모두를 가질 수 있다. 바람직하게, 균류 숙주는 (1) 감소된 수준의 Gsh1 단백질 또는 이의 호모로그 또는 감소된 활성 수준의 Gsh1 단백질 또는 이의 호모로그 및/또는 감소된 발현 수준의 GSH1 유전자 또는 이의 호모로그 및 (2) 감소된 수준의 Not4 단백질 또는 이의 호모로그 또는 감수된 활성 수준의 Not4 단백질 또는 이의 호모로그 및/또는 감소된 발현 수준의 NOT4 유전자 또는 이의 호모로그를 갖는다. 대안적으로, 균류 숙주는 (1) 감소된 수준의 Gsh1 단백질 또는 이의 호모로그 또는 감소된 활성 수준의 Gsh1 단백질 또는 이의 호모로그 및/또는 감소된 발현 수준의 GSH1 유전자 또는 이의 호모로그 및 (2) 증가된 수준의 Not4 단백질 또는 이의 호모로그 또는 증가된 활성 수준의 Not4 단백질 또는 이의 호모로그 및/또는 증가된 발현 수준의 NOT4 유전자 또는 이의 호모로그를 가질 수 있다. 대안적으로, 균류 숙주는 (1) 증가된 수준의 Gsh1 단백질 또는 이의 호모로그 또는 증가된 활성 수준의 Gsh1 단백질 또는 이의 호모로그 및/또는 증가된 발현 수준의 GSH1 유전자 또는 이의 호모로그 및 (2) 감소된 수준의 Not4 단백질 또는 이의 호모로그 또는 감소된 활성 수준의 Not4 단백질 또는 이의 호모로그 및/또는 감소된 발현 수준의 NOT4 유전자 또는 이의 호모로그를 가질 수 있다. GSH1NOT4의 발현 수준과 관련하여 동일한 옵션이 적용된다. '증가' 및 '감소'는 본원에 설명된 바와 같다.
바람직하게는 Gsh1의 변형된, 예를 들어 감소된 수준은 Gsh1 단백질이 SEQ ID NO: 2를 포함하거나 이로 구성된 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포에서의 수준에 상대적이며, Not4의 변형된, 예를 들어 감소된 수준은 Not4 단백질이 SEQ ID NO: 6을 포함하거나 이로 구성된 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포에서의 수준에 상대적이다. 레퍼런스 균류 숙주의 Gsh1 단백질은 SEQ ID NO: 2와 같은 야생형 Gsh1 서열일 수 있다. 레퍼런스 균류 숙주의 Not4 단백질은 SEQ ID NO: 6과 같은 야생형 Not4 서열일 수 있다. 적절한 레퍼런스 균류 숙주 세포는 상기 기술한 S. 세레비지애(S. cerevisiae) S288C 또는 S. 세레비지애(S. cerevisiae) DXY1이다. 다른 적합한 레퍼런스 균류 숙주 세포는 GSH1 유전자 또는 Gsh1 단백질 또는 이의 호모로그 및 NOT4 유전자 또는 Not4 단백질 또는 이의 호모로그를 제외하고는 숙주 세포와 동일한 세포를 포함한다. 예를 들어, 레퍼런스의 GSH1 유전자는 야생형일 수 있거나(예, SEQ ID NO: 1), 또는 레퍼런스의 GSH1 유전자는 야생형 Gsh1 단백질(예, SEQ ID NO: 2)을 코딩할 수 있거나, 또는 레퍼런스에 의해 코딩된 Gsh1 단백질은 야생형일 수 있다(예, SEQ ID NO: 2). 레퍼런스의 NOT4 유전자는 야생형일 수 있거나(예, SEQ ID NO: 5) 또는 레퍼런스의 NOT4 유전자는 야생형 Not4 단백질(예, SEQ ID NO: 6)을 코딩할 수 있거나 또는 레퍼런스에 의해 코딩되는 Not4 단백질은 야생형일 수 있다(예, SEQ ID NO: 6). 바람직하게, 본 발명의 숙주 세포는 GSH1 유전자 또는 Gsh1 단백질 또는 이의 호모로그 및 NOT4 유전자 또는 Not4 단백질 또는 이의 호모로그를 제외하고는 모스트레인과 동일하다. 레퍼런스 균류 숙주는 또한 "상응하는(corresponding)" 균류 숙주로 지칭될 수 있다. 레퍼런스 균류 숙주는 모균류 숙주일 수 있다.
균류 숙주 세포는 재조합 균류 숙주 세포일 수 있다.
균류 숙주 세포는 효모 또는 사상균류(filamentous fungus)일 수 있다. 본원에 사용된 "균류(fungi)"는 phyla Ascomycota, Basidiomycota, Chytridiomycota, 및 Zygomycota(문헌 [Hawksworth et al., in, Ainsworth and Bisby's Dictionary of The Fungi, 8th edition, 1995, CAB International, University Press, Cambridge, UK]에 정의된 바와 같음)뿐만 아니라 Oomycota(Hawksworth et al., 1995, 상기 참조, 171쪽에 인용된 바와 같음) 및 모든 미토스포릭(mitosporic) 균류(Hawksworth et al., 1995, 상기 참조)를 포함한다.
바람직한 견지에서, 균류 숙주 세포는 효모 세포이다. 본원에 사용된 "효모(yeast)"는 자낭포자형성 효모(ascosporogenous yeast)(Endomycetales), 담자균 효모(basidiosporogenous yeast), 및 불완전 균류(Fungi Imperfecti)(Blastomycetes)에 속하는 효모를 포함한다. 효모의 분류는 미래에 앞으로 변경될 수 있기 때문에, 본 발명의 목적상, 효모는 효모의 생물학적 및 활성 (Skinner, F.A., Passmore, S.M., and Davenport, R.R., eds, Soc. App. Bacteriol. Symposium Series No: 9, 1980, pages 1 to 27)에 기술된 바와 같이 정의될 것이다.
보다 바람직한 견지에서, 효모 숙주 세포는 칸디다(Candida), 한세눌라(Hansenula), 클루이로마이세스(Kluyveromyces), 피키아(Pichia), 사카로마이세스(Saccharomyces), 쉬조사카로마이세스(Schizosaccharomyces), 또는 야로위아(Yarrowia) 세포이다.
보다 바람직한 견지로, 효모 숙주 세포는 사카로마이세스 카를스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 더글라시(Saccharomyces douglasii), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로미세스 오비포르미스(Saccharomyces oviformis), 클루이베로마이세스 락티스(Kluyveromyces lactis) 또는 야로위아 리포리티카(Yarrowia lipolytica) 세포이다. 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 숙주가 특히 바람직하다.
S. 세레비지애(S. cerevisiae) 숙주는 하기 유전자형 특징 중 하나 이상을 포함하거나 포함하지 않을 수 있다: leu2-3, leu2-122, can1, pra1, ubc4, ura3, yap3::URA3, lys2, hsp150::LYS2, pmt1::URA3(WO2014/138371에 정의된 바와 같음, 본원에 참고문헌으로 편입됨), 예, S. 세레비지애(S. cerevisiae) BXP10. 바람직하게, S. 세레비지애(S. cerevisiae) 숙주는 MATa를 포함한다.
S. 세레비지애(S. cerevisiae) 숙주는 하기 유전자형 중 하나 이상을 포함하거나 포함하지 않을 수 있다: PDI1 유전자좌에 통합된 PDI1, URA3 및 YIplac211을 갖는 MATa, leu2-3, leu2-112, ubc4, ura3, yap3::URA3, lys2, hsp150::LYS2(Finnis et al 2010, Microbial Cell Factories 9:87), 예, S. 세레비지애(S. cerevisiae) DP9.
S. 세레비지애(S. cerevisiae) 숙주는 하기 유전자형 중 하나 이상을 포함하거나 포함하지 않을 수 있다: MATα, leu2, pep4-3, 예, Finnis et al 1993, Eur. J. Biochem, 212: 201-210에 기재된 바와 같은 S. 세레비지애(S. cerevisiae) MT302/28B.
S. 세레비지애(S. cerevisiae) 숙주는 하기 유전자형 중 하나 이상을 포함하거나 포함하지 않을 수 있다: MATα, SUC2, gal2, mal2, mel, flo1, flo8-1, hap1, ho, bio1, bio6(Mortimer and Johnston(1986) Genetics 113:35-43), 예, S. 세레비지애(S. cerevisiae) S288C.
바람직한 S. 세레비지애(S. cerevisiae) 숙주 스트레인은 MATa, leu2-3, leu2-122, can1, pra1, ubc4, ura3, yap3::URA3, lys2, hsp150::LYS2pmt1::URA3을 모두 포함하거나 이로 구성된다.
다른 바람직한 S. 세레비지애(S. cerevisiae) 숙주는 PDI1 유전자좌에 통합된 PDI1, URA3 및 YIplac211을 갖는, MATa, leu2-3, leu2-112, ubc4, ura3, yap3::URA3, lys2, hsp150::LYS2를 모두 포함하거나 이로 구성된다.
다른 바람직한 S. 세레비지애(S. cerevisiae) 숙주는 MATα, SUC2, gal2, mal2, mel, flo1, flo8-1, hap1, ho, bio1, bio6을 모두 포함하거나 이로 구성된다.
다른 바람직한 S. 세레비지애(S. cerevisiae) 숙주는 MATα, leu2, pep4-3을 모두 포함하거나 이로 구성된다.
숙주는 다배체, 이배체 또는 반수체일 수 있다. 반수체 또는 이배체 효모 숙주가 바람직하며, 바람직하게는 반수체이다.
숙주 매이팅(mating) 유형은, 예를 들어, MATa 또는 MATα(Mat-alpha)일 수 있다. 바람직하게, S. 세레비지애(S. cerevisiae) 숙주는 인간 알부민 또는 이의 변이체, 단편 및/또는 융합체를 코딩하는 플라스미드를 함유한다.
"사상균류(filamentous fungi)"는 모든 필라멘트 형태의 서브디비전 Eumycota 및 Oomycota(Hawksworth et al., 1995에 의해 정의됨, 상기 참조)를 포함한다. 사상균류는 키틴, 셀룰로오스, 글루칸, 키토산, 만난 및 이외의 복합 다당류를 포함하여 구성된 균사체 벽(mycelial wall)을 특징으로 한다. 영양 성장은 균사 신장에 의한 것이고, 탄소 이화 작용은 반드시 호기성이다. 대조적으로, 사카로 마이세스세레비지애(Saccharomyces cerevisiae)와 같은 효모에 의한 영양 성장은 단세포성 엽상체의 버딩에 의한 것이고, 탄소 이화 작용은 발효적일 수 있다.
바람직한 사상균류 숙주 세포는 아크레모늄(Acremonium), 아스페르길루스(Aspergillus), 아우레오바시디움(Aureobasidium), 브제르칸데라(Bjerkandera), 세리포리옵시스(Ceriporiopsis), 크리소스포리움(Chrysosporium), 코프리너스(Coprinus), 코리올러스(Coriolus), 크립토코쿠스(Cryptococcus), 플릴리바시디움(Flilibasidium), 푸사리움(Fusarium), 휴미콜라(Humicola), 마그나포르테(Magnaporthe), 무코(Mucor), 미셀리오프토라(Myceliophthora), 네오칼릴마스틱스Nzeocallimastix), 뉴로스포라(Neurospora), 패실로마이세스(Paecilomyces), 페니실리움Ptenicillium), 파네로차에테(Phanerochaete), 플레비아(Phlebia), 피로마이세스Pairomyces), 플레우로터스(Pleurotus), 쉬조필럼(Schizophyllum), 탈라로마이세스(Tkalaromyces), 테르모아스커스(Thermoascus), 티엘라비아(Thielavia), 톨리포클라디움(Tolypocladium), 트라메테스(Trametes) 또는 트리코더마(Trichoderma)를 포함하거나 포함하지 않을 수 있다..
균류 숙주 세포는 원하는 단백질을 코딩하는 뉴클레오티드 서열을 포함할 수 있다. 바람직하게, 원하는 단백질은 이종 단백질이다. 이종 단백질은 숙주 세포에 의해 자연적으로 생성된 것이 아니며, 바람직하게는 선택 가능한 마커, 예를 들어 항생제 내성 마커 또는 영양 요구성 마커, 샤페론, FLP 또는 FRT와 같은 단백질을 포함하지 않는다.
균류 숙주 세포는 발현 숙주일 수 있다. 균류 숙주 세포는, 예를 들어 이종 단백질과 같은 원하는 단백질을 코딩하는 발현 카세트를 포함할 수 있다. 발현 카세트는, 예를 들어 플라스미드와 같은 벡터 내에 있을 수 있다. 균류 숙주 세포는 발현 벡터를 포함할 수 있다.
원하는 단백질은 식물 또는 동물성 단백질 또는 이의 변이체일 수도 있고 아닐 수도 있다. 원하는 단백질은 알부민, 모노클로날 항체, 에토포시드, 혈청 단백질(혈액 응고 인자와 같은), 안티스타신, 진드기 항응고 펩티드, 트랜스페린, 락토페린, 엔도스타틴, 안지오스타틴, 콜라겐, 면역글로불린 또는 면역글로불린-기반 분자 또는 이의 단편(예, Small Modular ImmunoPharmaceutical™("SMIP") 또는 dAb, Fab' 단편, F(ab')2, scAb, scFv 또는 scFv 단편), 쿠니츠 도메인 단백질(알부민 융합을 갖거나 갖지 않는, WO03/066824(본원에 참고문헌으로 편입됨)에 기재된 것들), 인터페론, 인터루킨, IL-10, IL-11, IL-2, 인터페론 α(알파) 종 및 아종, 인터페론 β(베타) 종 및 아종, 인터페론 γ(감마) 종 및 아종, 렙틴, CNTF, CNTFAx15, IL-1-리셉터 안타고니스트, 에리트로포이에틴(EPO) 및 EPO 모방체(mimics), 트롬보포이에틴(TPO) 및 TPO 모방체, 프로삽티드(prosaptide), 시아노비린-N, 5-헬릭스, T20 펩티드, T1249 펩티드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA, 히루딘, 혈소판 유래 성장인자, 부갑상선 호르몬, 프로인슐린, 인슐린, 글루카곤, 예컨대 엑센딘-4, GLP-1 또는 GLP-2와 같은 글루카곤-유사 펩티드, 인슐린-유사 성장인자, 칼시토닌, 성장 호르몬, 형질전환 성장 인자 β(베타), 종양 괴사인자, G-CSF, GM-CSF, M-CSF, FGF, 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈을 포함하는 프리 및 활성 형태의 응고 인자, 폰 빌레브란트 팩터(von Willebrand's factor), 알파1-안티트립신, 플라스미노겐 활성화제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII, 신경 성장인자, LACI, 혈소판 유래 내피세포 성장인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체 단백질, 인터-알파 트립신 인히비터, 안티트롬빈 III, 아포-리포단백질 종, 단백질 C, 단백질 S, 대사산물, 항생제, 또는 상기의 임의의 변이체 또는 단편의 서열을 포함하거나 포함하지 않을 수 있다.
바람직하게, 상기 변이체는 상기 개시된 하나 이상의 단백질과 적어도 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 동일성을 갖는다.
바람직한 원하는 단백질은 알부민과 같은 혈청 단백질 또는 이의 변이체, 단편 및/또는 융합체이거나 아닐 수 있다. 바람직하게, 알부민은 SEQ ID NO: 10과 60, 65, 70, 75, 80, 85, 90, 95, 96, 97, 98, 98.2, 98.4, 98.6, 98.8, 99, 99.2, 99.3, 99.4, 99.5, 99.6, 99.7, 99.8 또는 99.9 내지 70, 75, 80, 85, 90, 95, 96, 97, 98, 98.2, 98.4, 98.6, 98.8, 99, 99.2, 99.3, 99.4, 99.5, 99.6, 99.7, 99.8, 99.9 또는 100% 서열 동일성을 갖는다. 가장 바람직하게, 알부민은 SEQ ID NO: 10을 포함하거나 이로 구성된다.
알부민 변이체, 이의 단편 및/또는 이의 융합체는 SEQ ID NO: 10에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 또는 19 내지 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 돌연변이를 포함하거나 포함하지 않을 수 있다. 바람직한 알부민 변이체는 SEQ ID NO: 10에 대해 1 내지 10개의 돌연변이, 더욱 바람직하게는 1 내지 5개의 돌연변이를 포함한다. 바람직한 돌연변이는 치환을 포함한다.
알부민 변이체, 이의 단편 및/또는 이의 융합체는 SEQ ID NO: 10의 위치 K573에 상응하는 위치에서 A, C, D, E, F, G, H, I, L, M, N, P, Q, R, S, T, V, W 또는 Y, 보다 바람직하게 SEQ ID NO: 10의 위치 K573에 상응하는 위치에서 P, H, W 또는 Y를 포함하거나 포함하지 않을 수 있다. 특히 바람직한 알부민 변이체는 SEQ ID NO: 10과 적어도 95% 동일성(보다 바람직하게 적어도 96, 97, 98 또는 99% 동일성)을 가지며, SEQ ID NO: 10의 573에 상응하는 위치에서 P를 포함한다.
알부민 변이체, 이의 단편 및/또는 이의 융합체는 SEQ ID NO: 10의 위치 E492에 상응하는 위치에서 A, C, D, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y, 보다 바람직하게 SEQ ID NO: 10의 위치 E492에 상응하는 위치에서 G, D, F, H, M 또는 R, 더욱 바람직하게는 SEQ ID NO: 10의 위치 E492에 상응하는 위치에서 G 또는 D를 포함하거나 포함하지 않을 수 있다. 특히 바람직한 알부민 변이체는 SEQ ID NO: 10과 적어도 95% 동일성(보다 바람직하게 적어도 96, 97, 98 또는 99% 동일성)을 가지며, SEQ ID NO: 10의 E492에 상응하는 위치에서 G를 포함한다.
알부민 변이체, 이의 단편 및/또는 이의 융합체는 SEQ ID NO: 10의 위치 K574에 상응하는 위치에서 A, C, D, E, F, G, H, I, L, M, N, P, Q, R, S, T, V, W 또는 Y, 보다 바람직하게 SEQ ID NO: 10의 위치 K574에 상응하는 위치에서 H, G, D, F, N, S 또는 Y, 보다 바람직하게 SEQ ID NO: 10의 위치 K574에 상응하는 위치에서 D, F, G 또는 H를 포함하거나 포함하지 않을 수 있다. 특히 바람직한 알부민 변이체는 SEQ ID NO: 10과 적어도 95% 동일성(보다 바람직하게 적어도 96, 97, 98 또는 99% 동일성)을 가지며, SEQ ID NO: 10의 K574에 상응하는 위치에서 H를 포함한다.
알부민 변이체, 이의 단편 및/또는 이의 융합체는 SEQ ID NO: 10의 위치 Q580에 상응하는 위치에서 A, C, D, E, F, G, H, I, K, L, M, N, P, R, S, T, V, W 또는 Y, 보다 바람직하게 SEQ ID NO: 10의 위치 Q580에 상응하는 위치에서 K 또는 R을 포함하거나 포함하지 않을 수 있다. 특히 바람직한 알부민 변이체는 SEQ ID NO: 10과 적어도 95% 동일성(보다 바람직하게 적어도 96, 97, 98 또는 99% 동일성)을 가지며, SEQ ID NO: 10의 Q580에 상응하는 위치에서 K를 포함한다.
바람직한 알부민 변이체는 위치 492, 573, 574 및 580에 상응하는 것들로 선택된 하나 이상의 위치에서 돌연변이, 예를 들어 상기 기재된 치환을 포함하거나 포함하지 않을 수 있다. 예를 들어, 알부민 변이체는 SEQ ID NO: 45를 포함하거나 이로 구성될 수 있다.
다른 바람직한 알부민 변이체는, 이의 단편 및/또는 융합체는 WO2011/051489, WO2011/124718, WO2012/059486, WO2012/150319, WO2014/072481, WO2013/135896, WO2015/036579, WO2010/092135, WO2013/075066, WO2014/179657, WO2009/126920, WO2010/059315, WO2011/103076, WO2012/112188, WO2015/063611 및 WO 2017/029407에 개시된 것들 또는 이의 융합체의 단편을 포함한다(각각 본원에 참고문헌으로 편입됨).
알부민은 알부민의 단편 또는 이의 변이체이거나 아닐 수 있다.
알부민 변이체, 이의 단편 및/또는 이의 융합체는 모알부민, 단편 및/또는 이의 융합체보다 강하거나 약한 (및 바람직하게는 더 강한) FcRn에 대한 바인딩 친화도를 가질 수 있다.
알부민 변이체, 이의 단편 및/또는 이의 융합체는 HSA 또는 이의 접합체에 대한 상응하는 KD보다 낮은 KD 대 FcRn(예를 들어, shFcRn)을 가질 수 있다. 바람직하게, 알부민 변이체, 이의 단편 및/또는 융합체에 대한 KD는 HSA 대 FcRn에 대해 0.9X KD 미만, 보다 바람직하게는 HSA 대 FcRn에 대해 0.5X KD 미만, 보다 바람직하게 HSA 대 FcRn에 대해 0.1X KD 미만, 보다 바람직하게 HSA 대 FcRn에 대해 0.02X KD 미만, 보다 바람직하게 HSA 대 FcRn에 대해 0.01X KD 미만, 그리고 가장 바람직하게 HSA 대 FcRn에 대해 0.001X KD 미만이다(여기서 X는 '곱하기(multiplied by)'를 의미함). KD가 낮을 수록 강한 바인딩 친화력에 해당한다.
알부민 변이체, 이의 단편 및/또는 이의 융합체는 HSA 또는 이의 FcRn에 대한 접합체에 대한 상응하는 KD보다 높은 KD 대 FcRn을 가질 수 있다. 바람직하게, 알부민 변이체, 이의 단편 및/또는 이의 융합체에 대한 KD는 HSA 대 FcRn에 대해 2X KD 초과, 보다 바람직하게는 HSA 대 FcRn에 대해 5X KD 초과, 보다 바람직하게는 HSA 대 FcRn에 대해 10X KD 초과, 보다 바람직하게는 HSA 대 FcRn에 대해 25X KD 초과, 가장 바람직하게는 HSA 대 FcRn에 대해 50X KD 초과이다. 알부민 변이체, 이의 단편 및/또는 이의 융합체는 FcRn에 대한 널(null) 바인더일 수 있다. KD가 높을 수록 약한 바인딩 친화력에 해당한다.
KD를 측정 및/또는 비교할 때, 다음 파라미터 중 하나 이상(예를 들어, 몇 개) (및 바람직하게는 모두)이 사용될 수 있다:
기기: Biacore 3000 instrument(GE Healthcare)
플로우 셀: CM5 센서 칩
FcRn: 인간 FcRn, 바람직하게는 가용성 인간 FcRn, 선택적으로 글루타티온 S 트랜스퍼라아제(GST) 또는 히스티딘(His), 가장 바람직하게는 베타-2-마이크로글로불린의 C-말단에 6개의 히스티딘 잔기와 같은 His와 같은 태그에 결합된 것.
FcRn의 양: 1200-2500 RU
결합 화학: 아민 결합 화학(예, 기기의 제조자에 의해 제공된 프로토콜에 기재된 바와 같음).
결합 방법: 결합은 20㎍/ml의 단백질을 10mM 소듐 아세테이트 pH 5.0(GE Healthcare)에 주입함으로써 수행될 수 있다. pH 5.5에서의 포스페이트 버퍼(67mM 포스페이트 버퍼, 0.15M NaCl, 0.005% Tween 20)을 러닝 버퍼 및 희석 버퍼로서 사용할 수 있다. 표면의 재생은 pH 7.4(Biacore AB)에서 HBS-EP 버퍼(0.01M HEPES, 0.15M NaCl, 3mM EDTA, 0.005% 계면활성제 P20)의 주사를 사용하여 수행될 수 있다.
시험 분자(예, HSA 또는 변이체)의 주입량 20-0.032μM.
주입 흐름 속도: 일정, 예, 30㎕/ml.
주입 온도: 25℃
데이터 평가 소프트웨어: BIAevaluation 4.1 소프트웨어(BIAcore AB).
알부민 변이체, 단편 및/또는 이의 융합체는 모알부민, 단편 및/또는 이의 융합체보다 더 길거나 더 짧은, 바람직하게는 더 긴 혈장 반감기를 가질 수 있다.
혈장 반감기는 이상적으로 적절한 개체에서 생체 내에서 측정된다. 그러나, 시간이 많이 걸리고, 비싸며, 필연적으로 동물 또는 인간에서 실험을 수행하는 것과 관련된 윤리적 문제가 있기 때문에, 혈장 반감기가 연장되는지 감소되는지를 측정하기 위해 시험관 내 분석을 사용하는 것이 바람직하다. 알부민의 이의 리셉터(FcRn)에 대한 바인딩은 혈장 반감기에 중요하며, 리셉터 바인딩과 혈장 반감기 사이의 상관 관계는 알부민의 수용체에 대한 친화도가 높을 수록 혈장 반감기가 길어진다는 것이 알려져 있다. 따라서, 본 발명에 있어서, FcRn에 대한 알부민의 더 높은 친화도는 증가된 혈장 반감기를 나타내는 것으로 간주되고, 이의 리셉터에 대한 알부민의 더 낮은 친화도는 감소된 혈장 반감기를 나타내는 것으로 간주된다.
알부민의 이의 리셉터 FcRn와의 바인딩은 용어 친화도 및 표현 "더 강한(stronger)" 또는 "더 약한(weaker)"을 사용하여 기술될 수 있다. 따라서, HSA의 FcRn에 대한 친화도보다 FcRn에 대한 더 높은 친화도를 갖는 분자는 HSA이 FcRn에 바인딩하는 것에 비해 FcRn에 더 강력하게 바인딩하는 것으로 간주되고, HSA의 FcRn에 대한 친화도에 비해 FcRn에 대한 보다 낮은 친화도를 갖는 분자는 HSA가 FcRn에 대해 바인딩하는 것에 비해 FcRn에 더 약하게 바인딩하는 것으로 간주되는 것이 이해되어야 한다. '바인딩 친화도(binding affinity)'라는 용어 대신 '바인딩 계수(binding coefficient)'라는 용어를 사용할 수 있다.
용어 "더 긴 혈장 반감기(longer plasma half-life)" 또는 "더 짧은 혈장 반감기(shorter plasma half-life)" 및 유사한 표현은 상응하는 모체 또는 레퍼런스 또는 상응하는 알부민 분자와 관련이 있는 것으로 이해된다. 따라서, 본 발명의 변이체 알부민과 관련하여 더 긴 혈장 반감기는 변이체가 본원에 기재된 변경(들)을 제외하고 동일한 서열을 갖는 상응하는 알부민의 것보다 더 긴 혈장 반감기를 갖는다는 것을 의미한다.
알부민 또는 변이체 및/또는 이의 단편은 융합 파트너에 유전적으로 융합되거나 융합되지 않을 수 있다. 바람직하게, 융합 파트너는 비-알부민 단백질이다. 융합 파트너는 알부민의 N' 또는 C' 말단에 융합될 수 있다. 알부민 모이어티와 파트너 모이어티 사이에 위치한 하나 이상의 스페이서 아미노산이 있을 수도 있고 없을 수도 있다. 융합 파트너는 알부민 서열 내에 삽입될 수 있다. 융합 파트너는 적어도 5개의 아미노산 길이, 예를 들어 적어도 5, 10, 15, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90 또는 적어도 100개의 아미노산 길이일 수 있다. 융합 파트너는 35, 30, 40, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 아미노산 길이의 최대 길이를 갖거나 갖지 않을 수 있다. 융합 단백질은 하나 이상의 융합 파트너, 예를 들어 알부민의 N' 또는 C' 말단에서 융합되거나 알부민 서열 내에 삽입된 하나 이상의 융합 파트너를 포함할 수 있다. 융합 단백질은 동일한 융합 파트너 또는 둘 이상의 상이한 파트너의 하나 이상의 (예를 들어, 여러 개, 예컨대 2, 3, 4 또는 5개) 카피를 포함할 수 있다. 융합 파트너는 상기 개시된 바와 같이 원하는 단백질 또는 이종 단백질로부터 선택될 수 있다.
바람직한 융합 단백질은 WO2014/138371(본원에 참고문헌으로 편입됨, 특히 13, 14, 26, 34 내지 37 페이지 참조)에 기재된 것과 같은 GLP-1 활성을 갖는 폴리펩티드를 포함할 수 있다. 예를 들어, 바람직한 융합 단백질은 HSA(SEQ ID NO: 10), 또는 GLP 유사체(예, SEQ ID NO: 14 또는 51)의 하나의 카피에 연속적으로 유전적으로 융합된 HSA의 변이체(예, SEQ ID NO: 45) 및/또는 단편 또는 HSA(SEQ ID NO: 10), 또는 GLP 유사체(예, SEQ ID NO: 15, 52 또는 53)의 탠덤 리피트에 연속적으로 유전적으로 융합된 HSA의 변이체(예, SEQ ID NO: 45) 및/또는 단편을 포함할 수 있다. 예를 들어, 융합 단백질은 SEQ ID NO: 16(알비글루타이드(albiglutide))을 포함하거나 이로 구성될 수 있다.
알부민, 이의 변이체, 단편 및/또는 융합체의 생산에 특히 적합한 균류 숙주 세포는, 이에 한정하는 것은 아니나 아스페르길러스(Aspergillus)(WO06/066595), 클루이베로마이세스(Kluyveromyces)(Fleer, 1991, Bio/technology 9: 968-975), 피키아(Pichia)(Kobayashi, 1998, Therapeutic Apheresis 2: 257-262) 및 사카로마이세스(Saccharomyces)(Sleechar, 1990, Bio/technology 8: 42-46)를 포함하며, 각 문헌은 본원에 참고문헌으로 편입된다.
원하는 단백질(이종 단백질과 같은)은 분비 단백질이거나 아닐 수 있다. 따라서, 숙주 세포에 의해 코딩된 단백질은 신호 펩티드(일부 문헌에서는 "리더 서열(leader sequence)"로도 지칭될 수 있음)를 포함하거나 포함하지 않을 수 있다. 전형적으로, 신호 펩티드 서열은 숙주 세포로부터 분비되는 동안 단백질로부터 절단되므로, 생성된 (성숙한) 단백질은 신호 펩티드 서열을 포함하지 않는다. 적합한 신호 펩티드 서열의 예는 하기에 제공된다. 신호 펩티드는 프로-펩타이드를 포함하거나 포함하지 않을 수 있다.
대안적으로, 원하는 단백질은 세포 내이거나 아닐 수 있다.
원하는 단백질은 플라스미드에 의해 코딩되거나 코딩되지 않을 수 있다.
원하는 단백질은 염색체 핵산에 의해 코딩되거나 코딩되지 않을 수 있다.
적절한 플라스미드는 WO2006/067511(본원에 참고문헌으로 편입됨, 특히 46-61페이지의 "2㎛-family plasmids"라는 제목의 섹션에 중점을 둠)에 기재된 것과 같은 2-미크론 패밀리 플라스미드를 포함한다. 집합적으로 "2㎛-패밀리 플라스미드"로 지칭되는 이러한 플라스미드는, 자이고사카로마이세스 로욱시(Zygosaccharomyces rouxii)(이전에는 자이고사카로마이세스 비스포러스(Zygosaccharomyces bisporus)로 분류되었음)의 pSR1, pSB3 및 pSB4, 자이고사카로마이세스 바일리(Zygosaccharomyces bailii)의 플라스미드 pSB1 및 pSB2, 자이고사카로마이세스 페르멘타티(Zygosaccharomyces fermentati)의 플라스미드 pSM1, 클루이베로마이세스 드로소필라럼(Kluyveromyces drosphilarum)의 플라스미드 pKD1, 피키아 멤브라나에파시엔스(Pichia membranaefaciens)의 이름이 밝혀지지 않은 플라스미드("pPM1") 및 사카로바이세스 세레비지애(Saccharomyces cerevisiae)의 2㎛ 플라스미드(WO2006/067511의 도 1에 나타낸 바와 같음) 및 변이체(Scp1, Scp2 및 Scp3와 같음)(Volkert, et al., 1989, Microbiological Reviews 53: 299; Murray et al., 1988, J. Mol. Biol. 200: 601; Painting, et al., 1984, J. Applied Bacteriology 56: 331)를 포함한다.
2㎛-패밀리 플라스미드는 전형적으로 다중 카피 플라스미드로서 2㎛-패밀리 플라스미드의 안정적인 유지에 기능하는 단백질을 각각 코딩하는 적어도 3개의 오픈 리딩 프레임("ORF")을 포함한다. 3개의 ORF에 의해 코딩된 단백질은 FLP, REP1REP2로 지칭될 수 있다. 2㎛ 패밀리 플라스미드가 FLP, REP1REP2를 코딩하는 3개의 ORF를 모두 포함하지 않는 경우, 누락된 단백질을 코딩하는 ORF는 다른 플라스미드 상에 또는 염색체 통합에 의해 트랜스로(in trans) 공급되어야 한다.
바람직한 플라스미드는 S. 세레비지애(S. cerevisiae)의 2㎛ 플라스미드이며, 바람직하게는 이종 단백질과 같은 원하는 단백질을 코딩하는 S. 세레비지애(S. cerevisiae)의 2㎛ 플라스미드이다.
Gsh1 단백질, Not4 단백질 및/또는 원하는, 예를 들어 이종성, 단백질은 조절 서열과 호환되는 조건 하에서 적절한 숙주 세포에서 코딩 서열의 발현을 지시하는 하나 이상의 조절 서열에 작동가능하게 연결된 뉴클레오티드 서열에 의해 코딩될 수 있다.
폴리뉴클레오티드는 폴리펩티드의 발현을 제공하기 위해 다양한 방식으로 조작될 수 있다. 벡터 내로의 삽입 전에 폴리 뉴클레오티드의 조작은 발현 벡터에 따라 바람직하거나 필요할 수 있다. 재조합 DNA 방법을 이용하여 폴리뉴클레오티드를 변형시키는 기술은 당업계에 공지되어 있다.
조절 서열은 폴리뉴클레오티드의 발현을 위해 숙주 세포에 의해 인식되는 폴리뉴클레오티드인, 프로모터일 수 있다. 프로모터는 폴리펩티드의 발현을 매개하는 전사 조절 서열을 함유한다. 프로모터는 돌연변이, 트렁케이티드 및 하이브리드 프로모터를 포함하는 숙주 세포에서 전사 활성을 나타내는 어느 폴리뉴클레오티드일 수 있고, 숙주 세포에 대해 상동성 또는 이종성인 세포 외 또는 세포 내 폴리펩티드를 코딩하는 유전자로부터 수득될 수 있다.
사상균류 숙주 세포에서 본 발명의 핵산 구조물의 전사를 지시하기에 적합한 프로모터의 예는 아스페르길러스 니둘란스(Aspergillus nidulans) 아세트아미다아제, 아스페르길러스 나이거(Aspergillus niger) 중성 알파-아밀라아제, 아스페르길러스 나이거(Aspergillus niger) 산 안정 알파-아밀라아제, 아스페르길러스 나이거(Aspergillus niger) 또는 아스페르길러스 아와모리(Aspergillus awamori) 글루코아밀라아제(glaA), 아스페르길러스 오리자에(Aspergillus oryzae) 알칼린 프로테아제, 아스페르길러스 오리자에(Aspergillus oryzae) 트리오스 포스페이트 이소머라아제, 푸사리움 옥시스포럼(Fusarium oxysporum) 트립신-유사 프로테아제(WO96/00787), 푸사리움 베네나텀(Fusarium venenatum) 아밀로글루코시다아제(WO00/56900), 푸사리움 베네나텀(Fusarium venenatum) Daria(WO00/56900), 푸사리움 베네나텀(Fusarium venenatum) Quinn(WO00/56900), 리조뮤코르 미에헤이(Rhizomucor miehei) 리파아제, 리조뮤코르 미에헤이(Rhizomucor miehei) 아스파르틱 프로테이나아제, 트리코더마 리세이(Trichoderma reesei) 베타-글루코시다아제, 트리코더마 리세이(Trichoderma reesei) 셀로비오하이드로라아제 I, 트리코더마 리세이(Trichoderma reesei) 셀로비오하이드로라아제 II, 트리코더마 리세이(Trichoderma reesei) 엔도글루카나아제 I, 트리코더마 리세이(Trichoderma reesei) 엔도글루카나아제 II, 트리코더마 리세이(Trichoderma reesei) 엔도글루카나아제 III, 트리코더마 리세이(Trichoderma reesei) 엔도글루카나아제 IV, 트리코더마 리세이(Trichoderma reesei) 엔도글루카나아제 V, 트리코더마 리세이(Trichoderma reesei) 자일라나아제 I, 트리코더마 리세이(Trichoderma reesei) 자일라나아제 II, 트리코더마 리세이(Trichoderma reesei) 베타-자일로시다아제에 대한 유전자로부터 얻어지는 프로모터뿐만 아니라, NA2-tpi 프로모터(번역되지 않은 리더가 아스페르길러스(Aspergillus) 트리오스 포스페이트 이소머라아제 유전자로부터 번역되지 않은 리더에 의해 대체된 아스페르길러스(Aspergillus) 중성 알파-아밀라아제 유전자의 변형된 프로모터; 비제한적 예는 번역되지 않은 리더가 아스페르길러스 니둘란스(Aspergillus nidulans) 또는 아스페르길러스 오리자에(Aspergillus oryzae) 트리오스 포스페이트 이소머라아제 유전자의 번역되지 않은 리더에 의해 대체된 아스페르길러스 나이거(Aspergillus niger) 중성 알파-아밀라아제 유전자로의 변형된 프로모터를 포함한다); 이의 돌연변이, 트렁케이티드 및 하이브리드 프로모터이다.
효모 숙주에서, 유용한 프로모터는 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 에놀라아제(ENO1), 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 갈락토키나아제(GAL1), 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 알코올 디하이드로게나아제/글리세르알데히드-3-포스페이트 디하이드로게나아제(ADH1, ADH2/GAP), 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 트리오스 포스페이트 이소머라아제(TPI), 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 메탈로티오네인(CUP1), 및 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 3-포스포글리세레이트 키나아제에 대한 유전자로부터 얻어진다. 효모 숙주 세포에 대한 다른 유용한 프로모터는 상기 문헌(Romanos et al., 1992)에 기재되어 있다.
조절 서열은 또한 전사 종결자일 수 있으며, 전사 종결자는 숙주 세포에 의해 인식되어 전사를 종결시킨다. 종결자 서열은 폴리펩티드를 코딩하는 폴리뉴클레오티드의 3'-말단에 작동가능하게 연결된다. 숙주 세포에서 기능하는 어느 종결자가 사용될 수 있다.
사상균류 숙주 세포에 대한 바람직한 종결자는 아스페르길러스 니둘란스(Aspergillus nidulans) 안트라닐레이트 신타아제, 아스페르길러스 나이거(Aspergillus niger) 글루코아밀라아제, 아스페르길러스 나이거(Aspergillus niger) 알파-글루코시다아제, 아스페르길러스 오리자에(Aspergillus oryzae) TAKA 아밀라아제 및 푸사리움 옥시스포럼(Fusarium oxysporum) 트립신-유사 프로테아제에 대한 유전자로부터 얻어진다.
효모 숙주 세포에 대한 바람직한 종결자는 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 에놀라아제, 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 시토크롬 C(CYC1), 및 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 글리세르알데히드-3-포스페이트 디하이드로게나아제에 대한 유전자로부터 얻어진다. 효모 숙주 세포에 대한 다른 유용한 종결자는 상기 문헌(Romanos et al., 1992)에 기술되어 있다.
조절 서열은 또한 프로모터의 다운스트림 및 유전자의 발현을 증가시키는 유전자의 코딩 서열의 업스트림에서의 mRNA 안정화제 영역일 수 있다.
조절 서열은 또한 숙주 세포에 의한 번역에 중요한 mRNA의 비번역 영역인 리더일 수 있다. 리더 서열은 폴리펩티드를 코딩하는 폴리뉴클레오티드의 5'-말단에 작동가능하게 연결된다. 숙주 세포에서 기능하는 어느 리더가 사용될 수 있다.
사상균류 숙주 세포에 대한 바람직한 리더는 아스페르길러스 오리자에(Aspergillus oryzae) TAKA 아밀라아제 및 아스페르길러스 니둘란스(Aspergillus nidulans) 트리오스 포스페이트 이소머라아제에 대한 유전자로부터 얻어진다.
효모 숙주 세포에 적합한 리더는 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 에놀라아제(ENO 1), 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 3-포스포글리세레이트 키나아제, 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 알파-팩터, 및 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 알코올 디하이드로게나아제/글리세르알데히드-3-포스페이트 디하이드로게나아제(ADH2/GAP)에 대한 유전자로부터 얻어진다.
조절 서열은 또한 폴리펩티드-코딩 서열의 3'-말단에 작동가능하게 연결된 서열인, 폴리아데닐화 서열일 수 있으며, 전사될 때 전사된 mRNA에 폴리아데노신 잔기를 첨가하는 신호로서 숙주 세포에 의해 인식된다. 숙주 세포에서 기능적인 어느 폴리아데닐화 서열이 사용될 수 있다.
사상균류 숙주 세포에 대한 바람직한 폴리아데닐화 서열은 아스페르길러스 니둘란스(Aspergillus nidulans) 안트라닐레이트 신타아제, 아스페르길러스 나이거(Aspergillus niger) 글루코아밀라아제, 아스페르길러스 나이거(Aspergillus niger) 알파-글루코시다아제, 아스페르길러스 오리자에(Aspergillus oryzae) TAKA 아밀라아제 및 푸사리움 옥시스포럼(Fusarium oxysporum) 트립신-유사 프로테아제에 대한 유전자로부터 얻어진다.
효모 숙주에 대한 유용한 폴리아데닐화 서열은 문헌 [Guo and Sherman, 1995, Mol. Cellular Biol. 15: 5983-5990]에 의해 기술되어 있다.
조절 서열은 또한 폴리펩티드의 N-말단에 연결된 신호 펩티드를 코딩하고, 폴리펩티드를 세포의 분비 경로로 지시하는 신호 펩티드 코딩 영역일 수 있다. 폴리뉴클레오티드의 코딩 서열의 5'-말단은 폴리펩티드를 코딩하는 코딩 서열의 세그먼트를 갖는 번역 리딩 프레임에 자연적으로 연결된 신호 펩티드 코딩 서열을 본래 함유할 수 있다. 대안적으로, 코딩 서열의 5'-말단은 코딩 서열에 대해 외래의 신호 펩티드 코딩 서열을 함유할 수 있다. 코딩 서열이 신호 펩티드 코딩 서열을 자연적으로 함유하지 않는 경우, 외래 신호 펩티드 코딩 서열이 필요할 수 있다. 대안적으로, 외래 신호 펩티드 코딩 서열은 폴리펩티드의 분비를 향상시키기 위해 자연 신호 펩티드 코딩 서열을 단순히 대체할 수 있다. 그러나, 발현된 폴리펩티드를 숙주 세포의 분비 경로로 지시하는 임의의 신호 펩티드 코딩 서열이 사용될 수 있다.
사상균류 숙주 세포에 대한 효과적인 신호 펩티드 코딩 서열은 아스페르길러스 나이거(Aspergillus niger) 중성 아밀라아제, 아스페르길러스 나이거(Aspergillus niger) 글루코아밀라아제, 아스페르길러스 오리자에(Aspergillus oryzae) TAKA 아밀라아제 및 휴미콜라 인솔렌스(Humicola insolens) 셀룰라아제, 휴미콜라 인솔렌스(Humicola insolens) 엔도글루카나아제 V, 휴미콜라 라누기노사(Humicola lanuginosa) 리파아제, 및 리조뮤코르 미에헤이(Rhizomucor miehei) 프로테아제에 대한 유전자로부터 얻어진다.
예를 들어, 알부민, 또는 이의 변이체, 단편 및/또는 융합체의 생산을 위한 효모 숙주 세포와 같은, 효모 숙주 세포에 대한 바람직한 신호 펩티드는,
사카로마이세스 세레비지애(Saccharomyces cerevisiae) 알파-팩터에 대한 유전자로부터 얻어진 신호 펩티드,
사카로마이세스 세레비지애(Saccharomyces cerevisiae) 인버타아제에 대한 유전자로부터 얻어진 신호 펩티드,
예를 들어, SEQ ID NO: 17을 포함하거나 이로 구성된 것과 같은 사카로마이세스 세레비지애(Saccharomyces cerevisiae) KEX2에 대한 유전자로부터 얻어진 신호 펩티드 또는 SEQ ID NO: 18을 포함하거나 이로 구성된 것과 같은 변형된 KEX2 신호 펩티드 서열
을 포함한다.
특히 바람직한 신호 펩티드는,
WO90/01063(본원에 참고문헌으로 편입됨)에 교시된 바와 같은 매이팅 팩터 알파 신호 펩티드 서열 및 인간 알부민 신호 펩티드 서열의 융합체를 포함하는 신호 펩티드로서, 이러한 신호 펩티드 서열의 예는 SEQ ID NO: 19에 제공되는, 신호 펩티드;
SEQ ID NO: 20의 펜타펩티드 모티프를 포함하는 신호 펩티드로서, 여기서 펜타펩티드 모티프는 신호 펩티드 서열의 소수성 도메인, 예를 들어 미성숙 단백질의 위치 -10 내지 -25에 위치하며, 여기서 위치 -1은 성숙 서열의 제 1 아미노산의 N-말단에 바로 인접한 신호 펩티드 서열의 아미노산을 지칭하며, 또는 프로-펩티드 위치 -1을 포함하는 신호 펩티드 서열에 대하여 프로-펩티드의 제 1 아미노산의 N-말단에 바로 인접한 신호 펩티드 서열의 아미노산을 지칭하며, 이러한 신호 펩티드 서열의 예는 WO2004/009819(본원에 참고문헌으로 편입됨)에 개시되어 있는, 신호 펩티드;
SEQ ID NO: 20의 펜타펩티드 모티프를 포함하도록 변형된 알부민 신호 펩티드로서, 상기 펜타펩티드 모티프는 신호 펩티드 서열의 소수성 도메인에 위치할 수 있으며, 이러한 변형된 신호 펩티드 서열의 예는 SEQ ID NO: 20에 제공된다. 상기 펜타펩티드 모티프는 변형된 인버타아제 신호 펩티드를 생성하기 위해 인버타아제 신호 펩티드 내로 삽입될 수 있으며, 변형된 인버타아제 신호 펩티드의 예는 SEQ ID NO: 41 및 SEQ ID NO: 42에 제공되며; 또는 SEQ ID NO: 20의 펜타펩티드 모티프를 포함하도록 변형되고, 신호 펩티드 서열의 C' 말단에 프로-펩티드를 포함하는 알부민 신호 펩티드로서, 상기 펜타펩티드 모티프는 신호 펩티드 서열의 소수성 도메인에 위치할 수 있으며, 이러한 변형된 신호 펩티드 서열의 예는 SEQ ID NO: 22, SEQ ID NO: 23 및 SEQ ID NO: 24에 제공되는, 신호 펩티드.
SEQ ID NO: 19, SEQ ID NO: 24 및 SEQ ID NO: 42를 포함하거나 이로 구성되는 신호 펩티드가, 예를 들어, 알부민 또는 이의 변이체, 단편 및/또는 융합체의 발현을 위해, 특히 바람직하다.
다른 유용한 신호 펩티드 코딩 서열은 상기 문헌 [Romanos et al., 1992]에 의해 기술되어 있다.
조절 서열은 또한 폴리펩티드의 N-말단에 위치한 프로-펩타이드를 코딩하는 프로-펩티드 코딩 서열일 수 있다. 생성된 폴리펩티드는 프로엔자임 또는 프로-폴리펩티드(또는 일부 경우에는 자이모겐)로 알려져 있다. 프로-폴리펩티드는 일반적으로 불활성이며, 프로-폴리펩티드로부터 프로-펩티드의 촉매적 또는 자가촉매적 절단(cleavage)에 의해 활성 폴리펩타이드로 전환될 수 있다. 프로-펩티드 코딩 서열은 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 알파-팩터에 대한 유전자로부터 얻어질 수 있다.
신호 펩티드 및 프로-펩티드 서열 둘 모두가 존재하는 경우, 프로-펩티드 서열은 폴리펩티드의 N-말단 다음에 위치하고, 신호 펩티드 서열은 프로-펩티드 서열의 N-말단 다음에 위치한다.
숙주 세포의 성장과 관련하여 폴리펩티드의 발현을 조절하는 조절 서열을 추가하는 것이 또한 바람직할 수 있다. 조절 시스템의 예는 조절 화합물의 존재를 포함하여 화학적 또는 물리적 자극에 반응하여 유전자의 발현을 켜거나 끄는 것을 일으키는 것들이다. 효모에서, ADH2 시스템 또는 GAL1 시스템이 사용될 수 있다. 사상균류에서, 아스페르길러스 나이거(Aspergillus niger) 글루코아밀라아제 프로모터, 아스페르길러스 오리자에(Aspergillus oryzae) TAKA 알파-아밀라아제 프로모터 및 아스페르길러스 오리자에(Aspergillus oryzae) 글루코아밀라아제 프로모터를 사용할 수 있다. 조절 서열의 다른 예는 유전자 증폭을 가능하게 하는 것들이다. 진핵 시스템에서, 이들 조절 서열은 메토트렉세이트의 존재 하에서 증폭되는 디하이드로폴레이트 환원효소 유전자, 및 중금속으로 증폭되는 메탈로티오네인 유전자를 포함한다. 이러한 경우에, 폴리펩티드를 코딩하는 폴리뉴클레오티드는 조절 서열과 작동가능하게 연결될 수 있다.
숙주 스트레인은 WO2005/061718, WO2006/067511, WO2006/136831 또는 WO2014/138371(모두 본원에 참고문헌으로 편입됨)에 기재된 것과 같은 하나 이상의 샤페론 단백질을 발현 또는 과발현하거나 그렇지 않을 수 있다. 예를 들어, 숙주 스트레인은 AHA1, CCT2, CCT3, CCT4, CCT5, CCT6, CCT7, CCT8, CNS1, CPR3, CPR6, ERO1, EUG1, FMO1, HCH1, HSP10, HSP12, HSP104, HSP26, HSP30, HSP42, HSP60, HSP78, HSP82, JEM1, MDJ1, MDJ2, MPD1, MPD2, PDI1, PFD1, ABC1, APJ1, ATP11, ATP12, BTT1, CDC37, CPR7, HSC82, KAR2, LHS1, MGE1, MRS11, NOB1, ECM10, SSA1, SSA2, SSA3, SSA4, SSC1, SSE2, SIL1, SLS1, ORM1, ORM2, PER1, PTC2, PSE1, UBI4HAC1 또는 트렁케이티드 인트론리스 HAC1(Valkonen et al., 2003, Applied Environ. Micro., 69: 2065)뿐만 아니라 TIM9, PAM18(TIM14로도 알려짐) 및 TCP1(CCT1으로도 알려짐) 또는 이의 변이체 중 하나 이상을 과발현하거나 과발현하지 않을 수 있다. PDI1(SEQ ID NO: 25) 또는 이의 변이체 또는 단편 및/또는 ERO1(SEQ ID NO: 26) 또는 이의 변이체 또는 단편의 과발현이 바람직하다. 과발현은 숙주 세포에서 샤페론의 고유 수준 발현에 비해 샤페론의 발현을 적어도 25, 50, 75, 100, 200, 300, 400, 500% 증가시키는 것을 포함한다. 과발현은 샤페론 양의 증가, 또는 샤페론 활성의 증가에 해당할 수 있다. 과발현은 샤페론을 코딩하는 유전자의 카피 수를 증가시킴으로써, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 유전자의 카피를 포함하는 숙주 세포를 제공함으로써 달성될 수 있다. 바람직하게, 변이 샤페론은 샤페론과 적어도 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98 또는 99% 서열 동일성을 갖는다. 바람직하게, 변이체는 샤페론의 기능적 활성을 유지한다.
숙주 세포는 프로테아제 또는 이의 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산을 포함하거나 포함하지 않을 수 있다. 숙주 세포는 킬러 발현 프로테아제(Kex2p)와 같은 칼슘 의존성 세린 프로테아제와 같은 프로테아제를 코딩하는 적어도 하나의 핵산 또는 이의 단편 및/또는 변이체를 포함하거나 포함하지 않을 수 있다. 바람직하게, 프로테아제 변이체 또는 단편은 기능적이며, 예를 들어 인식 서열 Arg-Arg/X 또는 Lys-Arg/X의 카르복실 말단에서 폴리펩티드를 절단하는 능력을 갖는다. KEX2 뉴클레오티드 서열은 SEQ ID NO: 27을 포함하거나 이로 구성될 수 있고, Kex2p 단백질은 SEQ ID NO: 28을 포함하거나 이로 구성될 수 있다. KEX2 및 Kex2p의 변이체는 각각, SEQ ID NO: 27 및 SEQ ID NO: 28과 적어도 70, 75, 80, 85, 90, 95, 96, 97, 98 또는 99% 동일성을 가질 수 있다. KEX2는 과발현되거나 과발현되지 않을 수 있다.
바람직한 숙주 세포, 가장 바람직하게, S. 세레비지애(S. cerevisiae)는 PDI1 및/또는 ERO1을 과발현하고 Kex2p를 코딩하는 적어도 하나의 핵산을 포함한다.
Gsh1 단백질, Not4 단백질, 또는 이의 호모로그를 코딩하는 뉴클레오티드 서열, 및 원하는 단백질은 당업계에 공지된 임의의 돌연변이 유발 방법, 예컨대 부위-특이적 돌연변이 유발, 합성 유전자 구축, 반합성 유전자 구축, 무작위 돌연변이 유발, 셔플링 등을 이용하여 제조될 수 있다.
부위-특이적 돌연변이 유발은 하나 이상의(예를 들어, 여러 개의) 돌연변이가 모체를 코딩하는 폴리뉴클레오티드의 하나 이상의 정의된 부위에 도입되는 기술이다.
부위-특이적 돌연변이 유발은 원하는 돌연변이를 함유하는 올리고뉴클레오티드 프라이머의 사용을 포함하는 PCR에 의해 시험관 내(in vitro)에서 달성될 수 있다. 부위-특이적 돌연변이 유발은 또한 모체를 코딩하는 폴리뉴클레오티드를 포함하는 플라스미드의 부위에서 제한 효소에 의한 절단 및 폴리뉴클레오티드에서 돌연변이를 함유하는 올리고뉴클레오티드의 후속적 결찰을 포함하는 카세트 돌연변이 유발에 의해 시험관 내에서 수행될 수 있다. 일반적으로, 플라스미드 및 올리고뉴클레오티드를 다아제션하는 제한 효소는 동일하여, 플라스미드 및 삽입물의 스티키 말단이 서로 연결되도록 한다. 참조 예, 문헌 [Scherer and Davis, 1979, Proc. Natl. Acad. Sci. USA 76: 4949-4955; and Barton et al., 1990, Nucleic Acids Res. 18: 7349-4966]
부위-특이적 돌연변이 유발은 또한 당업계에 공지된 방법에 의해 생체 내(in vivo)에서 달성될 수 있다. 참조 예, 미국 특허출원 공개번호 2004/0171154; Storici et al., 2001, Nature Biotechnol. 19: 773-776; Kren et al., 1998, Nat. Med. 4: 285-290; and Calissano and Macino, 1996, Fungal Genet. Newslett. 43: 15-16.
임의의 부위-특이적 돌연변이 유발 방법이 본 발명에 사용될 수 있다. 폴리펩티드를 제조하는데 사용될 수 있는 많은 시판 키트가 존재한다.
합성 유전자 구축은 관심 폴리펩티드를 코딩하기 위해 디자인된 폴리뉴클레오티드 분자의 시험관 내 합성을 수반한다. 유전자 합성은 올리고뉴클레오티드가 포토-프로그래밍가능한 마이크로플루이딕 칩 상에 합성되고 조립되는 Tian 등(2004, Nature 432: 1050-1054)에 의해 기술된 다중 마이크로칩-기반 기술 및 유사한 기술과 같은 다수의 기술을 이용하여 수행될 수 있다.
단일 또는 다중 아미노산 치환, 결실 및/또는 삽입은 공지된 돌연변이 유발, 재조합 및/또는 셔플링의 방법들을 사용하여 제조 및 시험한 후, 관련 스크리닝 방법, 예컨대 문헌 [Reidhaar-Olson and Sauer, 1988, Science 241: 53-57; Bowie and Sauer, 1989, Proc. Natl. Acad. Sci. USA 86: 2152-2156]; WO95/17413; 또는 WO95/22625에 기술된 것들과 같은 관련 스크리닝 방법이 후속될 수 있다. 사용될 수 있는 다른 방법은 에러-프론(error-prone) PCR, 파지 디스플레이(예, Lowman et al., 1991, Biochemistry 30: 10832-10837; 미국 특허번호 5,223,409; WO92/06204) 및 영역-특이 돌연변이 유발(Derbyshire et al., 1986, Gene 46: 145; Ner et al., 1988, DNA 7: 127)을 포함한다.
돌연변이 유발/셔플링 방법은 고처리량의 자동 스크리닝 방법과 결합하여 숙주 세포에 의해 발현되는 클로닝된 돌연변이 유발된 폴리펩티드의 활성을 검출할 수 있다(Ness et al., 1999, Nature Biotechnology 17: 893-896). 활성 폴리펩티드를 코딩하는 돌연변이 유발된 DNA 분자는 숙주 세포로부터 회수될 수 있고, 당업계의 표준 방법을 사용하여 신속하게 서열 분석될 수 있다. 이들 방법은 폴리펩티드에서 개별 아미노산 잔기의 중요성을 신속하게 결정할 수 있게 한다.
반합성 유전자 구축은 합성 유전자 구축, 및/또는 부위-특이적 돌연변이 유발 및/또는 무작위 돌연변이 유발 및/또는 셔플링의 어스펙트를 조합함으로써 달성된다. 반합성 구성은 PCR 기술과 함께 합성된 폴리뉴클레오티드 단편을 이용하는 공정으로 전형화된다. 따라서, 정의된 유전자 영역은 새로(de novo) 합성될 수 있는 반면, 다른 영역은 부위-특이적 돌연변이 유발 프라이머를 사용하여 증폭될 수 있고, 한편 다른 영역은 에러-프론 PCR 또는 논에러-프론 PCR 증폭에 적용될 수 있다. 그 다음, 폴리뉴클레오티드 서브서열을 셔플링할 수 있다.
본 발명의 제2견지는 균류 숙주 세포가 Gsh1 단백질 또는 이의 호모로그의 감소된 활성 수준과 같은 변형된 활성 수준 및/또는 Gsh1 단백질 또는 이의 호모로그의 감소된 발현 수준과 같은 변형된 발현 수준을 갖는 것을 특징으로 하는, 원하는 단백질, 예를 들어 이종 단백질을 코딩하는 폴리뉴클레오티드 서열을 함유하는 균류 숙주 세포의 배양물을 제공한다.
본 발명의 제2견지에 따른 균류 숙주 세포의 배양물은 Not4 단백질 또는 이의 호모로그의 감소된 활성 수준과 같은 변형된 활성 수준, 그리고/또는 Not4 단백질 또는 이의 호모로그의 감소된 발현 수준과 같은 변형된 발현 수준을 추가로 가질 수 있다. 본 발명의 제2견지에 따른 균류 숙주 세포는 본 발명의 제1견지에 대해 기술된 바와 같다.
대안적으로, 본 발명의 제2견지는 균류 숙주 세포가 Gsh1 단백질 또는 이의 호모로그의 증가된 활성 수준 및/또는 Gsh1 단백질 또는 이의 호모로그의 증가된 발현 수준을 갖는 것을 특징으로 하는, 이종 단백질과 같은 원하는 단백질을 코딩하는 폴리뉴클레오티드를 함유하는 균류 숙주 세포의 배양물을 제공한다. 이는 숙주의 생존력에 해로운 원하는 단백질의 생산에 유용할 수 있다. 본 발명의 이러한 대안적인 제2견지에 따른 균류 숙주 세포는 본 발명의 제1견지에 대해 기술된 바와 같다.
본 발명의 제2견지는 또한 균류 숙주 세포가 (i) Gsh1 단백질 또는 이의 호모로그의 증가된 활성 수준 및/또는 Gsh1 단백질 또는 이의 호모로그의 증가된 발현 수준 및 (ii) Not4 단백질 또는 이의 호모로그의 증가된 활성 수준 및/또는 Not4 단백질 또는 이의 호모로그의 증가된 발현 수준을 갖는 것을 특징으로 하는, 이종 단백질과 같은 웜하는 단백질을 코딩하는 폴리뉴클레오티드 서열을 함유하는 균류 숙주 세포의 배양물을 제공한다. 본 발명의 이러한 대안적인 제2견지에 따른 균류 숙주 세포는 본 발명의 제1견지에 대해 기술된 바와 같다.
상기 방법은 글루타티온의 존재하에서 배양하는 것을 포함할 수 있다. 이는 균류 숙주에 예를 들어 돌연변이 또는 결실로 인해 기능성 Gsh1 단백질이 결여된 경우에 특히 유용하다. 균류 숙주 세포가 기능성 또는 부분적으로 기능성 Gsh1 단백질을 함유하는 경우에도 유용할 수 있다. 글루타티온은 적어도 0.05mM, 예를 들어 약 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450mM 내지 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500mM, 바람직하게 약 0.5 내지 약 50mM, 더욱 바람직하게는 약 1 내지 약 10mM, 더욱 바람직하게는 약 3 내지 약 7mM, 가장 바람직하게는 약 5mM로 발효 배지에 존재할 수 있다.
본 발명의 제3견지는 균류 숙주 세포로부터 이종 단백질과 같은 원하는 단백질을 생산하는 방법을 제공하며, 상기 방법은 본 발명의 제1견지에 따른 균류 숙주 세포 또는 본 발명의 제2견지에 따른 배양물을 제공하는 단계 및 상기 균류 숙주 세포 또는 배양물을 배양하여 원하는 단백질을 생산하는 단계를 포함한다. 상기 방법은 균류 숙주 세포로부터 원하는 폴리펩티드의 생산 수율을 변형시키기 위해 사용될 수 있다. 일부 경우에, 하나 이상의 단백질의 생산 수율을 증가시키는 것이 바람직할 수 있다. 다른 경우에, 숙주 세포에 독성일 수 있는 단백질과 같은 하나 이상의 단백질의 생산 수율을 감소시키는 것이 바람직할 수 있다.
원하는 단백질은 숙주 세포로부터 분비되거나 분비되지 않을 수 있으며, 분비된 단백질이 바람직하다.
숙주 세포는 당업계에 공지된 방법을 사용하여 원하는 단백질의 생산에 적합한 영양 배지에서 배양될 수 있다. 예를 들어, 세포는 쉐이크 플라스크 배양, 또는 소규모 또는 대규모 발효(연속, 뱃치(batch), 유가식(fed-batch), 또는 고상 발효 포함)에 의해 적절한 배지에서 그리고 폴리펩티드가 발현 및/또는 분리되도록 하는 조건하에서 수행되는 실험실 또는 산업적 발효기에서 배양될 수 있다. 배양은 당업계에 공지된 절차를 사용하여 탄소 및 질소 공급원 및 무기염을 포함하는 적절한 영양 배지에서 일어날 수 있다. 적절한 배지는 상업적 공급업체로부터 입수할 수 있거나 공개된 조성에 따라(예, American Type Culture Collection의 카탈로그에서) 제조될 수 있다. 바람직한 배지는 실시예 5에 기재된 바와 같은 MW11D를 포함한다. 원하는 단백질이 영양 배지로 분비되는 경우, 원하는 단백질은 배지로부터 직접 회수될 수 있다. 원하는 단백질이 분비되지 않으면, 세포 용해물로부터 회수될 수 있다.
배양은 소규모 또는 대규모, 예를 들어 마이크로타이터 플레이트 규모(예를 들어, 10 내지 500마이크로리터 배양 부피 배지), 쉐이크 플라스크 규모(예를 들어, 5 내지 1000밀리리터(mL) 배양 부피), 또는 발효기 또는 동등한 시스템 규모(예를 들어, 적어도 5mL 배양 부피, 보다 바람직하게는 적어도 1, 2, 3, 4 또는 5리터(L), 더욱 바람직하게는 적어도 10, 50, 100L, 예를 들어 적어도 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000L 배양 부피)일 수 있다.
배양은 숙주 세포에 적합한 pH일 수 있다. S. 세레비지애(S. cerevisiae)의 경우, 바람직하게 pH는 5 내지 7, 예를 들어 5, 5.1, 5.2, 5.3, 5.4, 5.5, 5.6, 5.7, 5.8, 5.9, 6, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 또는 6.9 내지 5.1, 5.2, 5.3, 5.4, 5.5, 5.6, 5.7, 5.8, 5.9, 6, 6.1, 6.2, 6.3, 6.4, 6.5, 6.6, 6.7, 6.8, 6.9 또는 7이다. 바람직한 pH 범위는 약 6.0 내지 약 6.4이다.
배양은 약 20℃ 내지 약 35℃의 온도, 예를 들어 약 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34℃ 내지 약 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35℃, 바람직하게는 약 28 내지 약 32℃, 더욱 바람직하게 약 30℃일 수 있다.
배양은 교반, 예를 들어 배양 용기의 회전 또는 배양 용기 내에서 교반기를 사용한 교반을 포함하거나 포함하지 않을 수 있다. 교반이 바람직하다.
원하는 단백질은 원하는 단백질에 특이적인 당업계에 공지된 방법을 사용하여 검출될 수 있다. 이러한 검출 방법은 이에 한정하는 것은 아니나, 특정 항체 또는 고성능 액체 크로마토그래피(HPLC)의 사용을 포함한다.
바람직한 HPLC는 겔 투과 HPLC(GP-HPLC)이다. 적합한 장비에는 Shimadzu VP7.3 클라이언트 서버 소프트웨어 제어 하에 UV 감지가 구비된 LC2010 HPLC system(Shimadzu)이 포함된다. 75μL의 주입은 6.0mm id x 40mm 길이의 TSK SW 가드 컬럼(Tosoh Bioscience)과 함께 7.8mm id x 300mm 길이의 TSK G3000SWXL 컬럼(Tosoh Bioscience)에 이루어질 수 있다. 샘플은 25mM 소듐 포스페이트, 100mM 소듐 설페이트, 0.05%(w/v) 소듐 아지드, pH 7.0에서, 1mL.min-1으로 20분의 실행 시간으로 크로마토그래피가 수행될 수 있다. 알려진 농도(예를 들어, 10mg/mL)의 재조합 인간 알부민 스탠다드에 대해 280nm에서 피크 면적에 의한 UV 검출에 의해 샘플을 정량화하고, 이들의 상대 흡광 계수에 대해 보정할 수 있다.
선택적으로, 상기 방법은 원하는 단백질을 회수하는 단계, 예를 들어 숙주 세포 또는 숙주 세포 배양물, 예, 세포 배지 또는 세포 용해물로부터 원하는 단백질을 분리하는 단계를 포함한다.
원하는 단백질은 당업계에 알려진 방법을 사용하여 회수될 수 있다. 예를 들어, 원하는 단백질은, 이에 한정하는 것은 아니나, 수집, 원심분리, 여과, 추출, 분무-건조, 증발, 또는 침전을 포함하는 통상적인 절차에 의해 영양 배지로부터 회수될 수 있다.
선택적으로, 상기 방법은 원하는 단백질을 정제하는 단계를 포함한다. 원하는 단백질은, 이에 한정하는 것은 아니나, 크로마토그래피(예를 들어, 이온 교환, 친화성, 소수성, 크로마토포커싱 및 크기 배제), 전기영동법(예를 들어, 예비 등전 포커싱(preparative isoelectric focusing), 차등적 용해도(예를 들어, 암모늄 설페이트 침전), SDS PAGE, 또는 추출(참조, 예, Protein Purification, Janson and Ryden, editors, VCH Publishers, New York, 1989)을 포함하는 당업계에 알려진 다양한 방법에 의해 정제되어 실질적으로 순수한 원하는 단백질을 얻을 수 있다.
대안적인 견지에서, 원하는 단백질은 회수되지 않지만, 원하는 단백질을 발현하는 본 발명의 숙주 세포가 원하는 단백질의 공급원으로서 사용된다.
배양된 숙주 세포 또는 배양 배지로부터 원하는 단백질(예를 들어, 원하는 이종 단백질)을 정제하는 단계는, 선택적으로 세포 고정화, 세포 분리 및/또는 세포 파괴를 포함하지만, 항상 상기 세포 고정화, 세포 분리 및/또는 세포 파괴의 단계 또는 단계들과 상이한 적어도 하나의 다른 정제 단계를 포함한다.
칼슘 알기네이트 비드를 사용하여 세포를 인케이싱(encasing)하는 것과 같은 세포 고정화 기술은 당업계에 공지되어 있다. 유사하게, 원심분리, 여과(예를 들어, 교차-흐름 여과), 팽창 층 크로마토그래피 등과 같은 세포 분리 기술이 당업계에 공지되어 있다. 마찬가지로, 비드밀링, 초음파 처리, 효소 노출 등을 포함하는 세포 파괴 방법이 당업계에 공지되어 있다.
적어도 하나의 다른 정제 단계는 당업계에 공지된 단백질 정제에 적합한 임의의 다른 단계일 수 있다. 예를 들어, 재조합적으로 발현되는 알부민의 회수를 위한 정제 기술은 WO2010/128142에 기재되어 있으며, 예를 들어 2-클로로-4,6-디(2'-설포아닐리노)-S-트리아진과 같은 알부민 특이적 리간드를 이용한 친화도 정제는 WO92/04367에 기재되어 있으며, 매트릭스-유래 염료의 제거는 EP464590에 기재되어 있으며, 효모-유래 착색제의 제거는 EP319067에 기재되어 있으며, 알칼리성 침전 및 친유성 상으로의 알부민의 후속 적용은 완전한 정제 공정이 기술되어 있는 WO96/37515, US5728553 및 WO00/44772에 기재되어 있으며, 이들 모두는 본원에 참고문헌으로 편입된다.
알부민 이외의 원하는 단백질은 이러한 단백질을 정제하는데 유용한 것으로 밝혀진 임의의 기술에 의해 배양 배지로부터 정제될 수 있다.
적합한 방법으로는 암모늄 설페이트 또는 에탄올 침전, 산 또는 용매 추출, 음이온 또는 양이온 교환 크로마토그래피, 포스포셀룰로스 크로마토그래피, 소수성 상호작용 크로마토그래피, 친화성 크로마토그래피, 하이드록시라파타이트 크로마토그래피, 렉틴 크로마토그래피, 농도, 희석, pH 조정, 정용여과, 한외여과, 고성능 액체 크로마토그래피("HPLC"), 역상 HPLC, 전도도 조절 등이 포함된다.
선택적으로, 상기 방법은 분리된 단백질을 상업적으로 또는 산업적으로 허용되는 수준의 순도로 정제하는 단계를 포함할 수 있다. 상업적으로 또는 산업적으로 허용되는 수준의 순도는, 적어도 0.01g.L-1, 0.02g.L-1, 0.03g.L-1, 0.04g.L-1, 0.05g.L-1, 0.06g.L-1, 0.07g.L-1, 0.08g.L-1, 0.09g.L-1, 0.1g.L-1, 0.2g.L-1, 0.3g.L-1, 0.4g.L-1, 0.5g.L-1, 0.6g.L-1, 0.7g.L-1, 0.8g.L-1, 0.9g.L-1, 1g.L-1, 2g.L-1, 3g.L-1, 4g.L-1, 5g.L-1, 6g.L-1, 7g.L-1, 8g.L-1, 9g.L-1, 10g.L-1, 15g.L-1, 20g.L-1, 25g.L-1, 30g.L-1, 40g.L-1, 50g.L-1, 60g.L-1, 70g.L-1, 80g.L-1, 90g.L-1, 100g.L-1, 150g.L-1, 200g.L-1, 250g.L-1, 300g.L-1, 350g.L-1, 400g.L-1, 500g.L-1, 600g.L-1, 700g.L-1, 800g.L-1, 900g.L-1, 1000g.L-1 이상의 농도로 단백질을 제공하는 것을 포함한다. 상업적으로 또는 산업적으로 허용되는 수준의 순도는, 다른 물질(예를 들어, 하나 이상의 (예를 들어, 여러 개의) 오염물이 50%, 40%, 30%, 20%, 10%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.01%, 0.001%, 0.0001%, 0.00001%, 또는 0.000001% 미만의 수준으로, 그리고 가장 바람직하게 0%의 수준으로 존재하는 분리된 단백질을 제공하는 것을 포함한다.
단백질은 적어도 0.01g.L-1, 0.02g.L-1, 0.03g.L-1, 0.04g.L-1, 0.05g.L-1, 0.06g.L-1, 0.07g.L-1, 0.08g.L-1, 0.09g.L-1, 0.1g.L-1, 0.2g.L-1, 0.3g.L-1, 0.4g.L-1, 0.5g.L-1, 0.6g.L-1, 0.7g.L-1, 0.8g.L-1, 0.9g.L-1, 1g.L-1, 2g.L-1, 3g.L-1, 4g.L-1, 5g.L-1, 6g.L-1, 7g.L-1, 8g.L-1, 9g.L-1, 10g.L-1, 15g.L-1, 20g.L-1, 25g.L-1, 30g.L-1, 40g.L-1, 50g.L-1, 60g.L-1, 70g.L-1, 80g.L-1, 90g.L-1, 100g.L-1, 150g.L-1, 200g.L-1, 250g.L-1, 300g.L-1, 350g.L-1, 400g.L-1, 500g.L-1, 600g.L-1, 700g.L-1, 800g.L-1, 900g.L-1, 1000g.L-1 이상의 농도로 제공될 수 있다.
원하는 단백질은 약학적으로 허용되는 수준의 순도를 달성하도록 정제되는 것이 바람직하다. 단백질은 본질적으로 발열원(pyrogen)이 없고, 단백질의 활성과 관련되지 않은 의학적 효과를 유발하지 않으면서 약학적으로 유효한 양으로 투여될 수 있는 경우에 약학적으로 허용되는 수준의 순도를 갖는다.
선택적으로, 상기 방법은 치료적으로 허용되는 캐리어 또는 희석제로 원하는 단백질을 제형화하여 인간 또는 동물에게 투여하기에 적합한 치료 제품을 생성하는 단계를 추가로 포함한다.
생성된 원하는 단백질은, 알부민의 경우, 심각한 화상, 쇼크 및 혈액 손실을 치료하기 위해 환자에게 정맥 내(i.v.) 투여하는 것, 배양 배지 보충, 및 다른 단백질의 제형에서 부형제로서 사용하는 이의 어느 공지된 용도를 위해 사용되거나 또는 사용되지 않을 수 있다.
본 발명의 방법에 의해 얻어지는 치료학적으로, 진단학적으로, 산업적으로, 가정적으로 또는 영양적으로 유용한 원하는 단백질은 단독으로 제공되거나 투여되는 것이 가능하지만, 이를 제형(약학적 제형과 같이, 특히 치료적 및/또는 진단적으로 유용한 단백질의 경우에)으로서, 하나 이상의 허용되는 캐리어 또는 희석제와 함께 제공하는 것이 바람직하다. 캐리어(들) 또는 희석제(들)는 원하는 단백질과 호환될 수 있다는 견지에서 "허용가능(acceptable)"해야 하고, 여기서 상기 제형은 수용자에게 투여되도록 의도된 후에 수용자에게 유해하지 않아야 한다. 전형적으로, 캐리어 또는 희석제는 멸균되고 발열원이 없는 물 또는 염수일 것이다.
선택적으로, 이렇게 제형화된 단백질은 정제, 캡슐, 주사용 용액 등의 형태와 같은 단위 투여 형태로 제공될 것이다.
선택적으로, 상기 방법은 원하는 단백질을 단위 투여 형태로 제공하는 단계를 추가로 포함한다.
본 발명의 제4견지는 본 발명의 제3견지에 따른 방법을 포함하는 원하는 단백질(이종 단백질과 같은)의 수율을 증가시키는 방법을 제공한다.
본 발명의 제4견지는 또한 원하는 단백질(이종 단백질과 같은)의 수율을 증가시키기 위해 본 발명의 제1견지에 따른 숙주 세포 또는 본 발명의 제2견지에 따른 배양물의 사용을 제공한다.
수율은 용액, 예를 들어 배양 브로스 또는 세포 용해 혼합물 중에 있는 생성물, 예를 들어 원하는 단백질의 양을 지칭한다. 수율은, 예를 들어 레퍼런스 숙주 스트레인으로부터의 수율이 100%이다. 숙주 스트레인을 비교할 때, 정의된 조건 세트하에서 수율을 측정하는 것이 바람직하다. 절대 수율은 마이크로리터당 나노그램(ng/μL) 또는 리터당 그램(g/L)으로 표현될 수 있다. 수율은 대안적으로 특정 세포 생산성의 속도(YPXT)로 표현될 수 있다.
바람직하게, 원하는 단백질의 수율은 SEQ ID NO: 2와 같은 야생형 Gsh1 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율(g/L 또는 YPXT) 보다 적어도 2% 더 높으며, 보다 바람직하게 적어도 3, 4, 5, 6, 7, 8, 9, 10, 12.5, 15, 17.5, 20, 22.5, 25, 27.5, 30, 35, 40, 45 또는 적어도 50% 더 높다. 바람직한 레퍼런스 균류 숙주 세포는 SEQ ID NO: 2의 Gsh1 단백질을 갖는다.
바람직하게, 원하는 단백질의 수율은 SEQ ID NO: 6과 같은 야생형 Not4 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율(g/L 또는 YPXT) 보다 적어도 2% 더 높으며, 보다 바람직하게 적어도 3, 4, 5, 6, 7, 8, 9, 10, 12.5, 15, 17.5, 20, 22.5, 25, 27.5, 30, 35, 40, 45 또는 적어도 50% 더 높다. 바람직한 레퍼런스 균류 숙주 세포는 SEQ ID NO: 6의 Not4 단백질을 갖는다.
바람직하게, 원하는 단백질의 수율은 SEQ ID NO: 2와 같은 야생형 Gsh1 단백질, 및 SEQ ID NO: 6과 같은 야생형 Not4 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율(g/L 또는 YPXT) 보다 적어도 2% 더 높으며, 보다 바람직하게 적어도 3, 4, 5, 6, 7, 8, 9, 10, 12.5, 15, 17.5, 20, 22.5, 25, 27.5, 30, 35, 40, 45 또는 적어도 50% 더 높다. 바람직한 레퍼런스 균류 숙주 세포는 SEQ ID NO: 2의 Gsh1 단백질 및 SEQ ID NO: 6의 Not4 단백질을 갖는다.
바람직한 단백질은 본 발명의 제1견지, 특히 알부민 또는 이의 변이체, 단편 및/또는 융합체에 대해 기재된 바와 같을 수 있다.
본 발명의 제5견지는 본 발명의 제3견지 또는 제4견지에 따른 방법에 의해 생성된 원하는 단백질(이종 단백질과 같은)을 제공한다.
본 발명은 또한 본 발명의 제5견지의 원하는 단백질을 포함하는 약학 조성물과 같은 조성물을 제공한다. 약학 조성물은 미국 식품 의약국 또는 유럽 의약청과 같은 규제 기관에 의해 승인된 것들과 같은 하나 이상의 약학적으로 허용되는 캐리어를 포함할 수 있다. 본 발명은 유효량의 약학 조성물을 환자에게 투여하는 것을 포함하는 환자 치료 방법을 추가로 제공한다.
본 발명의 제6견지는 본 발명의 제1견지에 따른 균류 숙주 세포의 제조 방법 또는 본 발명의 제2견지에 따른 배양물을 제공한다. 상기 방법은 예를 들어 Gsh1 단백질 또는 이의 호모로그의 활성 수준을 감소시키는 것과 같이 변형시키기 위해, GSH1 유전자 또는 이의 호모로그 또는 이의 조절 서열을 변형시키기 위해 또는 GSH1 유전자 또는 이의 호모로그의 발현 수준을 변형시키기 위해, (모)균류 숙주 세포를 유전자 변형하여 생성된 Gsh1 단백질 또는 이의 호모로그를 변형시키는 것을 포함한다. 선택적으로, 상기 방법은 또한 예를 들어 Not4 단백질 또는 이의 호모로그의 활성 수준을 감소시키는 것과 같이 변형시키기 위해, NOT4 유전자 또는 이의 호모로그 또는 이의 조절 서열을 변형시키기 위해 또는 NOT4 유전자 또는 이의 호모로그의 발현 수준을 변형시키기 위해, (모)균류 숙주 세포를 유전자 변형하여 생성된 Not4 단백질 또는 이의 호모로그를 변형시키는 것을 포함한다. 활성 및/또는 발현 수준의 돌연변이, 결실 및 변형은 본 발명의 제1견지, 제2견지 및 제3견지에 대해 기재된 바와 같을 수 있다. 숙주 세포를 조작하는 방법은 당업계에 공지되어 있다. 숙주 세포의 유전자 변형에 대한 대안으로서, 성장 배지에 인히비터 또는 인핸서를 첨가함으로써 Gsh1 단백질 또는 활성의 수준을 변형될 수 있다. 마찬가지로, 숙주 세포의 유전자 변형에 대한 대안으로서, Not4 단백질 또는 활성의 수준은 성장 배지에 인히비터 또는 인핸서를 첨가함으로써 변형될 수 있다.
본 발명의 제7견지는 SEQ ID NO: 2와 적어도 50%의 동일성 및 SEQ ID NO: 2의 47, 48, 49, 50, 51, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 409, 451, 452, 453, 454 및 455로부터 선택된 하나 이상의 위치, 바람직하게는 (a) 57 내지 51; (b) 120 내지 130; (c) 409 또는 (d) 451 내지 455로부터 선택된 위치에 상응하는 위치에서의 돌연변이를 포함하는 Gsh1 단백질, 또는 이의 호모로그를 제공한다. SEQ ID NO: 2의 위치 125에 상응하는 위치에서의 돌연변이가 특히 바람직하다.
본 발명의 제7견지에 따른 Gsh1 단백질은 본 발명의 제1견지와 관련하여 기술된 바와 같을 수 있다. 바람직하게, Gsh1 단백질은 SEQ ID NO: 4를 포함하거나 이로 구성된다. 본 발명의 제7견지의 Gsh1 단백질은 분리된 단백질이거나 아닐 수 있다.
본 발명의 제8견지는, SEQ ID NO: 2와 같은 야생형 Gsh1 단백질을 코딩하는 숙주 세포, 또는 이의 호모로그에 비해 보다 낮은 수준의 Gsh1 단백질 발현 또는 이의 호모로그, 및/또는 보다 낮은 활성 수준의 Gsh1 단백질, 또는 이의 호모로그를 일으키는 SEQ ID NO: 2의 변이체와 같은 본 발명의 Gsh1 변이체를 코딩하는 폴리뉴클레오티드를 제공한다. 이러한 Gsh1 단백질은 본 발명의 제1견지 내지 제6견지에 기재되어 있다.
바람직한 폴리뉴클레오티드는 돌연변이 R125G(SEQ ID NO: 4)를 갖는 Gsh1 단백질을 코딩하며, 이러한 폴리뉴클레오티드 서열의 예는 SEQ ID NO: 3에 의해 제공된다.
예를 들어, 본 발명은 또한 조절 서열과 호환되는 조건하에서 적절한 숙주 세포에서 코딩 서열의 발현을 지시하는 하나 이상의 조절 서열에 작동가능하게 연결된 본 발명의 Gsh1 변이체를 코딩하는 폴리뉴클레오티드를 포함하는 핵산 구조물에 관한 것이다. 적절한 조절 서열은 본 발명의 제1견지 내지 제7견지에 기재되어 있다.
핵산 구조물은 조절 서열과 호환되는 조건하에서 적절한 숙주 세포에서 코딩 서열의 발현을 지시하는 하나 이상의 조절 서열에 작동가능하게 연결된 본 발명의 Not4 변이체를 코딩하는 폴리뉴클레오티드를 추가로 포함할 수 있다. 적절한 조절 서열은 본 발명의 제1견지 내지 제6견지에 기재되어 있다.
폴리뉴클레오티드(들)는 벡터에 또는 숙주 세포의 게놈에 위치할 수 있다.
결과적으로, 본 발명은 또한 본 발명의 Gsh1 변이체를 코딩하는 폴리뉴클레오티드, 프로모터, 및 전사 및 번역 정지 신호를 포함하는 재조합 벡터에 관한 것이다. 선택적으로, 벡터는 본 발명의 Not4 변이체, 프로모터 및 전사 및 번역 정지 신호를 코딩하는 폴리뉴클레오티드를 추가로 포함한다. Gsh1은 Not4에 대해 동일한 폴리뉴클레오타이드(예를 들어, 벡터) 또는 상이한 폴리뉴클레오티드(예를 들어, 벡터)상에 코딩될 수 있다. 본 발명은 또한 Gsh1, 및 Gsh1 또는 Gsh1 활성의 수준이 예를 들어, 감소되도록 하는 것과 같이, 변형되도록 하는 하나 이상의(예를 들어, 여러 개의) 조절 서열을 코딩하는 폴리뉴클레오티드를 포함하는 벡터에 관한 것이다. 선택적으로, 폴리뉴클레오타이드(예를 들어, 벡터)는 Not4, 및 Not4 또는 Not4 활성의 수준이 예를 들어, 감소되도록 하는 것과 같이, 변형되도록 하는 하나 이상의(예를 들어, 여러 개의) 조절 서열을 코딩하는 폴리뉴클레오티드를 추가로 포함한다. 다양한 뉴클레오티드 및 조절 서열은 함께 결합되어 이러한 부위에서 변이체를 코딩하는 폴리뉴클레오티드의 삽입 또는 치환을 가능하게 하는 하나 이상의 편리한 제한 부위를 포함할 수 있는 재조합 벡터를 생성할 수 있다. 대안적으로, 폴리뉴클레오티드는 폴리뉴클레오티드 또는 상기 폴리뉴클레오티드를 포함하는 핵산 구조물을 발현을 위한 적절한 벡터에 삽입함으로써 발현될 수 있다. 벡터를 생성할 때, 코딩 서열은 벡터에 위치하여 코딩 서열이 발현을 위한 적절한 조절 서열과 작동가능하게 연결된다.
재조합 벡터는 재조합 DNA 방법에 편리하게 적용될 수 있고, 폴리뉴클레오티드의 발현을 야기할 수 있는 임의의 벡터(예를 들어, 플라스미드 또는 바이러스)일 수 있다. 벡터의 선택은 전형적으로 벡터가 도입될 숙주 세포와 벡터의 호환성에 따라 달라질 것이다. 벡터는 선형 또는 폐쇄된 원형 플라스미드일 수 있다.
벡터는 자체적으로 복제되는 벡터, 즉 염색체 외 엔티티(extrachromosomal entity)로서 존재하는 벡터일 수 있으며, 이의 복제는 염색체 복제, 예를 들어 플라스미드, 염색체 외 엘리먼트, 미니 염색체 또는 인공 염색체와는 독립적이다. 벡터는 자자-복제(self-replication)를 보장하기 위한 임의의 수단을 함유할 수 있다. 대안적으로, 벡터는 숙주 세포 내로 도입될 때, 게놈 내로 통합되고 이것이 통합된 염색체(들)와 함께 복제되는 것일 수 있다. 또한, 숙주 세포의 게놈으로 도입되는 총 DNA, 또는 트랜스포손을 함께 함유하는 단일 벡터 또는 플라스미드 또는 둘 이상의 벡터 또는 플라스미드가 사용될 수 있다.
벡터는 바람직하게 형질전환된, 형질감염된, 형질도입된 것과 같은 등의 세포의 선택을 허용하는 하나 이상의 선택가능한 마커를 함유한다. 선택가능한 마커는, 이의 산물이 살생물제 또는 바이러스 저항성, 중금속에 대한 내성, 영양 요구성에 대한 프로토트로피 등을 제공하는 유전자이다.
벡터는 바람직하게 벡터를 숙주 세포의 게놈 내로 통합 시키거나 게놈과 무관한 세포에서 벡터의 자체적 복제를 가능하게 하는 엘리먼트(들)를 함유한다.
숙주 세포 게놈으로의 통합을 위해, 벡터는 동종 또는 비-동종 재조합에 의해 게놈으로의 통합을 위해 벡터의 변이체 또는 임의의 다른 엘리먼트를 코딩하는 폴리뉴클레오티드의 서열에 의존할 수 있다. 대안적으로, 벡터는 염색체(들) 내의 정확한 위치(들)에서 동종 재조합에 의해 숙주 세포의 게놈으로의 통합을 지시하기 위한 추가의 폴리뉴클레오티드를 함유할 수 있다. 정확한 위치에서 통합 가능성을 증가시키기 위해, 통합 엘리먼트는 100 내지 10,000 염기쌍, 400 내지 10,000 염기쌍, 및 800 내지 10,000 염기쌍과 같은 충분한 수의 핵산을 함유해야 하며, 이는 동종 재조합의 가능성을 향상시키기 위해 상응하는 표적 서열에 대한 고도의 서열 동일성을 갖는다. 통합 엘리먼트는 숙주 세포의 게놈에서 표적 서열과 동종의 임의의 서열일 수 있다. 또한, 통합 엘리먼트는 논-코딩 또는 코딩 폴리뉴클레오티드일 수 있다. 한편, 벡터는 비-동종 재조합에 의해 숙주 세포의 게놈에 통합될 수 있다.
자체적 복제의 경우, 벡터는 벡터가 해당 숙주 세포에서 자체적으로 복제될 수 있게 하는 복제 오리진을 추가로 포함할 수 있다. 복제 오리진은 세포에서 기능하는 자체적 복제를 매개하는 임의의 플라스미드 리플리케이터일 수 있다. "복제 오리진(origin of replication)" 또는 "플라스미드 리플리케이터(plasmid replicator)"라는 용어는 플라스미드 또는 벡터가 생체 내에서 복제될 수 있게 하는 폴리뉴클레오티드를 의미한다.
효모 숙주 세포에서 사용하기 위한 복제 오리진의 예는 2-미크론 복제 오리진, ARS1, ARS4, ARS1과 CEN3의 조합, 및 ARS4와 CEN6의 조합이다.
사상균류 세포에 유용한 복제 오리진의 예는 AMA1 및 ANS1이다(Gems et al., 1991, Gene 98: 61-67; Cullen et al., 1987, Nucleic Acids Res. 15: 9163-9175; WO00/24883). AMA1 유전자의 분리 및 상기 유전자를 포함하는 플라스미드 또는 벡터의 구성은 WO00/24883에 개시된 방법에 따라 달성될 수 있다.
원하는 단백질의 생산을 증가시키기 위해 본 발명의 폴리뉴클레오티드의 하나가 넘는 카피를 숙주 세포에 삽입할 수 있다. 폴리뉴클레오티드의 카피 수의 증가는, 서열의 적어도 하나의 추가 카피를 숙주 세포 게놈 내로 통합함으로써, 또는 세포가 선택가능한 마커 유전자의 증폭된 카피를 함유하며, 이에 따라 추가의 폴리뉴클레오티드 카피가 적절한 선택가능한 제제의 존재하에 상기 세포를 배양함으로써 선택될 수 있는 폴리뉴클레오티드와 함께 증폭가능한 선택가능한 마터 유전자를 포함함으로써 얻어질 수 있다.
본 발명의 재조합 벡터를 구축하기 위해 상기 기술된 엘리먼트를 결찰하기 위해 사용되는 방법은 당업자에게 공지되어 있다(참조, 예, Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, 2d edition, Cold Spring Harbor, New York).
바람직한 구현들
1. 변형된
a. Gsh1 단백질 또는 이의 호모로그, 및/또는
b. 활성 수준 또는 발현 수준의 Gsh1 단백질 또는 이의 호모로그, 및/또는
c. GSH1 유전자 또는 이의 호모로그, 및/또는
d. 발현 수준의 GSH1 유전자 또는 이의 호모로그
를 갖는 균류 숙주 세포.
2. 제1구현에 있어서,
변형된 수준은 감소된 수준인, 균류 숙주 세포.
3. 제1구현에 있어서,
변형된 수준은 증가된 수준인, 균류 숙주 세포.
4. 제1구현 내지 제3구현 중 어느 한 구현에 있어서,
변형된 수준은
a. Gsh1 단백질 또는 이의 호모로그가 야생형 Gsh1 단백질 또는 이의 호모로그인 균류 숙주 세포,
b. Gsh1 단백질이 SEQ ID NO: 2를 포함하거나 이로 구성되는 균류 숙주 세포,
c, S. 세레비지애(S. cerevisiae) S288C 또는
d. S. 세레비지애(S. cerevisiae) DXY1
과 같은 레퍼런스 균류 숙주 세포의 수준에 상대적인, 균류 숙주 세포.
5. 제1구현 내지 제4구현 중 어느 한 구현에 있어서,
변형된
e. Not4 단백질 또는 이의 호모로그, 및/또는
f. 활성 수준 또는 발현 수준의 Not4 단백질 또는 이의 호모로그, 및/또는
g. NOT4 유전자 또는 이의 호모로그, 및/또는
h. 발현 수준의 NOT4 유전자 또는 이의 호모로그
를 갖는, 균류 숙주.
6. 제5구현에 있어서,
변형된 수준은 감소된 수준인, 균류 숙주 세포.
7. 제5구현에 있어서,
변형된 수준은 증가된 수준인, 균류 숙주 세포.
8. 제5구현 또는 제6구현에 있어서,
변형된 수준은
a. Not4 단백질 또는 이의 호모로그가 야생형 Not4 단백질 또는 이의 호모로그인 균류 숙주 세포,
b. Not4 단백질이 SEQ ID NO: 6을 포함하거나 이로 구성되는 균류 숙주 세포,
c, S. 세레비지애(S. cerevisiae) S288C 또는
d. S. 세레비지애(S. cerevisiae) DXY1
과 같은 레퍼런스 균류 숙주 세포의 수준에 상대적인, 균류 숙주 세포.
9. 제1구현 내지 제8구현 중 어느 한 구현에 있어서,
이종 단백질과 같은 원하는 단백질을 코딩하는 뉴클레오티드 서열을 포함하는, 균류 숙주 세포.
10. 제9구현에 있어서,
원하는 단백질은 알부민, 모노클로날 항체, 에토포시드, 혈청 단백질(혈액 응고 인자와 같은), 안티스타신, 진드기 항응고 펩티드, 트랜스페린, 락토페린, 엔도스타틴, 안지오스타틴, 콜라겐, 면역글로불린 또는 면역글로불린-기반 분자 또는 이의 단편(예, Small Modular ImmunoPharmaceutical™("SMIP") 또는 dAb, Fab' 단편, F(ab')2, scAb, scFv 또는 scFv 단편), 쿠니츠 도메인 단백질(알부민 융합을 갖거나 갖지 않는, WO03/066824(본원에 참고문헌으로 편입됨)에 기재된 것들), 인터페론, 인터루킨, IL-10, IL-11, IL-2, 인터페론 α(알파) 종 및 아종, 인터페론 β(베타) 종 및 아종, 인터페론 γ(감마) 종 및 아종, 렙틴, CNTF, CNTFAx15, IL-1-리셉터 안타고니스트, 에리트로포이에틴(EPO) 및 EPO 모방체(mimics), 트롬보포이에틴(TPO) 및 TPO 모방체, 프로삽티드(prosaptide), 시아노비린-N, 5-헬릭스, T20 펩티드, T1249 펩티드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA, 히루딘, 혈소판 유래 성장인자, 부갑상선 호르몬, 프로인슐린, 인슐린, 글루카곤, 예컨대 엑센딘-4, GLP-1 또는 GLP-2와 같은 글루카곤-유사 펩티드, 인슐린-유사 성장인자, 칼시토닌, 성장 호르몬, 형질전환 성장 인자 β(베타), 종양 괴사인자, G-CSF, GM-CSF, M-CSF, FGF, 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈을 포함하는 프리 및 활성 형태의 응고 인자, 폰 빌레브란트 팩터(von Willebrand's factor), 알파1-안티트립신, 플라스미노겐 활성화제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII, 신경 성장인자, LACI, 혈소판 유래 내피세포 성장인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체 단백질, 인터-알파 트립신 인히비터, 안티트롬빈 III, 아포-리포단백질 종, 단백질 C, 단백질 S, 대사산물, 항생제, 또는 상기의 임의의 변이체 또는 단편으로부터 선택되는, 균류 숙주 세포.
11. 제9구현 또는 제10구현에 있어서,
원하는 단백질은 알부민, 이의 변이체, 단편 및/또는 융합체를 포함하거나 이로 구성되는, 균류 숙주 세포.
12. 제11구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 70% 동일성을 갖는, 균류 숙주 세포.
13. 제11구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 75, 80, 85, 90, 91, 92, 93, 95, 96, 97, 98 또는 99% 동일성을 갖는, 균류 숙주 세포.
14. 제13구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 70% 동일성, 바람직하게 SEQ ID NO: 10과 적어도 75, 80, 85, 90, 91, 92, 93, 95, 96, 97, 98 또는 99% 동일성을 가지며, 그리고 SEQ ID NO: 10의 K573에 상응하는 위치에 A, C, D, E, F, G, H, I, L, M, N, P, Q, R, S, T, V, W 또는 Y를 포함하는, 균류 숙주 세포.
15. 제14구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10의 K573에 상응하는 위치에 P, H, W 또는 Y를 포함하는, 균류 숙주 세포.
16. 제15구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 98% 동일성을 가지며, 그리고 SEQ ID NO: 10의 K573에 상응하는 위치에 P를 포함하는, 균류 숙주 세포.
17. 제13구현 내지 제16구현 중 어느 한 구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 70% 동일성, 바람직하게 SEQ ID NO: 10과 적어도 75, 80, 85, 90, 91, 92, 93, 95, 96, 97, 98 또는 99% 동일성을 가지며, 그리고 SEQ ID NO: 10의 E492에 상응하는 위치에 A, C, D, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y를 포함하는, 균류 숙주 세포.
18. 제17구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10의 E492에 상응하는 위치에 G, D, F, H, M 또는 R을 포함하는, 균류 숙주 세포.
19. 제18구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 98% 동일성을 가지며, 그리고 SEQ ID NO: 10의 E492에 상응하는 위치에 G 또는 D를 포함하는, 균류 숙주 세포.
20. 제19구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 98% 동일성을 가지며, 그리고 SEQ ID NO: 10의 E492에 상응하는 위치에 G를 포함하는, 균류 숙주 세포.
21. 제13구현 내지 제20구현 중 어느 한 구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 70% 동일성, 바람직하게 SEQ ID NO: 10과 적어도 75, 80, 85, 90, 91, 92, 93, 95, 96, 97, 98 또는 99% 동일성을 가지며, 그리고 SEQ ID NO: 10의 K574에 상응하는 위치에 A, C, D, E, F, G, H, I, L, M, N, P, Q, R, S, T, V, W 또는 Y를 포함하는, 균류 숙주 세포.
22. 제21구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10의 K574에 상응하는 위치에 H, G, D, F, N, S 또는 Y를 포함하는, 균류 숙주 세포.
23. 제22구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 98% 동일성을 가지며, 그리고 SEQ ID NO: 10의 K574에 상응하는 위치에 D, F, G 또는 H를 포함하는, 균류 숙주 세포.
24. 제23구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 98% 동일성을 가지며, 그리고 SEQ ID NO: 10의 K574에 상응하는 위치에 H를 포함하는, 균류 숙주 세포.
25. 제13구현 내지 제24구현 중 어느 한 구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 70% 동일성, 바람직하게 SEQ ID NO: 10과 적어도 75, 80, 85, 90, 91, 92, 93, 95, 96, 97, 98 또는 99% 동일성을 가지며, 그리고 SEQ ID NO: 10의 Q580에 상응하는 위치에 A, C, D, E, F, G, H, I, K, L, M, N, P, R, S, T, V, W 또는 Y를 포함하는, 균류 숙주 세포.
26. 제25구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10의 Q580에 상응하는 위치에 K 또는 R을 포함하는, 균류 숙주 세포.
27. 제26구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 98% 동일성을 가지며, 그리고 SEQ ID NO: 10의 K573에 상응하는 위치에 K를 포하하는, 균류 숙주 세포.
28. 제13구현 내지 제26구현 중 어느 한 구현에 있어서,
알부민 융합체는 SEQ ID NO: 45의 알부민 변이체를 포함하는, 균류 숙주 세포.
29. 제13구현 내지 제26구현 중 어느 한 구현에 있어서,
알부민 융합체는 SEQ ID NO: 45를 포함하거나 이로 구성되는, 균류 숙주 세포.
30. 제11구현 내지 제29구현 중 어느 한 구현에 있어서,
융합체는 알부민 또는 이의 변이체 또는 단편 또는 융합체가 아닌 융합 파트너를 포함하는, 균류 숙주 세포.
31. 제12구현 내지 제30구현 중 어느 한 구현에 있어서,
융합체는 모노클로날 항체, 에토포시드, 혈청 단백질(혈액 응고 인자와 같은), 안티스타신, 진드기 항응고 펩티드, 트랜스페린, 락토페린, 엔도스타틴, 안지오스타틴, 콜라겐, 면역글로불린 또는 면역글로불린-기반 분자 또는 이의 단편(예, Small Modular ImmunoPharmaceutical™("SMIP") 또는 dAb, Fab' 단편, F(ab')2, scAb, scFv 또는 scFv 단편), 쿠니츠 도메인 단백질(알부민 융합을 갖거나 갖지 않는, WO03/066824(본원에 참고문헌으로 편입됨)에 기재된 것들), 인터페론, 인터루킨, IL-10, IL-11, IL-2, 인터페론 α(알파) 종 및 아종, 인터페론 β(베타) 종 및 아종, 인터페론 γ(감마) 종 및 아종, 렙틴, CNTF, CNTFAx15, IL-1-리셉터 안타고니스트, 에리트로포이에틴(EPO) 및 EPO 모방체(mimics), 트롬보포이에틴(TPO) 및 TPO 모방체, 프로삽티드(prosaptide), 시아노비린-N, 5-헬릭스, T20 펩티드, T1249 펩티드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA, 히루딘, 혈소판 유래 성장인자, 부갑상선 호르몬, 프로인슐린, 인슐린, 글루카곤, 예컨대 엑센딘-4, GLP-1 또는 GLP-2와 같은 글루카곤-유사 펩티드, 인슐린-유사 성장인자, 칼시토닌, 성장 호르몬, 형질전환 성장 인자 β(베타), 종양 괴사인자, G-CSF, GM-CSF, M-CSF, FGF, 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈을 포함하는 프리 및 활성 형태의 응고 인자, 폰 빌레브란트 팩터(von Willebrand's factor), 알파1-안티트립신, 플라스미노겐 활성화제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII, 신경 성장인자, LACI, 혈소판 유래 내피세포 성장인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체 단백질, 인터-알파 트립신 인히비터, 안티트롬빈 III, 아포-리포단백질 종, 단백질 C, 단백질 S, 대사산물, 항생제, 또는 상기의 임의의 변이체 또는 단편으로부터 선택되는 융합 파트너를 포함하는, 균류 숙주 세포.
32. 제30구현 또는 제31구현에 있어서,
융합 파트너는 글루카곤-유사 단백질 또는 이의 유사체를 포함하거나 이로 구성되는, 균류 숙주 세포.
33. 제32구현에 있어서,
융합 파트너는 SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 51, 또는 SEQ ID NO: 52를 포함하거나 이로 구성되는, 균류 숙주 세포.
34. 제9구현 내지 제33구현 중 어느 한 구현에 있어서,
원하는 단백질은 SEQ ID NO: 16을 포함하거나 이로 구성되는, 균류 숙주 세포.
35. 제1구현 내지 제34구현 중 어느 한 구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 변형된 활성 수준 및/또는 발현 수준은 야생형 균류 숙주 세포와 같은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 또는 발현 수준에 상대적인, 균류 숙주 세포.
36. 제35구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 99% 이하로 감소되는, 균류 숙주 세포.
37. 제36구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 95% 이하로 감소되는, 균류 숙주 세포.
38. 제37구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 90% 이하로 감소되는, 균류 숙주 세포.
39. 제38구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 80% 이하로 감소되는, 균류 숙주 세포.
40. 제39구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 70% 이하로 감소되는, 균류 숙주 세포.
41. 제40구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 60% 이하로 감소되는, 균류 숙주 세포.
42. 제41구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 50% 이하로 감소되는, 균류 숙주 세포.
43. 제42구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 40% 이하로 감소되는, 균류 숙주 세포.
44. 제43구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 30% 이하로 감소되는, 균류 숙주 세포.
45. 제44구현에 있어서,
Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Gsh1 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 실질적으로 0%로 감소되는, 균류 숙주 세포.
46. 제1구현 내지 제45구현 중 어느 한 구현에 있어서,
숙주 세포는 기능성 GSH1 유전자 또는 이의 호모로그, 또는 기능성 Gsh1 단백질 또는 이의 호모로그가 결여된, 균류 숙주 세포.
47. 제1구현 내지 제46구현 중 어느 한 구현에 있어서,
숙주 세포는 GSH1 유전자 또는 이의 호모로그, 또는 Gsh1 단백질 또는 이의 호모로그가 결여된, 균류 숙주 세포.
48. 제1구현 내지 제47구현 중 어느 한 구현에 있어서,
Gsh1 단백질 또는 이의 호모로그는 SEQ ID NO: 2의 47, 48, 49, 50, 51, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 409, 451, 452, 453, 454 및 455로부터 선택된 위치에 상응하는 위치에 돌연변이를 포함하는, 균류 숙주 세포.
49. 제48구현에 있어서,
위치는 SEQ ID NO: 2의 R125에 상응하는, 균류 숙주 세포.
50. 제48구현 또는 제49구현에 있어서,
위치는 SEQ ID NO: 2의 H409에 상응하는, 균류 숙주 세포.
51. 제48구현 내지 제50구현 중 어느 한 구현에 있어서,
위치는 SEQ ID NO: 2의 P453에 상응하는, 균류 숙주 세포.
52. 제48구현 내지 제51구현 중 어느 한 구현에 있어서,
돌연변이는 치환, 바람직하게 비-보존 아미노산으로의 치환인, 균류 숙주 세포.
53. 제52구현에 있어서,
SEQ ID NO: 2의 위치 125에 상응하는 위치에서의 돌연변이는 A, C, D, E, F, G, H, I, L, M, N, P, Q, S, T, V, W 또는 Y로의 치환, 바람직하게 C, D, E 또는 G로의 치환, 보다 바람직하게 G로의 치환인, 균류 숙주 세포.
54. 제48구현 내지 제53구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 125에 상응하는 위치에서의 돌연변이는 양으로 하전된 아미노산에서 지방족, 방향족, 소수성, 소(small), 아주 작은(tiny), 극성 또는 음으로 하전된 아미노산으로의 치환, 바람직하게는 음으로 하전된 아미노산의 아주 작은 아미노산으로의 치환인, 균류 숙주 세포.
55. 제48구현 내지 제54구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 D49에 상응하는 위치에서의 돌연변이는 A, C, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y로의 치환, 바람직하게 H, K 또는 R로의 치환, 보다 바람직하게 K 또는 R로의 치환인, 균류 숙주 세포.
56. 제48구현 내지 제55구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 49에 상응하는 위치에서의 돌연변이는 음으로 하전된 아미노산에서 양으로 하전된 아미노산으로인, 균류 숙주 세포.
57. 제48구현 내지 제56구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 H409에 상응하는 위치에서 돌연변이는 A, C, D, E, F, G, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y, 바람직하게 A, I, L, V, M, F, W, Y, 보다 바람직하게 A, I, L, V, 가장 바람직하게 L로의 치환인, 균류 숙주 세포.
58. 제48구현 내지 제57구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 H409에 상응하는 위치에서 돌연변이는 방향족 아미노산에서 지방족 아미노산으로인, 균류 숙주 세포.
59. 제48구현 내지 제58구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 P453에 상응하는 위치에서 돌연변이는 A, C, D, E, F, G, H, I, K, L, M, N, Q, R, S, T, V, W 또는 Y, 바람직하게 A, I, L, V, M, F, W, Y, 보다 바람직하게 A, I, L, V, 가장 바람직하게 L로의 치환인, 균류 숙주 세포.
60. 제48구현 내지 제59구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 P453에 상응하는 위치에서 돌연변이는 방향족 아미노산에서 지방족 아미노산으로인, 균류 숙주 세포.
61. 제1구현 내지 제60구현 중 어느 한 구현에 있어서,
Gsh1 단백질은 SEQ ID NO: 4를 포함하거나 이로 구성되는, 균류 숙주 세포.
62. 제1구현 내지 제61구현 중 어느 한 구현에 있어서,
변형된 GSH1 유전자, 예를 들어 SEQ ID NO: 4를 코딩하는 폴리뉴클레오티드를 포함하는, 균류 숙주 세포.
63. 제5구현 내지 제62구현 중 어느 한 구현에 있어서,
Not4 단백질 또는 이의 호모로그의 변형된 활성 수준 또는 발현 수준은 야생형 균류 숙주 세포와 같은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 또는 발현 수준에 상대적인, 균류 숙주 세포.
64. 제63구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 90% 이하로 감소되는, 균류 숙주 세포.
65. 제64구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 80% 이하로 감소되는, 균류 숙주 세포.
66. 제65구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 70% 이하로 감소되는, 균류 숙주 세포.
67. 제66구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 60% 이하로 감소되는, 균류 숙주 세포.
68. 제67구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 50% 이하로 감소되는, 균류 숙주 세포.
69. 제68구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 40% 이하로 감소되는, 균류 숙주 세포.
70. 제69구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 30% 이하로 감소되는, 균류 숙주 세포.
71. 제70구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 20% 이하로 감소되는, 균류 숙주 세포.
72. 제71구현에 있어서,
Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준은 모균류 숙주 세포의 Not4 단백질 또는 이의 호모로그의 활성 수준 및/또는 발현 수준의 실질적으로 0%로 감소되는, 균류 숙주 세포.
73. 제5구현 내지 제72구현 중 어느 한 구현에 있어서,
숙주 세포는 기능성 NOT4 유전자 또는 이의 호모로그, 또는 기능성 Not4 단백질 또는 이의 호모로그가 결여된, 균류 숙주 세포.
74. 제5구현 내지 제73구현 중 어느 한 구현에 있어서,
숙주 세포는 NOT4 유전자 또는 이의 호모로그, 또는 Not4 단백질 또는 이의 호모로그가 결여된, 균류 숙주 세포.
75. 제5구현 내지 제74구현 중 어느 한 구현에 있어서,
NOT4 유전자 또는 이의 호모로그, 또는 Not4 단백질 또는 이의 호모로그는 Not4 단백질 또는 이의 호모로그와 Not1 단백질 또는 이의 호모로그의 상호작용을 변경시키도록 돌연변이되는, 균류 숙주 세포.
76. 제5구현 내지 제75구현 중 어느 한 구현에 있어서,
Not4 단백질 또는 이의 호모로그는 SEQ ID NO: 6의 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469 또는 470으로부터 선택된 위치에 상응하는 위치에 돌연변이를 포함하는, 균류 숙주 세포.
77. 제76구현에 있어서,
위치는 SEQ ID NO: 6의 429, 430, 434, 또는 437에 상응하는 위치로부터 선택되는, 균류 숙주 세포.
78. 제76구현 또는 제77구현에 있어서,
위치는 SEQ ID NO: 6의 463, 464 또는 466에 상응하는 위치로부터 선택되는, 균류 숙주 세포.
79. 제76구현 내지 제78구현 중 어느 한 구현에 있어서,
위치는 SEQ ID NO: 6의 442, 445, 447 또는 452에 상응하는 위치로부터 선택되는, 균류 숙주 세포.
80. 제76구현 내지 제79구현 중 어느 구현에 있어서,
위치는 SEQ ID NO: 6의 442, 445, 447 또는 452에 상응하는 위치로부터 선택되는, 균류 숙주 세포.
81. 제76구현 내지 제80구현 중 어느 한 구현에 있어서,
SEQ ID NO: 6의 위치 429에 상응하는 위치에서 돌연변이는 A, C, D, E, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y, 바람직하게 G, A, V, L 또는 I, 보다 바람직하게 I, L 또는 V, 가장 바람직하게 I로의 치환인, 균류 숙주 세포.
82. 제76구현 내지 제81구현 중 어느 한 구현에 있어서,
SEQ ID NO: 6의 위치 429에 상응하는 위치에서 돌연변이는 방향족 아미노산에서 지방족 아미노산으로의 치환인, 균류 숙주 세포.
83. 제76구현 내지 제82구현 중 어느 한 구현에 있어서,
Not4 단백질은 SEQ ID NO: 8을 포함하거나 이로 구성되는, 균류 숙주 세포.
84. 제1구현 내지 제83구현 중 어느 한 구현에 있어서,
변형된 NOT4 유전자, 예를 들어 SEQ ID NO: 8을 코딩하는 폴리뉴클레오티드를 포함하는, 균류 숙주 세포.
85. 제1구현 내지 제84구현 중 어느 한 구현에 있어서,
숙주 세포는 NOT4 유전자 또는 이의 호모로그, 또는 Not4 단백질 또는 이의 호모로그가 결여된, 균류 숙주 세포.
86. 제1구현 내지 제85구현 중 어느 한 구현에 있어서,
하기의 샤페론 중 하나 이상이 과발현되는, 균류 숙주 세포.
AHA1, CCT2, CCT3, CCT4, CCT5, CCT6, CCT7, CCT8, CNS1, CPR3, CPR6, ERO1, EUG1, FMO1, HCH1, HSP10, HSP12, HSP104, HSP26, HSP30, HSP42, HSP60, HSP78, HSP82, JEM1, MDJ1, MDJ2, MPD1, MPD2, PDI1, PFD1, ABC1, APJ1, ATP11, ATP12, BTT1, CDC37, CPR7, HSC82, KAR2, LHS1, MGE1, MRS11, NOB1, ECM10, SSA1, SSA2, SSA3, SSA4, SSC1, SSE2, SIL1, SLS1, ORM1, ORM2, PER1, PTC2, PSE1, UBI4HAC1 또는 트렁케이티드 인트론리스 HAC1, TIM9, PAM18, TCP1 또는 이의 변이체.
87. 제1구현 내지 제86구현 중 어느 한 구현에 있어서,
KEX2, 또는 이의 변이체 또는 단편이 발현되거나 과발현되는, 균류 숙주 세포.
88. 제86구현 또는 제87구현에 있어서,
PDI1 또는 이의 변이체가 과발현되거나, 또는 ERO1 또는 이의 변이체가 과발현되는, 균류 숙주 세포.
89. 제86구현 또는 제87구현에 있어서,
PDI1 또는 이의 변이체가 과발현되며, ERO1 또는 이의 변이체가 과발현되는, 균류 숙주 세포.
90. 제86구현 또는 제87구현에 있어서,
PDI1 또는 이의 변이체가 과발현되며, KEX2 또는 이의 변이체가 발현되거나 과발현되는, 균류 숙주 세포.
91. 제86구현 또는 제87구현에 있어서,
ERO1 또는 이의 변이체가 과발현되고, KEX2 또는 이의 변이체가 발현되거나 과발현되는, 균류 숙주 세포.
92. 제86구현 또는 제91구현 중 어느 한 구현에 있어서,
PDI1 또는 이의 변이체가 과발현되며, ERO1 또는 이의 변이체가 과발현되며, 그리고 KEX2 또는 이의 변이체가 발현되거나 과발현되는, 균류 숙주 세포.
93. 제1구현 내지 제92구현 중 어느 한 구현에 있어서,
균류 숙주는 효모 또는 사상균류인, 균류 숙주 세포.
94. 제1구현 내지 제93구현 중 어느 한 구현에 있어서,
숙주 세포는 사카로마이세스(Saccharomyces), 칸디다(Candida), 한세눌라(Hansenula), 클루이로마이세스(Kluyveromyces), 피키아(Pichia), 사카로마이세스(Saccharomyces), 쉬조사카로마이세스(Schizosaccharomyces), 또는 야로위아(Yarrowia)인, 균류 숙주 세포.
95. 제94구현에 있어서,
사카로마이세스(Saccharomyces)는 사카로마이세스 카를스베르겐시스(Saccharomyces carlsbergensis), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 사카로마이세스 디아스타티쿠스(Saccharomyces diastaticus), 사카로마이세스 더글라시(Saccharomyces douglasii), 사카로마이세스 클루이베리(Saccharomyces kluyveri), 사카로마이세스 노르벤시스(Saccharomyces norbensis), 사카로미세스 오비포르미스(Saccharomyces oviformis)이며, 바람직하게 사카로마이세스 세레비지애(Saccharomyces cerevisiae)인, 균류 숙주 세포.
96. 균류 숙주 세포가 감소된 활성 수준 및 발현 수준의 Gsh1 단백질 또는 이의 호모로그를 갖는 것을 특징으로 하는, 이종 단백질과 같은 원하는 단백질을 코딩하는 폴리뉴클레오티드 서열을 함유하는, 균류 숙주 세포의 배양물.
97. 제96항에 있어서,
감소된 활성 수준 및/또는 발현 수준의 Not4 단백질 또는 이의 호모로그를 갖는, 균류 숙주 세포의 배양물.
98. 제96구현 또는 제97구현에 있어서,
숙주 세포는 제1구현 내지 제95구현 중 어느 한 구현에 정의된 바와 같은, 균류 숙주 세포의 배양물.
99. a. 제1구현 내지 제94구현 중 어느 한 구현에 따른 균류 숙주 세포 또는 제96구현 내지 제98구현 중 어느 한 구현에 따른 배양물을 제공하는 단계,
b. 균류 숙주 세포 또는 배양물을 배양하여 원하는 단백질을 생산하는 단계,
c. 선택적으로 원하는 단백질을 회수하는 단계,
d. 선택적으로 원하는 단백질을 정제하는 단계,
e. 선택적으로 원하는 단백질을 치료적으로 허용되는 캐리어 또는 희석제와 제형화하여, 이에 의해 인간 또는 동물에 투여하기에 적절한 치료 제품을 생산하는 단계, 및
f. 선택적으로 원하는 단백질을 단위 투여량 형태로 제공하는 단계
를 포함하는 균류 숙주 세포로부터, 이종 단백질과 같은 원하는 단백질을 생산하는 방법.
100. a. 제1구현 내지 제94구현 중 어느 한 구현에 따른 균류 숙주 세포와 같은, 변형된
1. Gsh1 단백질 또는 이의 호모로그, 및/또는
2. 활성(바람직하게 감소된) 수준의 Gsh1 단백질 또는 이의 호모로그, 및/또는
3. GSH1 유전자 또는 이의 호모로그, 및/또는
4. 발현(바람직하게 감소된) 수준의 GSH1 유전자 또는 이의 호모로그
를 갖는 (효모 또는 사상균류와 같은) 균류 숙주 세포를 제공하는 단계,
b. 숙주 세포를 배양하여 원하는 단백질을 생산하는 단계, 및
c. 선택적으로 원하는 단백질을 회수하는 단계,
d. 선택적으로 원하는 단백질을 정제하는 단계,
e. 선택적으로 원하는 단백질을 치료적으로 허용되는 캐리어 또는 희석제와 제형화하여, 이에 의해 인간 또는 동물에 투여하기에 적절한 치료 제품을 생산하는 단계,
f. 선택적으로 원하는 단백질을 단위 투여량 형태로 제공하는 단계
를 포함하는 (이종 단백질과 같은) 원하는 단백질의 수율을 증가시키는 방법.
101. 제99구현 또는 제100구현에 있어서,
배양은 글루타티온의 존재하에 존재하는, 방법.
102. 제101구현에 있어서,
글루타티온은 적어도 0.05mM로 존재하는, 방법.
103. 제102구현에 있어서,
글루타티온은 약 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450mM 내지 약 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500mM로 존재하는, 방법.
104. 제103구현에 있어서,
글루타티온은 약 1 내지 약 10mM로 존재하는, 방법.
105. 제104구현에 있어서,
글루타티온은 약 3 내지 약 7mM로 존재하는, 방법.
106. 제105구현에 있어서,
글루타티온은 약 5mM로 존재하는, 방법.
107. 제99구현 내지 제106구현 중 어느 한 구현에 있어서,
원하는 단백질의 수율은 SEQ ID NO: 2와 같은 야생형 Gsh1 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 2% 더 높은, 방법.
108. 제107구현에 있어서,
수율은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 3, 4, 5, 6, 7, 8, 9, 10, 12.5, 15, 17.5, 20, 22.5, 25, 27.5, 30, 35, 40, 45, 또는 적어도 50% 더 높은, 방법.
109. 제107구현 또는 제108구현에 있어서,
원하는 단백질의 수율은 SEQ ID NO: 2의 Gsh1 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 2% 더 높은, 방법.
110. 제109구현에 있어서,
수율은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 3, 4, 5, 6, 7, 8, 9, 10, 12.5, 15, 17.5, 20, 22.5, 25, 27.5, 30, 35, 40, 45, 또는 적어도 50% 더 높은, 방법.
111. 제99구현 내지 제110구현 중 어느 한 구현에 있어서,
균류 숙주 세포는 제5구현 내지 제95구현 중 어느 한 구현에 따른 균류 숙주 세포와 같은, 변형된
1. Not4 단백질 또는 이의 호모로그, 및/또는
2. 활성(바람직하게 감소된) 수준의 Not4 단백질 또는 이의 호모로그, 및/또는
3. NOT4 유전자 또는 이의 호모로그, 및/또는
4. 발현(바람직하게 감소된) 수준의 NOT4 유전자 또는 이의 호모로그
를 갖는, 방법.
112. 제111구현에 있어서,
원하는 단백질의 수율은 SEQ ID NO: 6과 같은 야생형 Not4 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 2% 더 높은, 방법.
113. 제112구현에 있어서,
수율은 SEQ ID NO: 6과 같은 야생형 Not4 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 3, 4, 5, 6, 7, 8, 9, 10, 12.5, 15, 17.5, 20, 22.5, 25, 27.5, 30, 35, 40, 45, 또는 적어도 50% 더 높은, 방법.
114. 제111구현 내지 제113구현 중 어느 한 구현에 있어서,
원하는 단백질의 수율은 SEQ ID NO: 2의 Gsh1 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 2% 더 높은, 방법.
115. 제114구현에 있어서,
수율은 SEQ ID NO: 2의 Gsh1 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 3, 4, 5, 6, 7, 8, 9, 10, 12.5, 15, 17.5, 20, 22.5, 25, 27.5, 30, 35, 40, 45, 또는 적어도 50% 더 높은, 방법.
116. 제111구현 내지 제115구현 중 어느 한 구현에 있어서,
원하는 단백질의 수율은 SEQ ID NO: 2의 Gsh1 단백질 및 SEQ ID NO: 6의 Not4 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 2% 더 높은, 방법.
117. 제116구현에 있어서,
원하는 단백질의 수율은 SEQ ID NO: 2의 Gsh1 단백질 및 SEQ ID NO: 6의 Not4 단백질을 갖는 균류 숙주 세포와 같은 레퍼런스 균류 숙주 세포로부터의 수율보다 적어도 3, 4, 5, 6, 7, 8, 9, 10, 12.5, 15, 17.5, 20, 22.5, 25, 27.5, 30, 35, 40, 45, 또는 적어도 50% 더 높은, 방법.
118. 제99구현 내지 제117구현 중 어느 한 구현에 있어서,
원하는 단백질은 알부민, 모노클로날 항체, 에토포시드, 혈청 단백질(혈액 응고 인자와 같은), 안티스타신, 진드기 항응고 펩티드, 트랜스페린, 락토페린, 엔도스타틴, 안지오스타틴, 콜라겐, 면역글로불린 또는 면역글로불린-기반 분자 또는 이의 단편(예, Small Modular ImmunoPharmaceutical™("SMIP") 또는 dAb, Fab' 단편, F(ab')2, scAb, scFv 또는 scFv 단편), 쿠니츠 도메인 단백질(알부민 융합을 갖거나 갖지 않는, WO03/066824(본원에 참고문헌으로 편입됨)에 기재된 것들), 인터페론, 인터루킨, IL-10, IL-11, IL-2, 인터페론 α(알파) 종 및 아종, 인터페론 β(베타) 종 및 아종, 인터페론 γ(감마) 종 및 아종, 렙틴, CNTF, CNTFAx15, IL-1-리셉터 안타고니스트, 에리트로포이에틴(EPO) 및 EPO 모방체(mimics), 트롬보포이에틴(TPO) 및 TPO 모방체, 프로삽티드(prosaptide), 시아노비린-N, 5-헬릭스, T20 펩티드, T1249 펩티드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA, 히루딘, 혈소판 유래 성장인자, 부갑상선 호르몬, 프로인슐린, 인슐린, 글루카곤, 예컨대 엑센딘-4, GLP-1 또는 GLP-2와 같은 글루카곤-유사 펩티드, 인슐린-유사 성장인자, 칼시토닌, 성장 호르몬, 형질전환 성장 인자 β(베타), 종양 괴사인자, G-CSF, GM-CSF, M-CSF, FGF, 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈을 포함하는 프리 및 활성 형태의 응고 인자, 폰 빌레브란트 팩터(von Willebrand's factor), 알파1-안티트립신, 플라스미노겐 활성화제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII, 신경 성장인자, LACI, 혈소판 유래 내피세포 성장인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체 단백질, 인터-알파 트립신 인히비터, 안티트롬빈 III, 아포-리포단백질 종, 단백질 C, 단백질 S, 대사산물, 항생제, 또는 상기의 임의의 변이체 또는 단편으로부터 선택되는, 방법.
119. 제99구현 내지 제118구현 중 어느 한 구현에 있어서,
원하는 단백질은 알부민 또는 이의 변이체, 단편 및/또는 융합체를 포함하거나 이로 구성되는, 방법.
120. 제119구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 70% 동일성을 갖는, 방법.
121. 제120구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 75, 80, 85, 90, 91, 92, 93, 95, 96, 97, 98 또는 99% 동일성을 갖는, 방법.
122. 제121구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 70% 동일성, 바람직하게 SEQ ID NO: 10과 적어도 75, 80, 85, 90, 91, 92, 93, 95, 96, 97, 98 또는 99% 동일성을 가지며, 그리고 SEQ ID NO: 10의 K573에 상응하는 위치에 A, C, D, E, F, G, H, I, L, M, N, P, Q, R, S, T, V, W 또는 Y를 포함하는, 방법.
123. 제122구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10에 상응하는 위치에 P, H, W 또는 Y를 포함하는, 방법.
124. 제123구현에 있어서,
알부민 또는 이의 변이체, 단편 및/또는 융합체는 SEQ ID NO: 10과 적어도 98% 동일성을 가지며, 그리고 SEQ ID NO: 10의 K573에 상응하는 위치에 P를 포함하는, 방법.
125. 제119구현 내지 제124구현 중 어느 한 구현에 있어서,
융합체는 알부민 또는 이의 변이체, 단편 및/또는 융합체가 아닌 융합 파트너를 포함하는, 방법.
126. 제120구현 내지 제125구현 중 어느 한 구현에 있어서,
융합체는 모노클로날 항체, 에토포시드, 혈청 단백질(혈액 응고 인자와 같은), 안티스타신, 진드기 항응고 펩티드, 트랜스페린, 락토페린, 엔도스타틴, 안지오스타틴, 콜라겐, 면역글로불린 또는 면역글로불린-기반 분자 또는 이의 단편(예, Small Modular ImmunoPharmaceutical™("SMIP") 또는 dAb, Fab' 단편, F(ab')2, scAb, scFv 또는 scFv 단편), 쿠니츠 도메인 단백질(알부민 융합을 갖거나 갖지 않는, WO03/066824(본원에 참고문헌으로 편입됨)에 기재된 것들), 인터페론, 인터루킨, IL-10, IL-11, IL-2, 인터페론 α(알파) 종 및 아종, 인터페론 β(베타) 종 및 아종, 인터페론 γ(감마) 종 및 아종, 렙틴, CNTF, CNTFAx15, IL-1-리셉터 안타고니스트, 에리트로포이에틴(EPO) 및 EPO 모방체(mimics), 트롬보포이에틴(TPO) 및 TPO 모방체, 프로삽티드(prosaptide), 시아노비린-N, 5-헬릭스, T20 펩티드, T1249 펩티드, HIV gp41, HIV gp120, 유로키나아제, 프로유로키나아제, tPA, 히루딘, 혈소판 유래 성장인자, 부갑상선 호르몬, 프로인슐린, 인슐린, 글루카곤, 예컨대 엑센딘-4, GLP-1 또는 GLP-2와 같은 글루카곤-유사 펩티드, 인슐린-유사 성장인자, 칼시토닌, 성장 호르몬, 형질전환 성장 인자 β(베타), 종양 괴사인자, G-CSF, GM-CSF, M-CSF, FGF, 이에 한정하는 것은 아니나 플라스미노겐, 피브리노겐, 트롬빈, 프리-트롬빈, 프로-트롬빈을 포함하는 프리 및 활성 형태의 응고 인자, 폰 빌레브란트 팩터(von Willebrand's factor), 알파1-안티트립신, 플라스미노겐 활성화제, 팩터 VII, 팩터 VIII, 팩터 IX, 팩터 X 및 팩터 XIII, 신경 성장인자, LACI, 혈소판 유래 내피세포 성장인자(PD-ECGF), 글루코즈 옥시다아제, 혈청 콜린에스테라아제, 아프로티닌, 아밀로이드 전구체 단백질, 인터-알파 트립신 인히비터, 안티트롬빈 III, 아포-리포단백질 종, 단백질 C, 단백질 S, 대사산물, 항생제, 또는 상기의 임의의 변이체 또는 단편으로부터 선택되는, 융합 파트너를 포함하는, 방법.
127. 제126구현에 있어서,
융합 파트너는 글루카곤-유사 단백질 또는 이의 유사체를 포함하거나 이로 구성되는, 방법.
128. 제127구현에 있어서,
융합 파트너는 of SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 51, 또는 SEQ ID NO: 52를 포함하거나 이로 구성되는, 방법.
129. 제118구현 내지 제128구현 중 어느 한 구현에 있어서,
원하는 단백질은 SEQ ID NO: 16을 포함하거나 이로 구성되는, 방법.
130. 제99구현 내지 제128구현 중 어느 한 구현에 있어서,
숙주 세포는 적어도 1L의 스케일로 배양되는, 방법.
131. 제130구현에 있어서,
숙주 세포는 적어도 2L의 스케일로 배양되는, 방법.
132. 제131구현에 있어서,
숙주 세포는 적어도 5L의 스케일로 배양되는, 방법.
133. 제132구현에 있어서,
숙주 세포는 적어도 10L의 스케일로 배양되는, 방법.
134. 제133구현에 있어서,
숙주 세포는 적어도 1000L의 스케일로 배양되는, 방법.
135. 제134구현에 있어서,
숙주 세포는 적어도 5000L의 스케일로 배양되는, 방법.
136. 제99구현 내지 제135구현 중 어느 한 구현에 있어서,
원하는 단백질은 균류 숙주 세포로부터 선택되는, 방법.
137. 제136구현에 있어서,
원하는 단백질은 신호 펩티드를 포함하는 미성숙 단백질로부터 생기는, 방법.
138. 제137구현에 있어서,
신호 펩티드는 SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 41 또는 SEQ ID NO: 42 또는 SEQ ID NO: 20의 펜타펩티드를 포함하는 신호 펩티드를 포함하거나 이로 구성되는, 방법.
139. 제138구현에 있어서,
신호 펩티드는 SEQ ID NO: 19를 포함하거나 이로 구성되는, 방법.
140. 제138구현에 있어서,
신호 펩티드는 SEQ ID NO: 24를 포함하거나 이로 구성되는, 방법.
141. 제138구현에 있어서,
신호 펩티드는 SEQ ID NO: 42를 포함하거나 이로 구성되는, 방법.
142. 제99구현 내지 제135구현 중 어느 한 구현에 있어서,
원하는 단백질은 세포내(intracellular)인, 방법.
143. 제99구현 내지 제142구현 중 어느 한 구현에 따른 방법에 의해 생산된 (이종 단백질과 같은) 원하는 단백질.
144. 제143구현에 있어서,
예방, 치료 또는 진단용인, 원하는 단백질.
145. 제143구현 또는 제144구현에 따른 원하는 단백질 및 약학적으로 허용되는 캐리어를 포함하는 약학 조성물과 같은 조성물.
146. 제143구현 또는 제144구현의 원하는 단백질 또는 제145구현의 조성물을 환자에게 투여하는 것을 포함하는 치료방법.
147. 제1구현 내지 제95구현 중 어느 한 구현에 따른 균류 숙주 세포 또는 제96구현 내지 제98구현 중 어느 구현에 따른 배양물을 제조하는 방법으로서,
상기 방법은 (모)균류 숙주 세포를 유전적으로 변형하여 Gsh1 단백질 또는 이의 호모로그의 발현 수준 및/또는 활성 수준을 감소시키는 것을 포함하는, 방법.
148. 제147구현에 있어서,
(모)균류 숙주 세포를 유전적으로 변형하여 Not4 단백질 또는 이의 호모로그의 발현 수준 및/또는 활성 수준을 감소시키는 것을 추가로 포함하는, 방법.
149. 예를 들어: GSH1 유전자를 돌연변이시키거나 결실시켜, 이에 따라 돌연변이된 Gsh1 단백질 또는 이의 호모로그 또는 Gsh1 단백질 또는 이의 호모로그의 완전한 부재를 발생시킴으로써; 상기 유전자의 오픈 리딩 프래임을 제거 또는 변화시킴으로써; 프로모터 서열 및/또는 종결자 서열과 같은 GSH1 유전자의 조절 서열을 돌연변이시키거나 변화시킴으로써; 예를 들어, 안티센스 mRNA와 같은 적절한 간섭 RNA를 도입시킴으로써, 적절한 전사 활성자 유전자를 도입, 조절 또는 변형시킴으로써 또는 Gsh1 단백질 또는 이의 호모로그의 활성 수준을 차단하는 제제를 도입함으로써 GSH1 유전자의 전사를 차단 또는 감소시킴으로써, 균류 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 발현 수준 및/또는 활성 수준을 감소시키는 수단을, 균류 숙주 세포로부터 (이종 단백질과 같은) 원하는 단백질의 수율을 증가시키기 위해 사용하는 용도.
150. 예를 들어: GSH1 유전자를 돌연변이시키거나 결실시키고 NOT4 유전자를 돌연변이시키거나 결실시켜, 이에 따라 돌연변이된 Gsh1 단백질 또는 이의 호모로그 또는 Gsh1 단백질 또는 이의 호모로그의 완전한 부재를 발생시키고, 돌연변이된 Not4 단백질 또는 이의 호모로그 또는 Not4 단백질 또는 이의 호모로그의 완전한 부재를 발생시킴으로써; 상기 유전자의 오픈 리딩 프래임을 제거 또는 변화시킴으로써; 프로모터 서열 및/또는 종결자 서열과 같은 GSH1 및/또는 NOT4 유전자의 조절 서열을 돌연변이시키거나 변화시킴으로써; 예를 들어, 안티센스 mRNA와 같은 적절한 간섭 RNA를 도입시킴으로써 GSH1 및/또는 NOT4 유전자의 전사를 차단 또는 감소시킴으로써; 적절한 전사 활성자 유전자를 도입, 조절 또는 변형시킴으로써 또는 Gsh1 단백질 또는 이의 호모로그 및/또는 Not4 단백질 또는 이의 호모로그의 활성 수준을 차단하는 제제를 도입함으로써, 균류 숙주 세포에서 Gsh1 단백질 또는 이의 호모로그의 발현 수준 및/또는 활성 수준을 감소시키고, Not4 단백질 또는 이의 호모로그의 활성 수준을 감소시키는 수단을, 균류 숙주 세포로부터 (이종 단백질과 같은) 원하는 단백질의 수율을 증가시키기 위해 사용하는 용도.
151. SEQ ID NO: 2와 적어도 50% 동일성 및 SEQ ID NO: 2의 47, 48, 49, 50, 51, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 409, 451, 452, 453, 454 및 455로부터 선택된 하나 이상의 위치에 상응하는 위치에서의 돌연변이를 포함하는, Gsh1 단백질 또는 이의 호모로그.
152. 제151구현에 있어서,
위치는 SEQ ID NO: 2의 R125에 상응하는, Gsh1 단백질 또는 이의 호모로그.
153. 제151구현 또는 제152구현에 있어서,
위치는 SEQ ID NO: 2의 H409에 상응하는, Gsh1 단백질 또는 이의 호모로그.
154. 제151구현 내지 제153구현 중 어느 한 구현에 있어서,
위치는 SEQ ID NO: 2의 P453에 상응하는, Gsh1 단백질 또는 이의 호모로그.
155. 제151구현 내지 제154구현 중 어느 한 구현에 있어서,
돌연변이는 치환, 바람직하게 비-보존 아미노산으로의 치환인, Gsh1 단백질 또는 이의 호모로그.
156. 제152구현 내지 제155구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 R125에 상응하는 위치에서 돌연변이는 A, C, D, E, F, G, H, I, L, M, N, P, Q, S, T, V, W 또는 Y, 바람직하게 C, D, E 또는 G, 보다 바람직하게 G로의 치환인, Gsh1 단백질 또는 이의 호모로그.
157. 제151구현 내지 제156구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 R125에 상응하는 위치에서 돌연변이는 양으로 하전된 아미노산의 지방족, 방향족, 소수성, 소(small), 아주 작은(tiny), 극성 또는 음으로 하전된 아미노산으로의, 바람직하게는 음으로 하전된 아미노산의 아주 작은 아미노산으로의 치환인, Gsh1 단백질 또는 이의 호모로그.
158. 제151구현 내지 제157구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 D49에 상응하는 위치에서 돌연변이는 A, C, F, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y, 바람직하게 H, K 또는 R, 보다 바람직하게 K 또는 R로의 치환인, Gsh1 단백질 또는 이의 호모로그.
159. 제151구현 내지 제158구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 49에 상응하는 위치에서 돌연변이는 음으로 하전된 아미노산에서 양으로 하전된 아미노산으로인, Gsh1 단백질 또는 이의 호모로그.
160. 제151구현 내지 제159구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 H409에 상응하는 위치에서 돌연변이는 A, C, D, E, F, G, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y, 바람직하게 A, I, L, V, M, F, W, Y, 보다 바람직하게 A, I, L, V, 가장 바람직하게 L로의 치환인, Gsh1 단백질 또는 이의 호모로그.
161. 제151구현 내지 제160구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 H409에 상응하는 위치에서 돌연변이는 방향족 아미노산에서 지방족 아미노산으로인, Gsh1 단백질 또는 이의 호모로그.
162. 제151구현 내지 제161구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 P453에 상응하는 위치에서 돌연변이는 A, C, D, E, F, G, H, I, K, L, M, N, Q, R, S, T, V, W 또는 Y, 바람직하게 A, I, L, V, M, F, W, Y, 보다 바람직하게 A, I, L, V, 가장 바람직하게 L로의 치환인, Gsh1 단백질 또는 이의 호모로그.
163. 제151구현 내지 제162구현 중 어느 한 구현에 있어서,
SEQ ID NO: 2의 위치 P453에 상응하는 위치에서 돌연변이는 방향족 아미노산에서 지방족 아미노산으로인, Gsh1 단백질 또는 이의 호모로그.
164. 제151구현 내지 제163구현 중 어느 한 구현에 있어서,
SEQ ID NO: 4를 포함하거나 이로 구성되는, Gsh1 단백질 또는 이의 호모로그.
본 발명은 이제 하기 비제한적인 실시예를 참조하여 기술된다.
실시예
실시예 1: 사카로마이세스 세레비지애( Saccharomyces cerevisiae ) GSH1 유전자의 돌연변이
S. 세레비지애(S. cerevisiae) DP9는 PDI1, 상기 PDI1 유전자좌에 통합된 URA3 및 YIplac211를 갖는 유전자형 cir° MATa, leu2-3, leu2-112 ubc4 ura3 yap3::URA3 lys2 hsp150:LYS2 을 갖는다(Finnis et al, 2010, Microbial Cell Factories 9: 87). 본 발명자들은 S. 세레비지애(S. cerevisiae) DP9(알부민-코딩 플라스미드로 형질전환된 경우)가 예를 들어, S. 세레비지애(S. cerevisiae) DB1과 같은 이전의 스트레인보다 더 높은 수율로 재조합 인간 알부민을 생성할 수 있었음을 관찰하였다. S. 세레비지애(S. cerevisiae) DP9의 특성은 GSH1 유전자에서 SNP를 나타내었다. 이 SNP가 S. 세레비지애(S. cerevisiae) DP9의 개선된 단백질 수율에 기여하였는지 확인하기 위해, SNP(A373G)를 하기에 기재된 야생형(즉, 위치 373에서 A)으로 되돌렸다. 결과적으로, 돌연변이 Gsh1 단백질(G125)은 또한 야생형(R125)으로 되돌아갔다. 야생형 GSH1 유전자 및 Gsh1 단백질은 각각 SEQ ID NO: 1 및 SEQ ID NO: 2에 제공된다. 돌연변이(즉, SNP를 함유하는) GSH1 유전자 및 Gsh1 단백질은 각각 SEQ ID NO: 3 및 SEQ ID NO: 4에 제공된다.
S. 세레비지애(S. cerevisiae) GSH1 유전자는 염색체 X에 위치한다. 돌연변이 GSH1 유전자의 SNP(A373G)는 단편을 GSH1 유전자좌에 통합시키는 프로세스에 의해 야생형으로 되돌아왔으며, 이는 염기 373G를 A로 변화시켜 돌연변이 Gsh1 단백질(위치 125에서 G)을 야생형 Gsh1 단백질(위치 125 에서 R)로 되돌렸다.
이는 PCR에 의해 GSH1 오픈 리딩 프레임의 업스트림 영역과 동일한 이들의 5' 말단에 DNA 서열을 포함하는 DNA 프라이머를 갖는 적합한 선택 마커(KanMX)를 먼저 증폭시킴으로써 달성되었다. PCR 프라이머는 MBP267 및 MBP268이었다. KanMX는 제네티신(G418)에 대한 저항성을 부여한다.
프라이머 MBP267:
5'-ATACTATTGTAATTCAAAAAAAAAAAGCGAATCTTCCCATGCCTGTTGCTGCTCTTGAATGGCGAC AGCCTATTGCCCCAGTGTTCCCTCAACAACCTTGCGTACGCTGCAGGTCG-3' (SEQ ID NO: 29)
프라이머 MBP268:
5'-ACAGTTGTAGTCACGTGCGCGCCATGCTGACTAATGGCAGCCGTCGTTGGGCAGAAGAGAATTAGT ATGGTACAGGATACGCTAATTGCGCTCCAACTACATCGATGAATTCGAGCTCG-3' (SEQ ID NO: 30)
플라스미드 pDB5438로부터 KanMX 유전자를 증폭시키기 위해 PCR을 수행하였다(도 2). 조건은 다음과 같다: 제조업체의 지침에 따라, 100ng 플라스미드 pDB5438, 각 프라이머 0.5μM, 0.2μM dNTP, 98℃에서 30초 동안 초기 변성, 98℃에서 10초 동안 35회 사이클, 62℃에서 30초 동안 어닐링, 72℃에서 2분 동안 연장한 후, 72℃에서 4분 동안 최종 연장하고, 4℃로 냉각, Applied Biosystems 2720 Thermal Cycler 및 NEB Q5 Hot Start High-Fidelity DNA Polymerase PCR 키트(M0493S)를 사용, 총 반응 용량 50μL.
산물, 5'-GSH1 5'UTR-KanMX-GSH1 5'UTR-3'은 겔 전기영동으로 분석되었으며, 예상 크기는 약 1.7kb인 것으로 밝혀졌다. 증폭된 PCR 산물을 정제하였다. 정제된 산물을 사용하여 GSH1(즉, SEQ ID NO: 1)에 대해 야생형인 S. 세레비지애(S. cerevisiae) 스트레인을 형질전환시켰다. 형질전환은 형질전환 믹스를 원심분리하는 단계 후에 펠릿을 0.5mL YEPD 배지에 재현탁시킨 다음, 4.5mL YEPD를 함유하는 쉐이크 플라스크로 옮기는 것을 제외하고, 제조사의 지시에 따라 Sigma Yeast Transformation 키트를 사용하여 수행하였다. YEPD(g/L): 10g BactoTM Yeast Extract Technical, 20g BactoTM Peptone, 20g 글루코즈.
쉐이크 플라스크를 쉐이킹(200rpm)하면서 30℃에서 16시간 동안 인큐베이팅하였다. 배양물을 5분 동안 분당 3,000rpm(revolutions per minute)으로 원심분리하고, 상청액을 따라내었다. 이어서, 펠렛을 1M 소르비톨로 세척한 다음, 0.5ml 1M 소르비톨에 재현탁시켰다. 이어서, 약 100㎕를 새로 제조된 G418 아가 플레이트(300㎍/ml G418 최종 농도)상에 플레이팅하고, 4일 동안 30℃에서 페이스-다운 인큐베이팅하였다. G418 아가 플레이트는 다음과 같이 제조하였다: 0.17g 효모 질소 베이스((NH4)2SO4 및 아미노산이 함유되지 않음), 0.1g 글루탐산(모노소듐염, Sigma G-1626) 및 0.069g CSM-Leu 분말을 100ml H2O(관개(irrigration)-비발열성, 저삼투압성을 위한 멸균수)에 용해하고, 및 필터 멸균하였다. 그 후, 1.5g의 Bacto 아가를 첨가하고, 그 병을 찜통에서 1시간 동안 가열한 다음, 워터 배스에서 55℃로 냉각시켰다. 0.6ml 50mg/ml Geneticin(G418) 및 4mL 무균 50% 덱스트로스(w/v)를 첨가하고, 혼합하였다. 혼합물의 분액을 페트리디쉬에 부어 세팅하였다.
게놈 DNA를 G418 저항성 형질전환체로부터 추출하고, 프라이머 MBP288 및 MBP289를 사용하여 제2PCR에서 주형으로 사용하여 KanMX 유전자가 삽입된 GSH1 5'UTR 및 GSH1 ORF의 5' 부분(최대 422 염기)을 함유하는 5'-GSH1 5'UTR-KanMX-GSH1 5'UTR-GSH1 ORF 단편(SEQ ID NO: 31)을 증폭하였다.
프라이머 MBP288: 5' - GATTTTATCGGTCAAAGG - 3' (SEQ ID NO: 32)
프라이머 MBP289: 5' - CTATCTTGTCTCGCATATTC - 3' (SEQ ID NO: 33)
PCR 재료, 방법 및 조건은, 1㎕ 게놈 DNA를 사용하고, 어닐링 온도가 55℃이고, 연장 시간이 각 사이클에서 3분, 최종적으로 7분인 것을 제외하고는, 상술한 바와 같다. 산물을 겔 전기영동에 의해 분석하였으며, 대략 2.9kb인 예상 크기인 것으로 밝혀졌다. 증폭된 PCR 산물을 제조사의 지시에 따라 QIAGEN QIAquick PCR 정제 키트를 사용하여 정제하였다. 정제된 산물을 사용하여 상기 형질전환 방법을 사용하여 DP9[pDB2305](도 3)를 형질전환시켰다. S. 세레비지애(S. cerevisiae) DP9는 GSH1 SNP(R125G를 형성하는 A373G)를 함유하는 스트레인이다. pDB2305는 인간 알부민의 발현을 위한 플라스미드이다(도 3). G418 아가 플레이트에서의 성장 및 선택은 상기한 바와 같다. 게놈 DNA를 내성 콜로니로부터 추출하고, 프라이머 MBP290 및 MBP292를 사용하여 ORF의 100bp 업스트림에서 ORF의 염기 446까지의 영역을 커버하는 546bp 단편을 증폭시키기 위해 PCR을 사용하였다. 사이클링 단계를 1분 동안 98℃의 초기 변성, 그 다음 10초 동안 98℃의 35 사이클, 61℃에서 20초 동안 어닐링, 및 2.5분 동안 72℃에서 연장, 그 다음 7분 동안 72℃에서 최종 연장으로 변경한 것을 제외하고는, 동일한 PCR 키트 및 조건을 사용하였다.
프라이머 MBP290: 5'- TCTCGAGTCACTTGTAGAAG - 3' (SEQ ID NO: 34)
프라이머 MBP292: 5'- GAGCCCACATGCAAGTT - 3' (SEQ ID NO: 35)
Qiagen QIAquick 96 PCR 정제 키트를 사용하여 산물을 세정하였다. Life Technologies BigDye Terminator v3.1 Cycle Sequencing 키트는 50μL의 총 반응량을 사용하고, 50ng 이하의 세정된 산물을 주형으로 사용하고, 4μL의 1μM 프라이머 MBP291을 사용하여 제조사의 지침에 따라 산물의 시퀀싱에 사용되었다. 조건은 다음과 같았다: 초기 변성 96℃ 1분 후, 96℃에서 10초 동안 변성, 50℃에서 5초 동안 어닐링, 60℃에서 4분 동안 연장의 25 사이클 및 최종적으로 4℃로 냉각. 시퀀싱 반응물을 침전시키고, HiDi(Applied Biosystems)에 재현탁시키고, Applied Biosystems 3130xl Genetic Analyser에서 분석하였다.
프라이머 MBP291: 5'- GTAGGGTGGTTTAGAGTATC - 3' (SEQ ID NO: 36)
시퀀싱 분석 결과, 하나의 형질전환체가 위치 373(R125)에서 야생형 A를 갖는 것으로 나타났고, 이 스트레인은 PRG13[pDB2305]으로 명명되었다. 2개의 형질전환체는 여전히 위치 373(G125)에서 G를 가졌으며, 이들 스트레인은 PSG10[pDB2305] 및 PSG11[pDB2305]로 명명되었다. 이들 3개의 형질전환체를 각 웰에 0.5mL BMMD(아미노산 및 암모늄 설페이트가 없는 0.17%(w/v) 효모 질소 베이스(Difco), 37.8mM 암모늄 설페이트, 36mM 시트르산, 126mM 디소듐 하이드로겐 오르토포스페이트 pH 6.5, 2%(w/v) 글루코즈, NaOH로 pH 6.5로 조정됨)를 함유하는 48 웰 마이크로타이터 플레이트(MTP)에서 배양하였다. MTP를 30℃에서 72시간 동안 쉐이킹(200rpm)하면서 습식 챔버에서 인큐베이팅하였다. 그런 다음, 각 웰에서 50μL 세포 배양물을 각 웰에 0.45mL BMMD를 함유하는 새로운 48-웰 MTP의 3개의 웰로 옮겼다. 새로운 MTP를 96시간 동안 쉐이킹(200rpm)하면서 습식 챔버에서 30℃에서 인큐베이팅하였다.
원심분리에 의해 상청액을 분리하고, Shimadzu VP7.3 클라이언트 서버 소프트웨어 제어하에 UV 검출이 장착된 LC2010 HPLC 시스템(Shimadzu)을 사용하여 GP-HPLC 분석에 의해 재조합 알부민 생산성을 측정하였다. 6.0mm id x 40mm 길이 TSK SW 가드 컬럼(Tosoh Bioscience)과 함께 7.8mm id x 300mm 길이 TSK G3000SWXL 컬럼(Tosoh Bioscience)에 75μL의 주입이 이루어졌다. 샘플을 25mM 소듐 포스페이트, 100mM 소듐 설페이트, 0.05%(w/v) 소듐 아지드, pH 7.0, 1 mL.min-1에서 20분의 실행 시간으로 크로마토그래피하였다. 알려진 농도(10mg/mL)의 재조합 인간 알부민 스탠다드에 대해 280nm에서 피크 면적에 의한 UV 검출에 의해 샘플을 정량화하고, 이들의 상대 흡광 계수에 대해 보정하였다.
표 2에 나타낸 바와 같이, SNP의 존재는 평균 알부민 수율의 21% 증가를 일으켰다.
[표 2]
추가의 S. 세레비지애(S. cerevisiae) 스트레인에서 작업을 반복하였다. 간략히, GSH1 SNP를 야생형으로 되돌리기 위해 S. 세레비지애(S. cerevisiae) 스트레인 BXP10[pDB2244](도 4)에 대해 동일한 형질전환 절차를 수행하였다. pDB2244는 인간 알부민을 발현하는 플라스미드이다. 상기 스트레인을 쉐이크 플라스크, 50ml 플라스크 내 대략 10mL의 성장 배지에서 성장시키고, 30℃에서 200rpm으로 쉐이킹하면서 인큐베이팅하였다. SNP를 여전히 함유하는 형질전환체, 즉 BSG3[pDB2244]로부터의 알부민의 수율을 야생형, 즉 BRG5[pDB2244]로 변환된 SNP를 갖는 형질전환체로부터의 알부민의 수율과 비교하였다. BXP10은 유전자형 MATa, leu2-3, leu2-122, can1, pra1, ubc4, ura3, yap3::URA3, lys2, hsp150::LYS2, and pmt1::URA3을 갖는다.
표 3에 나타낸 바와 같이, SNP의 존재는 알부민 수율의 68% 증가를 일으켰다(각 스트레인에 대해 3회 반복함).
[표 3]
실시예 2: S. 세레비지애( S. cerevisiae ) GSH1 유전자의 결실은 재조합 단백질의 생산을 향상시켰다.
GSH1 유전자는 SNP 복귀를 위해 실시예 1에서 사용된 동일한 두 S. 세레비지애(S. cerevisiae) 스트레인에서 결실되었다. GSH1 유전자를 마커 KanMX로 대체함으로써 결실을 달성하였다. 결과적으로, 생성된 스트레인은 어떠한 Gsh1 단백질도 생산할 수 없었다. 결실을 수행하기 위해, 필요한 DNA를 Acc65I 제한부위 옆에 있는 플라스미드 삽입물로서 오더딩하였다. DNA 단편은 5' 말단에 GSH1 ORF의 바로 업스트림에 300bp, 3' 말단에 GSH1 ORF의 바로 다운스트림에 300bp 측면에 있는 KanMX DNA로 구성되었다(SEQ ID NO: 43). 플라스미드를 Acc65I로 다이제션하고, QIAGEN 겔 추출 키트를 사용하여 Tris-acetate-EDTA(TAE) 아가로즈 겔로부터 KanMX 단편을 정제하였다. 이 DNA를 사용하여 효모 스트레인 DP9[pDB2305] 및 BXP10[pDB2244]을 형질전환시켰으며, 여기서 pDB2305 및 pDB2244는 인간 혈청 알부민에 대한 발현 카세트를 함유하는 플라스미드이다. 형질전환 절차의 마지막에, 효모 세포를 YEPD 배지에 재현탁시키고 30℃ 및 200rpm에서 밤새 성장시켰다. 다음 날, (실시예 1에 기재된 바와 같이) G418 플레이트에 플레이팅하고, L-글루타티온을 5mM으로 첨가하였다. 콜로니를 새로운 플레이트 상에 패치하고(G418 및 L- 글루타티온과 마찬가지로), 패치가 성장했을 때, 게놈 DNA를 추출하고, 전체 DNA 단편이 올바르게 통합된 경우 접합점 측면(flank)에 있는 프라이머를 사용하여 PCR을 수행하였다. BXP10에서 GSH1이 결실된 3개의 형질전환체가 확인되었으며(형질전환체는 BDG1, BDG2 및 BDG10으로 명명됨), DP9에서 GSH1이 결실된 1개의 형질전환체가 확인되었다(변형체는 PDG14로 명명됨). 이들 스트레인은 SNP 복귀가 있거나 없는 앞서 기재된 스트레인과 함께 BMMD의 48웰 플레이트에서 배양되었다. 결실 스트레인을 5mM L- 글루타티온이 보충된 웰에서 성장시키고, 다른 스트레인을 L-글루타티온과 함께 또는 L- 글루타티온 없이 배양하였다. 상청액을 GP-HPLC로 분석하여 인간 혈청 알부민의 발현 수준을 정량화하였다.
[표 4]
표 4에 나타낸 바와 같이, BXP10[pDB2244]에서 GSH1의 결실은 야생형 GSH1을 갖는 스트레인과 비교할 때 알부민 수율의 증가를 일으켰다. 또한, 실시예 1에서 나타낸 바와 같이, GSH1에서 SNP의 존재는 야생형 GSH1을 함유하는 스트레인과 비교할 때 알부민 수율을 증가시켰다.
[표 5]
표 5에 나타낸 바와 같이, DP9[pDB2305]에서 GSH1의 결실은 야생형 GSH1을 갖는 스트레인과 비교하여, 그리고 SNP를 갖는 GSH1을 함유하는 스트레인과 비교하여 알부민 수율의 증가를 일으켰다.
실시예 3: GSH1 유전자의 돌연변이는 10L 스케일에서 알부민 발효를 개선시킨다.
실시예 1로부터의 BXP10 유래 스트레인을 발효기에서 10 리터 스케일로 성장시키고, 특이적 세포 생산성 비율(YPXT) 수율을 측정하였다(표 6). 발효는 실시예 5에 기재된 것과 유사한 방식으로 수행되었다.
[표 6]
SNP A373G를 함유하는 GSH1을 갖는 스트레인(R125G를 생성함)에서 평균 4.6%의 증가가 관찰되었고, 이는 통계적으로 유의하였다. P-값 = 0.069
실시예 4: GSH1 에서 돌연변이에 의해 제공된 S. 세레비지애( S. cerevisiae )로부터 재조합 단백질의 수율에 대한 양성적인 효과는 NOT4 에서 돌연변이의 존재에 의해 더욱 증가된다.
이전에 (PCT/US2016/068239, 본원에 참고문헌으로 편입됨), NOT4의 돌연변이(MOT2라고도 함)는 숙주 스트레인에서 생성된 이종 단백질의 수율 증가를 일으킨다는 것이 확인되었다.
NOT4에서의 돌연변이와 GSH1에서의 돌연변이의 조합이 수율에 추가로 영향을 미치는지 여부를 측정하기 위해, (상기 유전자 중 어떠한 것도 없거나, 상기 유전자 중 하나 또는 둘 모두의 야생형 버전을 함유하는 플라스미드를 이용한 형질전환에 의해) 하나 또는 둘 모두의 돌연변이 또는 어떠한 돌연변이도 없는 것이 숙주 세포에서 컴플리먼팅되었으며, 이는
(A) SNP를 함유하는 GSH1, 및 SNP를 함유하는 NOT4,
(B) SNP를 함유하는 GSH1, 및 야생형 NOT4,
(C) 야생형 GSH1 및 SNP를 함유하는 NOT4, 및
(D) 야생형 GSH1 및 야생형 NOT4
에 근접한 표현형을 갖는 일련의 스트레인을 생성하였다.
이종 단백질 수율은 생성된 스트레인의 배양 상청액의 GP-HPLC 분석에 의해 측정되었다.
야생형 NOT4 및/또는 GSH1을 함유하는 플라스미드를 생성하기 위해, 효모 스트레인 DB1로부터의 게놈 DNA를 사용하여 PCR을 수행하였다. 이 스트레인은 야생형 NOT4 및 야생형 GSH1을 갖는다. 프라이머 쌍(표 7)을 사용하여 야생형 ORF 및 NOT4GSH1의 업스트림 및 다운스트림 서열을 함유하는 DNA를 생성하였다. 프라이머는 플라스미드 YCP50으로 클로닝할 수 있도록 제한효소 부위를 포함하도록 디자인되었다(도 5 및 Rose et al., 1987, Gene, 60, 237-243). PCR은 표 8에 따라 수행되었다.
[표 7]
[표 8]
PCR 조건은 다음과 같았다: Applied Biosystems 2720 Thermal Cycler 및 NEB Q5 Hot Start High-Fidelity DNA Polymerase PCR 키트를 사용하여, 제조자의 지시에 따라, 총 반응량 50μL로 하여, 0.1μg 게놈 DNA, 각 프라이머 0.5μM, 0.2μM dNTP, 98℃에서 30초 동안 초기 변성 후, 98℃에서 10초, 상기 온도에서 30초 어닐링, 72℃에서 2분 연장의 35 사이클, 그 다음, 72℃에서 4분 최종 연장, 및 4℃로의 냉각. 산물을 겔 전기영동에 의해 분석한 결과, 예상 크기, NOT4의 경우 대략 2.5kb 및 GSH1의 경우 대략 3.3kb인 것으로 밝혀졌다. 증폭된 PCR 산물을 제조사의 지시에 따라 QIAGEN QIAquick PCR 정제 키트를 사용하여 정제하였다.
정제된 PCR 산물 및 YCP50 플라스미드에서 제한 효소 다이제스트를 수행하였다. 제한 효소와 버퍼는 New England Biolabs(NEB)로부터 얻어졌으며, 제조자의 프로토콜을 따랐다. 수행된 다이제스트는 NOT4 PCR 산물에서 EcoRI + HindIII, YCP50에서 EcoRI + HindIII, GSH1 PCR 산물에서 SphI + SalI 그리고 YCP50에서 SphI 및 SalI이었다. 사용된 버퍼는 CutSmart 버퍼이고, 제한 효소는 모든 NEB 고 충실도("HF") 효소(즉, EcoRI-HF 등)이었다. 다이제스트는 37℃에서 약 1.5시간 동안 인큐베이팅되었다. PCR 산물의 다이제스트는 QIAGEN QIAquick PCR 정제 키트에 의해 정제되었고, YCP50 DNA는 제조사의 지시에 따라 QIAGEN QIAquick 겔 추출 키트를 사용하여 TAE 아가로스 겔로부터 정제되었다.
각각의 다이제션 및 정제된 PCR 산물은 동일한 효소로 절단된 YCP50 DNA에 결찰되었다. 결찰은 제조사의 지지에 따라 NEB Quick ligation 키트(M2200S)를 사용하고, PCR 산물:YCP50에 대해 3:1의 몰비를 사용하여 수행하였다. 이어서, 각각의 결찰 반응의 1마이크로리터를 제조사의 지시에 따라 NEB 5-알파 컴피턴트(고효율) E. 콜라이(E. coili) 세포(M2987I)를 형질전환시키기 위해 사용하고, 그 세포를 LB 암피실린상에 플레이팅하였다. 생성된 콜로니로부터 밤새 배양물을 성장시키고, QIAGEN QIAprep 스핀 미니프렙을 수행하였다. 클로닝이 성공한 것으로 보이는 플라스미드를 확인하기 위해 제한 효소 다이제스트를 수행하였다.
이어서, YCP50-NOT4 플라스미드를 SphI + SalI으로 다이제션하고, 제조사의 지시에 따라 QIAGEN QIAquick 겔 추출 키트를 사용하여 TAE 아가로스 겔로부터 DNA를 정제하였다. 이 DNA를 SphI + SalI으로 다이제션된 GSH1 PCR 산물에 결찰시킨 후, QIAquick PCR 정제 키트를 사용하여 정제하였다. 또한, 삽입물 대 백본의 몰 DNA 비는 3:1이었다. NEB 5-알파 컴피턴트(고효율) 세포를 (상기와 같이) 형질전환시키고, (상기와 같이) 플라스미드 DNA를 제조하였다. 제한 다이제션에 의해 올바른 플라스미드가 확인되었다.
결과적으로 3가지 새로운 플라스미드가 생성되었다: YCP50-NOT4, YCP50-GSH1 및 YCP50-NOT4-GSH1. 이들 및 YCP50 단독을 사용하여 재조합 인간 혈청 알부민의 발현을 위해 플라스미드 pDB2305를 함유하는 DYB7 ura3[pDB2305]를 형질전환시켰다. DYB7은 Payne et al,(2008) Applied and Environmental Microbiology 74(24) 7759-7766에 기술되어 있다. 형질전환 혼합물을 원심분리하는 단계 후에 펠렛을 1M 소르비톨 200μl에 재현탁한 다음, 100μl를 BMMD 아가 플레이트에 플레이팅한 것을 제외하고, 제조사의 지시에 따라 Sigma Yeast Transformation 키트를 사용하여 형질전환을 수행하였다. 콜로니가 나타날 때까지 플레이트를 30℃에서 인큐베이팅하였다.
각 형질전환으로부터의 단일 콜로니를 웰당 0.5ml BMMD를 함유하는 48 웰 마이크로타이터 플레이트의 웰에 접종하였다. 플레이트를 30℃ 및 200rpm에서 2일 동안 인큐베이팅한 다음, 동일한 부피의 40% 트레할로스를 각 웰에 혼합하고, 플레이트를 -80℃에 저장하였다. 나중에, 플레이트를 해동시키고, 50㎕를 각각의 웰로부터 450㎕의 BMMD를 함유하는 새로운 플레이트의 웰로 옮겼다. 이 플레이트를 30℃ 및 200rpm에서 2일 동안 인큐베이팅한 다음, 또 다른 새로운 플레이트로 계대배양하였다(50 ㎕를 450㎕ BMMD에 넣음). 이 플레이트를 4일 동안 인큐베이팅하였다. 이어서, 플레이트를 2000rpm에서 5분 동안 원심분리하고, 각각으로부터 200㎕의 상청액을 HPLC 바이얼로 옮겼다. 상청액 중의 인간 혈청 알부민의 양을 실시예 1에 기재된 GP-HPLC로 정량하였다.
새로운 플라스미드인 YCP50-NOT4, YCP50-GSH1 및 YCP50-NOT4-GSH1을 시퀀싱하여, 이들이 각각 정확한 삽입물을 함유하고 있음을 확인하였다. 이 경우 150 내지 300ng 플라스미드 DNA가 각 반응에 사용된 것을 제외하고는 상기 실시예에 기재된 바와 같이 시퀀싱을 수행하였다.
배양 상청액의 GP-HPLC 분석에 의해 측정된 상대적 알부민 수율은 하기 표 9에 나타내었다.
[표 9]
수율은 SNP-함유 유전자들 둘 모두의 상보성이 있는 스트레인인 (D)에 상대적으로 표시된다. SNP를 갖는 NOT4(C)는 수율이 31% 증가하였고, SNP를 갖는 GSH1(B)은 수율이 77% 증가하였으며, 두 SNP 모두를 존재하는 경우(A)는 수율이 84% 증가한 것으로 나타났다. 이러한 상보성 연구는 GSH1NOT4 돌연변이가 알부민 수율에 긍정적으로 영향을 미치고, 조합될 경우에 수율이 더욱 증가한다는 것을 입증한다.
이러한 수율 증가는 또한 보다 큰 스케일에서도 관찰될 것으로 예상된다. 이는 실시예 1 및 2가 작은 스케일에서 GSH1의 돌연변이 또는 결실이 S. 세레비지애(S. cerevisiae)로부터 생산된 알부민의 수율에 영향을 미치는 것을 입증하고, 또한 실시예 3 및 5는 이것이 10L 스케일에서도 관찰되는 것을 입증하고, 그리고 이전 출원 PCT/US2016/068239는 작은 스케일 및 10L 스케일 모두에서 NOT4의 돌연변이 또는 결실이 S. 세레비지애(S. cerevisiae)로부터 생산된 알부민의 수율에 영향을 미친다는 것을 입증하였기 때문이다.
실시예 5: S. 세레비지애( S. cerevisiae ) GSH1 유전자의 돌연변이는 10L 스케일에서 알부민 수율을 증가시켰다.
재조합 단백질 발현을 위한 S. 세레비지애(S. cerevisiae) 스트레인 DYB7 ura3[pDB2305/YCp50-NOT4], DYB7 ura3[pDB2305/YCp50-GSH1] 및 DYB7 ura3[pDB2305/YCp50-NOT4-GSH1]의 생산성은 10L 발효기에서의 성장에 의해 평가되었다(Wigley et al, (2007) Genetic Engineering News. 27 (2): 40 - 42). 발효는 Wonderware Supervisory Control 및 Data Acquisition 소프트웨어가 MFCS 대신에 사용되고, 사용 전에 발효기 용기가 시트르산에 적용되고, 미량 원소 스톡이 Na2MoO4.5H2O 대신에 Na2MoO4.2H2O를 포함하고, pH가 암모니아 용액으로 pH 6.2로 조정되고, 발효 도중에 0.05vvm 대신에 약 1.0vvm(즉, 1.0리터)로 멸균 공기가 용기 내로 도입되어, 에어플로우가 약 1.0vvm의 에어플로우를 유지하기 위해 2단계 대신 1단계에서 에어플로우가 증가되고, 비성장률은 약 0.06h-1이고, 지수 상수(K)는 0.06으로 유지된 것을 제외하고는, MW11D 배지를 사용하여 WO97/33973(본원에 참고문헌으로 편입됨)의 실시예 1에 기술된 바와 같다. "vvm"은 분당 액체 부피의 단위당 가스 부피 흐름을 의미한다.
상대적 수율은 표 10에 나타내었다(리터당 산물의 그램).
[표 10]
알부민의 수율은 야생형에 근접한 GSH1 표현형을 갖는 스트레인과 비교하여 SNP를 함유하는 GSH1을 갖는 스트레인에서 증가된다.
실시예 6: 사카로마이세스 세레비지애( Saccharomyces cerevisiae ) GSH1 유전자의 돌연변이 또는 결실은 알부민 변이체의 발현을 증가시켰으며, 그리고 GSH1 의 결실은 알부민 융합 단백질(albumin-IL-1Ra) 및 scFv (vHvL)-FLAG의 발현을 증가시켰다.
본 실시예에서 발현되는 단백질은 (a) WT HSA(SEQ ID NO. 10)에 대해 4개의 돌연변이를 함유하는 알부민 변이체(SEQ ID NO. 45), (b) 인간 혈청 알부민(SEQ ID NO: 47, "알부민-IL-1Ra")의 C-말단에 유전적으로 융합된 IL-1Ra 및 (c) C-말단(SEQ ID NO: 49)에 FLAG 태그(DYKDDDDK, SEQ ID NO: 50)를 갖는 scFv, FITC8(Evans et al 2010, Protein Expression and Purification 73:113-124, 레퍼런스 16 및 17을 포함함, 모두 본원에 참고문헌으로 편입됨)이었다.
3개의 스트레인들, PDG14[pDB2305], PSG11[pDB2305] 및 PRG13[pDB2305]은 YEPD 배지에서 쉐이크 플라스크에 배양하고, 플라스미드(pDB2305)의 이들을 큐어링(cure)하기 위해 3회 계대배양하였다. 최종 배양물의 희석물을 YEPD에 플레이팅 한 다음, 이들 플레이트로부터 단일 콜로니를 YEPD 상에 패치하였다. YEPD 패치를 BMMD + 5mM L-글루타티온 플레이트로 옮기고, 30℃에서 인큐베이팅하였으며; BMMD + 5mM L-글루타티온에서의 성장의 부재는 플라스미드의 큐어링된 세포를 확인시켜주었다. 큐어링된 효모 스트레인은 플라스미드 pDB5862(알부민 변이체의 발현을 위한)(pDB5862을 위한 플라스미드 맵은 도 9에 제공됨, 알부민 변이체를 코딩하는 DNA 서열은 SEQ ID NO: 44에 나타냄), pDB3029(scFv(vHvL)-FLAG의 발현을 위한)(pDB3029를 위한 플라스미드 맵은 도 9에 제공됨, scFv-FLAG를 코딩하는 DNA 서열은 SEQ ID NO: 48에 나타냄)를 이용하여, 또는 pDB3936 및 pDB5912(갭-리페어드 플라스미드 pDB3936:GR:pDB5912로부터 알부민-IL-1RA의 발현을 위한)의 정제된 제한 다이제스트를 이용하여, 제조사의 지시에 따라 Sigma Yeast Transformation 키트를 사용하여 각각 형질전환되었다. 세포를 BMMD 상에 플레이팅하고, 30℃에서 5일 동안 인큐베이팅하였다. 각 스트레인의 6개의 형질전환체를 웰당 5mM L-글루타티온과 함께 0.5ml BMMD를 함유하는 48웰 MTP에서 배양하였다. 플레이트를 습식 챔버에서 30℃ 및 200rpm에서 48시간 동안 인큐베이팅하였다. 이어서, 이 플레이트를 새로운 플레이트에서 5mM L-글루타티온과 함께 450㎕의 BMMD로 각 배양물의 50㎕를 옮김으로써 계대배양하였다. 이 플레이트를 96시간 동안 인큐베이팅하였다.
원심분리에 의해 상청액을 분리하고, 재조합 단백질 생산성(알부민 변이체, 알부민-IL-1Ra 또는 ScFv에 대한)을 실시예 1에서와 같이 GP-HPLC로 측정하였다.
표 11에 나타낸 바와 같이, SNP(A373G)의 존재 또는 결실은 알부민 변이체의 수율 증가를 일으켰다. 야생형 GSH1을 갖는 스크레인(PRG13)와 비교하여, GSH1(PSG11)에서 SNP를 함유하는 스트레인에서 수율은 15% 더 높았고, GSH1의 결실을 함유하는 스트레인(PDG14)에서는 23% 더 높았다.
[표 11]
표 12에 나타낸 바와 같이, 결실의 존재로 알부민-IL-1Ra의 수율이 증가하였다. 야생형 GSH1을 갖는 스트레인(PRG13)에 비해 결실을 함유하는 스트레인(PDG14)에서 수율은 14% 더 높았다.
[표 12]
표 13에 나타낸 바와 같이, 결실의 존재로 인해 ScFv-FLAG의 수율이 증가하였다. 야생형 GSH1(PRG13)을 갖는 스트레인과 비교하여 GSH1(PDG14)의 결실을 함유하는 스트레인에서 수율은 38% 더 높았다.
[표 13]
SEQUENCE LISTING <110> Albumedix Ltd <120> IMPROVED PROTEIN EXPRESSION STRAINS <130> 13169-WO-PCT <150> EP17176932.6 <151> 2017-06-20 <160> 52 <170> PatentIn version 3.5 <210> 1 <211> 2037 <212> DNA <213> Saccharomyces cerevisiae <400> 1 atgggactct tagctttggg cacgcctttg cagtggtttg agtctaggac gtacaatgaa 60 cacataaggg atgaaggtat cgagcagttg ttgtatattt tccaagctgc tggtaaaaga 120 gacaatgacc ctcttttttg gggagacgag cttgagtaca tggttgtaga ttttgatgat 180 aaggagagaa attctatgct cgacgtttgc catgacaaga tactcactga gcttaatatg 240 gaggattcgt ccctttgtga ggctaacgat gtgagttttc accctgagta tggccggtat 300 atgttagagg caacaccagc ttctccatat ttgaattacg tgggtagtta cgttgaggtt 360 aacatgcaaa aaagacgtgc cattgcagaa tataagctat ctgaatatgc gagacaagat 420 agtaaaaata acttgcatgt gggctccagg tctgtccctt tgacgctgac tgtcttcccg 480 aggatgggat gccccgactt tattaacatt aaggatccgt ggaatcataa aaatgccgct 540 tccaggtctc tgtttttacc cgatgaagtc attaacagac atgtcaggtt tcctaacttg 600 acagcatcca tcaggaccag gcgtggtgaa aaagtttgca tgaatgttcc catgtataaa 660 gatatagcta ctccagaaac ggatgactcc atctacgatc gagattggtt tttaccagaa 720 gacaaagagg cgaaactggc ttccaaaccg ggtttcattt atatggattc catgggtttt 780 ggcatgggct gttcgtgctt acaagtgacc tttcaggcac ccaatatcaa caaggcacgt 840 tacctgtacg atgcattagt gaattttgca cctataatgc tagccttctc tgccgctgcg 900 cctgctttta aaggttggct agccgaccaa gatgttcgtt ggaatgtgat atctggtgcg 960 gtggacgacc gtactccgaa ggaaagaggt gttgcgccat tactacccaa atacaacaag 1020 aacggatttg gaggcattgc caaagacgta caagataaag tccttgaaat accaaagtca 1080 agatatagtt cggttgatct tttcttgggt gggtcgaaat ttttcaatag gacttataac 1140 gacacaaatg tacctattaa tgaaaaagta ttaggacgac tactagagaa tgataaggcg 1200 ccactggact atgatcttgc taaacatttt gcgcatctct acataagaga tccagtatct 1260 acattcgaag aactgttgaa tcaggacaac aaaacgtctt caaatcactt tgaaaacatc 1320 caaagtacaa attggcagac attacgtttt aaacccccca cacaacaagc aaccccggac 1380 aaaaaggatt ctcctggttg gagagtggaa ttcagaccat ttgaagtgca actattagat 1440 tttgagaacg ctgcgtattc cgtgctcata tacttgattg tcgatagcat tttgaccttt 1500 tccgataata ttaacgcata tattcatatg tccaaagtat gggaaaatat gaagatagcc 1560 catcacagag atgctatcct atttgaaaaa tttcattgga aaaaatcatt tcgcaacgac 1620 accgatgtgg aaactgaaga ttattctata agcgagattt tccataatcc agagaatggt 1680 atatttcctc aatttgttac gccaatccta tgccaaaaag ggtttgtaac caaagattgg 1740 aaagaattaa agcattcttc caaacacgag agactatact attatttaaa gctaatttct 1800 gatagagcaa gcggtgaatt gccaacaaca gcaaaattct ttagaaattt tgtactacaa 1860 catccagatt acaaacatga ttcaaaaatt tcaaagtcga tcaattatga tttgctttct 1920 acgtgtgata gacttaccca tttagacgat tcaaaaggtg aattgacatc ctttttagga 1980 gctgaaattg cagaatatgt aaaaaaaaat aagccttcaa tagaaagcaa atgttaa 2037 <210> 2 <211> 678 <212> PRT <213> Saccharomyces cerevisiae <400> 2 Met Gly Leu Leu Ala Leu Gly Thr Pro Leu Gln Trp Phe Glu Ser Arg 1 5 10 15 Thr Tyr Asn Glu His Ile Arg Asp Glu Gly Ile Glu Gln Leu Leu Tyr 20 25 30 Ile Phe Gln Ala Ala Gly Lys Arg Asp Asn Asp Pro Leu Phe Trp Gly 35 40 45 Asp Glu Leu Glu Tyr Met Val Val Asp Phe Asp Asp Lys Glu Arg Asn 50 55 60 Ser Met Leu Asp Val Cys His Asp Lys Ile Leu Thr Glu Leu Asn Met 65 70 75 80 Glu Asp Ser Ser Leu Cys Glu Ala Asn Asp Val Ser Phe His Pro Glu 85 90 95 Tyr Gly Arg Tyr Met Leu Glu Ala Thr Pro Ala Ser Pro Tyr Leu Asn 100 105 110 Tyr Val Gly Ser Tyr Val Glu Val Asn Met Gln Lys Arg Arg Ala Ile 115 120 125 Ala Glu Tyr Lys Leu Ser Glu Tyr Ala Arg Gln Asp Ser Lys Asn Asn 130 135 140 Leu His Val Gly Ser Arg Ser Val Pro Leu Thr Leu Thr Val Phe Pro 145 150 155 160 Arg Met Gly Cys Pro Asp Phe Ile Asn Ile Lys Asp Pro Trp Asn His 165 170 175 Lys Asn Ala Ala Ser Arg Ser Leu Phe Leu Pro Asp Glu Val Ile Asn 180 185 190 Arg His Val Arg Phe Pro Asn Leu Thr Ala Ser Ile Arg Thr Arg Arg 195 200 205 Gly Glu Lys Val Cys Met Asn Val Pro Met Tyr Lys Asp Ile Ala Thr 210 215 220 Pro Glu Thr Asp Asp Ser Ile Tyr Asp Arg Asp Trp Phe Leu Pro Glu 225 230 235 240 Asp Lys Glu Ala Lys Leu Ala Ser Lys Pro Gly Phe Ile Tyr Met Asp 245 250 255 Ser Met Gly Phe Gly Met Gly Cys Ser Cys Leu Gln Val Thr Phe Gln 260 265 270 Ala Pro Asn Ile Asn Lys Ala Arg Tyr Leu Tyr Asp Ala Leu Val Asn 275 280 285 Phe Ala Pro Ile Met Leu Ala Phe Ser Ala Ala Ala Pro Ala Phe Lys 290 295 300 Gly Trp Leu Ala Asp Gln Asp Val Arg Trp Asn Val Ile Ser Gly Ala 305 310 315 320 Val Asp Asp Arg Thr Pro Lys Glu Arg Gly Val Ala Pro Leu Leu Pro 325 330 335 Lys Tyr Asn Lys Asn Gly Phe Gly Gly Ile Ala Lys Asp Val Gln Asp 340 345 350 Lys Val Leu Glu Ile Pro Lys Ser Arg Tyr Ser Ser Val Asp Leu Phe 355 360 365 Leu Gly Gly Ser Lys Phe Phe Asn Arg Thr Tyr Asn Asp Thr Asn Val 370 375 380 Pro Ile Asn Glu Lys Val Leu Gly Arg Leu Leu Glu Asn Asp Lys Ala 385 390 395 400 Pro Leu Asp Tyr Asp Leu Ala Lys His Phe Ala His Leu Tyr Ile Arg 405 410 415 Asp Pro Val Ser Thr Phe Glu Glu Leu Leu Asn Gln Asp Asn Lys Thr 420 425 430 Ser Ser Asn His Phe Glu Asn Ile Gln Ser Thr Asn Trp Gln Thr Leu 435 440 445 Arg Phe Lys Pro Pro Thr Gln Gln Ala Thr Pro Asp Lys Lys Asp Ser 450 455 460 Pro Gly Trp Arg Val Glu Phe Arg Pro Phe Glu Val Gln Leu Leu Asp 465 470 475 480 Phe Glu Asn Ala Ala Tyr Ser Val Leu Ile Tyr Leu Ile Val Asp Ser 485 490 495 Ile Leu Thr Phe Ser Asp Asn Ile Asn Ala Tyr Ile His Met Ser Lys 500 505 510 Val Trp Glu Asn Met Lys Ile Ala His His Arg Asp Ala Ile Leu Phe 515 520 525 Glu Lys Phe His Trp Lys Lys Ser Phe Arg Asn Asp Thr Asp Val Glu 530 535 540 Thr Glu Asp Tyr Ser Ile Ser Glu Ile Phe His Asn Pro Glu Asn Gly 545 550 555 560 Ile Phe Pro Gln Phe Val Thr Pro Ile Leu Cys Gln Lys Gly Phe Val 565 570 575 Thr Lys Asp Trp Lys Glu Leu Lys His Ser Ser Lys His Glu Arg Leu 580 585 590 Tyr Tyr Tyr Leu Lys Leu Ile Ser Asp Arg Ala Ser Gly Glu Leu Pro 595 600 605 Thr Thr Ala Lys Phe Phe Arg Asn Phe Val Leu Gln His Pro Asp Tyr 610 615 620 Lys His Asp Ser Lys Ile Ser Lys Ser Ile Asn Tyr Asp Leu Leu Ser 625 630 635 640 Thr Cys Asp Arg Leu Thr His Leu Asp Asp Ser Lys Gly Glu Leu Thr 645 650 655 Ser Phe Leu Gly Ala Glu Ile Ala Glu Tyr Val Lys Lys Asn Lys Pro 660 665 670 Ser Ile Glu Ser Lys Cys 675 <210> 3 <211> 2037 <212> DNA <213> Artificial sequence <220> <223> GSH1 with A373G mutation <400> 3 atgggactct tagctttggg cacgcctttg cagtggtttg agtctaggac gtacaatgaa 60 cacataaggg atgaaggtat cgagcagttg ttgtatattt tccaagctgc tggtaaaaga 120 gacaatgacc ctcttttttg gggagacgag cttgagtaca tggttgtaga ttttgatgat 180 aaggagagaa attctatgct cgacgtttgc catgacaaga tactcactga gcttaatatg 240 gaggattcgt ccctttgtga ggctaacgat gtgagttttc accctgagta tggccggtat 300 atgttagagg caacaccagc ttctccatat ttgaattacg tgggtagtta cgttgaggtt 360 aacatgcaaa aaggacgtgc cattgcagaa tataagctat ctgaatatgc gagacaagat 420 agtaaaaata acttgcatgt gggctccagg tctgtccctt tgacgctgac tgtcttcccg 480 aggatgggat gccccgactt tattaacatt aaggatccgt ggaatcataa aaatgccgct 540 tccaggtctc tgtttttacc cgatgaagtc attaacagac atgtcaggtt tcctaacttg 600 acagcatcca tcaggaccag gcgtggtgaa aaagtttgca tgaatgttcc catgtataaa 660 gatatagcta ctccagaaac ggatgactcc atctacgatc gagattggtt tttaccagaa 720 gacaaagagg cgaaactggc ttccaaaccg ggtttcattt atatggattc catgggtttt 780 ggcatgggct gttcgtgctt acaagtgacc tttcaggcac ccaatatcaa caaggcacgt 840 tacctgtacg atgcattagt gaattttgca cctataatgc tagccttctc tgccgctgcg 900 cctgctttta aaggttggct agccgaccaa gatgttcgtt ggaatgtgat atctggtgcg 960 gtggacgacc gtactccgaa ggaaagaggt gttgcgccat tactacccaa atacaacaag 1020 aacggatttg gaggcattgc caaagacgta caagataaag tccttgaaat accaaagtca 1080 agatatagtt cggttgatct tttcttgggt gggtcgaaat ttttcaatag gacttataac 1140 gacacaaatg tacctattaa tgaaaaagta ttaggacgac tactagagaa tgataaggcg 1200 ccactggact atgatcttgc taaacatttt gcgcatctct acataagaga tccagtatct 1260 acattcgaag aactgttgaa tcaggacaac aaaacgtctt caaatcactt tgaaaacatc 1320 caaagtacaa attggcagac attacgtttt aaacccccca cacaacaagc aaccccggac 1380 aaaaaggatt ctcctggttg gagagtggaa ttcagaccat ttgaagtgca actattagat 1440 tttgagaacg ctgcgtattc cgtgctcata tacttgattg tcgatagcat tttgaccttt 1500 tccgataata ttaacgcata tattcatatg tccaaagtat gggaaaatat gaagatagcc 1560 catcacagag atgctatcct atttgaaaaa tttcattgga aaaaatcatt tcgcaacgac 1620 accgatgtgg aaactgaaga ttattctata agcgagattt tccataatcc agagaatggt 1680 atatttcctc aatttgttac gccaatccta tgccaaaaag ggtttgtaac caaagattgg 1740 aaagaattaa agcattcttc caaacacgag agactatact attatttaaa gctaatttct 1800 gatagagcaa gcggtgaatt gccaacaaca gcaaaattct ttagaaattt tgtactacaa 1860 catccagatt acaaacatga ttcaaaaatt tcaaagtcga tcaattatga tttgctttct 1920 acgtgtgata gacttaccca tttagacgat tcaaaaggtg aattgacatc ctttttagga 1980 gctgaaattg cagaatatgt aaaaaaaaat aagccttcaa tagaaagcaa atgttaa 2037 <210> 4 <211> 678 <212> PRT <213> Artificial sequence <220> <223> Gsh1 with Arg125Gly mutation <400> 4 Met Gly Leu Leu Ala Leu Gly Thr Pro Leu Gln Trp Phe Glu Ser Arg 1 5 10 15 Thr Tyr Asn Glu His Ile Arg Asp Glu Gly Ile Glu Gln Leu Leu Tyr 20 25 30 Ile Phe Gln Ala Ala Gly Lys Arg Asp Asn Asp Pro Leu Phe Trp Gly 35 40 45 Asp Glu Leu Glu Tyr Met Val Val Asp Phe Asp Asp Lys Glu Arg Asn 50 55 60 Ser Met Leu Asp Val Cys His Asp Lys Ile Leu Thr Glu Leu Asn Met 65 70 75 80 Glu Asp Ser Ser Leu Cys Glu Ala Asn Asp Val Ser Phe His Pro Glu 85 90 95 Tyr Gly Arg Tyr Met Leu Glu Ala Thr Pro Ala Ser Pro Tyr Leu Asn 100 105 110 Tyr Val Gly Ser Tyr Val Glu Val Asn Met Gln Lys Gly Arg Ala Ile 115 120 125 Ala Glu Tyr Lys Leu Ser Glu Tyr Ala Arg Gln Asp Ser Lys Asn Asn 130 135 140 Leu His Val Gly Ser Arg Ser Val Pro Leu Thr Leu Thr Val Phe Pro 145 150 155 160 Arg Met Gly Cys Pro Asp Phe Ile Asn Ile Lys Asp Pro Trp Asn His 165 170 175 Lys Asn Ala Ala Ser Arg Ser Leu Phe Leu Pro Asp Glu Val Ile Asn 180 185 190 Arg His Val Arg Phe Pro Asn Leu Thr Ala Ser Ile Arg Thr Arg Arg 195 200 205 Gly Glu Lys Val Cys Met Asn Val Pro Met Tyr Lys Asp Ile Ala Thr 210 215 220 Pro Glu Thr Asp Asp Ser Ile Tyr Asp Arg Asp Trp Phe Leu Pro Glu 225 230 235 240 Asp Lys Glu Ala Lys Leu Ala Ser Lys Pro Gly Phe Ile Tyr Met Asp 245 250 255 Ser Met Gly Phe Gly Met Gly Cys Ser Cys Leu Gln Val Thr Phe Gln 260 265 270 Ala Pro Asn Ile Asn Lys Ala Arg Tyr Leu Tyr Asp Ala Leu Val Asn 275 280 285 Phe Ala Pro Ile Met Leu Ala Phe Ser Ala Ala Ala Pro Ala Phe Lys 290 295 300 Gly Trp Leu Ala Asp Gln Asp Val Arg Trp Asn Val Ile Ser Gly Ala 305 310 315 320 Val Asp Asp Arg Thr Pro Lys Glu Arg Gly Val Ala Pro Leu Leu Pro 325 330 335 Lys Tyr Asn Lys Asn Gly Phe Gly Gly Ile Ala Lys Asp Val Gln Asp 340 345 350 Lys Val Leu Glu Ile Pro Lys Ser Arg Tyr Ser Ser Val Asp Leu Phe 355 360 365 Leu Gly Gly Ser Lys Phe Phe Asn Arg Thr Tyr Asn Asp Thr Asn Val 370 375 380 Pro Ile Asn Glu Lys Val Leu Gly Arg Leu Leu Glu Asn Asp Lys Ala 385 390 395 400 Pro Leu Asp Tyr Asp Leu Ala Lys His Phe Ala His Leu Tyr Ile Arg 405 410 415 Asp Pro Val Ser Thr Phe Glu Glu Leu Leu Asn Gln Asp Asn Lys Thr 420 425 430 Ser Ser Asn His Phe Glu Asn Ile Gln Ser Thr Asn Trp Gln Thr Leu 435 440 445 Arg Phe Lys Pro Pro Thr Gln Gln Ala Thr Pro Asp Lys Lys Asp Ser 450 455 460 Pro Gly Trp Arg Val Glu Phe Arg Pro Phe Glu Val Gln Leu Leu Asp 465 470 475 480 Phe Glu Asn Ala Ala Tyr Ser Val Leu Ile Tyr Leu Ile Val Asp Ser 485 490 495 Ile Leu Thr Phe Ser Asp Asn Ile Asn Ala Tyr Ile His Met Ser Lys 500 505 510 Val Trp Glu Asn Met Lys Ile Ala His His Arg Asp Ala Ile Leu Phe 515 520 525 Glu Lys Phe His Trp Lys Lys Ser Phe Arg Asn Asp Thr Asp Val Glu 530 535 540 Thr Glu Asp Tyr Ser Ile Ser Glu Ile Phe His Asn Pro Glu Asn Gly 545 550 555 560 Ile Phe Pro Gln Phe Val Thr Pro Ile Leu Cys Gln Lys Gly Phe Val 565 570 575 Thr Lys Asp Trp Lys Glu Leu Lys His Ser Ser Lys His Glu Arg Leu 580 585 590 Tyr Tyr Tyr Leu Lys Leu Ile Ser Asp Arg Ala Ser Gly Glu Leu Pro 595 600 605 Thr Thr Ala Lys Phe Phe Arg Asn Phe Val Leu Gln His Pro Asp Tyr 610 615 620 Lys His Asp Ser Lys Ile Ser Lys Ser Ile Asn Tyr Asp Leu Leu Ser 625 630 635 640 Thr Cys Asp Arg Leu Thr His Leu Asp Asp Ser Lys Gly Glu Leu Thr 645 650 655 Ser Phe Leu Gly Ala Glu Ile Ala Glu Tyr Val Lys Lys Asn Lys Pro 660 665 670 Ser Ile Glu Ser Lys Cys 675 <210> 5 <211> 1764 <212> DNA <213> Saccharomyces cerevisiae <400> 5 atgatgaatc cacacgttca agaaaatttg caagcaatcc acaacgcctt aagcaatttt 60 gatacgtcat ttttatcgga ggatgaagaa gattattgcc ctctttgtat tgaaccaatg 120 gatattactg ataaaaattt ttttccttgt ccctgtggtt atcaaatttg tcaattttgc 180 tacaataata tcagacaaaa tccagaatta aatggccgtt gcccagcatg tcgtcgtaaa 240 tatgatgacg agaacgtcag atacgtcaca ttatctccgg aggagttaaa aatggagaga 300 gccaagctcg ctaggaagga gaaagaaaga aagcatagag aaaaagaacg taaagagaat 360 gaatatacga ataggaaaca tttatctggt accagagtta tccaaaagaa tttagtgtac 420 gttgttggca tcaatcctcc tgttccatac gaggaagttg cgcccactct gaaatctgaa 480 aaatattttg gccaatatgg taagataaat aagattgtgg ttaatagaaa aacaccccat 540 tctaacaaca caaccagcga gcattatcac catcattcac caggatatgg cgtttacata 600 accttcggat ccaaggacga tgctgcaaga tgtatagctc aggtagacgg gacgtatatg 660 gatggccgcc tgatcaaagc tgcctacggt actactaaat actgttcttc ttatttaaga 720 ggattgccat gcccaaatcc caactgtatg tttttgcatg aacctggtga agaagctgat 780 tcttttaata aaagagaact ccacaataaa caacaagcgc aacagcaaag tggcggaact 840 gcattcacta gatctggaat acacaacaat atatctacca gtaccgctgg ttcaaatacc 900 aatttactaa gtgaaaattt cacaggcaca ccttcaccgg cggcgatgag ggctcagtta 960 catcatgaca gccatacaaa cgctggaaca ccggtattaa cacctgctcc ggtccctgca 1020 gggtcaaatc cttggggagt tactcaatca gcaacacctg taacctctat caatctctct 1080 aaaaacagca gctccataaa cttgccaaca ttaaatgatt ctctgggcca tcatactacc 1140 cccacaacag agaataccat cacaagtacg acaactacta ccaataccaa tgctacaagt 1200 cactcccatg gtagcaagaa gaagcaatct cttgctgcag aggaatacaa agatccttat 1260 gacgcactag ggaatgctgt tgactttttg gatgcaagac tacattctct atcaaattat 1320 cagaagcgcc ctatatctat caaatccaat attattgacg aagaaactta taaaaagtat 1380 ccgtctttgt tttcttggga caagattgag gcctcaaaga aaagtgacaa tacattagcc 1440 aacaaacttg tggagatcct ggctataaag ccaatagact acactgcttc tgtcgttcaa 1500 ttcttgcaga gtgtcaatgt tggtgtaaat gacaatatta caatcacaga taatacgaaa 1560 actcccaccc aaccaataag actgcaaacc gtctcacagc aaatccaacc accattaaac 1620 gtcagtaccc ctccaccggg tatctttggt ccacaacata aggttcctat tcagcagcaa 1680 caaatgggtg atacaagctc aagaaattcc tctgatttac taaatcaact aatcaacgga 1740 aggaaaatta tcgccggtaa ttaa 1764 <210> 6 <211> 587 <212> PRT <213> Saccharomyces cerevisiae <400> 6 Met Met Asn Pro His Val Gln Glu Asn Leu Gln Ala Ile His Asn Ala 1 5 10 15 Leu Ser Asn Phe Asp Thr Ser Phe Leu Ser Glu Asp Glu Glu Asp Tyr 20 25 30 Cys Pro Leu Cys Ile Glu Pro Met Asp Ile Thr Asp Lys Asn Phe Phe 35 40 45 Pro Cys Pro Cys Gly Tyr Gln Ile Cys Gln Phe Cys Tyr Asn Asn Ile 50 55 60 Arg Gln Asn Pro Glu Leu Asn Gly Arg Cys Pro Ala Cys Arg Arg Lys 65 70 75 80 Tyr Asp Asp Glu Asn Val Arg Tyr Val Thr Leu Ser Pro Glu Glu Leu 85 90 95 Lys Met Glu Arg Ala Lys Leu Ala Arg Lys Glu Lys Glu Arg Lys His 100 105 110 Arg Glu Lys Glu Arg Lys Glu Asn Glu Tyr Thr Asn Arg Lys His Leu 115 120 125 Ser Gly Thr Arg Val Ile Gln Lys Asn Leu Val Tyr Val Val Gly Ile 130 135 140 Asn Pro Pro Val Pro Tyr Glu Glu Val Ala Pro Thr Leu Lys Ser Glu 145 150 155 160 Lys Tyr Phe Gly Gln Tyr Gly Lys Ile Asn Lys Ile Val Val Asn Arg 165 170 175 Lys Thr Pro His Ser Asn Asn Thr Thr Ser Glu His Tyr His His His 180 185 190 Ser Pro Gly Tyr Gly Val Tyr Ile Thr Phe Gly Ser Lys Asp Asp Ala 195 200 205 Ala Arg Cys Ile Ala Gln Val Asp Gly Thr Tyr Met Asp Gly Arg Leu 210 215 220 Ile Lys Ala Ala Tyr Gly Thr Thr Lys Tyr Cys Ser Ser Tyr Leu Arg 225 230 235 240 Gly Leu Pro Cys Pro Asn Pro Asn Cys Met Phe Leu His Glu Pro Gly 245 250 255 Glu Glu Ala Asp Ser Phe Asn Lys Arg Glu Leu His Asn Lys Gln Gln 260 265 270 Ala Gln Gln Gln Ser Gly Gly Thr Ala Phe Thr Arg Ser Gly Ile His 275 280 285 Asn Asn Ile Ser Thr Ser Thr Ala Gly Ser Asn Thr Asn Leu Leu Ser 290 295 300 Glu Asn Phe Thr Gly Thr Pro Ser Pro Ala Ala Met Arg Ala Gln Leu 305 310 315 320 His His Asp Ser His Thr Asn Ala Gly Thr Pro Val Leu Thr Pro Ala 325 330 335 Pro Val Pro Ala Gly Ser Asn Pro Trp Gly Val Thr Gln Ser Ala Thr 340 345 350 Pro Val Thr Ser Ile Asn Leu Ser Lys Asn Ser Ser Ser Ile Asn Leu 355 360 365 Pro Thr Leu Asn Asp Ser Leu Gly His His Thr Thr Pro Thr Thr Glu 370 375 380 Asn Thr Ile Thr Ser Thr Thr Thr Thr Thr Asn Thr Asn Ala Thr Ser 385 390 395 400 His Ser His Gly Ser Lys Lys Lys Gln Ser Leu Ala Ala Glu Glu Tyr 405 410 415 Lys Asp Pro Tyr Asp Ala Leu Gly Asn Ala Val Asp Phe Leu Asp Ala 420 425 430 Arg Leu His Ser Leu Ser Asn Tyr Gln Lys Arg Pro Ile Ser Ile Lys 435 440 445 Ser Asn Ile Ile Asp Glu Glu Thr Tyr Lys Lys Tyr Pro Ser Leu Phe 450 455 460 Ser Trp Asp Lys Ile Glu Ala Ser Lys Lys Ser Asp Asn Thr Leu Ala 465 470 475 480 Asn Lys Leu Val Glu Ile Leu Ala Ile Lys Pro Ile Asp Tyr Thr Ala 485 490 495 Ser Val Val Gln Phe Leu Gln Ser Val Asn Val Gly Val Asn Asp Asn 500 505 510 Ile Thr Ile Thr Asp Asn Thr Lys Thr Pro Thr Gln Pro Ile Arg Leu 515 520 525 Gln Thr Val Ser Gln Gln Ile Gln Pro Pro Leu Asn Val Ser Thr Pro 530 535 540 Pro Pro Gly Ile Phe Gly Pro Gln His Lys Val Pro Ile Gln Gln Gln 545 550 555 560 Gln Met Gly Asp Thr Ser Ser Arg Asn Ser Ser Asp Leu Leu Asn Gln 565 570 575 Leu Ile Asn Gly Arg Lys Ile Ile Ala Gly Asn 580 585 <210> 7 <211> 1764 <212> DNA <213> Artificial sequence <220> <223> NOT4 with T1285A mutation <400> 7 atgatgaatc cacacgttca agaaaatttg caagcaatcc acaacgcctt aagcaatttt 60 gatacgtcat ttttatcgga ggatgaagaa gattattgcc ctctttgtat tgaaccaatg 120 gatattactg ataaaaattt ttttccttgt ccctgtggtt atcaaatttg tcaattttgc 180 tacaataata tcagacaaaa tccagaatta aatggccgtt gcccagcatg tcgtcgtaaa 240 tatgatgacg agaacgtcag atacgtcaca ttatctccgg aggagttaaa aatggagaga 300 gccaagctcg ctaggaagga gaaagaaaga aagcatagag aaaaagaacg taaagagaat 360 gaatatacga ataggaaaca tttatctggt accagagtta tccaaaagaa tttagtgtac 420 gttgttggca tcaatcctcc tgttccatac gaggaagttg cgcccactct gaaatctgaa 480 aaatattttg gccaatatgg taagataaat aagattgtgg ttaatagaaa aacaccccat 540 tctaacaaca caaccagcga gcattatcac catcattcac caggatatgg cgtttacata 600 accttcggat ccaaggacga tgctgcaaga tgtatagctc aggtagacgg gacgtatatg 660 gatggccgcc tgatcaaagc tgcctacggt actactaaat actgttcttc ttatttaaga 720 ggattgccat gcccaaatcc caactgtatg tttttgcatg aacctggtga agaagctgat 780 tcttttaata aaagagaact ccacaataaa caacaagcgc aacagcaaag tggcggaact 840 gcattcacta gatctggaat acacaacaat atatctacca gtaccgctgg ttcaaatacc 900 aatttactaa gtgaaaattt cacaggcaca ccttcaccgg cggcgatgag ggctcagtta 960 catcatgaca gccatacaaa cgctggaaca ccggtattaa cacctgctcc ggtccctgca 1020 gggtcaaatc cttggggagt tactcaatca gcaacacctg taacctctat caatctctct 1080 aaaaacagca gctccataaa cttgccaaca ttaaatgatt ctctgggcca tcatactacc 1140 cccacaacag agaataccat cacaagtacg acaactacta ccaataccaa tgctacaagt 1200 cactcccatg gtagcaagaa gaagcaatct cttgctgcag aggaatacaa agatccttat 1260 gacgcactag ggaatgctgt tgacattttg gatgcaagac tacattctct atcaaattat 1320 cagaagcgcc ctatatctat caaatccaat attattgacg aagaaactta taaaaagtat 1380 ccgtctttgt tttcttggga caagattgag gcctcaaaga aaagtgacaa tacattagcc 1440 aacaaacttg tggagatcct ggctataaag ccaatagact acactgcttc tgtcgttcaa 1500 ttcttgcaga gtgtcaatgt tggtgtaaat gacaatatta caatcacaga taatacgaaa 1560 actcccaccc aaccaataag actgcaaacc gtctcacagc aaatccaacc accattaaac 1620 gtcagtaccc ctccaccggg tatctttggt ccacaacata aggttcctat tcagcagcaa 1680 caaatgggtg atacaagctc aagaaattcc tctgatttac taaatcaact aatcaacgga 1740 aggaaaatta tcgccggtaa ttaa 1764 <210> 8 <211> 587 <212> PRT <213> Artificial sequence <220> <223> Not4 with Phe429Ile mutation <400> 8 Met Met Asn Pro His Val Gln Glu Asn Leu Gln Ala Ile His Asn Ala 1 5 10 15 Leu Ser Asn Phe Asp Thr Ser Phe Leu Ser Glu Asp Glu Glu Asp Tyr 20 25 30 Cys Pro Leu Cys Ile Glu Pro Met Asp Ile Thr Asp Lys Asn Phe Phe 35 40 45 Pro Cys Pro Cys Gly Tyr Gln Ile Cys Gln Phe Cys Tyr Asn Asn Ile 50 55 60 Arg Gln Asn Pro Glu Leu Asn Gly Arg Cys Pro Ala Cys Arg Arg Lys 65 70 75 80 Tyr Asp Asp Glu Asn Val Arg Tyr Val Thr Leu Ser Pro Glu Glu Leu 85 90 95 Lys Met Glu Arg Ala Lys Leu Ala Arg Lys Glu Lys Glu Arg Lys His 100 105 110 Arg Glu Lys Glu Arg Lys Glu Asn Glu Tyr Thr Asn Arg Lys His Leu 115 120 125 Ser Gly Thr Arg Val Ile Gln Lys Asn Leu Val Tyr Val Val Gly Ile 130 135 140 Asn Pro Pro Val Pro Tyr Glu Glu Val Ala Pro Thr Leu Lys Ser Glu 145 150 155 160 Lys Tyr Phe Gly Gln Tyr Gly Lys Ile Asn Lys Ile Val Val Asn Arg 165 170 175 Lys Thr Pro His Ser Asn Asn Thr Thr Ser Glu His Tyr His His His 180 185 190 Ser Pro Gly Tyr Gly Val Tyr Ile Thr Phe Gly Ser Lys Asp Asp Ala 195 200 205 Ala Arg Cys Ile Ala Gln Val Asp Gly Thr Tyr Met Asp Gly Arg Leu 210 215 220 Ile Lys Ala Ala Tyr Gly Thr Thr Lys Tyr Cys Ser Ser Tyr Leu Arg 225 230 235 240 Gly Leu Pro Cys Pro Asn Pro Asn Cys Met Phe Leu His Glu Pro Gly 245 250 255 Glu Glu Ala Asp Ser Phe Asn Lys Arg Glu Leu His Asn Lys Gln Gln 260 265 270 Ala Gln Gln Gln Ser Gly Gly Thr Ala Phe Thr Arg Ser Gly Ile His 275 280 285 Asn Asn Ile Ser Thr Ser Thr Ala Gly Ser Asn Thr Asn Leu Leu Ser 290 295 300 Glu Asn Phe Thr Gly Thr Pro Ser Pro Ala Ala Met Arg Ala Gln Leu 305 310 315 320 His His Asp Ser His Thr Asn Ala Gly Thr Pro Val Leu Thr Pro Ala 325 330 335 Pro Val Pro Ala Gly Ser Asn Pro Trp Gly Val Thr Gln Ser Ala Thr 340 345 350 Pro Val Thr Ser Ile Asn Leu Ser Lys Asn Ser Ser Ser Ile Asn Leu 355 360 365 Pro Thr Leu Asn Asp Ser Leu Gly His His Thr Thr Pro Thr Thr Glu 370 375 380 Asn Thr Ile Thr Ser Thr Thr Thr Thr Thr Asn Thr Asn Ala Thr Ser 385 390 395 400 His Ser His Gly Ser Lys Lys Lys Gln Ser Leu Ala Ala Glu Glu Tyr 405 410 415 Lys Asp Pro Tyr Asp Ala Leu Gly Asn Ala Val Asp Ile Leu Asp Ala 420 425 430 Arg Leu His Ser Leu Ser Asn Tyr Gln Lys Arg Pro Ile Ser Ile Lys 435 440 445 Ser Asn Ile Ile Asp Glu Glu Thr Tyr Lys Lys Tyr Pro Ser Leu Phe 450 455 460 Ser Trp Asp Lys Ile Glu Ala Ser Lys Lys Ser Asp Asn Thr Leu Ala 465 470 475 480 Asn Lys Leu Val Glu Ile Leu Ala Ile Lys Pro Ile Asp Tyr Thr Ala 485 490 495 Ser Val Val Gln Phe Leu Gln Ser Val Asn Val Gly Val Asn Asp Asn 500 505 510 Ile Thr Ile Thr Asp Asn Thr Lys Thr Pro Thr Gln Pro Ile Arg Leu 515 520 525 Gln Thr Val Ser Gln Gln Ile Gln Pro Pro Leu Asn Val Ser Thr Pro 530 535 540 Pro Pro Gly Ile Phe Gly Pro Gln His Lys Val Pro Ile Gln Gln Gln 545 550 555 560 Gln Met Gly Asp Thr Ser Ser Arg Asn Ser Ser Asp Leu Leu Asn Gln 565 570 575 Leu Ile Asn Gly Arg Lys Ile Ile Ala Gly Asn 580 585 <210> 9 <211> 1755 <212> DNA <213> Homo sapiens <400> 9 gatgcacaca agagtgaggt tgctcatcgg tttaaagatt tgggagaaga aaatttcaaa 60 gccttggtgt tgattgcctt tgctcagtat cttcagcagt gtccatttga agatcatgta 120 aaattagtga atgaagtaac tgaatttgca aaaacatgtg ttgctgatga gtcagctgaa 180 aattgtgaca aatcacttca tacccttttt ggagacaaat tatgcacagt tgcaactctt 240 cgtgaaacct atggtgaaat ggctgactgc tgtgcaaaac aagaacctga gagaaatgaa 300 tgcttcttgc aacacaaaga tgacaaccca aacctccccc gattggtgag accagaggtt 360 gatgtgatgt gcactgcttt tcatgacaat gaagagacat ttttgaaaaa atacttatat 420 gaaattgcca gaagacatcc ttacttttat gccccggaac tccttttctt tgctaaaagg 480 tataaagctg cttttacaga atgttgccaa gctgctgata aagctgcctg cctgttgcca 540 aagctcgatg aacttcggga tgaagggaag gcttcgtctg ccaaacagag actcaagtgt 600 gccagtctcc aaaaatttgg agaaagagct ttcaaagcat gggcagtagc tcgcctgagc 660 cagagatttc ccaaagctga gtttgcagaa gtttccaagt tagtgacaga tcttaccaaa 720 gtccacacgg aatgctgcca tggagatctg cttgaatgtg ctgatgacag ggcggacctt 780 gccaagtata tctgtgaaaa tcaagattcg atctccagta aactgaagga atgctgtgaa 840 aaacctctgt tggaaaaatc ccactgcatt gccgaagtgg aaaatgatga gatgcctgct 900 gacttgcctt cattagctgc tgattttgtt gaaagtaagg atgtttgcaa aaactatgct 960 gaggcaaagg atgtcttcct gggcatgttt ttgtatgaat atgcaagaag gcatcctgat 1020 tactctgtcg tgctgctgct gagacttgcc aagacatatg aaaccactct agagaagtgc 1080 tgtgccgctg cagatcctca tgaatgctat gccaaagtgt tcgatgaatt taaacctctt 1140 gtggaagagc ctcagaattt aatcaaacaa aattgtgagc tttttgagca gcttggagag 1200 tacaaattcc agaatgcgct attagttcgt tacaccaaga aagtacccca agtgtcaact 1260 ccaactcttg tagaggtctc aagaaaccta ggaaaagtgg gcagcaaatg ttgtaaacat 1320 cctgaagcaa aaagaatgcc ctgtgcagaa gactatctat ccgtggtcct gaaccagtta 1380 tgtgtgttgc atgagaaaac gccagtaagt gacagagtca ccaaatgctg cacagaatcc 1440 ttggtgaaca ggcgaccatg cttttcagct ctggaagtcg atgaaacata cgttcccaaa 1500 gagtttaatg ctgaaacatt caccttccat gcagatatat gcacactttc tgagaaggag 1560 agacaaatca agaaacaaac tgcacttgtt gagctcgtga aacacaagcc caaggcaaca 1620 aaagagcaac tgaaagctgt tatggatgat ttcgcagctt ttgtagagaa gtgctgcaag 1680 gctgacgata aggagacctg ctttgccgag gagggtaaaa aacttgttgc tgcaagtcaa 1740 gctgccttag gctta 1755 <210> 10 <211> 585 <212> PRT <213> Homo sapiens <400> 10 Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu 1 5 10 15 Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln 20 25 30 Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu 35 40 45 Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys 50 55 60 Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu 65 70 75 80 Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro 85 90 95 Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu 100 105 110 Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His 115 120 125 Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg 130 135 140 Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg 145 150 155 160 Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala 165 170 175 Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser 180 185 190 Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu 195 200 205 Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro 210 215 220 Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys 225 230 235 240 Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp 245 250 255 Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser 260 265 270 Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His 275 280 285 Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser 290 295 300 Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala 305 310 315 320 Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg 325 330 335 Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr 340 345 350 Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu 355 360 365 Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro 370 375 380 Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu 385 390 395 400 Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro 405 410 415 Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys 420 425 430 Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys 435 440 445 Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His 450 455 460 Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser 465 470 475 480 Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr 485 490 495 Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp 500 505 510 Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala 515 520 525 Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu 530 535 540 Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys 545 550 555 560 Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val 565 570 575 Ala Ala Ser Gln Ala Ala Leu Gly Leu 580 585 <210> 11 <211> 1827 <212> DNA <213> Homo sapiens <400> 11 atgaagtggg taagctttat ttcccttctt tttctcttta gctcggctta ttccaggagc 60 ttggataaaa gagatgcaca caagagtgag gttgctcatc ggtttaaaga tttgggagaa 120 gaaaatttca aagccttggt gttgattgcc tttgctcagt atcttcagca gtgtccattt 180 gaagatcatg taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat 240 gagtcagctg aaaattgtga caaatcactt catacccttt ttggagacaa attatgcaca 300 gttgcaactc ttcgtgaaac ctatggtgaa atggctgact gctgtgcaaa acaagaacct 360 gagagaaatg aatgcttctt gcaacacaaa gatgacaacc caaacctccc ccgattggtg 420 agaccagagg ttgatgtgat gtgcactgct tttcatgaca atgaagagac atttttgaaa 480 aaatacttat atgaaattgc cagaagacat ccttactttt atgccccgga actccttttc 540 tttgctaaaa ggtataaagc tgcttttaca gaatgttgcc aagctgctga taaagctgcc 600 tgcctgttgc caaagctcga tgaacttcgg gatgaaggga aggcttcgtc tgccaaacag 660 agactcaagt gtgccagtct ccaaaaattt ggagaaagag ctttcaaagc atgggcagta 720 gctcgcctga gccagagatt tcccaaagct gagtttgcag aagtttccaa gttagtgaca 780 gatcttacca aagtccacac ggaatgctgc catggagatc tgcttgaatg tgctgatgac 840 agggcggacc ttgccaagta tatctgtgaa aatcaagatt cgatctccag taaactgaag 900 gaatgctgtg aaaaacctct gttggaaaaa tcccactgca ttgccgaagt ggaaaatgat 960 gagatgcctg ctgacttgcc ttcattagct gctgattttg ttgaaagtaa ggatgtttgc 1020 aaaaactatg ctgaggcaaa ggatgtcttc ctgggcatgt ttttgtatga atatgcaaga 1080 aggcatcctg attactctgt cgtgctgctg ctgagacttg ccaagacata tgaaaccact 1140 ctagagaagt gctgtgccgc tgcagatcct catgaatgct atgccaaagt gttcgatgaa 1200 tttaaacctc ttgtggaaga gcctcagaat ttaatcaaac aaaattgtga gctttttgag 1260 cagcttggag agtacaaatt ccagaatgcg ctattagttc gttacaccaa gaaagtaccc 1320 caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc taggaaaagt gggcagcaaa 1380 tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag aagactatct atccgtggtc 1440 ctgaaccagt tatgtgtgtt gcatgagaaa acgccagtaa gtgacagagt caccaaatgc 1500 tgcacagaat ccttggtgaa caggcgacca tgcttttcag ctctggaagt cgatgaaaca 1560 tacgttccca aagagtttaa tgctgaaaca ttcaccttcc atgcagatat atgcacactt 1620 tctgagaagg agagacaaat caagaaacaa actgcacttg ttgagctcgt gaaacacaag 1680 cccaaggcaa caaaagagca actgaaagct gttatggatg atttcgcagc ttttgtagag 1740 aagtgctgca aggctgacga taaggagacc tgctttgccg aggagggtaa aaaacttgtt 1800 gctgcaagtc aagctgcctt aggctta 1827 <210> 12 <211> 609 <212> PRT <213> Homo sapiens <400> 12 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala 20 25 30 His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu 35 40 45 Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val 50 55 60 Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp 65 70 75 80 Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp 85 90 95 Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala 100 105 110 Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln 115 120 125 His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val 130 135 140 Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys 145 150 155 160 Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro 165 170 175 Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys 180 185 190 Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu 195 200 205 Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys 210 215 220 Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val 225 230 235 240 Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser 245 250 255 Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly 260 265 270 Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile 275 280 285 Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu 290 295 300 Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp 305 310 315 320 Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser 325 330 335 Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly 340 345 350 Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val 355 360 365 Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys 370 375 380 Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu 385 390 395 400 Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys 405 410 415 Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu 420 425 430 Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val 435 440 445 Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His 450 455 460 Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val 465 470 475 480 Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg 485 490 495 Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe 500 505 510 Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala 515 520 525 Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu 530 535 540 Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys 545 550 555 560 Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala 565 570 575 Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe 580 585 590 Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly 595 600 605 Leu <210> 13 <211> 2108 <212> PRT <213> Saccharomyces cerevisiae <400> 13 Met Leu Ser Ala Thr Tyr Arg Asp Leu Asn Thr Ala Ser Asn Leu Glu 1 5 10 15 Thr Ser Lys Glu Lys Gln Ala Ala Gln Ile Val Ile Ala Gln Ile Ser 20 25 30 Leu Leu Phe Thr Thr Leu Asn Asn Asp Asn Phe Glu Ser Val Glu Arg 35 40 45 Glu Ile Arg His Ile Leu Asp Arg Ser Ser Val Asp Ile Tyr Ile Lys 50 55 60 Val Trp Glu Arg Leu Leu Thr Leu Ser Ser Arg Asp Ile Leu Gln Ala 65 70 75 80 Gly Lys Phe Leu Leu Gln Glu Asn Leu Leu His Arg Leu Leu Leu Glu 85 90 95 Phe Ala Lys Asp Leu Pro Lys Lys Ser Thr Asp Leu Ile Glu Leu Leu 100 105 110 Lys Glu Arg Thr Phe Asn Asn Gln Glu Phe Gln Lys Gln Thr Gly Ile 115 120 125 Thr Leu Ser Leu Phe Ile Asp Leu Phe Asp Lys Ser Ala Asn Lys Asp 130 135 140 Ile Ile Glu Ser Leu Asp Arg Ser Ser Gln Ile Asn Asp Phe Lys Thr 145 150 155 160 Ile Lys Met Asn His Thr Asn Tyr Leu Arg Asn Phe Phe Leu Gln Thr 165 170 175 Thr Pro Glu Thr Leu Glu Ser Asn Leu Arg Asp Leu Leu His Ser Leu 180 185 190 Glu Gly Glu Ser Leu Asn Asp Leu Leu Ala Leu Leu Leu Ser Glu Ile 195 200 205 Leu Ser Pro Gly Ser Gln Asn Leu Gln Asn Asp Pro Thr Arg Ser Trp 210 215 220 Leu Thr Pro Pro Met Val Leu Asp Ala Thr Asn Arg Gly Asn Val Ile 225 230 235 240 Ala Arg Ser Ile Ser Ser Leu Gln Ala Asn Gln Ile Asn Trp Asn Arg 245 250 255 Val Phe Asn Leu Met Ser Thr Lys Tyr Phe Leu Ser Ala Pro Leu Met 260 265 270 Pro Thr Thr Ala Ser Leu Ser Cys Leu Phe Ala Ala Leu His Asp Gly 275 280 285 Pro Val Ile Asp Glu Phe Phe Ser Cys Asp Trp Lys Val Ile Phe Lys 290 295 300 Leu Asp Leu Ala Ile Gln Leu His Lys Trp Ser Val Gln Asn Gly Cys 305 310 315 320 Phe Asp Leu Leu Asn Ala Glu Gly Thr Arg Lys Val Ser Glu Thr Ile 325 330 335 Pro Asn Thr Lys Gln Ser Leu Leu Tyr Leu Leu Ser Ile Ala Ser Leu 340 345 350 Asn Leu Glu Leu Phe Leu Gln Arg Glu Glu Leu Ser Asp Gly Pro Met 355 360 365 Leu Ala Tyr Phe Gln Glu Cys Phe Phe Glu Asp Phe Asn Tyr Ala Pro 370 375 380 Glu Tyr Leu Ile Leu Ala Leu Val Lys Glu Met Lys Arg Phe Val Leu 385 390 395 400 Leu Ile Glu Asn Arg Thr Val Ile Asp Glu Ile Leu Ile Thr Leu Leu 405 410 415 Ile Gln Val His Asn Lys Ser Pro Ser Ser Phe Lys Asp Val Ile Ser 420 425 430 Thr Ile Thr Asp Asp Ser Lys Ile Val Asp Ala Ala Lys Ile Ile Ile 435 440 445 Asn Ser Asp Asp Ala Pro Ile Ala Asn Phe Leu Lys Ser Leu Leu Asp 450 455 460 Thr Gly Arg Leu Asp Thr Val Ile Asn Lys Leu Pro Phe Asn Glu Ala 465 470 475 480 Phe Lys Ile Leu Pro Cys Ala Arg Gln Ile Gly Trp Glu Gly Phe Asp 485 490 495 Thr Phe Leu Lys Thr Lys Val Ser Pro Ser Asn Val Asp Val Val Leu 500 505 510 Glu Ser Leu Glu Val Gln Thr Lys Met Thr Asp Thr Asn Thr Pro Phe 515 520 525 Arg Ser Leu Lys Thr Phe Asp Leu Phe Ala Phe His Ser Leu Ile Glu 530 535 540 Val Leu Asn Lys Cys Pro Leu Asp Val Leu Gln Leu Gln Arg Phe Glu 545 550 555 560 Ser Leu Glu Phe Ser Leu Leu Ile Ala Phe Pro Arg Leu Ile Asn Phe 565 570 575 Gly Phe Gly His Asp Glu Ala Ile Leu Ala Asn Gly Asp Ile Ala Gly 580 585 590 Ile Asn Asn Asp Ile Glu Lys Glu Met Gln Asn Tyr Leu Gln Lys Met 595 600 605 Tyr Ser Gly Glu Leu Ala Ile Lys Asp Val Ile Glu Leu Leu Arg Arg 610 615 620 Leu Arg Asp Ser Asp Leu Pro Arg Asp Gln Glu Val Phe Thr Cys Ile 625 630 635 640 Thr His Ala Val Ile Ala Glu Ser Thr Phe Phe Gln Asp Tyr Pro Leu 645 650 655 Asp Ala Leu Ala Thr Thr Ser Val Leu Phe Gly Ser Met Ile Leu Phe 660 665 670 Gln Leu Leu Arg Gly Phe Val Leu Asp Val Ala Phe Arg Ile Ile Met 675 680 685 Arg Phe Ala Lys Glu Pro Pro Glu Ser Lys Met Phe Lys Phe Ala Val 690 695 700 Gln Ala Ile Tyr Ala Phe Arg Ile Arg Leu Ala Glu Tyr Pro Gln Tyr 705 710 715 720 Cys Lys Asp Leu Leu Arg Asp Val Pro Ala Leu Lys Ser Gln Ala Gln 725 730 735 Val Tyr Gln Ser Ile Val Glu Ala Ala Thr Leu Ala Asn Ala Pro Lys 740 745 750 Glu Arg Ser Arg Pro Val Gln Glu Met Ile Pro Leu Lys Phe Phe Ala 755 760 765 Val Asp Glu Val Ser Cys Gln Ile Asn Gln Glu Gly Ala Pro Lys Asp 770 775 780 Val Val Glu Lys Val Leu Phe Val Leu Asn Asn Val Thr Leu Ala Asn 785 790 795 800 Leu Asn Asn Lys Val Asp Glu Leu Lys Lys Ser Leu Thr Pro Asn Tyr 805 810 815 Phe Ser Trp Phe Ser Thr Tyr Leu Val Thr Gln Arg Ala Lys Thr Glu 820 825 830 Pro Asn Tyr His Asp Leu Tyr Ser Lys Val Ile Val Ala Met Gly Ser 835 840 845 Gly Leu Leu His Gln Phe Met Val Asn Val Thr Leu Arg Gln Leu Phe 850 855 860 Val Leu Leu Ser Thr Lys Asp Glu Gln Ala Ile Asp Lys Lys His Leu 865 870 875 880 Lys Asn Leu Ala Ser Trp Leu Gly Cys Ile Thr Leu Ala Leu Asn Lys 885 890 895 Pro Ile Lys His Lys Asn Ile Ala Phe Arg Glu Met Leu Ile Glu Ala 900 905 910 Tyr Lys Glu Asn Arg Leu Glu Ile Val Val Pro Phe Val Thr Lys Ile 915 920 925 Leu Gln Arg Ala Ser Glu Ser Lys Ile Phe Lys Pro Pro Asn Pro Trp 930 935 940 Thr Val Gly Ile Leu Lys Leu Leu Ile Glu Leu Asn Glu Lys Ala Asn 945 950 955 960 Trp Lys Leu Ser Leu Thr Phe Glu Val Glu Val Leu Leu Lys Ser Phe 965 970 975 Asn Leu Thr Thr Lys Ser Leu Lys Pro Ser Asn Phe Ile Asn Thr Pro 980 985 990 Glu Val Ile Glu Thr Leu Ser Gly Ala Leu Gly Ser Ile Thr Leu Glu 995 1000 1005 Gln Gln Gln Thr Glu Gln Gln Arg Gln Ile Ile Leu Met Gln Gln 1010 1015 1020 His Gln Gln Gln Met Leu Ile Tyr Gln Gln Arg Gln Gln Gln Gln 1025 1030 1035 Gln Gln Arg Gln Gln Gln Gln Gln His His Ile Ser Ala Asn Thr 1040 1045 1050 Ile Ala Asp Gln Gln Ala Ala Phe Gly Gly Glu Gly Ser Ile Ser 1055 1060 1065 His Asp Asn Pro Phe Asn Asn Leu Leu Gly Ser Thr Ile Phe Val 1070 1075 1080 Thr His Pro Asp Leu Lys Arg Val Phe Gln Met Ala Leu Ala Lys 1085 1090 1095 Ser Val Arg Glu Ile Leu Leu Glu Val Val Glu Lys Ser Ser Gly 1100 1105 1110 Ile Ala Val Val Thr Thr Thr Lys Ile Ile Leu Lys Asp Phe Ala 1115 1120 1125 Thr Glu Val Asp Glu Ser Lys Leu Lys Thr Ala Ala Ile Ile Met 1130 1135 1140 Val Arg His Leu Ala Gln Ser Leu Ala Arg Ala Thr Ser Ile Glu 1145 1150 1155 Pro Leu Lys Glu Gly Ile Arg Ser Thr Met Gln Ser Leu Ala Pro 1160 1165 1170 Asn Leu Met Ser Leu Ser Ser Ser Pro Ala Glu Glu Leu Asp Thr 1175 1180 1185 Ala Ile Asn Glu Asn Ile Gly Ile Ala Leu Val Leu Ile Glu Lys 1190 1195 1200 Ala Ser Met Asp Lys Ser Thr Gln Asp Leu Ala Asp Gln Leu Met 1205 1210 1215 Gln Ala Ile Ala Ile Arg Arg Tyr His Lys Glu Arg Arg Ala Asp 1220 1225 1230 Gln Pro Phe Ile Thr Gln Asn Thr Asn Pro Tyr Ser Leu Ser Leu 1235 1240 1245 Pro Glu Pro Leu Gly Leu Lys Asn Thr Gly Val Thr Pro Gln Gln 1250 1255 1260 Phe Arg Val Tyr Glu Glu Phe Gly Lys Asn Ile Pro Asn Leu Asp 1265 1270 1275 Val Ile Pro Phe Ala Gly Leu Pro Ala His Ala Pro Pro Met Thr 1280 1285 1290 Gln Asn Val Gly Leu Thr Gln Pro Gln Gln Gln Gln Ala Gln Met 1295 1300 1305 Pro Thr Gln Ile Leu Thr Ser Glu Gln Ile Arg Ala Gln Gln Gln 1310 1315 1320 Gln Gln Gln Leu Gln Lys Ser Arg Leu Asn Gln Pro Ser Gln Ser 1325 1330 1335 Ala Gln Pro Pro Gly Val Asn Val Pro Asn Pro Gln Gly Gly Ile 1340 1345 1350 Ala Ala Val Gln Ser Asp Leu Glu Gln Asn Gln Arg Val Leu Val 1355 1360 1365 His Leu Met Asp Ile Leu Val Ser Gln Ile Lys Glu Asn Ala Thr 1370 1375 1380 Lys Asn Asn Leu Ala Glu Leu Gly Asp Gln Asn Gln Ile Lys Thr 1385 1390 1395 Ile Ile Phe Gln Ile Leu Thr Phe Ile Ala Lys Ser Ala Gln Lys 1400 1405 1410 Asp Gln Leu Ala Leu Lys Val Ser Gln Ala Val Val Asn Ser Leu 1415 1420 1425 Phe Ala Thr Ser Glu Ser Pro Leu Cys Arg Glu Val Leu Ser Leu 1430 1435 1440 Leu Leu Glu Lys Leu Cys Ser Leu Ser Leu Val Ala Arg Lys Asp 1445 1450 1455 Val Val Trp Trp Leu Val Tyr Ala Leu Asp Ser Arg Lys Phe Asn 1460 1465 1470 Val Pro Val Ile Arg Ser Leu Leu Glu Val Asn Leu Ile Asp Ala 1475 1480 1485 Thr Glu Leu Asp Asn Val Leu Val Thr Ala Met Lys Asn Lys Met 1490 1495 1500 Glu Asn Ser Thr Glu Phe Ala Met Lys Leu Ile Gln Asn Thr Val 1505 1510 1515 Leu Ser Asp Asp Pro Ile Leu Met Arg Met Asp Phe Ile Lys Thr 1520 1525 1530 Leu Glu His Leu Ala Ser Ser Glu Asp Glu Asn Val Lys Lys Phe 1535 1540 1545 Ile Lys Glu Phe Glu Asp Thr Lys Ile Met Pro Val Arg Lys Gly 1550 1555 1560 Thr Lys Thr Thr Arg Thr Glu Lys Leu Tyr Leu Val Phe Thr Glu 1565 1570 1575 Trp Val Lys Leu Leu Gln Arg Val Glu Asn Asn Asp Val Ile Thr 1580 1585 1590 Thr Val Phe Ile Lys Gln Leu Val Glu Lys Gly Val Ile Ser Asp 1595 1600 1605 Thr Asp Asn Leu Leu Thr Phe Val Lys Ser Ser Leu Glu Leu Ser 1610 1615 1620 Val Ser Ser Phe Lys Glu Ser Asp Pro Thr Asp Glu Val Phe Ile 1625 1630 1635 Ala Ile Asp Ala Leu Gly Ser Leu Ile Ile Lys Leu Leu Ile Leu 1640 1645 1650 Gln Gly Phe Lys Asp Asp Thr Arg Arg Asp Tyr Ile Asn Ala Ile 1655 1660 1665 Phe Ser Val Ile Val Leu Val Phe Ala Lys Asp His Ser Gln Glu 1670 1675 1680 Gly Thr Thr Phe Asn Glu Arg Pro Tyr Phe Arg Leu Phe Ser Asn 1685 1690 1695 Ile Leu Tyr Glu Trp Ala Thr Ile Arg Thr His Asn Phe Val Arg 1700 1705 1710 Ile Ser Asp Ser Ser Thr Arg Gln Glu Leu Ile Glu Phe Asp Ser 1715 1720 1725 Val Phe Tyr Asn Thr Phe Ser Gly Tyr Leu His Ala Leu Gln Pro 1730 1735 1740 Phe Ala Phe Pro Gly Phe Ser Phe Ala Trp Val Thr Leu Leu Ser 1745 1750 1755 His Arg Met Leu Leu Pro Ile Met Leu Arg Leu Pro Asn Lys Ile 1760 1765 1770 Gly Trp Glu Lys Leu Met Leu Leu Ile Ile Asp Leu Phe Lys Phe 1775 1780 1785 Leu Asp Gln Tyr Thr Ser Lys His Ala Val Ser Asp Ala Val Ser 1790 1795 1800 Val Val Tyr Lys Gly Thr Leu Arg Val Ile Leu Gly Ile Ser Asn 1805 1810 1815 Asp Met Pro Ser Phe Leu Ile Glu Asn His Tyr Glu Leu Met Asn 1820 1825 1830 Asn Leu Pro Pro Thr Tyr Phe Gln Leu Lys Asn Val Ile Leu Ser 1835 1840 1845 Ala Ile Pro Lys Asn Met Thr Val Pro Asn Pro Tyr Asp Val Asp 1850 1855 1860 Leu Asn Met Glu Asp Ile Pro Ala Cys Lys Glu Leu Pro Glu Val 1865 1870 1875 Phe Phe Asp Pro Val Ile Asp Leu His Ser Leu Lys Lys Pro Val 1880 1885 1890 Asp Asn Tyr Leu Arg Ile Pro Ser Asn Ser Leu Leu Arg Thr Ile 1895 1900 1905 Leu Ser Ala Ile Tyr Lys Asp Thr Tyr Asp Ile Lys Lys Gly Val 1910 1915 1920 Gly Tyr Asp Phe Leu Ser Val Asp Ser Lys Leu Ile Arg Ala Ile 1925 1930 1935 Val Leu His Val Gly Ile Glu Ala Gly Ile Glu Tyr Lys Arg Thr 1940 1945 1950 Ser Ser Asn Ala Val Phe Asn Thr Lys Ser Ser Tyr Tyr Thr Leu 1955 1960 1965 Leu Phe Asn Leu Ile Gln Asn Gly Ser Ile Glu Met Lys Tyr Gln 1970 1975 1980 Ile Ile Leu Ser Ile Val Glu Gln Leu Arg Tyr Pro Asn Ile His 1985 1990 1995 Thr Tyr Trp Phe Ser Phe Val Leu Met Asn Met Phe Lys Ser Asp 2000 2005 2010 Glu Trp Asn Asp Gln Lys Leu Glu Val Gln Glu Ile Ile Leu Arg 2015 2020 2025 Asn Phe Leu Lys Arg Ile Ile Val Asn Lys Pro His Thr Trp Gly 2030 2035 2040 Val Ser Val Phe Phe Thr Gln Leu Ile Asn Asn Asn Asp Ile Asn 2045 2050 2055 Leu Leu Asp Leu Pro Phe Val Gln Ser Val Pro Glu Ile Lys Leu 2060 2065 2070 Ile Leu Gln Gln Leu Val Lys Tyr Ser Lys Lys Tyr Thr Thr Ser 2075 2080 2085 Glu Gln Asp Asp Gln Ser Ala Thr Ile Asn Arg Arg Gln Thr Pro 2090 2095 2100 Leu Gln Ser Asn Ala 2105 <210> 14 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> GLP-1 fragment <400> 14 His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 20 25 30 <210> 15 <211> 61 <212> PRT <213> Artificial Sequence <220> <223> Tandem repeat of GLP-1 fragment <400> 15 His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg His Gly 20 25 30 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 35 40 45 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 50 55 60 <210> 16 <211> 645 <212> PRT <213> Artificial Sequence <220> <223> Albiglutide (GLP-1 tandem repeat fused to the N-terminus of human serum albumin) <400> 16 His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg His Gly 20 25 30 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 35 40 45 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Asp Ala His Lys 50 55 60 Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys 65 70 75 80 Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe 85 90 95 Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr 100 105 110 Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr 115 120 125 Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr 130 135 140 Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu 145 150 155 160 Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val 165 170 175 Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu 180 185 190 Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr 195 200 205 Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala 210 215 220 Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro 225 230 235 240 Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln 245 250 255 Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys 260 265 270 Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe 275 280 285 Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu 290 295 300 Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu 305 310 315 320 Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys 325 330 335 Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu 340 345 350 Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp 355 360 365 Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp 370 375 380 Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp 385 390 395 400 Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr 405 410 415 Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys 420 425 430 Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile 435 440 445 Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln 450 455 460 Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr 465 470 475 480 Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys 485 490 495 Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr 500 505 510 Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro 515 520 525 Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg 530 535 540 Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys 545 550 555 560 Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu 565 570 575 Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu 580 585 590 Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met 595 600 605 Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys 610 615 620 Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln 625 630 635 640 Ala Ala Leu Gly Leu 645 <210> 17 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> KEX leader sequence <400> 17 Met Lys Trp Val Ser Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Ser Leu Asp Lys Arg 20 <210> 18 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Modified KEX leader sequence <400> 18 Met Lys Trp Val Ser Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Gly Ser Leu Asp Lys Arg 20 <210> 19 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Mating factor alpha - Human serum albumin fusion leader sequence <400> 19 Met Lys Trp Val Ser Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Ser Leu Asp Lys Arg Asp Ala His 20 25 <210> 20 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Pentapeptide motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa = Phe, Trp or Tyr <220> <221> MISC_FEATURE <222> (2)..(2) <223> Xaa = Ile, Leu, Val, Ala or Met <220> <221> MISC_FEATURE <222> (3)..(3) <223> Xaa = Leu, Val, Ala or Met <220> <221> MISC_FEATURE <222> (4)..(4) <223> Xaa = Ser or Thr <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa = Ile, Val, Ala or Met <400> 20 Xaa Xaa Xaa Xaa Xaa 1 5 <210> 21 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Leader Sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa = Phe, Trp or Tyr <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa = Ile, Leu, Val, Ala or Met <220> <221> MISC_FEATURE <222> (7)..(7) <223> Xaa = Leu, Val, Ala or Met <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa = Ser or Thr <220> <221> MISC_FEATURE <222> (9)..(9) <223> Xaa = Ile, Val, Ala or Met <400> 21 Met Lys Trp Val Xaa Xaa Xaa Xaa Xaa Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg <210> 22 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Leader Sequence <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa = Phe, Trp or Tyr <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa = Ile, Leu, Val, Ala or Met <220> <221> MISC_FEATURE <222> (7)..(7) <223> Xaa = Leu, Val, Ala or Met <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa = Ser or Thr <220> <221> MISC_FEATURE <222> (9)..(9) <223> Xaa = Ile, Val, Ala or Met <220> <221> PROPEP <222> (20)..(24) <220> <221> MISC_FEATURE <222> (20)..(20) <223> Xaa = Gly or Ser <220> <221> MISC_FEATURE <222> (21)..(21) <223> Xaa = Val or Leu <220> <221> MISC_FEATURE <222> (22)..(22) <223> Xaa = Phe or Asp <220> <221> MISC_FEATURE <222> (23)..(23) <223> Xaa = Arg or Lys <220> <221> MISC_FEATURE <222> (24)..(24) <223> Xaa = Arg or Lys <400> 22 Met Lys Trp Val Xaa Xaa Xaa Xaa Xaa Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Xaa Xaa Xaa Xaa Xaa 20 <210> 23 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <220> <221> SIGNAL <222> (1)..(19) <223> Pre sequence <220> <221> PROPEP <222> (20)..(24) <220> <221> MISC_FEATURE <222> (20)..(20) <223> Xaa = Gly or Ser <220> <221> MISC_FEATURE <222> (21)..(21) <223> Xaa = Val or Leu <220> <221> MISC_FEATURE <222> (22)..(22) <223> Xaa = Phe or Asp <220> <221> MISC_FEATURE <222> (23)..(23) <223> Xaa = Arg or Lys <220> <221> MISC_FEATURE <222> (24)..(24) <223> Xaa = Arg or Lys <400> 23 Met Lys Trp Val Phe Ile Val Ser Ile Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Xaa Xaa Xaa Xaa Xaa 20 <210> 24 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> Leader sequence <400> 24 Met Lys Trp Val Phe Ile Val Ser Ile Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Ser Leu Asp Lys Arg 20 <210> 25 <211> 522 <212> PRT <213> Saccharomyces cerevisiae <400> 25 Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu 1 5 10 15 Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser 20 25 30 Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser 35 40 45 His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys 50 55 60 Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu 65 70 75 80 Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu 85 90 95 Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys 100 105 110 Asn Ser Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala 115 120 125 Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala 130 135 140 Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr 145 150 155 160 Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr 165 170 175 Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser 180 185 190 Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser 195 200 205 Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala 210 215 220 Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr 225 230 235 240 Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly 245 250 255 Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu 260 265 270 Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met 275 280 285 Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn 290 295 300 Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr 305 310 315 320 Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp 325 330 335 Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu 340 345 350 Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln 355 360 365 Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys 370 375 380 Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu 385 390 395 400 Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr 405 410 415 Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile 420 425 430 Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu 435 440 445 Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser 450 455 460 Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile 465 470 475 480 Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu 485 490 495 Ala Gln Glu Lys Ala Ala Glu Glu Ala Asp Ala Asp Ala Glu Leu Ala 500 505 510 Asp Glu Glu Asp Ala Ile His Asp Glu Leu 515 520 <210> 26 <211> 563 <212> PRT <213> Saccharomyces cerevisiae <400> 26 Met Arg Leu Arg Thr Ala Ile Ala Thr Leu Cys Leu Thr Ala Phe Thr 1 5 10 15 Ser Ala Thr Ser Asn Asn Ser Tyr Ile Ala Thr Asp Gln Thr Gln Asn 20 25 30 Ala Phe Asn Asp Thr His Phe Cys Lys Val Asp Arg Asn Asp His Val 35 40 45 Ser Pro Ser Cys Asn Val Thr Phe Asn Glu Leu Asn Ala Ile Asn Glu 50 55 60 Asn Ile Arg Asp Asp Leu Ser Ala Leu Leu Lys Ser Asp Phe Phe Lys 65 70 75 80 Tyr Phe Arg Leu Asp Leu Tyr Lys Gln Cys Ser Phe Trp Asp Ala Asn 85 90 95 Asp Gly Leu Cys Leu Asn Arg Ala Cys Ser Val Asp Val Val Glu Asp 100 105 110 Trp Asp Thr Leu Pro Glu Tyr Trp Gln Pro Glu Ile Leu Gly Ser Phe 115 120 125 Asn Asn Asp Thr Met Lys Glu Ala Asp Asp Ser Asp Asp Glu Cys Lys 130 135 140 Phe Leu Asp Gln Leu Cys Gln Thr Ser Lys Lys Pro Val Asp Ile Glu 145 150 155 160 Asp Thr Ile Asn Tyr Cys Asp Val Asn Asp Phe Asn Gly Lys Asn Ala 165 170 175 Val Leu Ile Asp Leu Thr Ala Asn Pro Glu Arg Phe Thr Gly Tyr Gly 180 185 190 Gly Lys Gln Ala Gly Gln Ile Trp Ser Thr Ile Tyr Gln Asp Asn Cys 195 200 205 Phe Thr Ile Gly Glu Thr Gly Glu Ser Leu Ala Lys Asp Ala Phe Tyr 210 215 220 Arg Leu Val Ser Gly Phe His Ala Ser Ile Gly Thr His Leu Ser Lys 225 230 235 240 Glu Tyr Leu Asn Thr Lys Thr Gly Lys Trp Glu Pro Asn Leu Asp Leu 245 250 255 Phe Met Ala Arg Ile Gly Asn Phe Pro Asp Arg Val Thr Asn Met Tyr 260 265 270 Phe Asn Tyr Ala Val Val Ala Lys Ala Leu Trp Lys Ile Gln Pro Tyr 275 280 285 Leu Pro Glu Phe Ser Phe Cys Asp Leu Val Asn Lys Glu Ile Lys Asn 290 295 300 Lys Met Asp Asn Val Ile Ser Gln Leu Asp Thr Lys Ile Phe Asn Glu 305 310 315 320 Asp Leu Val Phe Ala Asn Asp Leu Ser Leu Thr Leu Lys Asp Glu Phe 325 330 335 Arg Ser Arg Phe Lys Asn Val Thr Lys Ile Met Asp Cys Val Gln Cys 340 345 350 Asp Arg Cys Arg Leu Trp Gly Lys Ile Gln Thr Thr Gly Tyr Ala Thr 355 360 365 Ala Leu Lys Ile Leu Phe Glu Ile Asn Asp Ala Asp Glu Phe Thr Lys 370 375 380 Gln His Ile Val Gly Lys Leu Thr Lys Tyr Glu Leu Ile Ala Leu Leu 385 390 395 400 Gln Thr Phe Gly Arg Leu Ser Glu Ser Ile Glu Ser Val Asn Met Phe 405 410 415 Glu Lys Met Tyr Gly Lys Arg Leu Asn Gly Ser Glu Asn Arg Leu Ser 420 425 430 Ser Phe Phe Gln Asn Asn Phe Phe Asn Ile Leu Lys Glu Ala Gly Lys 435 440 445 Ser Ile Arg Tyr Thr Ile Glu Asn Ile Asn Ser Thr Lys Glu Gly Lys 450 455 460 Lys Lys Thr Asn Asn Ser Gln Ser His Val Phe Asp Asp Leu Lys Met 465 470 475 480 Pro Lys Ala Glu Ile Val Pro Arg Pro Ser Asn Gly Thr Val Asn Lys 485 490 495 Trp Lys Lys Ala Trp Asn Thr Glu Val Asn Asn Val Leu Glu Ala Phe 500 505 510 Arg Phe Ile Tyr Arg Ser Tyr Leu Asp Leu Pro Arg Asn Ile Trp Glu 515 520 525 Leu Ser Leu Met Lys Val Tyr Lys Phe Trp Asn Lys Phe Ile Gly Val 530 535 540 Ala Asp Tyr Val Ser Glu Glu Thr Arg Glu Pro Ile Ser Tyr Lys Leu 545 550 555 560 Asp Ile Gln <210> 27 <211> 2445 <212> DNA <213> Saccharomyces cerevisiae <400> 27 atgaaagtga ggaaatatat tactttatgc ttttggtggg ccttttcaac atccgctctt 60 gtatcatcac aacaaattcc attgaaggac catacgtcac gacagtattt tgctgtagaa 120 agcaatgaaa cattatcccg cttggaggaa atgcatccaa attggaaata tgaacatgat 180 gttcgagggc taccaaacca ttatgttttt tcaaaagagt tgctaaaatt gggcaaaaga 240 tcatcattag aagagttaca gggggataac aacgaccaca tattatctgt ccatgattta 300 ttcccgcgta acgacctatt taagagacta ccggtgcctg ctccaccaat ggactcaagc 360 ttgttaccgg taaaagaagc tgaggataaa ctcagcataa atgatccgct ttttgagagg 420 cagtggcact tggtcaatcc aagttttcct ggcagtgata taaatgttct tgatctgtgg 480 tacaataata ttacaggcgc aggggtcgtg gctgccattg ttgatgatgg ccttgactac 540 gaaaatgaag acttgaagga taatttttgc gctgaaggtt cttgggattt caacgacaat 600 accaatttac ctaaaccaag attatctgat gactaccatg gtacgagatg tgcaggtgaa 660 atagctgcca aaaaaggtaa caatttttgc ggtgtcgggg taggttacaa cgctaaaatc 720 tcaggcataa gaatcttatc cggtgatatc actacggaag atgaagctgc gtccttgatt 780 tatggtctag acgtaaacga tatatattca tgctcatggg gtcccgctga tgacggaaga 840 catttacaag gccctagtga cctggtgaaa aaggctttag taaaaggtgt tactgaggga 900 agagattcca aaggagcgat ttacgttttt gccagtggaa atggtggaac tcgtggtgat 960 aattgcaatt acgacggcta tactaattcc atatattcta ttactattgg ggctattgat 1020 cacaaagatc tacatcctcc ttattccgaa ggttgttccg ccgtcatggc agtcacgtat 1080 tcttcaggtt caggcgaata tattcattcg agtgatatca acggcagatg cagtaatagc 1140 cacggtggaa cgtctgcggc tgctccatta gctgccggtg tttacacttt gttactagaa 1200 gccaacccaa acctaacttg gagagacgta cagtatttat caatcttgtc tgcggtaggg 1260 ttagaaaaga acgctgacgg agattggaga gatagcgcca tggggaagaa atactctcat 1320 cgctatggct ttggtaaaat cgatgcccat aagttaattg aaatgtccaa gacctgggag 1380 aatgttaacg cacaaacctg gttttacctg ccaacattgt atgtttccca gtccacaaac 1440 tccacggaag agacattaga atccgtcata accatatcag aaaaaagtct tcaagatgct 1500 aacttcaaga gaattgagca cgtcacggta actgtagata ttgatacaga aattagggga 1560 actacgactg tcgatttaat atcaccagcg gggataattt caaaccttgg cgttgtaaga 1620 ccaagagatg tttcatcaga gggattcaaa gactggacat tcatgtctgt agcacattgg 1680 ggtgagaacg gcgtaggtga ttggaaaatc aaggttaaga caacagaaaa tggacacagg 1740 attgacttcc acagttggag gctgaagctc tttggggaat ccattgattc atctaaaaca 1800 gaaactttcg tctttggaaa cgataaagag gaggttgaac cagctgctac agaaagtacc 1860 gtatcacaat attctgccag ttcaacttct atttccatca gcgctacttc tacatcttct 1920 atctcaattg gtgtggaaac gtcggccatt ccccaaacga ctactgcgag taccgatcct 1980 gattctgatc caaacactcc taaaaaactt tcctctccta ggcaagccat gcattatttt 2040 ttaacaatat ttttgattgg cgccacattt ttggtgttat acttcatgtt ttttatgaaa 2100 tcaaggagaa ggatcagaag gtcaagagcg gaaacgtatg aattcgatat cattgataca 2160 gactctgagt acgattctac tttggacaat ggaacttccg gaattactga gcccgaagag 2220 gttgaggact tcgattttga tttgtccgat gaagaccatc ttgcaagttt gtcttcatca 2280 gaaaacggtg atgctgaaca tacaattgat agtgtactaa caaacgaaaa tccatttagt 2340 gaccctataa agcaaaagtt cccaaatgac gccaacgcag aatctgcttc caataaatta 2400 caagaattac agcctgatgt tcctccatct tccggacgat cgtga 2445 <210> 28 <211> 814 <212> PRT <213> Saccharomyces cerevisiae <400> 28 Met Lys Val Arg Lys Tyr Ile Thr Leu Cys Phe Trp Trp Ala Phe Ser 1 5 10 15 Thr Ser Ala Leu Val Ser Ser Gln Gln Ile Pro Leu Lys Asp His Thr 20 25 30 Ser Arg Gln Tyr Phe Ala Val Glu Ser Asn Glu Thr Leu Ser Arg Leu 35 40 45 Glu Glu Met His Pro Asn Trp Lys Tyr Glu His Asp Val Arg Gly Leu 50 55 60 Pro Asn His Tyr Val Phe Ser Lys Glu Leu Leu Lys Leu Gly Lys Arg 65 70 75 80 Ser Ser Leu Glu Glu Leu Gln Gly Asp Asn Asn Asp His Ile Leu Ser 85 90 95 Val His Asp Leu Phe Pro Arg Asn Asp Leu Phe Lys Arg Leu Pro Val 100 105 110 Pro Ala Pro Pro Met Asp Ser Ser Leu Leu Pro Val Lys Glu Ala Glu 115 120 125 Asp Lys Leu Ser Ile Asn Asp Pro Leu Phe Glu Arg Gln Trp His Leu 130 135 140 Val Asn Pro Ser Phe Pro Gly Ser Asp Ile Asn Val Leu Asp Leu Trp 145 150 155 160 Tyr Asn Asn Ile Thr Gly Ala Gly Val Val Ala Ala Ile Val Asp Asp 165 170 175 Gly Leu Asp Tyr Glu Asn Glu Asp Leu Lys Asp Asn Phe Cys Ala Glu 180 185 190 Gly Ser Trp Asp Phe Asn Asp Asn Thr Asn Leu Pro Lys Pro Arg Leu 195 200 205 Ser Asp Asp Tyr His Gly Thr Arg Cys Ala Gly Glu Ile Ala Ala Lys 210 215 220 Lys Gly Asn Asn Phe Cys Gly Val Gly Val Gly Tyr Asn Ala Lys Ile 225 230 235 240 Ser Gly Ile Arg Ile Leu Ser Gly Asp Ile Thr Thr Glu Asp Glu Ala 245 250 255 Ala Ser Leu Ile Tyr Gly Leu Asp Val Asn Asp Ile Tyr Ser Cys Ser 260 265 270 Trp Gly Pro Ala Asp Asp Gly Arg His Leu Gln Gly Pro Ser Asp Leu 275 280 285 Val Lys Lys Ala Leu Val Lys Gly Val Thr Glu Gly Arg Asp Ser Lys 290 295 300 Gly Ala Ile Tyr Val Phe Ala Ser Gly Asn Gly Gly Thr Arg Gly Asp 305 310 315 320 Asn Cys Asn Tyr Asp Gly Tyr Thr Asn Ser Ile Tyr Ser Ile Thr Ile 325 330 335 Gly Ala Ile Asp His Lys Asp Leu His Pro Pro Tyr Ser Glu Gly Cys 340 345 350 Ser Ala Val Met Ala Val Thr Tyr Ser Ser Gly Ser Gly Glu Tyr Ile 355 360 365 His Ser Ser Asp Ile Asn Gly Arg Cys Ser Asn Ser His Gly Gly Thr 370 375 380 Ser Ala Ala Ala Pro Leu Ala Ala Gly Val Tyr Thr Leu Leu Leu Glu 385 390 395 400 Ala Asn Pro Asn Leu Thr Trp Arg Asp Val Gln Tyr Leu Ser Ile Leu 405 410 415 Ser Ala Val Gly Leu Glu Lys Asn Ala Asp Gly Asp Trp Arg Asp Ser 420 425 430 Ala Met Gly Lys Lys Tyr Ser His Arg Tyr Gly Phe Gly Lys Ile Asp 435 440 445 Ala His Lys Leu Ile Glu Met Ser Lys Thr Trp Glu Asn Val Asn Ala 450 455 460 Gln Thr Trp Phe Tyr Leu Pro Thr Leu Tyr Val Ser Gln Ser Thr Asn 465 470 475 480 Ser Thr Glu Glu Thr Leu Glu Ser Val Ile Thr Ile Ser Glu Lys Ser 485 490 495 Leu Gln Asp Ala Asn Phe Lys Arg Ile Glu His Val Thr Val Thr Val 500 505 510 Asp Ile Asp Thr Glu Ile Arg Gly Thr Thr Thr Val Asp Leu Ile Ser 515 520 525 Pro Ala Gly Ile Ile Ser Asn Leu Gly Val Val Arg Pro Arg Asp Val 530 535 540 Ser Ser Glu Gly Phe Lys Asp Trp Thr Phe Met Ser Val Ala His Trp 545 550 555 560 Gly Glu Asn Gly Val Gly Asp Trp Lys Ile Lys Val Lys Thr Thr Glu 565 570 575 Asn Gly His Arg Ile Asp Phe His Ser Trp Arg Leu Lys Leu Phe Gly 580 585 590 Glu Ser Ile Asp Ser Ser Lys Thr Glu Thr Phe Val Phe Gly Asn Asp 595 600 605 Lys Glu Glu Val Glu Pro Ala Ala Thr Glu Ser Thr Val Ser Gln Tyr 610 615 620 Ser Ala Ser Ser Thr Ser Ile Ser Ile Ser Ala Thr Ser Thr Ser Ser 625 630 635 640 Ile Ser Ile Gly Val Glu Thr Ser Ala Ile Pro Gln Thr Thr Thr Ala 645 650 655 Ser Thr Asp Pro Asp Ser Asp Pro Asn Thr Pro Lys Lys Leu Ser Ser 660 665 670 Pro Arg Gln Ala Met His Tyr Phe Leu Thr Ile Phe Leu Ile Gly Ala 675 680 685 Thr Phe Leu Val Leu Tyr Phe Met Phe Phe Met Lys Ser Arg Arg Arg 690 695 700 Ile Arg Arg Ser Arg Ala Glu Thr Tyr Glu Phe Asp Ile Ile Asp Thr 705 710 715 720 Asp Ser Glu Tyr Asp Ser Thr Leu Asp Asn Gly Thr Ser Gly Ile Thr 725 730 735 Glu Pro Glu Glu Val Glu Asp Phe Asp Phe Asp Leu Ser Asp Glu Asp 740 745 750 His Leu Ala Ser Leu Ser Ser Ser Glu Asn Gly Asp Ala Glu His Thr 755 760 765 Ile Asp Ser Val Leu Thr Asn Glu Asn Pro Phe Ser Asp Pro Ile Lys 770 775 780 Gln Lys Phe Pro Asn Asp Ala Asn Ala Glu Ser Ala Ser Asn Lys Leu 785 790 795 800 Gln Glu Leu Gln Pro Asp Val Pro Pro Ser Ser Gly Arg Ser 805 810 <210> 29 <211> 116 <212> DNA <213> Artificial sequence <220> <223> PCR primer MBP267 <400> 29 atactattgt aattcaaaaa aaaaaagcga atcttcccat gcctgttgct gctcttgaat 60 ggcgacagcc tattgcccca gtgttccctc aacaaccttg cgtacgctgc aggtcg 116 <210> 30 <211> 119 <212> DNA <213> Artificial sequence <220> <223> PCR Primer MBP268 <400> 30 acagttgtag tcacgtgcgc gccatgctga ctaatggcag ccgtcgttgg gcagaagaga 60 attagtatgg tacaggatac gctaattgcg ctccaactac atcgatgaat tcgagctcg 119 <210> 31 <211> 2723 <212> DNA <213> Artificial Sequence <220> <223> 5'-GSH1 5'UTR-KanMX-GSH1 5'UTR-GSH1 ORF fragment. Sequence amplified by MBP288 and MBP289 and used for GSH1 SNP reversion. <400> 31 gattttatcg gtcaaagggg aaatcaatgc gaaagacagt aatgatgaga gaaaaactct 60 ccgtaaccac caagtttggt tcagcgcgac gagattttta tcgattatcg agaaaaatac 120 ctgtatatct acatttctat gtcagtgata tatacttctt agataagtta tgccaccagt 180 gcatacgctt acgcacacac acgtattctt gtgcacacgc ctgttacttc ttgcagacat 240 cagacatact attgtaattc aaaaaaaaaa agcgaatctt cccatgcctg ttgctgctct 300 tgaatggcga cagcctattg ccccagtgtt ccctcaacaa ccttgcgtac gctgcaggtc 360 gacggatccc cgggttaatt aaggcgcgcc agatctgttt agcttgcctc gtccccgccg 420 ggtcacccgg ccagcgacat ggaggcccag aataccctcc ttgacagtct tgacgtgcgc 480 agctcagggg catgatgtga ctgtcgcccg tacatttagc ccatacatcc ccatgtataa 540 tcatttgcat ccatacattt tgatggccgc acggcgcgaa gcaaaaatta cggctcctcg 600 ctgcagacct gcgagcaggg aaacgctccc ctcacagacg cgttgaattg tccccacgcc 660 gcgcccctgt agagaaatat aaaaggttag gatttgccac tgaggttctt ctttcatata 720 cttcctttta aaatcttgct aggatacagt tctcacatca catccgaaca taaacaacca 780 tgggtaagga aaagactcac gtttcgaggc cgcgattaaa ttccaacatg gatgctgatt 840 tatatgggta taaatgggct cgcgataatg tcgggcaatc aggtgcgaca atctatcgat 900 tgtatgggaa gcccgatgcg ccagagttgt ttctgaaaca tggcaaaggt agcgttgcca 960 atgatgttac agatgagatg gtcagactaa actggctgac ggaatttatg cctcttccga 1020 ccatcaagca ttttatccgt actcctgatg atgcatggtt actcaccact gcgatccccg 1080 gcaaaacagc attccaggta ttagaagaat atcctgattc aggtgaaaat attgttgatg 1140 cgctggcagt gttcctgcgc cggttgcatt cgattcctgt ttgtaattgt ccttttaaca 1200 gcgatcgcgt atttcgtctc gctcaggcgc aatcacgaat gaataacggt ttggttgatg 1260 cgagtgattt tgatgacgag cgtaatggct ggcctgttga acaagtctgg aaagaaatgc 1320 ataagctttt gccattctca ccggattcag tcgtcactca tggtgatttc tcacttgata 1380 accttatttt tgacgagggg aaattaatag gttgtattga tgttggacga gtcggaatcg 1440 cagaccgata ccaggatctt gccatcctat ggaactgcct cggtgagttt tctccttcat 1500 tacagaaacg gctttttcaa aaatatggta ttgataatcc tgatatgaat aaattgcagt 1560 ttcatttgat gctcgatgag tttttctaat cagtactgac aataaaaaga ttcttgtttt 1620 caagaacttg tcatttgtat agttttttta tattgtagtt gttctatttt aatcaaatgt 1680 tagcgtgatt tatatttttt ttcgcctcga catcatctgc ccagatgcga agttaagtgc 1740 gcagaaagta atatcatgcg tcaatcgtat gtgaatgctg gtcgctatac tgctgtcgat 1800 tcgatactaa cgccgccatc cagtgtcgaa aacgagctcg aattcatcga tgtagttgga 1860 gcgcaattag cgtatcctgt accatactaa ttctcttctg cccaacgacg gctgccatta 1920 gtcagcatgg cgcgcacgtg actacaactg tggctggaaa ccttttcgtc ctccccggtt 1980 tttcagtgag ccgactctac tacaatgctt tttcattttt cactcagaaa aacctgcaat 2040 ttgccaaatt ggccatgctc tgtgcctccc ttgacaaagg acatcttccc tgtttataaa 2100 cggcggctta ccaaaagttg aagcttgttc ttgcctctta tgagtggagc aatcgattat 2160 attgaatcgt tgtgctggag tagttggatc tttccacgtg gtctcgagtc acttgtagaa 2220 gctgaaaatt gagcagattt agtatagggc tacattgtag ggtggtttag agtatcgaaa 2280 atatacatat agaagaataa aatgggactc ttagctttgg gcacgccttt gcagtggttt 2340 gagtctagga cgtacaatga acacataagg gatgaaggta tcgagcagtt gttgtatatt 2400 ttccaagctg ctggtaaaag agacaatgac cctctttttt ggggagacga gcttgagtac 2460 atggttgtag attttgatga taaggagaga aattctatgc tcgacgtttg ccatgacaag 2520 atactcactg agcttaatat ggaggattcg tccctttgtg aggctaacga tgtgagtttt 2580 caccctgagt atggccggta tatgttagag gcaacaccag cttctccata tttgaattac 2640 gtgggtagtt acgttgaggt taacatgcaa aaaagacgtg ccattgcaga atataagcta 2700 tctgaatatg cgagacaaga tag 2723 <210> 32 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> PCR Primer MBP288 <400> 32 gattttatcg gtcaaagg 18 <210> 33 <211> 20 <212> DNA <213> Artificial sequence <220> <223> PCR Primer MBP289 <400> 33 ctatcttgtc tcgcatattc 20 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> PCR Primer MBP290 <400> 34 tctcgagtca cttgtagaag 20 <210> 35 <211> 17 <212> DNA <213> Artificial sequence <220> <223> PCR Primer MBP292 <400> 35 gagcccacat gcaagtt 17 <210> 36 <211> 20 <212> DNA <213> Artificial sequence <220> <223> PCR Primer MBP291 <400> 36 gtagggtggt ttagagtatc 20 <210> 37 <211> 32 <212> DNA <213> Artificial sequence <220> <223> PCR Primer MBP393 <400> 37 tattatgaat tcaaatgttg agcccgaaga cg 32 <210> 38 <211> 32 <212> DNA <213> Artificial sequence <220> <223> PCR Primer MBP396 <400> 38 tattataagc ttaaattagc gaagcaggtt cc 32 <210> 39 <211> 32 <212> DNA <213> Artificial sequence <220> <223> PCR Primer MBP397 <400> 39 tattatgcat gccacgtatt cttgtgcaca cg 32 <210> 40 <211> 32 <212> DNA <213> Artificial sequence <220> <223> PCR Primer MBP406 <400> 40 tattatgtcg actaccacct acaccaataa gc 32 <210> 41 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Modified invertase signal peptide <220> <221> MISC <222> (7)..(7) <223> Xaa = Phe, Trp or Tyr <220> <221> MISC <222> (8)..(8) <223> Xaa = Ile, Leu, Val, Ala or Met <220> <221> MISC <222> (9)..(9) <223> Xaa = Leu, Val, Ala or Met <220> <221> MISC <222> (10)..(10) <223> Xaa = Ser or Thr <220> <221> MISC <222> (11)..(11) <223> Xaa = Ile, Val, Ala or Met <400> 41 Met Leu Leu Gln Ala Phe Xaa Xaa Xaa Xaa Xaa Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala <210> 42 <211> 19 <212> PRT <213> Artificial sequence <220> <223> Modified invertase signal peptide <400> 42 Met Leu Leu Gln Ala Phe Phe Ile Val Ser Ile Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala <210> 43 <211> 2118 <212> DNA <213> Artificial Sequence <220> <223> KanMX flanked on the 5' end by 300bp immediately upstream to the GSH1 ORF and on the 3' end by 300bp immediately downstream to the GSH1 ORF <400> 43 ggtaccacaa tgctttttca tttttcactc agaaaaacct gcaatttgcc aaattggcca 60 tgctctgtgc ctcccttgac aaaggacatc ttccctgttt ataaacggcg gcttaccaaa 120 agttgaagct tgttcttgcc tcttatgagt ggagcaatcg attatattga atcgttgtgc 180 tggagtagtt ggatctttcc acgtggtctc gagtcacttg tagaagctga aaattgagca 240 gatttagtat agggctacat tgtagggtgg tttagagtat cgaaaatata catatagaag 300 aataaacgta cgctgcaggt cgacggatcc ccgggttaat taaggcgcgc cagatctgtt 360 tagcttgcct cgtccccgcc gggtcacccg gccagcgaca tggaggccca gaataccctc 420 cttgacagtc ttgacgtgcg cagctcaggg gcatgatgtg actgtcgccc gtacatttag 480 cccatacatc cccatgtata atcatttgca tccatacatt ttgatggccg cacggcgcga 540 agcaaaaatt acggctcctc gctgcagacc tgcgagcagg gaaacgctcc cctcacagac 600 gcgttgaatt gtccccacgc cgcgcccctg tagagaaata taaaaggtta ggatttgcca 660 ctgaggttct tctttcatat acttcctttt aaaatcttgc taggatacag ttctcacatc 720 acatccgaac ataaacaacc atgggtaagg aaaagactca cgtttcgagg ccgcgattaa 780 attccaacat ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat 840 caggtgcgac aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac 900 atggcaaagg tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga 960 cggaatttat gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt 1020 tactcaccac tgcgatcccc ggcaaaacag cattccaggt attagaagaa tatcctgatt 1080 caggtgaaaa tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg 1140 tttgtaattg tccttttaac agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa 1200 tgaataacgg tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg 1260 aacaagtctg gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc 1320 atggtgattt ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg 1380 atgttggacg agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc 1440 tcggtgagtt ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc 1500 ctgatatgaa taaattgcag tttcatttga tgctcgatga gtttttctaa tcagtactga 1560 caataaaaag attcttgttt tcaagaactt gtcatttgta tagttttttt atattgtagt 1620 tgttctattt taatcaaatg ttagcgtgat ttatattttt tttcgcctcg acatcatctg 1680 cccagatgcg aagttaagtg cgcagaaagt aatatcatgc gtcaatcgta tgtgaatgct 1740 ggtcgctata ctgctgtcga ttcgatacta acgccgccat ccagtgtcga aaacgagctc 1800 gaattcatcg atactccttt tacttcggtt gtgaaagaaa gttgacatta tcgatttggg 1860 tgacacggtg attgaaaaag caacgaccag tattatacct ctttttttta ttattcagtt 1920 tatatttttg caagtgatct taagcatttc tacacaaact tatgccaacg tgaccattta 1980 ttattttata tagcaaaaaa aaatgagggg ccttgcagaa caattgttgc gagtttctaa 2040 taacaagcac gtagaatatt ggccatttaa tttttctctt caatttatag aatggttgtg 2100 ttagtgacaa aaggtacc 2118 <210> 44 <211> 1755 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid sequence encoding an albumin variant with mutations E492G, K573P, K574H and Q580K relative to wt HSA <400> 44 gacgctcaca agtctgaagt tgctcacaga ttcaaggact taggcgagga aaacttcaaa 60 gctttggttt tgattgcatt cgctcaatac ttacaacaat gcccattcga agaccacgtc 120 aaattggtta acgaagttac tgaattcgca aagacttgcg ttgcagacga atccgcagaa 180 aactgcgaca agtctttgca cacattgttc ggcgacaaat tgtgcacagt tgctacttta 240 agagaaacat acggcgaaat ggctgactgc tgcgctaaac aagagccaga aagaaacgaa 300 tgcttcttac aacacaagga cgacaaccca aacttaccaa gattggttag accagaagtt 360 gacgttatgt gcacagcatt ccacgacaac gaagaaactt tcttgaagaa gtacttgtac 420 gaaattgcta gaagacaccc atacttctac gctccagaat tgttgttctt cgctaaaaga 480 tacaaggctg cattcacaga atgctgccaa gcagctgaca aggctgcttg cttgttacca 540 aagttggacg aattgagaga cgaaggcaag gcttcttctg ctaagcaaag gttgaaatgc 600 gcttctttgc aaaagttcgg cgagagagca ttcaaggcat gggctgttgc tcgtttatct 660 caaagattcc caaaagcaga gttcgctgaa gtttccaagt tagttactga cttgacaaaa 720 gttcacactg aatgctgcca cggcgacttg ttagagtgcg ctgacgaccg tgctgactta 780 gccaaataca tttgcgaaaa ccaagactct atttcttcta agttaaagga gtgctgcgaa 840 aaaccgttgt tagagaaatc tcactgcatt gctgaagttg aaaacgacga aatgccagct 900 gacttgccat ctttagctgc tgacttcgtt gaatctaaag acgtttgcaa gaactacgca 960 gaagctaagg acgttttctt gggcatgttc ttatacgaat acgcaagaag acacccagac 1020 tactctgttg ttttgttgtt aagattggct aagacttacg aaactacatt agaaaagtgc 1080 tgcgctgccg cagacccaca cgaatgctac gctaaagttt tcgacgagtt caagccattg 1140 gttgaagaac cacaaaactt gattaagcaa aactgcgagt tattcgaaca attgggcgaa 1200 tacaaattcc aaaacgcctt gttagttaga tacactaaga aagttccaca agtttcaact 1260 ccaacattgg ttgaagtttc tcgtaactta ggcaaggttg gctctaagtg ctgcaaacac 1320 ccagaggcta agcgtatgcc atgcgctgaa gactacttgt ctgttgtttt gaaccagtta 1380 tgcgttttgc acgagaagac tccagtttct gaccgtgtta ctaagtgctg cacagaatct 1440 ttagttaaca gacgtccatg cttctcagct ttgggtgttg acgaaactta cgttccaaaa 1500 gaattcaacg ctgaaacttt cactttccac gctgacattt gcactttgtc tgaaaaggaa 1560 agacagatta agaaacaaac tgctttggtt gaattggtta agcacaagcc aaaggctact 1620 aaggaacaat tgaaggctgt tatggacgac ttcgctgctt tcgttgaaaa gtgctgcaaa 1680 gctgacgaca aggaaacttg cttcgctgag gaaggcccac atttggttgc agcttcaaaa 1740 gctgctttgg gcttg 1755 <210> 45 <211> 585 <212> PRT <213> Artificial sequence <220> <223> Albumin variant with mutations E492G, K573P, K574H and Q580K relative to wt HSA <400> 45 Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu 1 5 10 15 Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln 20 25 30 Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu 35 40 45 Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys 50 55 60 Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu 65 70 75 80 Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro 85 90 95 Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu 100 105 110 Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His 115 120 125 Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg 130 135 140 Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg 145 150 155 160 Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala 165 170 175 Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser 180 185 190 Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu 195 200 205 Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro 210 215 220 Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys 225 230 235 240 Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp 245 250 255 Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser 260 265 270 Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His 275 280 285 Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser 290 295 300 Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala 305 310 315 320 Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg 325 330 335 Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr 340 345 350 Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu 355 360 365 Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro 370 375 380 Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu 385 390 395 400 Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro 405 410 415 Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys 420 425 430 Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys 435 440 445 Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His 450 455 460 Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser 465 470 475 480 Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Gly Val Asp Glu Thr 485 490 495 Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp 500 505 510 Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala 515 520 525 Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu 530 535 540 Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys 545 550 555 560 Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Pro His Leu Val 565 570 575 Ala Ala Ser Lys Ala Ala Leu Gly Leu 580 585 <210> 46 <211> 2253 <212> DNA <213> Artificial sequence <220> <223> IL-1Ra fused to the C-terminus of HSA <400> 46 gacgctcaca agtccgaagt cgctcacaga ttcaaggact tgggtgaaga aaacttcaag 60 gctttggtct tgatcgcttt cgctcaatac ttgcaacaat gtccattcga agatcacgtc 120 aagttggtca acgaagttac cgaattcgct aagacttgtg ttgctgacga atccgcggaa 180 aactgtgaca agtccttgca caccttgttc ggtgataagt tgtgtactgt tgctaccttg 240 agagaaacct acggtgaaat ggctgactgt tgtgctaagc aagaaccaga aagaaacgaa 300 tgtttcttgc aacacaagga cgacaaccca aacttgccaa gattggttag accagaagtt 360 gacgtcatgt gtactgcttt ccacgacaac gaagaaacct tcttgaagaa gtacttgtac 420 gaaattgcta gaagacaccc atacttctac gctccagaat tgttgttctt cgctaagaga 480 tacaaggctg ctttcaccga atgttgtcaa gctgctgata aggctgcttg tttgttgcca 540 aagttggatg aattgagaga cgaaggtaag gcttcttccg ctaagcaaag attgaagtgt 600 gcttccttgc aaaagttcgg tgaaagagct ttcaaggctt gggctgtcgc tagattgtct 660 caaagattcc caaaggctga attcgctgaa gtttctaagt tggttactga cttgactaag 720 gttcacactg aatgttgtca cggtgacttg ttggaatgtg ctgatgacag agctgacttg 780 gctaagtaca tctgtgaaaa ccaagactct atctcttcca agttgaagga atgttgtgaa 840 aagccattgt tggaaaagtc tcactgtatt gctgaagttg aaaacgatga aatgccagct 900 gacttgccat ctttggctgc tgacttcgtt gaatctaagg acgtttgtaa gaactacgct 960 gaagctaagg acgtcttctt gggtatgttc ttgtacgaat acgctagaag acacccagac 1020 tactccgttg tcttgttgtt gagattggct aagacctacg aaactaccct cgagaagtgt 1080 tgtgctgctg ctgacccaca cgaatgttac gctaaggttt tcgatgaatt caagccattg 1140 gtcgaagaac cacaaaactt gatcaagcaa aactgtgaat tgttcgaaca attgggtgaa 1200 tacaagttcc aaaacgcttt gttggttaga tacactaaga aggtcccaca agtctccacc 1260 ccaactttgg ttgaagtctc tagaaacttg ggtaaggtcg gttctaagtg ttgtaagcac 1320 ccagaagcta agagaatgcc atgtgctgaa gattacttgt ccgtcgtttt gaaccaattg 1380 tgtgttttgc acgaaaagac cccagtctct gatagagtca ccaagtgttg tactgaatct 1440 ttggttaaca gaagaccatg tttctctgct ttggaagtcg acgaaactta cgttccaaag 1500 gaattcaacg ctgaaacttt caccttccac gctgatatct gtaccttgtc cgaaaaggaa 1560 agacaaatta agaagcaaac tgctttggtt gaattggtca agcacaagcc aaaggctact 1620 aaggaacaat tgaaggctgt catggatgat ttcgctgctt tcgttgaaaa gtgttgtaag 1680 gctgatgata aggaaacttg tttcgctgaa gaaggtaaga agttggtcgc tgcttcccaa 1740 gctgccttag gtttgggtgg ttctggtggt tccggtggtt ctggtggatc cggtggtcga 1800 ccctctggga gaaaatccag caagatgcaa gccttcagaa tctgggatgt taaccagaag 1860 accttctatc tgaggaacaa ccaactagtt gctggatact tgcaaggacc aaatgtcaat 1920 ttagaagaaa agatagatgt ggtacccatt gagcctcatg ctctgttctt gggaatccat 1980 ggagggaaga tgtgcctgtc ctgtgtcaag tctggtgatg agaccagact ccagctggag 2040 gcagttcaaa tcactgacct gagcgagaac agaaagcagg acaagcgctt cgccttcatc 2100 cgctcagaca gcggccccac caccagtttt gagtctgccg cctgccccgg ttggttcctc 2160 tgcacagcga tggaagctga ccagcccgtc agcctcacca atatgcctga cgaaggcgtc 2220 atggtcacca aattctactt ccaggaggac gag 2253 <210> 47 <211> 751 <212> PRT <213> Artificial Sequence <220> <223> IL-1Ra fused to the C-terminus of HSA <400> 47 Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu 1 5 10 15 Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln 20 25 30 Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu 35 40 45 Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys 50 55 60 Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu 65 70 75 80 Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro 85 90 95 Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu 100 105 110 Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His 115 120 125 Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg 130 135 140 Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg 145 150 155 160 Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala 165 170 175 Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser 180 185 190 Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu 195 200 205 Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro 210 215 220 Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys 225 230 235 240 Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp 245 250 255 Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser 260 265 270 Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His 275 280 285 Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser 290 295 300 Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala 305 310 315 320 Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg 325 330 335 Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr 340 345 350 Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu 355 360 365 Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro 370 375 380 Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu 385 390 395 400 Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro 405 410 415 Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys 420 425 430 Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys 435 440 445 Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His 450 455 460 Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser 465 470 475 480 Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr 485 490 495 Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp 500 505 510 Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala 515 520 525 Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu 530 535 540 Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys 545 550 555 560 Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val 565 570 575 Ala Ala Ser Gln Ala Ala Leu Gly Leu Gly Gly Ser Gly Gly Ser Gly 580 585 590 Gly Ser Gly Gly Ser Gly Gly Arg Pro Ser Gly Arg Lys Ser Ser Lys 595 600 605 Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu 610 615 620 Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn 625 630 635 640 Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu Phe 645 650 655 Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly 660 665 670 Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Gln Ile Thr Asp Leu Ser 675 680 685 Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser 690 695 700 Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu 705 710 715 720 Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro 725 730 735 Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu 740 745 750 <210> 48 <211> 756 <212> DNA <213> Artificial Sequence <220> <223> FLAG fused to the C-terminus of scFv <400> 48 gaagttcaat tgttggaatc tggtggtggt ttggttcaac ctggtggttc tttgagattg 60 tcttgtgctg cttctggttt tactttttct aattattgga tgtcttgggt tagacaagct 120 ccaggtaaag gtttggaatg ggtttccggt atttcaggta atggtggtta tacttatttt 180 gctgattcag ttaaagatag atttactatt tctagagata attctaaaaa taccttatat 240 ttgcaaatga actctttgag agcagaagat actgctgttt attactgtgc aggtggtgac 300 ggttctggtt ggagtttttg gggtcaaggt actctagtta ccgtttcttc aggtggtggt 360 ggttctggtg gaggtggatc aggtggtgga ggatctcaat cagttttgac tcaaccacca 420 tctgcttcag gtactccagg tcaaagagtt accatttctt gtactggttc ttcttctaat 480 attggtgcag gttacgatgt tcattggtat caacaattgc caggtactgc tccaaaattg 540 ttgatttatg gtaacaacaa tagaccatct ggtgtcccag atagattttc tggttctaaa 600 tctggtactt ctgcttcttt ggctatttct ggtttaagat cagaagatga agctgattac 660 tactgtgctg cttgggatga ctctttgtct ggtagagttt tcggtggtgg tactaaattg 720 accgttttgg gtgattataa agatgatgac gataaa 756 <210> 49 <211> 252 <212> PRT <213> Artificial Sequence <220> <223> FLAG fused to the C-terminus of scFv <400> 49 Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr 20 25 30 Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Gly Ile Ser Gly Asn Gly Gly Tyr Thr Tyr Phe Ala Asp Ser Val 50 55 60 Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Gly Gly Asp Gly Ser Gly Trp Ser Phe Trp Gly Gln Gly Thr Leu 100 105 110 Val Thr Val Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly 115 120 125 Gly Gly Gly Ser Gln Ser Val Leu Thr Gln Pro Pro Ser Ala Ser Gly 130 135 140 Thr Pro Gly Gln Arg Val Thr Ile Ser Cys Thr Gly Ser Ser Ser Asn 145 150 155 160 Ile Gly Ala Gly Tyr Asp Val His Trp Tyr Gln Gln Leu Pro Gly Thr 165 170 175 Ala Pro Lys Leu Leu Ile Tyr Gly Asn Asn Asn Arg Pro Ser Gly Val 180 185 190 Pro Asp Arg Phe Ser Gly Ser Lys Ser Gly Thr Ser Ala Ser Leu Ala 195 200 205 Ile Ser Gly Leu Arg Ser Glu Asp Glu Ala Asp Tyr Tyr Cys Ala Ala 210 215 220 Trp Asp Asp Ser Leu Ser Gly Arg Val Phe Gly Gly Gly Thr Lys Leu 225 230 235 240 Thr Val Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys 245 250 <210> 50 <211> 8 <212> PRT <213> Artificial sequence <220> <223> FLAG <400> 50 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 51 <211> 30 <212> PRT <213> Artificial sequence <220> <223> GLP-1 fragment <400> 51 His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg 20 25 30 <210> 52 <211> 60 <212> PRT <213> Artificial sequence <220> <223> Tandem repeat of GLP-1 fragment <400> 52 His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg His Gly 20 25 30 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 35 40 45 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg 50 55 60

Claims (36)

  1. a. 감소된 수준의 Gsh1 단백질, 또는
    b. 감소된 활성 수준 또는 발현 수준의 Gsh1 단백질, 또는
    c. 감소된 수준의 GSH1 유전자, 또는
    d. 감소된 발현 수준의 GSH1 유전자;
    및 이종 단백질을 코딩하는 뉴클레오티드
    를 갖는 균류 숙주 세포로서,
    여기서 감소된 수준의 Gsh1 단백질, 활성 수준 또는 발현 수준 또는 GSH1 유전자 또는 발현 수준은 레퍼런스 균류 숙주 세포에서의 수준에 상대적이며, 여기서 레퍼런스 균류 숙주 세포는 레퍼런스 균류 숙주 세포에서 GSH1 유전자 또는 Gsh1 단백질이 상기 균류 숙주 세포에 대해 GSH1 유전자 또는 Gsh1 단백질 야생형인 것을 제외하고 상기 숙주 세포와 동일한, 균류 숙주 세포.
  2. 제1항에 있어서,
    감소된 수준은 Gsh1 단백질이 SEQ ID NO: 2로 구성되는 또는 GSH1 유전자가 SEQ ID NO: 1로 구성되는, 레퍼런스 균류 숙주 세포에서의 수준에 상대적인, 균류 숙주 세포.
  3. 제1항에 있어서,
    a. 감소된 수준의 Not4 단백질, 또는
    b. 감소된 활성 수준 또는 발현 수준의 Not4 단백질, 또는
    c. 감소된 수준의 NOT4 유전자, 또는
    d. 감소된 발현 수준의 NOT4 유전자
    를 가지며,
    여기서 감소된 수준의 Not4 단백질, 활성 수준 또는 발현 수준 또는 NOT4 유전자 또는 발현 수준은 레퍼런스 균류 숙주 세포에서의 수준에 상대적이며, 여기서 레퍼런스 균류 숙주 세포는 레퍼런스 균류 숙주 세포에서 NOT4 유전자 또는 Not4 단백질이 상기 균류 숙주 세포에 대해 NOT4 유전자 또는 Not4 단백질 야생형이며, 레퍼런스 균류 숙주 세포에서 GSH1 유전자 또는 Gsh1 단백질이 상기 균류 숙주 세포에 대해 GSH1 유전자 또는 Gsh1 단백질 야생형인 것을 제외하고 상기 숙주 세포와 동일한, 균류 숙주 세포.
  4. 제3항에 있어서,
    감소된 수준의 Not4 단백질, 활성 또는 발현 또는 감소된 수준의 NOT4 유전자 또는 발현은 Not4 단백질이 SEQ ID NO: 6로 구성되는 또는 Not4 유전자가 SEQ ID NO: 5로 구성되는 레퍼런스 균류 숙주 세포에서의 수준에 상대적인, 균류 숙주 세포.
  5. 제1항에 있어서,
    균류 숙주는 효모 또는 사상균류인, 균류 숙주 세포.
  6. 제1항에 있어서,
    이종 단백질은 알부민 또는 이의 변이체, 단편 또는 융합체인, 균류 숙주 세포.
  7. 제1항에 있어서,
    Gsh1 단백질은 SEQ ID NO: 2의 47, 48, 49, 50, 51, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 409, 451, 452, 453, 454 또는 455로부터 선택된 위치에 상응하는 위치에서 돌연변이를 포함하는, 균류 숙주 세포.
  8. 제7항에 있어서,
    위치는 SEQ ID NO: 2의 R125, D49, H409 또는 P453으로부터 선택된 위치에 상응하는, 균류 숙주 세포.
  9. 제7항에 있어서,
    SEQ ID NO: 2의 위치 125에 상응하는 위치에서 돌연변이는 A, C, D, E, F, G, H, I, L, M, N, P, Q, S, T, V, W 또는 Y로의 치환인, 균류 숙주 세포.
  10. 제9항에 있어서,
    SEQ ID NO: 2의 위치 125에 상응하는 위치에서 돌연변이는 C, D, E 또는 G로의 치환인, 균류 숙주 세포.
  11. 제10항에 있어서,
    SEQ ID NO: 2의 위치 125에 상응하는 위치에서 돌연변이는 G로의 치환인, 균류 숙주 세포.
  12. 제1항에 있어서,
    Gsh1 단백질은 SEQ ID NO: 4로 구성되는, 균류 숙주 세포.
  13. 제1항에 있어서,
    숙주 세포는 GSH1 유전자 또는 Gsh1 단백질이 결여된, 균류 숙주 세포.
  14. 제3항에 있어서,
    Not4 단백질은 SEQ ID NO: 6의 426, 427, 428, 429, 430, 431, 432, 433, 434, 435, 436, 437, 438, 439, 440, 441, 442, 443, 444, 445, 446, 447, 448, 449, 450, 451, 452, 453, 454, 455, 456, 457, 458, 459, 460, 461, 462, 463, 464, 465, 466, 467, 468, 469 또는 470으로부터 선택된 위치에 상응하는 위치에서 돌연변이를 포함하는, 균류 숙주 세포.
  15. 제14항에 있어서,
    SEQ ID NO: 6의 위치 429에 상응하는 위치에서 돌연변이는 A, C, D, E, G, H, I, K, L, M, N, P, Q, R, S, T, V, W 또는 Y로의 치환인, 균류 숙주 세포.
  16. 제15항에 있어서,
    SEQ ID NO: 6의 위치 429에 상응하는 위치에서 돌연변이는 G, A, V, L 또는 I로의 치환인, 균류 숙주 세포.
  17. 제16항에 있어서,
    SEQ ID NO: 6의 위치 429에 상응하는 위치에서 돌연변이는 I, L 또는 V로의 치환인, 균류 숙주 세포.
  18. 제17항에 있어서,
    SEQ ID NO: 6의 위치 429에 상응하는 위치에서 돌연변이는 I로의 치환인, 균류 숙주 세포.
  19. 제3항에 있어서,
    Not4 단백질은 SEQ ID NO: 8로 구성되는, 균류 숙주 세포.
  20. 제3항에 있어서,
    숙주 세포는 NOT4 유전자 또는 Not4 단백질이 결여된, 균류 숙주 세포.
  21. 제1항에 있어서,
    균류 숙주는 사카로마이세스(Saccharomyces)인, 균류 숙주 세포.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서,
    균류 숙주는 사카로마이세스 세레비지애(Saccharomyces cerevisiae)인, 균류 숙주 세포.
  23. a.
    1. 감소된 수준의 Gsh1 단백질, 또는
    2. 감소된 활성 수준의 Gsh1 단백질, 또는
    3. 감소된 수준의 GSH1 유전자, 또는
    4. 감소된 발현 수준의 GSH1 유전자, 및
    5. 이종 단백질을 코딩하는 뉴클레오티드
    를 갖는 균류 숙주 세포를 제공하는 단계, 및
    b. 상기 숙주 세포를 배양하여 이종 단백질을 생산하는 단계
    를 포함하는 이종 단백질의 수율을 증가시키는 방법으로서.
    여기서 감소된 수준의 Gsh1 단백질, 활성 수준 또는 발현 수준 또는 GSH1 유전자 또는 발현 수준은 레퍼런스 균류 숙주 세포에서의 수준에 상대적이며, 여기서 레퍼런스 균류 숙주 세포는 레퍼런스 균류 숙주 세포에서 GSH1 유전자 또는 Gsh1 단백질이 상기 균류 숙주 세포에 대해 GSH1 유전자 또는 Gsh1 단백질 야생형인 것을 제외하고 상기 숙주 세포와 동일하며, 그리고
    수율은 레퍼런스 균류 숙주 세포에서의 수율에 상대적이며, 여기서 레퍼런스 균류 숙주 세포는 레퍼런스 균류 숙주 세포에서 GSH1 유전자 또는 Gsh1 단백질이 상기 균류 숙주 세포에 대해 GSH1 유전자 또는 Gsh1 단백질 야생형인 것을 제외하고 상기 숙주 세포와 동일한, 방법.
  24. 제23항에 있어서,
    이종 단백질을 회수하는 단계를 추가로 포함하는, 방법.
  25. 제23항에 있어서,
    이종 단백질을 정제하는 단계를 추가로 포함하는, 방법.
  26. 제23항에 있어서,
    이종 단백질을 치료적으로 허용되는 캐리어 또는 희석제와 제형화하여, 이에 의해 인간 또는 동물에 투여하기에 적절한 치료 제품을 생산하는 단계를 추가로 포함하는, 방법.
  27. 제23항에 있어서,
    이종 단백질을 단위 투여량 형태로 제공하는 단계를 추가로 포함하는, 방법.
  28. 제23항에 있어서,
    균류 숙주는 효모인, 방법.
  29. 제28항에 있어서,
    효모는 사카로마이세스(Saccharomyces)인, 방법.
  30. 제29항에 있어서,
    효모는 사카로마이세스 세레비지애(Saccharomyces cerevisiae)인, 방법.
  31. 제23항에 있어서,
    이종 단백질의 수율은 SEQ ID NO: 2의 Gsh1 단백질 또는 SEQ ID NO: 1의 GSH1 유전자를 갖는 레퍼런스 균류 숙주 세포로부터의 수율보다 2% 내지 100% 더 높은, 방법.
  32. 제23항에 있어서,
    균류 숙주 세포는
    1. 감소된 수준의 Not4 단백질, 또는
    2. 감소된 활성 수준의 Not4 단백질, 또는
    3. 감소된 수준의 NOT4 유전자, 또는
    4. 감소된 발현 수준의 NOT4 유전자
    를 가지며;
    여기서
    감소된 수준의 Not4 단백질, 활성 수준 또는 발현 수준 또는 NOT4 유전자 또는 발현 수준은 레퍼런스 균류 숙주 세포에서의 수준에 상대적이며, 여기서 레퍼런스 균류 숙주 세포는 레퍼런스 균류 숙주 세포에서 NOT4 유전자 또는 Not4 단백질이 상기 균류 숙주 세포에 대해 NOT4 유전자 또는 Not4 단백질 야생형이며, 레퍼런스 균류 숙주 세포에서 GSH1 유전자 또는 Gsh1 단백질이 상기 균류 숙주 세포에 대해 GSH1 유전자 또는 Gsh1 단백질 야생형인 것을 제외하고 상기 숙주 세포와 동일하며, 그리고
    수율은 레퍼런스 균류 숙주 세포의 수율에 상대적이며, 여기서 레퍼런스 균류 숙주 세포는 레퍼런스 균류 숙주 세포에서 GSH1 유전자 또는 Gsh1 단백질이 상기 균류 숙주 세포에 대해 GSH1 유전자 또는 Gsh1 단백질 야생형이며, 레퍼런스 균류 숙주 세포에서 NOT4 유전자 또는 Not4 단백질이 상기 균류 숙주 세포에 대해 NOT4 유전자 또는 Not4 단백질 야생형인 것을 제외하고 상기 숙주 세포와 동일한, 방법.
  33. 제32항에 있어서,
    이종 단백질의 수율은 SEQ ID NO: 2의 Gsh1 단백질 또는 SEQ ID NO: 1의 GSH1 유전자를 가지며, 그리고 SEQ ID NO: 6의 Not4 단백질 또는 SEQ ID NO: 5의 NOT4 유전자를 갖는 레퍼런스 균류 숙주 세포로부터의 수율보다 2% 내지 100% 더 높은, 방법.
  34. 제23항 내지 제33항 중 어느 한 항에 있어서,
    이종 단백질은 알부민 또는 이의 변이체, 단편 또는 융합체를 포함하거나 이로 구성되는, 방법.
  35. 제23항 내지 제33항 중 어느 한 항에 있어서,
    숙주 세포는 적어도 5L의 스케일로 배양되는, 방법.
  36. 삭제
KR1020207001925A 2017-06-20 2018-06-20 개선된 단백질 발현 스트레인 Active KR102638505B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17176932.6 2017-06-20
EP17176932 2017-06-20
PCT/EP2018/066344 WO2018234349A1 (en) 2017-06-20 2018-06-20 IMPROVED STRAINS FOR THE EXPRESSION OF PROTEINS

Publications (2)

Publication Number Publication Date
KR20200019731A KR20200019731A (ko) 2020-02-24
KR102638505B1 true KR102638505B1 (ko) 2024-02-20

Family

ID=59257979

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207001925A Active KR102638505B1 (ko) 2017-06-20 2018-06-20 개선된 단백질 발현 스트레인

Country Status (12)

Country Link
US (2) US11130979B2 (ko)
EP (2) EP3642343B1 (ko)
JP (1) JP7282693B2 (ko)
KR (1) KR102638505B1 (ko)
CN (1) CN111032871A (ko)
AU (1) AU2018286919B2 (ko)
BR (1) BR112019027397A2 (ko)
CA (1) CA3064037A1 (ko)
DK (1) DK3642343T3 (ko)
ES (1) ES2906997T3 (ko)
IL (1) IL271404A (ko)
WO (1) WO2018234349A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018234349A1 (en) * 2017-06-20 2018-12-27 Albumedix Ltd IMPROVED STRAINS FOR THE EXPRESSION OF PROTEINS
KR102546738B1 (ko) 2021-01-04 2023-06-22 씨제이제일제당 주식회사 글루타메이트-시스테인 리가아제 변이체 및 이를 이용한 글루타치온 생산방법
GB202301988D0 (en) 2023-02-13 2023-03-29 Phenotypeca Ltd Breeding process
GB202301983D0 (en) 2023-02-13 2023-03-29 Phenotypeca Ltd Engineered eukaryotic cell
GB202301984D0 (en) 2023-02-13 2023-03-29 Phenotypeca Ltd Engineered eukaryotic cell

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9019919D0 (en) 1990-09-12 1990-10-24 Delta Biotechnology Ltd Purification of proteins
US4302386A (en) 1978-08-25 1981-11-24 The Ohio State University Antigenic modification of polypeptides
IL88326A (en) 1987-11-18 1993-03-15 Gist Brocades Nv Purification of serum albumin
HU213571B (en) 1988-07-23 1997-08-28 Delta Biotechnology Ltd Process for producing peptides and dna sequences
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
CA2017176A1 (en) 1989-05-22 1990-11-22 Yoshitomi Pharmaceutical Industries Ltd. Albumin gene-containing plasmid, transformant carrying same, production of such transformant and production of albumin
JPH03155791A (ja) 1989-11-14 1991-07-03 Green Cross Corp:The 雑種プロモーター
JP3230091B2 (ja) 1990-06-25 2001-11-19 ウェルファイド株式会社 ヒト血清アルブミンの着色抑制方法
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
WO1992013951A1 (en) 1991-02-04 1992-08-20 The Salk Institute Biotechnology/Industrial Associates, Inc. Production of human serum albumin in methylotrophic yeast cells
US5728553A (en) 1992-09-23 1998-03-17 Delta Biotechnology Limited High purity albumin and method of producing
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
AU2705895A (en) 1994-06-30 1996-01-25 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
DK0889949T3 (da) 1996-03-13 2003-09-22 Delta Biotechnology Ltd Fermenteringskontrol
DE69731960T2 (de) 1996-09-24 2005-12-15 Cadus Pharmaceutical Corp. Verfahren und zusammensetzungen für die identifizierung von receptor effectoren
CA2344619C (en) 1998-10-26 2012-01-03 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
GB9902000D0 (en) 1999-01-30 1999-03-17 Delta Biotechnology Ltd Process
EP2278016B1 (en) 1999-03-22 2012-09-26 Novozymes Inc. Promoter sequences derived from Fusarium Venenatum and uses thereof
ATE375388T1 (de) 2001-07-27 2007-10-15 Us Gov Health & Human Serv Systeme zur stellengerichteten in-vivo-mutagenese mit oligonukleotiden
WO2003066078A1 (en) 2002-02-07 2003-08-14 Delta Biotechnology Limited Hiv inhibiting proteins
GB0217033D0 (en) 2002-07-23 2002-08-28 Delta Biotechnology Ltd Gene and polypeptide sequences
GB0329681D0 (en) 2003-12-23 2004-01-28 Delta Biotechnology Ltd Gene expression technique
US20090280534A1 (en) 2004-12-22 2009-11-12 Novozymes A/S Recombinant Production of Serum Albumin
DK2330200T3 (en) 2004-12-23 2017-07-24 Albumedix As GENE EXPRESSION TECHNIQUE
GB0512707D0 (en) 2005-06-22 2005-07-27 Delta Biotechnology Ltd Gene expression technique
WO2009126920A2 (en) 2008-04-11 2009-10-15 Merrimack Pharmaceuticals, Inc. Human serum albumin linkers and conjugates thereof
JP5410703B2 (ja) 2008-07-30 2014-02-05 アサヒグループホールディングス株式会社 酵母変異株の作製方法および酵母変異株
BRPI0921586A2 (pt) 2008-11-18 2019-09-24 Merrimack Pharmaceuticals Inc articuladores de albumina de soro humana e conjugados destes
WO2010092135A2 (en) 2009-02-11 2010-08-19 Novozymes Biopharma Uk Ltd. Albumin variants and conjugates
WO2010128143A1 (en) 2009-05-07 2010-11-11 Novozymes Biopharma Dk A/S Method of controlling o-linked glycosylation of antibodies
BR112012009450A2 (pt) 2009-10-30 2017-05-23 Novozymes Biopharma Dk As variantes de albumina
JP5634051B2 (ja) 2009-11-13 2014-12-03 Mcフードスペシャリティーズ株式会社 グルタチオン高生産酵母及びその利用
AU2011218294A1 (en) 2010-02-16 2012-08-30 Medimmune, Llc HSA-related compositions and methods of use
EP2556087A1 (en) 2010-04-09 2013-02-13 Novozymes Biopharma DK A/S Albumin derivatives and variants
CN103347893A (zh) 2010-11-01 2013-10-09 诺维信生物制药丹麦公司 白蛋白变体
KR20140012094A (ko) 2011-02-15 2014-01-29 메디뮨 엘엘씨 Hsa 관련 조성물 및 사용 방법
CN102296033B (zh) 2011-04-26 2013-08-28 武汉大学 一种酿酒酵母gshl缺失突变株的构建方法及应用
AU2012251583B2 (en) 2011-05-05 2017-06-08 Albumedix Ltd. Albumin variants
FR2980483B1 (fr) 2011-09-23 2015-07-17 Lesaffre & Cie Souches de levure pour la production de glutathion
WO2013075006A1 (en) 2011-11-16 2013-05-23 The General Hospital Corporation Method and apparatus for cryogenic treatment of skin tissue
WO2013075066A2 (en) 2011-11-18 2013-05-23 Eleven Biotherapeutics, Inc. Proteins with improved half-life and other properties
EP2825556B1 (en) 2012-03-16 2018-01-03 Albumedix A/S Albumin variants
AU2013305714A1 (en) 2012-08-22 2015-02-05 Butamax Advanced Biofuels Llc Production of fermentation products
KR20150082422A (ko) 2012-11-08 2015-07-15 노보자임스 바이오파마 디케이 에이/에스 알부민 변이체
AU2014225678B2 (en) 2013-03-06 2016-11-17 Glaxosmithkline Llc Host cells and methods of use
EP2992329A1 (en) 2013-05-03 2016-03-09 Eleven Biotherapeutics, Inc. Albumin variants binding to fcrn
JP6489014B2 (ja) * 2013-07-12 2019-03-27 味の素株式会社 Abu、γ−Glu−Abu、及び/又はγ−Glu−Abu−Glyを高含有する酵母
EP3044232A1 (en) 2013-09-13 2016-07-20 Novozymes Biopharma DK A/S Albumin variants
US10208102B2 (en) 2013-11-01 2019-02-19 University Of Oslo Albumin variants and uses thereof
CN104059936B (zh) * 2014-04-30 2017-01-25 唐星 一种用于合成谷胱甘肽的基因工程菌的制备方法及其产品
CA2989966C (en) 2015-08-20 2024-04-30 Albumedix A/S Albumin variants and conjugates
CA3005953A1 (en) 2015-12-22 2017-06-29 Albumedix Ltd Improved protein expression strains
WO2018234349A1 (en) * 2017-06-20 2018-12-27 Albumedix Ltd IMPROVED STRAINS FOR THE EXPRESSION OF PROTEINS

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Curr. Genet., 2000, Vol. 37, pp. 175-182.
Curr. Genet., 2013, Vol. 59, pp. 91-106.
Mol. Biol. Cell, 1997, Vol. 8, pp. 1699-1707.
Mutagenesis, 1990, Vol.5, pp. 39-44.

Also Published As

Publication number Publication date
EP3642343A1 (en) 2020-04-29
ES2906997T3 (es) 2022-04-21
CA3064037A1 (en) 2018-12-27
KR20200019731A (ko) 2020-02-24
BR112019027397A2 (pt) 2020-07-14
US11130979B2 (en) 2021-09-28
US20220090159A1 (en) 2022-03-24
JP7282693B2 (ja) 2023-05-29
US11396670B2 (en) 2022-07-26
DK3642343T3 (en) 2022-03-14
IL271404A (en) 2020-01-30
WO2018234349A1 (en) 2018-12-27
CN111032871A (zh) 2020-04-17
AU2018286919A1 (en) 2019-12-05
US20200123584A1 (en) 2020-04-23
JP2020530260A (ja) 2020-10-22
EP4026908A1 (en) 2022-07-13
EP3642343B1 (en) 2021-12-08
AU2018286919B2 (en) 2022-10-06

Similar Documents

Publication Publication Date Title
KR102638505B1 (ko) 개선된 단백질 발현 스트레인
US10023618B2 (en) Protein expression strains
KR101262682B1 (ko) 유전자 발현 기술
KR101298157B1 (ko) 2-미크론 패밀리 플라스미드 및 이의 용도
CN102762714B (zh) 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
JP5631533B2 (ja) 遺伝子発現技術
CN111372946A (zh) 难以表达的蛋白质的多位点特异性整合细胞
TWI853878B (zh) 重組宿主細胞中的碳源調控蛋白質製造
KR101246040B1 (ko) Fivsi 모티프를 포함하는 신호서열을 갖는폴리펩타이드 및 이를 암호하는 폴리뉴클레오타이드
CN105377882B (zh) 宿主细胞和使用方法
KR20200120908A (ko) 목적 단백질을 생산하기 위한 숙주 세포
JP7146637B2 (ja) 改善されたタンパク質発現株
CN113316641B (zh) 串联蛋白表达
DK2646558T3 (en) Promoters for expression of genes in a fungal cell
BR112018012851B1 (pt) Métodos para produzir uma albumina a partir de uma célula hospedeira de saccharomyces cerevisiae e para aumentar o rendimento de uma albumina
CN119752977A (zh) 可改善目标多肽表达效果的多核苷酸构建体及其应用

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20200120

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20210618

Comment text: Request for Examination of Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20230518

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20231212

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20240215

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20240216

End annual number: 3

Start annual number: 1

PG1601 Publication of registration