KR20220097451A

KR20220097451A - 향상된 단백질 생산성 표현형을 포함하는 진균 균주 및 이의 방법

Info

Publication number: KR20220097451A
Application number: KR1020227018658A
Authority: KR
Inventors: 엘리자베스 에이 보디; 종창 천; 촨빈 류; 마이클 워드
Original assignee: 다니스코 유에스 인크.
Priority date: 2019-11-08
Filing date: 2020-11-06
Publication date: 2022-07-07
Also published as: EP4055177B1; CN114667350B; JP7648614B2; FI4055177T3; US20240102070A1; JP2022553854A; EP4055177A1; WO2021092356A1; CN114667350A; DK4055177T3

Abstract

본 개시내용은 일반적으로 향상된 단백질 생산성 표현형을 포함하는 변형된 사상성 진균 균주(세포)에 관한 것으로, 여기서 이러한 변형된 균주는 침지된 배양물에서의 성장(예를 들어, 산업/상업용 용도를 위한 단백질의 대규모 생산)에 특히 매우 적합하다. 따라서, 본 개시내용의 특정 실시형태는 천연 GEF1 단백질을 암호화하는 유전자를 포함하는 모 균주로부터 유래된 (수득된) 사상성 진균의 이러한 변이체 (변형된) 균주에 관한 것으로, 여기서 변이체 균주는 천연 GEF1 단백질을 암호화하는 유전자를 파괴하거나 결실시키는 유전자 변형을 포함하며, 상기 변이체 균주는 동일한 조건 하에 성장/배양/발효될 때 (즉, 모 균주에 비해) 증가된 단백질 생산성 표현형을 포함한다.

Description

향상된 단백질 생산성 표현형을 포함하는 진균 균주 및 이의 방법

본 개시내용은 일반적으로 생물학, 분자 생물학, 사상성 진균, 효모, 발효, 유전학, 산업적 단백질 제조 등의 분야에 관한 것이다. 보다 구체적으로, 본 개시내용의 균주 및 방법은 변형된 표현형을 갖는(변형된) 변이체 균주를 발생시키는 사상성 진균에서의 유전자 변형에 관한 것으로, 이러한 변형된 균주는 침지된 배양물에서의 성장(예를 들어, 산업/상업용 용도를 위한 단백질의 대규모 생산)에 특히 매우 적합하다.

관련 출원에 대한 상호 참조

본 출원은 2019년 11월 08일자로 출원된 미국 가출원 제62/932,525호의 이익을 주장하며, 그 전체 내용이 본원에 참조로 포함된다.

서열 목록에 대한 참조

"NB41383-WO- PCT_SequenceListing.txt"로 명명된 서열 목록 텍스트 파일의 전자 제출 내용은 2020년 10월 27일자로 생성되었으며, 크기가 55 KB이고, 그 전체내용이 본원에 참조로 포함된다.

사상성 진균(예를 들어, 아스퍼질러스 종( Aspergillus sp .), 페니실리움 종(Penicillium sp .), 탈라로마이세스 종( Talaromyces sp .), 푸사리움 종( Fusarium sp.), 미셀리오프토라 종( Myceliophthora sp .), 뉴로스포라 종( Neurospora sp .), 칸디다 종(Candida sp.), 트리코더마 종(Trichoderma sp.) 등)은 자연적 단백질 및 이종성 단백질을 고수준으로 발현할 수 있다는 점에서 산업적 및/또는 상업적 분야, 예컨대 약제학적 분야, 동물 건강 분야, 식품 분야, 음료 분야, 세탁 및 텍스타일 분야 등에 대한 단백질(예를 들어, 효소, 항체, 펩타이드 등) 및/또는 대사물질의 대규모 제조에 매우 적합하다. 사상성 진균은 일반적으로 생물반응기(발효기)에서 균사체 액침 배양에서 성장하고, 생물반응기는 산소 및 영양소를 배양 배지(즉, 배양 브로스)로 도입하고 분포시키도록 적응된다. 예를 들어, 사상균인 트리코더마 레에세이(Trichoderma reesei)(T. reesei; 진균류 하이포크레아 제코리나(Hypocrea jecorina)의 변형체)는 셀룰라제 효소의 효율적인 생산자로 알려져 있다.

이에 따라, 사상성 진균은 셀룰로오스 (유래) 에탄올, 텍스타일 가공, 그레인 가공, 세제, 섬유/펄프/종이, 식품 첨가제, 사료 첨가제 등과 같은 상품의 제조에서 가치 있는 단백질(예를 들어, 효소)을 생산하는 이의 능력이 활용되어 왔다. 예를 들어, 이러한 진균 숙주 균주에서의 재조합 유전자 발현은 단백질 생산의 일반적인 방법(즉, 산업적 및 상업적 목적을 위한 단백질 생산의 일반적인 방법)이고, 이에 따라 진균 숙주 균주의 단백질 생산성 개선은 단백질 생산 비용의 중요한 경제적 인자이다. 따라서, 당업자에 의해 이해된 바와 같이, 사상성 진균 균주에서의 단백질 생산을 향상시키기 위한 이러한 신규 조성물 및 방법에 대해 상당한 상업적 관심이 있다.

본 개시내용은 일반적으로 향상된 단백질 생산성 표현형을 포함하는 변형된 사상성 진균 균주(세포)에 관한 것으로, 이러한 변형된 균주는 침지된 배양물에서의 성장(예를 들어, 산업/상업용 용도를 위한 단백질의 대규모 생산)에 특히 매우 적합하다. 따라서, 본 개시내용의 특정 실시형태는 천연 GEF1 단백질을 코딩하는 유전자를 포함하는 모 균주로부터 유래된 (수득된) 사상성 진균의 이러한 변이체 (변형된) 균주에 관한 것으로, 변이체 균주는 천연 GEF1 단백질을 코딩하는 유전자를 파괴하거나 결실시키는 유전자 변형을 포함하며, 상기 변이체 균주는 동일한 조건 하에 성장/배양/발효될 때 증가된 단백질 생산성 표현형(즉, 모 균주에 비해)을 포함한다.

생물학적 서열의 간단한 설명

서열번호 1은 서열번호 2를 포함하는 천연 GEF1 단백질을 암호화하는 트리코더마 레에세이(T. Reesei) 폴리뉴클레오타이드 서열이다.

서열번호 2는 서열번호 1의 폴리뉴클레오타이드에 의해 암호화된 천연 전장 GEF1 단백질의 아미노산 서열이다.

서열번호 3은 서열번호 2의 천연 전장 GEF1 단백질을 암호화하는 오픈 리딩 프레임(ORF)이다.

서열번호 4는 서열번호 2의 1번 내지 1,244번 아미노산 위치를 포함하는 C-말단 절단된 GEF1 변이체 단백질이다.

서열번호 5는 서열번호 2에 존재하는 GEF1 도메인의 아미노산 서열이다.

서열번호 6은 서열번호 2에 존재하는 BAR 도메인의 아미노산 서열이다.

서열번호 7은 서열번호 2에 존재하는 보존된 미지 도메인의 아미노산 서열이다.

서열번호 8은 트리코더마 레에세이(T. Reesei) GEF1 유전자 내의 표적 부위 3(TS3) RNA 서열이다.

서열번호 9는 프라이머 AL950의 핵산 서열이다.

서열번호 10은 프라이머 AL952의 핵산 서열이다.

서열번호 11은 프라이머 RhoF1의 핵산 서열이다.

서열번호 12는 프라이머 RhoR1의 핵산 서열이다.

서열번호 13은 트리코더마 레에세이(T. Reesei) GEF1 유전자 내의 표적 부위 4(TS4) RNA 서열이다.

서열번호 14는 하이그로마이신 포스포트랜스퍼라제 마커 유전자의 핵산 서열이다.

서열번호 15는 뉴로스포라 크라사(Neurospora crassa) cpc1 프로모터 핵산 서열이다.

서열번호 16은 아스퍼질러스 니둘란스(Aspergillus nidulans) trpC 종결자 핵산 서열이다.

서열번호 17은 프라이머 HygF1의 핵산 서열이다.

서열번호 18은 프라이머 HygR1의 핵산 서열이다.

서열번호 19는 pyr2 마커 유전자의 핵산 서열이다.

도 1은 서열번호 2의 아미노산 서열을 포함하는 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질 동족체를 암호화하는 폴리뉴클레오타이드 서열(서열번호 1; 도 1a~도 1b)을 나타낸다. 도 1a 및 도 1b에 도시된 바와 같이, GEF1 단백질을 암호화하는 DNA 서열(서열번호 2)은 소문자(뉴클레오타이드) 문자로 표시된 두(2)개의 인트론, 및 대문자(뉴클레오타이드) 문자로 표시된 세(3)개의 엑손을 포함하며, 여기서 Cas9 표적 부위 3(TS3) 뉴클레오타이드는 이중 밑줄이 그어진 대문자로 표시되고, Cas9 표적 부위 4(TS4) 뉴클레오타이드는 일반 밑줄이 그어진 대문자로 표시되고, 야생형 서열(서열번호 1)의 굵은 대문자 코돈 GAG는 돌연변이 균주에서 미성숙( T AG) 종결 코돈으로 돌연변이되어 C-말단 절단된 GEF1 단백질이 암호화된다(도 1b).
도 2는 서열번호 2의 천연 GEF1 단백질을 암호화하는 오픈 리딩 프레임(ORF) 서열(서열번호 3; 도 2a~도 2b)을 보여준다.
도 3은 천연 GEF1 단백질(서열번호 2; 도 3a) 및 변이체(C-말단 절단된) GEF1 단백질 (서열번호 4; 도 3b)의 아미노산 서열을 보여준다. 또한, 도 3에는 GEF1 도메인(도 3c; 서열번호 5), 및 BAR 도메인(도 3d; 서열번호 6) 및 서열번호 2의 천연 GEF1 단백질의 미지 도메인(도 3e; 서열번호 7)이 도시되어 있다. 예를 들어, 천연 GEF1 단백질의 아미노산 서열(서열번호 2; 도 3a)은 Pfam 예측된 GEF1 도메인(도 3a, 연회색 아미노산 음영; PF00621) 및 BAR 도메인(도 3a, 굵은 아미노산; Pf03114)을 포함한다. 도 3b에 도시된 바와 같이, 변이체 GEF1 단백질(서열번호 4)은 C-말단 절단되고, 여기서 절단은 GEF1 도메인(예를 들어, 잔기 "VI K ")의 N-말단 근처에서 발생한다.

본원에 기재되고 기술된 바와 같이, 본 개시내용은 일반적으로 유전적으로 변형된 사상성 진균 균주(세포) 및 산업적 단백질 생산에서의 이들의 용도에 관한 것이다. 보다 구체적으로, 본 개시내용의 균주 및 방법은 변형된 표현형을 갖는 변이체 균주를 발생시키는 사상성 진균에서의 유전자 변형에 관한 것으로, 이러한 변이체 균주는 침지된 배양물에서의 성장(예를 들어, 산업/상업용 용도를 위한 단백질의 대규모 생산)에 특히 매우 적합하다. 따라서, 본원에 기재된 바와 같이, 본 개시내용의 특정 실시형태는 사상성 진균의 유전적으로 변형된 균주 및 그의 방법에 관한 것이며, 이러한 변형된 균주는 개선된 부피 효율, 더 높은 비생산성, 탄소원에 대한 개선된 수율, 감소된 생물반응기(발효기) 작동 비용 등과 같은 개선된 단백질 생산성 표현형을 포함한다.

I. 정의

본 개시내용의 균주 및 방법을 자세히 기술하기 전에, 명확함을 위하여 하기 용어가 정의된다. 정의되지 않은 용어는 관련 분야에서 사용되는 통상적인 의미와 일치되어야 한다. 달리 정의되지 않는 한, 본원에 사용되는 모든 기술 용어 및 과학 용어는 본 개시내용의 조성물 및 방법이 적용되는 기술 분야의 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.

본 명세서에 인용된 모든 간행물 및 특허는 본원에 인용되어 포함된다.

일정 범위의 값이 제공되는 경우, 문맥이 명백하게 달리 지시하지 않는 한, 그 범위의 상한 및 하한, 그리고 그 언급된 범위 내의 임의의 기타 언급된 값 또는 개재 값의 사이에 있는 각각의 값은 하한 단위의 소수점 첫째 자리까지, 본 개시내용의 조성물 및 방법에 포함된다. 또한, 이러한 더 작은 범위의 상한 및 하한 값들은, 이러한 더 작은 범위 내에 독립적으로 포함될 수 있으며, 언급된 범위 내의 임의의 구체적으로 제외된 한계치를 조건으로, 본 개시내용의 조성물 및 방법에 포함된다. 언급된 범위가 한계치 중 하나 또는 둘 다를 포함하는 경우, 그렇게 포함되는 한계치 중 하나 또는 둘 다를 제외하는 범위들 또한, 본 개시내용의 조성물 및 방법에 포함된다.

본원에서 특정 범위는 용어 "약"이 선행되는 수치 값으로 제시된다. 본원에서 용어 "약"은 뒤에 오는 정확한 수뿐만 아니라 이 용어 뒤에 오는 수에 근사하거나 대략적인 수를 문자 그대로 뒷받침하기 위하여 사용된다. 소정의 수가 구체적으로 인용된 수에 근사한 수 또는 대략 구체적으로 인용된 수인지를 결정하는 데 있어서, 근사한 수 또는 근사값의 인용되지 않은 수는, 그것이 제시된 문맥에서, 구체적으로 인용된 수의 실질적인 등가를 제공하는 수일 수 있다. 예를 들어, 수치 값과 관련하여, "약"이라는 용어는 이 용어가 문맥에서 달리 구체적으로 정의되지 않으면, 그 수치 값의 ^-10% 내지 ⁺10%의 범위를 나타낸다. 다른 예에서, pH 값이 구체적으로 달리 정의되지 않으면, "약 6의 pH 값"이라는 문구는 5.4 내지 6.6의 pH 값들을 지칭한다.

본원에서 제공된 표제는 본 명세서 전체를 참조하여 가질 수 있는 본 개시내용의 조성물 및 방법의 다양한 양태 또는 실시형태의 제한이 아니다. 따라서, 바로 아래에 정의된 용어는 본 명세서를 전체로 참조하여 더욱 완전하게 정의된다.

이러한 개시내용을 실시하기 위한 구체적인 내용에 따라, 다음의 약어 및 정의가 적용된다. 단수형("a", "an" 및 "the")은 그 문맥에서 명확하게 달리 기술되지 않으면 복수의 지시 대상을 포함한다는 것에 유의한다. 따라서, 예를 들어 "효소"에 대한 언급은 복수의 그러한 효소를 포함하며, "투여량"에 대한 언급은 당업자에게 공지된 하나 이상의 투여량 및 이의 등가물 등을 포함한다.

또한 주목할 것은 청구범위가 임의의 선택적 요소를 제외하도록 작성될 수 있다는 것이다. 따라서, 이러한 서술은 청구항 요소의 설명과 관련하여 "오로지", "단지", "제외하는", "포함하지 않는" 등과 같은 배타적인 용어의 사용, 또는 "부정적" 제한의 사용에 대한 선행적 근거로서의 역할을 하기 위한 것이다.

본 설명에서 사용되는 바와 같은 "포함하는"이라는 용어는 "포함하는"이라는 용어 앞의 성분(들)을 "포함하지만 이에 제한되는 것은 아님"을 의미함에 또한, 유의한다. "포함하는"이라는 용어 앞의 성분(들)은 요구되거나 필수적이지만, 이 성분(들)을 포함하는 조성물은 다른 비-필수적인 또는 선택적인 성분(들)을 추가로 포함할 수 있다.

본원에 사용되는 바와 같은 "~로 구성된"이라는 용어는 "~로 구성된"이라는 용어 앞의 성분(들)을 "포함하고 이에 제한됨"을 의미함에 또한, 유의한다. 따라서, "~로 구성된"이라는 용어 앞의 성분(들)은 요구되거나 필수적이며, 다른 성분(들)은 조성물에 존재하지 않는다.

본 개시내용을 읽을 때 당업자에게 명백한 바와 같이, 본원에 기술되고 예시된 각각의 개별적인 실시형태는 본원에 기재된 본 개시내용의 조성물 및 방법의 범위 또는 사상으로부터 벗어나지 않고서 다른 몇몇 실시형태들 중 임의의 실시형태의 특징과 쉽게 분리되거나 조합될 수 있는 개별 구성요소 및 특징을 갖는다. 임의의 언급된 방법은 언급된 사건의 순서로 또는 논리적으로 가능한 임의의 다른 순서로 수행될 수 있다.

본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 자낭균류 문(phylum Ascomycota), 주발버섯 아문(subphylum Pezizomycotina), 특히 영양 균사 상태를 갖는 진균에서 유래한다. 이러한 유기체는 트리코더마 종(Trichoderma sp.), 아스퍼질러스 종(Aspergillus sp.), 푸사리움 종(Fusarium sp.), 페니실리움 종(Penicillium sp.), 크리소스포리움 종(Chrysosporium sp.), 세팔로스포리움 종(Cephalosporium sp.), 탈라로마이세스 종(Talaromyces sp.), 게오스미티아 종(Geosmithia sp.), 뉴로스포라 종(Neurospora sp.), 미셀리오프토라 종(Myceliophthora sp.) 등을 포함하지만, 이에 제한되지 않는 상업적으로 중요한 산업적 단백질 및 약제학적 단백질의 제조에 사용되는 사상성 진균 세포를 포함한다.

예를 들어, 특정 실시형태에서, 사상성 진균 세포 및 이의 균주는 트리코더마 레에세이(이전에 트리코더마 론기브라치아툼(Trichoderma longibrachiatum) 및 하이포크레아 예코리나(Hypocrea jecorina)로 분류됨), 아스퍼질러스 니게르(Aspergillus niger), 아스퍼질러스 푸미가투스(Aspergillus fumigatus), 아스퍼질러스 이타코니쿠스(Aspergillus itaconicus), 아스퍼질러스 오리자에(Aspergillus oryzae), 아스퍼질러스 니둘란스(Aspergillus nidulans), 아스퍼질러스 테레우스(Aspergillus terreus), 아스퍼질러스 소자에(Aspergillus sojae), 아스퍼질러스 쟈포니쿠스(Aspergillus japonicus), 뉴로스포라 크라사(Neurospora crassa), 페니실리움 푸니쿨로숨(Penicillium funiculosum), 페니실리움 크리소게눔(Penicillium chrysogenum), 탈라로마이세스 (게오스미티아) 에메르소니(Talaromyces (Geosmithia) emersonii), 푸사리움 베네나툼(Fusarium venenatum), 미셀리오프토라 써모필라(Myceliophthora thermophila), 크리소스포리움 루크노웬스(Chrysosporium lucknowense)(C1) 등을 포함하지만, 이들로 제한되지는 않는다.

본원에 사용된 바와 같이, "사상성 진균 균주(들)", "사상성 진균성 균주(들)", "진균 균주(들)", "진균성 균주(들)", "사상성 진균 세포(들)", "사상성 진균성 세포(들)", "진균 세포(들)", "진균성 세포(들)" 및 기타 등의 용어 및 어구는 설명의 편의를 위해 상호교환적으로 사용될 수 있고, 본 개시내용의 범위를 제한하도록 의도되지 않는다.

본원에 사용된 바와 같이, "효모" 및/또는 "효모 균주"는 사카로마이세스 종(Saccharomyces sp.)(예를 들어, 사카로마이세스 세레비지애(S. cerevisiae), 사카로마이세스 파스토리아누스(S. pastorianus), 사카로마이세스 칼스버겐시스(S. carlsbergensis)), 쉬조사카로마이세스 종(Schizosaccharomyces sp.)(예를 들어, 쉬조사카로마이세스 폼베(S. pombe)), 야로위아 종(Yarrowia sp.)(예를 들어, 야로위아 리폴리티카(Y. lipolytica)) 등을 포함하지만, 이들로 제한되지는 않는다.

본원에 사용된 바와 같이, 용어 "유전자"는 단백질 또는 RNA를 암호화하고 이의 발현을 지시하는 핵산(폴리뉴클레오타이드)을 지칭한다는 점에서 용어 "대립유전자"와 동의어이다. 사상성 진균의 영양 형태는 일반적으로 반수체이며, 따라서 특정 유전자의 단일 카피(즉, 단일 대립유전자)는 특정 표현형을 부여하기에 충분하다.

본원에 사용된 바와 같이, "모 세포", "모 진균 세포", "모 균주", "모 진균 균주", "사상성 진균 세포의 모 균주", "기준 균주" 등과 같은 어구는 상호교환적으로 사용될 수 있고, "비변형된" 모 사상성 진균 세포를 지칭한다. 예를 들어, "사상성 진균 세포의 모 균주"는 "모" 세포 및 "딸" 세포가 다르도록 사상성 진균 세포의 변이체 (딸) 균주를 생성하기 위해 "모" 세포의 게놈이 (예를 들어, 모 세포로 도입된 유전자 변형을 통해) 변형된 사상성 진균의 임의의 세포 또는 균주를 지칭한다.

본원에 사용된 바와 같이, "변이체 세포", "딸 세포", "변이체 균주", "딸 균주", "변이체 또는 딸 진균 균주", "사상성 진균 세포의 변이체 또는 딸 균주" 등과 같은 어구는 상호교환적으로 사용될 수 있고, 사상성 진균 세포의 모 균주(또는 기준 균주)로부터 유래된(즉, 수득되거나 수득 가능한) 사상성 진균 세포의 변형된 균주를 지칭하고, 여기서 변이체 균주는 모 균주에 존재하지 않는 유전자 변형을 포함하여서, 비교에 의하면 "모" 균주와 "변이체" 균주 간의 표현형 차이는 유전자 변형에 기인할 수 있다. 다르게 표현하면, 모 균주 및 변이체 균주는 변이체 균주로 "도입된" 유전자 변형(들)을 제외하고는 모두 동질유전자이다.

따라서, 모 "균주" 및 변이체 "균주"는 소정의 특징, 예컨대 유전자 변형, 발현 표현형, 형태 표현형 등을 갖는 것으로 기재될 수 있지만, 당업자는 이것이 기술적으로 이러한 특징을 갖는 모 균주 또는 변이체 균주의 "세포"라는 것을 이해할 것이고, "균주"는 편의를 위해 지칭된다.

본원에 사용된 바와 같이, 용어 "야생형" 및 "자연적"은 상호교환적으로 사용되고, 자연계에서 발견되는 것과 같은 유전자, 단백질, 단백질 혼합물 또는 균주를 지칭한다.

본원에 사용된 바와 같이, 관심 단백질을 암호화하는 "내인성 사상성 진균 유전자"는 글리코사이드 가수분해효소(GH) 패밀리 효소(예를 들어, EC 번호 3.2.1.1-3.2.1.206과 같음)를 암호화하는 내인성 유전자, 당업자에게 알려지고 이해되는 것처럼 프로테아제를 암호화하는 내인성 유전자, 에스테라제를 암호화하는 내인성 유전자, 리파아제를 암호화하는 내인성 유전자 등을 포함하지만, 이들로 제한되지는 않는다. 본원에 사용된 바와 같이, "리그노셀룰로스 분해 효소", "셀룰라제 효소", 및 "셀룰라제"라는 같은 어구는 상호교환적으로 사용되며, 글리코시드 가수분해효소(GH) 효소, 예컨대 셀룰로오스(헤미셀룰로오스)의 β-(1,4)-결합 글리코시드 결합을 가수분해하여 글루코스를 생성하는 셀로바이오하이드롤라제, 자일라나제, 엔도글루카나제 및 β-글루코시다제를 포함한다.

특정 실시형태에서, 셀로바이오하이드롤라제는 효소 번호(EC 3.2.1.91)로 분류된 효소를 포함하며, 엔도글루카나제는 EC 3.2.1.4로 분류된 효소를 포함하고, 엔도-β-1,4-자일라나제는 EC 3.2.1.8로 분류된 효소를 포함하고, β-자일로시다제는 EC 3.2.1.37로 분류된 효소를 포함하고, β-글루코시다제는 EC 3.2.1.21로 분류된 효소를 포함한다.

본원에 사용된 바와 같이, "엔도글루카나제" 단백질은 "EG"로 약칭될 수 있고, "셀로바이오하이드롤라제" 단백질은 "CBH"로 약칭될 수 있고, "β-글루코시다제" 단백질은 "BG"로 약칭될 수 있고, "자일라나제" 단백질은 "XYL"로 약칭될 수 있다. 따라서, 본원에 사용된 바와 같이, EG 단백질을 암호화하는 유전자(또는 ORF)는 "eg"로 약칭될 수 있고, CBH 단백질을 암호화하는 유전자(또는 ORF)는 "cbh"로 약칭될 수 있고, BG 단백질을 암호화하는 유전자(또는 ORF)는 "bg"로 약칭될 수 있고, XYL 단백질을 암호화하는 유전자(또는 ORF)는 "xyl"로 약칭될 수 있다.

특정 실시형태에서, 본원에 기재된 바와 같은 조작, 작제 및 사용을 위한 사상성 진균 세포는 일반적으로 주발버섯 아문, 특히 영양 균사 상태를 갖고 GEF1 유전자 또는 그의 동족체를 포함하는 진균에서 유래한다.

본원에 사용된 바와 같이, "천연 GEF1 단백질을 암호화하는 유전자 또는 폴리뉴클레오타이드"는 서열번호 1에 대한 서열 상동성을 포함한다. 특정 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자 또는 폴리뉴클레오타이드는 서열번호 1 또는 서열번호 3에 대한 약 70% 내지 100% 서열 동일성을 포함한다. 특정 다른 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자 또는 폴리뉴클레오타이드는 서열번호 1 또는 서열번호 3에 대한 약 70% 내지 100% 서열 동일성을 포함하고, 서열번호 5에 대한 적어도 90% 서열 동일성을 포함하는 GEF1 도메인을 암호화한다. 특정 다른 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자 또는 폴리뉴클레오타이드는 중간 내지 엄격한 혼성화 조건 하에 서열번호 1 또는 서열번호 3의 핵산 서열과 혼성화된다.

특정 실시형태에서, 상류(5′) 셀룰라제 유전자 프로모터 서열은 셀로바이오하이드롤라제(cbh) 유전자 프로모터 서열, 엔도글루카나제(eg) 유전자 프로모터 서열, β-글루코시다제(bg) 유전자 프로모터 서열, 자일라나아제(xyl) 유전자 프로모터 서열 등을 포함하지만, 이에 제한되지 않는다.

본원에 사용된 바와 같이, "천연 트리코더마 종(Trichoderma sp.) GEF1 단백질을 암호화하는 오픈 리딩 프레임(ORF) 핵산 서열"은 서열번호 3의 ORF 핵산 서열에 대한 서열 상동성을 포함한다. 특정 다른 실시형태에서, ORF 핵산 서열은 서열번호 2에 대한 약 70% 내지 100% 서열 동일성을 포함하는 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질을 암호화한다. 다른 실시형태에서, ORF 핵산 서열은 서열번호 2에 대해 약 70% 내지 100% 서열 동일성을 포함하는 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질을 암호화하며, 서열번호 5에 대해 적어도 90% 서열 동일성을 갖는 GEF1 도메인을 포함한다. 특정 다른 실시형태에서, 천연 GEF1 단백질을 암호화하는 ORF는 중간 내지 엄격한 혼성화 조건 하에 서열번호 1 또는 서열번호 3의 핵산 서열과 혼성화된다.

본원에 사용된 바와 같이, "주어진 아미노산 서열"에서의 아미노산 잔기의 "위치"는 서열번호 2의 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질의 아미노산 잔기 넘버링(위치)을 사용하여 본원에서 넘버링된다. 예를 들어, 도 3a는 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질(서열번호 2)의 아미노산 서열을 나타낸다. 따라서, "서열번호　2의 1,244번 위치에 상응하는 서열 위치에서의 글루탐산(E; Glu) 잔기를 포함" 또는 "서열번호　2의 1,242~1,454번 위치에 상응하는 서열 위치에서의 GEF1 도메인을 포함"과 같은 어구에서, 천연 (트리코더마 종(Trichoderma sp.)) GEF1 단백질의 아미노산 서열(서열번호 2)은 기준 (모) 단백질 서열로 작용한다. 예를 들어, 도 3a에 도시된 바와 같이, 본원에 기재된 주어진 아미노산 서열은 본원에 기재된 정렬 알고리즘(및/또는 당업자에게 공지된 정렬 알고리즘)을 이용하여 천연 트리코더마 종(Trichoderma sp.) GEF1 단백질 아미노산 서열(서열번호 2)과 정렬될 수 있고, 천연 서열에서의 아미노산 잔기와 정렬(바람직하게는, 최적으로 정렬)하는 주어진 아미노산 서열에서의 아미노산 잔기는 GEF1 서열에서의 상응하는 아미노산 잔기를 참조하여 편리하게 넘버링될 수 있다.

마찬가지로, 트리코더마 종(Trichoderma sp.) GEF1 단백질의 1차 (1°) 서열(서열번호 2)과 서열 상동성 또는 서열 동일성을 확립하기 위해, 당업자는 당업자에게 공지된 서열 정렬 알고리즘, 소프트웨어 및 이의 방법을 이용하여 서열번호 2의 1차 서열을 하나 이상의 후보 GEF1 단백질 동족체/오솔로그 서열과 용이하게 비교할 수 있다. 따라서, 정렬을 유지시키기 위해(즉, 임의적인 결실 및 삽입을 통해 보존된 잔기의 제거를 피하기 위해) 필요한 삽입 및 결실을 허용하는, 보존된 잔기를 정렬한 후, 후보 사상 균류 GEF1 단백질의 1차 서열에서의 특정 아미노산에 동등한 잔기가 정의된다. 보존된 잔기의 정렬은 바람직하게는 이러한 잔기의 100%를 보존해야 한다. 그러나, 보존된 잔기의 98% 초과, 95%, 90%, 85%, 80%, 75% 70%, 50% 또는 적어도 45%의 정렬은 동등한 잔기를 한정하기에 또한 적절하다.

본원에 사용된 바와 같이, "T4"로 명명된 트리코더마(Trichoderma) 균주는 비생산성(Qp)에 악영향을 미치지 않으면서 고온 단백질 생산이 가능한 돌연변이 균주를 동정 및 분리하기 위해 선택적 조건 하에서 연속적으로 증식되었다.

본원에 사용된 바와 같이, "T4-E1"로 명명된 돌연변이체 트리코더마(Trichoderma) 균주(즉, 모 ‘T4’ 균주로부터 유래됨)는 선택 온도에서 동정되고 분리되었으며, 여기서 T4-E1 돌연변이체 균주는 25℃에서의 T4 균주의 비생산성(Qp)에 비해 28℃에서의 유사한 Qp를 갖는다.

본원에 사용된 바와 같이, "T4-ΔRho#22D"로 명명된 변이체 트리코더마(Trichoderma) 균주는 T4 모 균주로부터 유래되었으며, 상기 변이체 T4-ΔRho#22D 균주는 Cas9 절단 부위(TS3)에 도입되어 GEF1 코딩 서열을 파괴하는 pyr2 마커 유전자를 포함한다.

본원에 사용된 바와 같이, "t-ATV84"로 명명된 트리코더마(Trichoderma) 균주는 DXST 엔도글루카나아제를 코딩하는 스타필로트리쿰 코코스포룸(S. coccosporum) 유전자의 3개의 사본을 포함하며, CBHI, CBHII, EGI 및 EGII 단백질을 암호화하는 천연 셀룰라제 유전자의 결실(또는 파괴)을 포함한다.

본원에 사용된 바와 같이, "t-AWC88"로 명명된 트리코더마(Trichoderma) 균주는 t-ATV84 균주로부터 유래되었으며, GEF1 유전자의 도입된 파괴를 추가로 포함한다.

본원에 사용된 바와 같이, 스타필로트리쿰 코코스포룸(Staphylotrichum coccosporum) 엔도글루카나제 "STCE1"은 미국 특허 제7,595,182호(그 전체 내용이 본원에 인용되어 포함됨)에 기재되어 있다.

본원에 사용된 바와 같이, "스타필로트리쿰 코코스포룸(S. coccosporum) STCE1 엔도글루카나제"는 "스타필로트리쿰 코코스포룸(S. coccosporum) DXST 엔도글루카나제"로도 언급될 수 있으며, 이와 같이 용어들 STCE1과 DXST는 서로 바꿔 사용할 수 있다. 특정 실시형태에서, DXST 단백질을 암호화하는 폴리뉴클레오타이드 서열은 cbhI.와 같은 프로모터의 제어하에 배치한다.

본원에 사용된 바와 같이, 어구 "상승된 발효(배양) 온도"는 25℃ 초과의 발효 온도이다. 특정 실시형태에서, 상승된 발효 온도는 적어도 약 25.5℃ 내지 약 28℃이다. 특정 실시형태에서, 상승된 발효 온도는 적어도 약 25.1℃ 내지 25.9℃이다.

본원에 사용된 바와 같이, 용어 "폴리펩타이드" 및 "단백질"(및/또는 이의 각각의 복수 형태)은 펩타이드 결합에 의해 연결된 아미노산 잔기를 포함하는 임의의 길이의 중합체를 지칭하기 위해 상호교환적으로 사용된다. 아미노산 잔기에 대한 통상적인 1문자 또는 3문자 코드가 본원에 사용된다. 중합체는 선형 또는 분지형일 수 있고, 변형된 아미노산을 포함할 수 있고, 비아미노산이 개재될 수 있다. 이 용어는 또한 자연적으로 또는 개입에 의해, 예컨대 디설파이드 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화 또는 표지 성분과의 접합과 같은 임의의 다른 조작 또는 변형에 의해 변형된 아미노산 중합체를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산 등을 포함함)뿐만 아니라 당해 분야에 공지된 다른 변형도 포함하는 폴리펩타이드가 이 정의 내에 또한, 포함된다. 본원에 사용된 바와 같이, 용어 "유도체 폴리펩타이드/단백질"은 N 말단 및 C 말단 중 어느 하나 또는 둘 모두에 대한 하나 이상의 아미노산의 부가, 아미노산 서열에서의 하나의 또는 다수의 상이한 부위에서의 하나 이상의 아미노산의 치환, 단백질의 어느 하나 또는 양 말단에서의 또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 결실, 및/또는 아미노산 서열에서의 하나 이상의 부위에서의 하나 이상의 아미노산의 삽입에 의해 단백질로부터 유래되거나 유래될 수 있는 단백질을 지칭한다. 단백질 유도체의 제조는 자연적 단백질을 암호화하는 DNA 서열의 변형, 적합한 숙주로 그 DNA 서열을 형질전환시키는 것 및 변형된 DNA 서열을 발현시켜 유도체 단백질을 형성하는 것에 의해 달성될 수 있다.

관련(및 유도체) 단백질은 "변이체 단백질"을 포함한다. 변이체 단백질은 소수의 아미노산 잔기에서의 치환, 결실, 및/또는 삽입에 의해 기준/모 단백질(예를 들어, 야생형 단백질)과 상이하다. 변이체 단백질과 모 단백질 사이에서 차이가 있는 아미노산 잔기의 수는 1개 이상, 예를 들어, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 30개, 40개, 50개 이상의 아미노산 잔기일 수 있다. 변이체 단백질은 기준 단백질과 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 심지어 적어도 약 99%, 또는 그 이상의 아미노산 서열 동일성을 공유할 수 있다. 변이체 단백질은 또한, 선택된 모티프, 도메인, 에피토프, 보존 영역 등에서 기준 단백질과 상이할 수 있다.

본원에 사용된 바와 같이, 용어 "상사 서열"은 관심 단백질(즉, 전형적으로 원래의 관심 단백질)과 유사한 작용, 3차 구조, 및/또는 보존 잔기를 제공하는 단백질 내의 서열을 지칭한다. 예를 들어, α-헬릭스 또는 β-시트 구조를 함유하는 에피토프 영역에서, 상사 서열에서의 대체 아미노산은 바람직하게는 동일한 특정 구조를 유지한다. 이 용어는 또한 뉴클레오타이드 서열, 및 아미노산 서열을 지칭한다. 일부 실시형태에서, 아미노산의 대체가 유사한 기능 또는 개선된 기능을 나타내는 변이체 효소를 생성시키도록 상사 서열이 개발된다. 일부 실시형태에서, 관심 단백질에서의 아미노산의 3차 구조 및/또는 보존 잔기는 관심 분절 또는 단편에서 또는 그 근처에 위치한다. 따라서, 관심 분절 또는 단편이 예를 들어 α-헬릭스 또는 β-시트 구조를 함유하는 경우, 대체 아미노산은 바람직하게는 그 특정 구조를 유지시킨다.

본원에 사용된 바와 같이, 용어 "상동성 단백질"은 기준 단백질과 비슷한 활성 및/또는 구조를 갖는 단백질을 지칭한다. 상동물은 반드시 진화론상 관련되는 것은 아니다. 따라서, 이 용어는 상이한 유기체로부터 얻은 동일한, 유사한 또는 대응하는 단백질(들)(즉, 구조 및 기능 면에서 유사한 또는 대응하는 단백질)을 포함하고자 한 것이다. 일부 실시형태에서, 기준 단백질과 유사한 4차, 3차 및/또는 1차 구조를 갖는 상동물을 확인하는 것이 바람직하다.

서열 사이의 상동성의 정도는 당해 분야에 알려진 임의의 적합한 방법을 이용하여 결정될 수 있다(예를 들어, Smith 및 Waterman의 1981 문헌; Needleman 및 Wunsch의 1970 문헌; Pearson 및 Lipman의 1988 문헌; Wisconsin Genetics Software Package(Genetics Computer Group, 미국 위스콘신주 매디슨 소재)의 GAP, BESTFIT, FASTA 및 TFASTA와 같은 프로그램; 및 Devereux 등의 1984 문헌 참조).

예를 들어, PILEUP는 서열 상동성 수준을 결정하는 데 유용한 프로그램이다. PILEUP은 진행식 쌍별 정렬(pair-wise alignment)을 이용하여 관련 서열들의 군으로부터 다중 서열 정렬을 생성한다. 이것은 또한 정렬을 생성하는 데 사용된 클러스터링(clustering) 관계를 나타내는 트리(tree)를 작성할 수 있다. PILEUP은 Feng 및 Doolittle의 1987 문헌의 진행식 정렬 방법의 단순화를 이용한다. 상기 방법은 Higgins 및 Sharp의 1989 문헌에 의해 기재된 것과 유사하다. 유용한 PILEUP 매개변수는 3.00의 디폴트 갭 가중치, 0.10의 디폴트 갭 길이 가중치 및 가중 말단 갭을 포함한다. 유용한 알고리즘의 또 다른 예로는 문헌[Altschul et al., 1990 및 Karlin et al., 1993]에 의해 기재된 BLAST 알고리즘이다. 하나의 특히 유용한 BLAST 프로그램은 WU-BLAST-2 프로그램이다(예를 들어, Altschul 등의 1996 문헌 참조). 매개변수 "W", "T" 및 "X"는 정렬의 민감도 및 속도를 결정한다. BLAST 프로그램은 디폴트로서 11의 워드길이(W), 50의 BLOSUM62 점수 행렬(예를 들어, Henikoff 및 Henikoff의 1989 문헌 참조) 정렬(B), 10의 기대치(E), M'5, N'-4, 및 스트랜드 둘 다의 비교를 이용한다.

본원에서 사용되는 바와 같이, 적어도 2개의 핵산 또는 폴리펩타이드의 맥락에서 어구 "실질적으로 유사한" 및 "실질적으로 동일한"은 전형적으로, 폴리뉴클레오타이드 또는 폴리펩타이드가 기준(즉, 야생형) 서열과 비교하여 적어도 약 70%의 동일성, 적어도 약 75%의 동일성, 적어도 약 80%의 동일성, 적어도 약 85%의 동일성, 적어도 약 90%의 동일성, 적어도 약 91%의 동일성, 적어도 약 92%의 동일성, 적어도 약 93%의 동일성, 적어도 약 94%의 동일성, 적어도 약 95%의 동일성, 적어도 약 96%의 동일성, 적어도 약 97%의 동일성, 적어도 약 98%의 동일성, 또는 심지어 적어도 약 99%의 동일성, 또는 그 이상의 동일성을 갖는 서열을 포함함을 의미한다. 서열 동일성은 표준 매개변수를 이용하여 BLAST, ALIGN 및 CLUSTAL과 같은 알려진 프로그램을 이용하여 결정될 수 있다. (예를 들어, Altschul 등의 1990 문헌; Henikoff 등의 1989 문헌; Karlin 등의 1993 문헌; 및 Higgins 등의 1988 문헌 참조). BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립 생물공학 정보 센터(National Center for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 또한, 데이터베이스는 FASTA(Pearson 등의 1988 문헌)를 이용하여 조사될 수 있다. 2개의 폴리펩타이드가 실질적으로 동일하다는 하나의 표시는 제1 폴리펩타이드가 제2 폴리펩타이드와 면역학적으로 교차반응성이라는 것이다. 전형적으로, 보존적 아미노산 치환이 다른 폴리펩타이드는 면역학적으로 교차반응성이다. 따라서, 예를 들어, 2개의 펩타이드가 보존적 치환만이 다른 경우에 폴리펩타이드는 제2 폴리펩타이드와 실질적으로 동일하다. 2개의 핵산 서열이 실질적으로 동일하다는 다른 표시는 2개의 분자가 엄격한 조건 하에 (예를 들어, 중간 내지 높은 엄격도로 배지의 범위 내에서) 서로에 혼성화된다는 것이다.

본원에서 사용되는 바와 같이, "핵산"은 뉴클레오타이드 서열 또는 폴리뉴클레오타이드 서열, 및 이의 단편 또는 일부를 지칭할 뿐만 아니라, 센스 가닥 또는 안티센스 가닥을 나타내는지와 상관없이, 이중 가닥 또는 단일 가닥일 수 있는 게놈 또는 합성 기원의 DNA, cDNA 및 RNA를 지칭한다.

본원에서 사용되는 바와 같이, 용어 "발현"은 본 개시내용의 핵산 분자로부터 유래된 센스 RNA(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 지칭한다. 발현은 또한 mRNA가 폴리펩타이드로 번역되는 것을 지칭할 수 있다. 따라서, 용어 "발현"은 폴리펩타이드의 생산에 관여된 임의의 단계를 포함하며, 이는 전사, 전사 후 변형, 번역, 번역 후 변형, 분비 등을 포함하지만 이에 제한되지 않는다.

본원에 사용된 바와 같이, "사상성 진균 세포의 변이체 균주가 '증가한' 양의 관심 단백질(POI)을 발현한다/생산한다"(즉, 모 세포에 비해)와 같은 어구에 사용된 바와 같은 조합된 용어 "발현한다/생산한다"에서, 용어 "발현한다/생산한다"는 본 개시내용의 이러한 변이체 사상성 진균 균주에서 단백질의 발현 및 생산에 관여된 임의의 단계를 포함하고자 한다. 특정 실시형태에서, "서열 상동성"을 포함하는, 천연 GEF1 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 (비교가 이루어진) 상응하는 핵산 서열로부터의 최소 서열 변이를 갖고, (비교가 이루어진) 상응하는 핵산 서열과 실질적으로 동일한 생물학적 기능을 보유하는 DNA 또는 RNA(핵산) 서열을 지칭한다. 예를 들어, 특정 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열과 실질적인 서열 상동성을 포함하는 핵산 서열은 본원에 기재된 것처럼 암호화된 유전자 산물(천연 GEF1 단백질)을 확인함으로써 평가된다.

특정 다른 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산에 대한 서열 상동성을 포함하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 핵산 혼성화 방법을 이용하여 결정/확인된다. 예를 들어, 특정 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자에 대한 실질적인 서열 상동성을 포함하는 DNA/RNA 서열(예를 들어, 서열번호 2)은 엄격한 조건 하에 본 개시내용의 특정 핵산 서열과 혼성화되는 이러한 DNA/RNA 서열의 능력에 의해 확인된다.

본원에 사용된 바와 같이, "엄격한 조건 하에 혼성화한다"는 서로 상당히 동일하거나 상동인 뉴클레오타이드 서열이 서로 혼성화된 상태로 유지되는 혼성화 및 세척에 대한 조건을 기술하고자 하는 것이다. 이러한 엄격한 조건은 당업자에게 잘 알려져 있다(예를 들어, Ausubel 등의 1995 문헌; Sambrook 등의 1989 문헌 참조). 예를 들어, 특정 실시형태에서, 엄격한 혼성화 조건의 비제한적인 예는 약 65~70℃에서의 4X 염소산나트륨/시트르산나트륨(SSC)에서의 혼성화(또는 약 42~50℃에서의 4×SSC + 50% 포름아미드에서의 혼성화) 이후, 약 65~70℃에서의 1×SSC에서의 1회 이상의 세척을 포함한다. 이와 같이 매우 엄격한 혼성화 조건의 비제한적인 예는 약 65~70℃에서의 1×SSC에서의 혼성화(또는 약 42~50℃에서의 4×SSC + 50% 포름아미드에서의 혼성화) 이후, 약 65~70℃에서의 0.3×SSC에서의 1회 이상의 세척을 포함한다. 따라서, 매우 엄격한 혼성화 조건은 약 50~60℃에서의 4×SSC에서의 혼성화(또는 대안적으로 약 40~45℃에서의 6×SSC + 50% 포름아미드에서의 혼성화) 이후, 약 50~60℃에서의 2×SSC에서의 1회 이상의 세척을 포함한다. 상기 인용된 값의 중간 범위, 예를 들어 65~70℃ 또는 42~50℃도 본 개시내용에 포함되는 것으로 의도된다. 특정 실시형태에서, SSPE(1×SSPE는 0.15 M NaCl, 10 mM NaH2PO4 및 1.25 mM EDTA, pH 7.4임)는 혼성화 및 세척 완충액에서 SSC(1xSSPE는 0.15 M NaCl 및 15 mM 시트르산나트륨임)를 대신할 수 있고, 세척은 혼성화가 완료된 후 각각 15분 동안 수행된다. 50개 미만의 염기 쌍 길이에 기대되는 하이브리드에 대한 혼성화 온도는 하이브리드의 융점(Tm)보다 5 내지 10℃ 낮아야 하고, 여기서 Tm은 하기 식에 따라 결정된다. 18개 미만의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 2(A+T 염기의 수) + 4(G+C 염기의 수). 18개 내지 49개의 염기 쌍 길이의 하이브리드에 대해, Tm(℃) = 81.5 + 16.6(log10[Na+]) + 0.41(% G+C) - (600/N)이고, 여기서 N은 하이브리드에서의 염기의 수이고, [Na+]는 혼성화 완충액 중의 나트륨 이온의 농도(1×SSC에 대한 [Na+] = 0.165 M)이다. 또한, 차단제(예를 들어, BSA 또는 연어 또는 청어 정자 운반체 DNA), 세제(예를 들어, SDS) 킬레이트제(예를 들어, EDTA), Ficoll, PVP 등을 포함하지만, 이에 제한되지 않는 멤브레인, 예를 들어 니트로셀룰로스 또는 나일론 멤브레인에 대한 핵산 분자의 비특이적 혼성화를 감소시키기 위해 추가 시약이 혼성화 및/또는 세척 완충액에 첨가될 수 있다는 것이 숙련된 실무자에 의해 인식될 것이다. 특히 나일론 멤브레인을 사용할 때, 엄격한 혼성화 조건의 추가의 비제한적인 예는 약 65℃에서의 0.25 내지 0.5 M NaH2PO4, 7% SDS에서의 혼성화, 이후 약 65℃에서의 0.02 M NaH2PO4, 1% SDS 또는 대안적으로 0.2×SSC, 1% SDS에서의 1회 이상의 세척을 포함한다(예를 들어, Church 및 Gilbert 등의 1984 문헌 참조).

따라서, 일반적으로 상기 기재된 것처럼, 본 개시내용의 특정 실시형태는 천연 GEF1 단백질을 암호화하는 유전자의 유전자 변형을 포함하는 사상성 진균 세포의 변이체 균주에 관한 것이다. 본원에서 사용되는 용어 "변형" 및 "유전자 변형"은 상호교환적으로 사용되며, (a) 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, 또는 유전자의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거, (b) 유전자 파괴, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자(예를 들어, 안티센스 RNA, siRNA, miRNA 등)의 하향조절, (f) 특이적 돌연변이유발(비제한적인 예로서 CRISPR/Cas9 기반 돌연변이유발 포함) 및/또는 (g) 본원에 개시된 임의의 하나 이상의 유전자의 랜덤 돌연변이유발을 포함하지만, 이들로 제한되지는 않는다.

본원에 사용된 바와 같이, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 본원에 개시된 천연 GEF1 단백질을 암호화하는 유전자의 유전자 변형을 포함하지만, 이것으로 제한되지는 않는다. 따라서, 하기 더 자세히 추가로 기재된 것처럼, 다양한 분자 생물학적 방법은 잘 알려져 있고, 사상성 진균 세포의 이러한 변이체 균주를 생성/작제하기 위해 당업자에게 이용 가능하다.

본원에 사용된 바와 같이, "단백질을 암호화하는 유전자에서의 하나 이상의 뉴클레오타이드의 도입, 치환 또는 제거"에서, 이러한 유전자 변형은 유전자의 암호화 서열(즉, 엑손) 및 비암호화 개재(인트론) 서열을 포함한다.

본원에 사용된 바와 같이, "유전자의 파괴", "유전자 파괴", "유전자의 불활성화" 및 "유전자 불활성화"는 상호교환적으로 사용되며, 표적 유전자를 실질적으로 파괴/불활성화하는 임의의 유전자 변형을 광의적으로 지칭한다. 예시적인 유전자 파괴 방법은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분의 전체 또는 부분 결실, 또는 이들의 돌연변이유발을 포함하지만, 이들로 제한되지는 않고, 여기서 돌연변이유발은 표적 유전자(들)를 파괴/불활성화하고 기능적 유전자 산물의 발현/생산을 실질적으로 감소시키거나 방지하는 치환, 삽입, 결실, 역전, 및 임의의 이들의 조합 및 변형을 포괄한다. 본 개시내용의 특정 실시형태에서, 이러한 유전자 파괴는 숙주 세포가 암호화된 lov 유전자 산물을 발현/생산하는 것을 방지한다.

특정 실시형태에서, 천연 GEF1 단백질을 암호화하는 유전자, 폴리뉴클레오타이드 또는 핵산 서열은 확립된 유전자 편집 기술, 예컨대 CRISPR/Cas9 유전자 편집, 아연-핑거 뉴클레아제(ZFN) 유전자 편집, 전사 활성화제-유사 효과기 뉴클레아제 편집(TALEN), 귀소(메가) 뉴클레아제 편집 등을 사용하여 유전적으로 변형된다.

다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 변환의 과정에 의해 작제된다(즉, 유전자 변형된다)(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조).

다른 실시형태에서, 본 개시내용의 진균 세포에 의해 발현/생산된 관심 단백질(예를 들어, 내인성 POI 또는 비상동성 POI)은 비제한적인 예로서 단백질 이동/이동도(SDS-PAGE), 질량 분광법, HPLC, 크기 배제, 초원심분리 침강 속도 분석, 전사체학, 단백질체학, 형광 태그, 에피토프 태그, 형광 단백질(GFP, RFP 등) 키메라/하이브리드 등을 포함하는 단백질 정량화 방법, 유전자 전사 방법, mRNA 번역 방법 등에 의해 검출되거나 측정되거나 분석 등이 이루어진다.

본원에 사용된 바와 같이, 기능적으로 및/또는 구조적으로 유사한 단백질은 "관련 단백질"인 것으로 간주된다. 이러한 관련 단백질은 상이한 속 및/또는 종의 유기체 또는 심지어 상이한 강의 유기체(예를 들어, 박테리아 및 진균)로부터 유래될 수 있다. 관련 단백질은 또한 1차 서열 분석에 의해 결정되거나, 2차 또는 3차 구조 분석에 의해 결정되거나, 면역학적 교차반응성에 의해 결정된 상동물 및/또는 오솔로그를 포괄한다.

본원에 사용된 바와 같이, 용어 "프로모터"는 암호화 서열 또는 기능적 RNA의 발현을 제어할 수 있는 핵산 서열을 지칭한다. 일반적으로, 암호화 서열은 프로모터 서열에 대해 3'(하류)에 위치한다. 프로모터는 자연적 유전자로부터 그 전체가 유래될 수 있거나, 자연에서 발견되는 상이한 프로모터로부터 유래되는 상이한 요소로 구성될 수 있거나, 심지어 합성 핵산 절편을 포함할 수 있다. 상이한 프로모터가 상이한 세포 유형에서의 유전자 또는 상이한 발달 단계에 있는 유전자의 발현을 지시하거나, 상이한 환경적 또는 생리적 조건에 반응하여 유전자의 발현을 지시할 수 있음을 당업자는 이해할 것이다. 대부분의 세포 유형에서 대부분의 시점에 유전자가 발현되도록 하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 또한, 대부분의 경우 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있는 것으로 추가로 인식된다.

본원에 사용된 바와 같이, 용어 "작동 가능하게 연결된"은 하나의 기능이 다른 하나에 의해 영향을 받도록 단일 핵산 단편 상에서 핵산 서열들이 회합하는 것을 지칭한다. 예를 들어, 프로모터가 코딩 서열(예를 들어, ORF)의 발현에 영향을 줄 수 있는 경우 (즉, 해당 코딩 서열이 프로모터에 의해 전사가 조절되는 경우) 프로모터는 해당 코딩 서열과 작동 가능하게 연결된 것이다. 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다. 핵산이 또 다른 핵산 서열과 기능적 관계에 있도록 위치될 때 이 핵산은 "작동 가능하게 연결된" 것이다. 예를 들어, 분비 리더(즉, 신호 펩타이드)를 코딩하는 DNA가 폴리펩타이드의 분비에 참여하는 전단백질(pre-protein)로서 발현되는 경우 이것은 폴리펩타이드용 DNA에 작동 가능하게 연결된 것이거나; 프로모터 또는 인핸서가 서열의 전사에 영향을 미칠 경우 이들은 코딩 서열에 작동 가능하게 연결된 것이거나; 리보솜 결합 부위가 번역을 촉진하도록 위치하는 경우 이것은 코딩 서열에 작동 가능하게 연결된 것이다. 일반적으로 "작동 가능하게 연결된"은 연결되는 DNA 서열들이 인접해 있음을 의미하고, 분비 리더의 경우에는 인접해 있고 판독 단계에 있음을 의미한다. 그러나, 인핸서는 인접해 있을 필요는 없다. 연결은 편리한 제한 부위에서의 결찰에 의해 달성된다. 이러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오타이드 어댑터 또는 링커가 통상적인 관례에 따라 사용된다. 본원에 정의된 바와 같이, "적합한 조절 서열"은 암호화 서열의 상류(5' 비암호화 서열)에, 암호화 서열 내에 또는 하류(3' 비암호화 서열)에 위치하고, 회합된 암호화 서열의 전사, RNA 가공 또는 안정성, 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 지칭한다. 조절 서열은 프로모터, 번역 리더 서열, RNA 가공 부위, 효과기 결합 부위 및 스템-루프 구조를 포함할 수 있다.

본원에 정의된 바와 같이, 적어도 하나의 폴리뉴클레오타이드 오픈 리딩 프레임(ORF: open reading frame), 또는 이의 유전자 또는 이의 벡터를 "진균 세포 내로 도입하는"과 같은 어구에서 사용될 때 용어 "도입하는"은 비제한적인 예로서 원형질체 융합, 천연 또는 인공 형질전환(예를 들어, 염화칼슘, 전기천공), 형질도입, 형질주입 등을 포함하는 세포로 폴리뉴클레오타이드를 도입하기 위해 당해 분야에 알려진 방법을 포함한다.

본원에서 사용되는 바와 같이, "형질전환된" 또는 "형질전환"은 세포가 재조합 DNA 기술을 사용하여 형질전환된다는 것을 의미한다. 형질전환은 일반적으로 하나 이상의 뉴클레오타이드 서열(예를 들어, 폴리뉴클레오타이드, ORF 또는 유전자)을 세포 내로 삽입함으로써 일어난다. 삽입된 뉴클레오타이드 서열은 이종성 뉴클레오타이드 서열(즉, 형질전환되는 세포에 자연 발생하지 않는 서열)일 수 있다.

본원에 사용된 바와 같이, "형질전환"은 DNA가 염색체 통합체 또는 자가 복제성 염색체외 벡터로서 유지되도록 숙주 세포로 외인성 DNA를 도입하는 것을 지칭한다. 본원에 사용된 바와 같이, "형질전환 DNA", "형질전환 서열" 및 "DNA 작제물"은 숙주 세포로 서열을 도입하는 데 사용된 DNA를 지칭한다. DNA는 PCR 또는 임의의 다른 적합한 기법에 의해 시험관 내 생성될 수 있다. 일부 실시형태에서, 형질전환 DNA는 유입 서열을 포함하는 반면, 다른 실시형태에서는 상동성 박스가 측접된 유입 서열을 추가로 포함한다. 또 다른 실시형태에서, 형질전환 DNA는 말단에 추가된 다른 비-상동성 서열(즉, 스터퍼(stuffer) 서열 또는 측면 서열)을 포함한다. 말단은, 형질전환 DNA가, 예를 들어, 벡터 내로의 삽입과 같이 폐쇄된 원을 형성하도록 폐쇄될 수 있다.

본원에 사용된 바와 같이, "유입 서열"은 진균 세포 염색체로 도입된 DNA 서열을 지칭한다. 일부 실시형태에서, 유입 서열은 DNA 작제물의 일부이다. 다른 실시형태에서, 유입 서열은 하나 이상의 관심 단백질을 암호화한다. 일부 실시 형태에서, 유입 서열은 형질전환되는 세포의 게놈에 이미 존재할 수 있거나 존재하지 않을 수 있는 서열을 포함한다(즉, 상동성 서열이거나 이종성 서열일 수 있음). 일부 실시형태에서, 유입 서열은 하나 이상의 관심 단백질, 유전자, 및/또는 돌연변이되었거나 변형된 유전자를 암호화한다. 대안적인 실시형태에서, 유입 서열은 기능적 야생형 유전자 또는 오페론, 기능적 돌연변이 유전자 또는 오페론, 또는 비기능적 유전자 또는 오페론을 암호화한다. 일부 실시형태에서, 유입 서열은 유전자로 삽입되어 유전자의 기능을 파괴하는 비기능적 서열이다. 또 다른 실시형태에서, 유입 서열은 선택적 마커를 포함한다. 다른 실시형태에서, 유입 서열은 2개의 상동성 박스를 포함한다.

본원에 사용된 바와 같이, "상동성 박스"는 진균 세포 염색체에서의 서열에 상동성인 핵산 서열을 지칭한다. 보다 구체적으로는, 상동성 박스는 본 개시내용에 따라 결실되거나, 파괴되거나, 비활성화되거나, 하향조절 등이 되는 유전자 또는 유전자의 일부의 바로 측접하는 암호화 영역과 약 80% 내지 100%의 서열 동일성, 약 90% 내지 100%의 서열 동일성, 또는 약 95% 내지 100%의 서열 동일성을 갖는 상류 또는 하류 영역이다. 이러한 서열은 진균 세포 염색체에서 DNA 작제물이 어디에서 통합되는지를 지시하고, 진균 세포 염색체의 어느 부분이 유입 서열에 의해 대체되는지를 지시한다. 본 개시내용을 한정하고자 하는 것은 아니지만, 상동성 박스는 약 1개 염기쌍(bp) 내지 200개 킬로염기(kb)를 포함할 수 있다. 바람직하게는, 상동성 박스는 약 1 bp 내지 10.0 kb; 1 bp 내지 5.0 kb; 1 bp 내지 2.5 kb; 1 bp 내지 1.0 kb, 및 0.25 kb 내지 2.5 kb를 포함한다. 상동성 박스는 또한 약 10.0 kb, 5.0 kb, 2.5 kb, 2.0 kb, 1.5 kb, 1.0 kb, 0.5 kb, 0.25 kb 및 0.1 kb를 포함할 수 있다. 일부 실시형태에서, 선택적 마커의 5’ 및 3’ 말단은 상동성 박스에 의해 측접되고, 상동성 박스는 유전자의 암호화 영역을 바로 측접시키는 핵산 서열을 포함한다.

본원에 사용된 바와 같이, 용어 "선별 마커-암호화 뉴클레오타이드 서열"은 숙주 세포에서 발현할 수 있고 선별 마커의 발현이 발현된 유전자를 함유하는 세포에 상응하는 선택 제제의 존재 또는 필수 영양소의 부재 하에 성장하는 능력을 부여하는 뉴클레오타이드 서열을 지칭한다.

본원에 사용된 바와 같이, 용어 "선별 마커" 및 "선택적 마커"는 벡터를 함유하는 숙주의 선택을 용이하게 하는 이 숙주 세포에서 발현할 수 있는 핵산(예를 들어, 유전자)을 지칭한다. 이러한 선발가능 마커의 예는 항미생물제를 포함되지만, 이에 한정되지 않는다. 따라서, "선발가능 마커"라는 용어는 숙주 세포가 관심 유입 DNA를 흡수했거나 일부 다른 반응이 일어났음을 나타내는 유전자를 나타낸다. 전형적으로, 선발가능 마커는 형질전환 도중에 임의의 외인성 서열을 수용한 적이 없는 세포로부터 외인성 DNA를 포함하는 세포를 구별할 수 있도록 숙주 세포에게 항미생물제 내성 또는 대사적 이점(metabolic advantage)을 부여하는 유전자이다.

본원에 정의된 바와 같이, 숙주 세포 "게놈", 진균 세포 "게놈" 또는 사상성 진균 세포 "게놈"은 염색체 유전자 및 염색체외 유전자를 포함한다.

본원에 사용된 바와 같이, 용어 "플라스미드", "벡터" 및 "카세트"는 염색체외 요소를 지칭하며, 이는 대개 전형적으로 세포의 중심 대사의 일부가 아니고 보통 원형 이중 가닥 DNA 분자의 형태인 유전자를 운반한다. 이러한 요소는 임의의 공급원으로부터 유래되는 단일 가닥 또는 이중 가닥 DNA 또는 RNA의, 선형 또는 원형인, 자율 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있으며, 여기서 다수의 뉴클레오타이드 서열은 선택된 유전자 산물에 대한 DNA 서열 및 프로모터 단편을 적절한 3' 비번역 서열과 함께 세포 내로 도입할 수 있는 독특한 작제물로 연결되거나 재조합된다.

본원에 사용된 바와 같이, 용어 "벡터"는 세포에서 복제(증식)될 수 있고, 새로운 유전자 또는 DNA 분절(예를 들어, "유입 서열")을 세포로 운반할 수 있는 임의의 핵산을 지칭한다. 따라서, 본 용어는 상이한 숙주 세포들 간의 전달을 위해 설계된 핵산 작제물을 지칭한다. 벡터는 바이러스, 박테리오파지, 프로-바이러스, 플라스미드, 파지미드, 트랜스포존 및 인공 염색체, 예컨대 YAC(효모 인공 염색체), BAC(박테리아 인공 염색체), PLAC(식물 인공 염색체) 등을 포함하는데, 이들은 "에피좀"(즉, 자율 복제)이거나 숙주 세포의 염색체로 통합될 수 있다.

본원에 사용된 바와 같이, "형질전환 카세트"는 유전자(또는 이의 ORF)를 포함하고 유전자 이외에 특정 숙주 세포의 형질전환을 용이하게 하는 요소를 갖는 특이적 벡터를 지칭한다. 본원에 사용된 바와 같이, "발현 벡터"는 세포에서 이종성 DNA를 혼입하고 발현시키는 능력을 갖는 벡터를 지칭한다. 많은 원핵 및 진핵 발현 벡터가 상업적으로 이용 가능하고 당업자에게 알려져 있다. 적절한 발현 벡터의 선택은 당업자의 지식 내에 있다.

본원에서 사용되는 바와 같이, 용어 "발현 카세트" 또는 "발현 벡터"는 표적 세포(즉, 상기와 같이 이것들은 벡터 또는 벡터 원소임)에서 특정한 핵산의 전사를 가능케 하는 일련의 명시된 핵산 요소를 사용해 재조합적으로 또는 합성에 의해 생성된 핵산 작제물을 지칭한다. 재조합 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소체 DNA, 바이러스 또는 핵산 단편으로 혼입될 수 있다. 전형적으로, 발현 벡터의 재조합 발현 카세트 부분은 다른 서열 중에서도 전사될 핵산 서열 및 프로모터를 포함한다. 일부 실시형태에서, DNA 작제물은 또한 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 명시된 핵산 요소를 포함한다. 특정 실시형태에서, 본 개시내용의 DNA 작제물은 본원에 정의된 바와 같은 선택적 마커 및 비활성화 염색체 또는 유전자 또는 DNA 절편을 포함한다.

본원에 사용된 바와 같이, "표적화 벡터"는 표적화 벡터가 형질전환되는 숙주 세포의 염색체 내 영역에 대해 상동성이고, 그 영역에서 상동성 재조합을 유도할 수 있는 폴리뉴클레오타이드 서열을 포함하는 벡터이다. 예를 들어, 표적화 벡터는 상동성 재조합을 통해 숙주 세포의 염색체로 유전자 변형을 도입하는 데 사용된다. 일부 실시형태에서, 표적화 벡터는 예를 들어 말단에 부가된 다른 비상동성 서열(즉, 스터퍼 서열 또는 측접 서열)을 포함한다. 그 말단은 표적화 벡터가 예를 들어 벡터 내로의 삽입과 같이 폐쇄된 원을 형성하도록 폐쇄될 수 있다.

본원에 사용된 바와 같이, "향상된 단백질 생산성 표현형"을 포함하는 변이체 세포(또는 균주)는 향상된/증가된 부피측정 생산성을 포함하는 변이체 세포(또는 균주), 향상된/증가된 탄소 전환 효율을 포함하는 변이체 세포(또는 균주), 향상된/증가된 단백질 수율을 포함하는 변이체 세포(또는 균주), 향상된/증가된 단백질 비생산성을 포함하는 변이체 세포(또는 균주) 등을 포함하지만, 이들로 제한되지는 않는다. 예를 들어, 특정 실시형태에서, 향상된 단백질 생산성 표현형을 포함하는 변이체 세포 또는 균주는 (모 균주에 비해) 공급 당의 g당 적어도 0.1% 이상의 총 단백질(g)을 발현/생산하고, 여기서 공급 당은 제조 단계(즉, 공급-시작 후) 동안 발효기에 첨가된 당의 질량의 면에서 표현될 수 있다.

본원에 정의된 바와 같이, 어구 "향상된 단백질 생산성 표현형" 및 "증가된 단백질 생산성 표현형"은 상호교환적으로 사용될 수 있다.

본원에 사용된 바와 같이, 변형된 (변이체/딸)에 대하여 비변형된 (모) 세포에서 "향상된/증가된 단백질 생산성 표현형"을 기술할 때, "모" 세포 및 "변이체" 세포가 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효되는 것으로 이해될 것이다. 유사하게, 변형된 (변이체/딸) 세포에서의 동일한 POI의 "발현/제조"에 대하여 비변형된 (모) 세포에서의 관심 단백질(POI)의 "발현/제조"를 기재할 때, "모" 세포 및 "변이체" 세포가 본질적으로 동일한 조건(예를 들어, 배지, 온도, pH 등과 같은 동일한 조건) 하에 성장/배양/발효된다고 이해될 것이다.

본원에 사용된 바와 같이, "호기성 발효"는 산소의 존재 하에서의 성장을 지칭한다.

본원에 사용된 바와 같이, 용어 "브로스", "세포 브로스", "발효 브로스" 및/또는 "배양 브로스"는 상호교환적으로 사용되고, 총체적으로 액체 (액침) 배양에서 (i) 발효 (배양) 배지 및 (ii) 세포를 지칭한다.

본원에 사용된 바와 같이, 용어 "세포량(cell mass)"은 액체(액침) 배양물에 존재하는 세포 성분(온전한 세포와 용해된 세포를 포함)을 지칭한다. 세포량은 건조 세포 중량(DCW) 또는 습윤 세포 중량 (WCW)으로 표현될 수 있다.

II. 상승된 배양 온도에서 강화된 단백질 생산성 표현형을 포함하는 진균 균주

하기 실시예 섹션에서 일반적으로 기술되고 설명된 바와 같이, 출원인은 T4로 명명된 트리코더마 레에세이(Trichoderma reesei) 전체 셀룰라제 균주를 선택적인 조건 하에 연속적으로 증식시켜, (즉, 특정 생산성(Qp)에 부정적인 영향을 미치지 않으면서; 예를 들어, 실시예 1 참조) 고온 단백질 생산이 가능한 돌연변이 균주를 동정 및 분리하였다. 보다 구체적으로, "T4-E1"로 명명된 돌연변이체 트리코더마 레에세이(T. reesei) 균주는 이러한 선택적 조건(실시예 2)에서 동정 및 분리되었으며, 여기서 돌연변이체 T4-E1 균주는 25℃에서의 모 T4 균주에 비해 28℃에서 유사한 비생산성을 갖는다(표 1). 출원인은 T4-E1 균주에서 돌연변이된 유전자를 동정했으며, 여기서 암호화된 단백질의 추론된 아미노산 서열(서열번호 2; PID:120482)은 GEF1 단백질 도메인(서열번호 5)과 서열 상동성 영역을 포함한다. 실시예 2에 상세히 기술된 바와 같이, T4-E1 균주의 돌연변이는 글루타메이트 코돈(Glu; 아미노산 위치 1,245)을 미성숙 종결 코돈으로 대체하여, "GEF1 도메인"의 시작부위 부근에서 (GEF1) 단백질을 절단하였다(예를 들어, 도 3a 천연 서열 대 도 3b C-말단 절단된 서열 참조). 본 개시내용의 실시예 3에 기재된 바와 같이, 출원인은 T4 모 균주로부터 유래된 ("T4-ΔRho#22D"로 명명된) 변이체(변형된) 트리코더마(Trichoderma) 균주를 추가로 작제하였으며, 상기 변이체 T4-ΔRho#22D 균주는 Cas9 절단 부위(TS3)에 도입되어 GEF1 코딩 서열을 파괴하는 pyr2 마커 유전자를 포함한다. 예를 들어, 야생형(모) T4 균주, 돌연변이체 T4-E1 균주 및 작제된 변이체 T4-ΔRho#22D 균주의 발효기(배양) 성능은 표 1에 제시되어 있으며, 여기서 돌연변이체 T4-E1 균주 및 작제된 변이체 T4-ΔRho#22D 균주는 25℃에서의 모 T4 균주의 총 단백질 생산율에 비해 28℃에서의 증가된 총 단백질 생산율을 입증한다.

실시예 4에 추가로 기재된 바와 같이, 출원인은 스타필로트리쿰 코코스포룸(S. Coccosporum) DXST(STCE1) 엔도글루카나제를 암호화하는 유전자의 사본으로 형질전환된 트리코더마 종(Trichoderma sp.) 생산 균주를 작제하였다. 보다 구체적으로, "t-ATV84"로 명명된 모 트리코더마 DXST 생산 균주는 스타필로트리쿰 코코스포룸(S. Coccosporum) DXST 엔도글루카나제를 암호화하는 유전자의 사본으로 형질전환되었으며, CBHI, CBHII, EGI 및 EGII 단백질을 암호화하는 천연 셀룰라제 유전자의 결실을 추가로 포함한다. 이와 같이, "t-AWC88"로 명명된 변이체(변형된) 트리코더마 DXST 생산 균주는 t-ATV84 균주로부터 유래되었으며, GEF1 유전자의 도입된 파괴를 추가로 포함한다. 예를 들어, 표 2에 나타낸 바와 같이, 파괴된 GEF1 유전자를 포함하는 변이체 트리코더마 균주(t-AWC88)는 천연 GEF1 유전자를 포함하는, 25℃에서 모 균주(t-ATV84)에 의해 생산된 DXST 엔도글루카나제의 양에 비해 25℃, 26℃ 및 27℃에서 생산된 더 많은 양의 DXST 엔도글루카나제를 나타낸다.

III. 분자 생물학

일반적으로 상기에 제시된 바대로, 본 개시내용의 특정 실시형태는 개선된 단백질 생산성 표현형을 포함하는 변형된 사상성 진균 균주에 관한 것이다. 특정 바람직한 실시형태에서, 변형된 (변이체) 사상성 진균 균주는 상승된 발효(배양) 온도에서 개선된 단백질 생산성 표현형을 포함한다. 또 다른 실시형태에서, 본 개시내용은 개선된 에탄올 생산성 표현형을 포함하는 변형된 효모 균주에 관한 것이다. 특정 바람직한 실시형태에서, 변형된 (변이체) 효모 균주는 상승된 발효(배양) 온도에서 개선된 에탄올 생산성 표현형을 포함한다.

따라서, 본 개시내용의 특정 다른 실시형태는 분자 생물학, 유전자 변형, 폴리뉴클레오타이드, 유전자, ORF, 벡터, 발현 카세트 등에 관한 것이다. 특정 실시형태에서, 본 개시내용은 관심 단백질(POI)을 암호화하는 유전자 또는 ORF를 포함하는 재조합 핵산(폴리뉴클레오타이드)에 관한 것이다. 특정 실시형태에서, 재조합 핵산 (폴리뉴클레오타이드)는 POI를 암호화하는 폴리뉴클레오타이드 발현 카세트를 포함한다.

특정 실시형태에서, 본 개시내용의 폴리뉴클레오타이드는 하나 이상의 선택 가능한 마커를 포함한다. 사상성 진균에 사용하기 위한 선택 가능한 마커는 alsl, amdS, hygR, pyr2, pyr4, pyrG, sucA, 블레오마이신 내성 마커, 블라스티시딘 내성 마커, 피리티아민 내성 마커, 클로리뮤론 에틸 내성 마커, 네오마이신 내성 마커, 아데닌 경로 유전자, 트립토판 경로 유전자, 티미딘 키나아제 마커 등을 포함하지만, 이에 제한되지 않는다. 특정 실시형태에서, 선택 가능한 마커는 pyr2이며, 조성물 및 이용 방법은 PCT 공개 WO2011/153449에 일반적으로 기재되어 있다.

사상성 진균의 형질전환 및 진균 배양을 위한 표준 기술(이는 당업자에게 잘 알려져 있다)이 본 개시내용의 진균 숙주 세포를 형질전환하는 데 사용된다. 따라서, DNA 구성체 또는 벡터를 진균 숙주 세포 내로 도입하는 것은 형질전환, 전기천공법, 핵 미세주입법, 형질도입, 형질감염(예컨대, 리포펙션 매개 및 DEAE-덱스트린 매개 형질감염), 인산칼슘을 이용한 인큐베이션에 의한 DNA 침전, DNA-코팅된 미세-발사체(micro-projectile)를 이용한 고속 충격(bombardment), 유전자 총 또는 바이오리스틱 형질전환(biolistic transformation) 및 원형질 융합 등과 같은 기법을 포함한다. 일반적인 형질전환 기법은 당해 분야에 공지되어 있다(예컨대, Ausubel et al., 1987, Sambrook et al., 2001 및 2012, 그리고 Campbell et al., 1989 참조). 트리코더마에서의 이종성 단백질의 발현은 예를 들어, 미국 특허 제6,022,725호; 미국 특허 제6,268,328호; Harkki et al., 1991 및 Harkki et al., 1989에 기술되어 있다. 또한, 아스퍼질러스(Aspergillus) 균주의 형질전환에 대해서는 Cao et al. (2000)을 참조한다.

일반적으로, 트리코더마 종의 형질전환은 투과성 처리된 원형질 또는 세포를 통상적으로 10⁵ 내지 10⁷/mL, 특히 2×10⁶/mL의 밀도로 사용한다. 적절한 용액(예컨대, 1.2 M 솔비톨 및 50 mM CaCl₂) 중의 이러한 원형질 또는 세포의 100 μL의 부피가 목적하는 DNA와 혼합된다. 일반적으로, 높은 농도의 폴리에틸렌 글리콜(PEG)이 흡수(uptake) 용액에 첨가된다. 첨가제, 예컨대 디메틸 설폭시드, 헤파린, 스페르미딘, 염화칼륨 등이 또한, 형질전환을 촉진하기 위해 흡수 용액에 첨가될 수 있다. 다른 진균 숙주 세포에 대해서도 유사한 절차가 사용될 수 있다(예를 들어, 미국 특허 제6,022,725호 및 미국 특허 제6,268,328호 참조, 둘 다 참조로 포함됨).

따라서, 본 개시내용의 방법 및 조성물은 일반적으로 재조합 유전학 분야의 일상적인 기술에 의존한다. 예를 들어, 특정 실시형태에서, 관심 단백질을 암호화하는 이종성 유전자 또는 ORF는 사상성 진균 (숙주) 세포 내로 도입된다. 특정 실시형태에서, 이종성 유전자 또는 ORF는 전형적으로는 복제 및/또는 발현을 위해 사상성 진균 (숙주) 세포 내로 형질전환되기 전에 중간 벡터 내로 클로닝된다. 이러한 중간 벡터는 예컨대, 플라스미드와 같은 원핵 벡터, 또는 셔틀 벡터일 수 있다. 특정 실시형태에서, 이종성 유전자 또는 ORF의 발현은 그것의 천연 프로모터의 제어 하에 있다. 다른 실시형태에서, 이종성 유전자 또는 ORF의 발현은 이종성 구성성 프로모터 또는 이종성 유도성 프로모터일 수 있는 이종성 프로모터의 제어 하에 위치된다.

당업자는 자연(천연) 프로모터가 그것의 기능을 변화시키지 않고 1개 이상의 뉴클레오타이드의 교체, 치환, 첨가 또는 제거에 의해 변형될 수 있음을 알고 있다. 본 개시내용의 실시는 프로모터에 대한 이러한 변경을 포괄하지만, 그에 의해 제한되지 않는다.

발현 벡터는 전형적으로 이종성 서열의 발현에 필요한 추가적인 요소 전부를 함유하는 전사 단위 또는 "발현 카세트"를 함유한다. 예를 들어, 전형적인 발현 카세트는 관심 단백질을 암호화하는 이종성 핵산 서열에 작동 가능하게 연결된 5' 프로모터를 함유하고, 전사체, 리보솜 결합 부위의 효율적인 폴리아데닐화 및 번역 종결 서열에 필요한 서열 신호를 더 포함할 수 있다. 카세트의 추가적인 요소는 인핸서를 포함할 수 있고, 게놈 DNA가 구조적 유전자로서 사용되는 경우, 기능적 스플라이스 공여자 및 수여자 자리가 있는 인트론을 포함할 수 있다.

프로모터 서열 이외에도, 발현 카세트는 또한, 효율적인 종결을 제공하기 위하여 구조적 유전자의 하류에 전사 종결 영역을 함유할 수 있다. 종결 영역은 프로모터 서열과 동일한 유전자로부터 수득될 수 있거나 상이한 유전자들로부터 수득될 수 있다. 임의의 진균 종결자가 본 개시내용에서 기능적일 수 있지만, 바람직한 종결자는: 트리코더마 cbhI 유전자로부터의 종결자, 아스퍼질러스 니둘란스(Aspergillus nidulans) trpC 유전자(Yelton et al., 1984; Mullaney et al., 1985) 및 아스퍼질러스 아와모리(Aspergillus awamori) 또는 아스퍼질러스 니거(Aspergillus niger) 글루코아밀라제 유전자(Nunberg et al., 1984; Boel et al., 1984)로부터의 종결자를 포함한다.

세포 내로 유전자 정보를 수송하는 데 사용되는 구체적인 발현 벡터는 특별히 결정적이지는 않다. 진핵 또는 원핵 세포에서의 발현에 사용되는 통상적인 임의의 벡터가 사용될 수 있다. 표준 박테리아 발현 벡터는 박테리오파지 λ 및 M13과 플라스미드, 예컨대 pBR322 기반 플라스미드, pSKF, pET23D, 및 융합 발현 시스템, 예컨대 MBP, GST, 및 LacZ를 포함한다. 에피토프 태그, 예를 들어, c-myc 또한, 편리한 단리 방법을 제공하기 위해 재조합 단백질에 부가될 수 있다.

발현 벡터에 포함될 수 있는 요소는 또한, 레플리콘, 재조합 플라스미드를 보유하는 박테리아의 선택을 허용하는 항생제 내성을 암호화하는 유전자, 또는 이종성 서열의 삽입을 허용하는 플라스미드의 비필수 영역 내 고유한 제한 부위일 수 있다. 선택된 특정한 항생제 내성 유전자가 결정적인 것은 아니다; 당해 분야에 공지된 임의의 여러 내성 유전자가 적합할 수 있다. 원핵생물 서열은 바람직하게는 트리코더마 레에세이에서 DNA의 복제 또는 통합을 방해하지 않도록 선택된다.

본 개시내용의 형질전환 방법은 모든 또는 일부 형질전환 벡터의 사상성 진균 게놈 내로의 안정적인 통합을 초래할 수 있다. 그러나 자가-복제성 염색체 외 형질전환 벡터의 유지를 초래하는 형질전환이 또한 고려된다. 많은 표준 형질감염 방법을 사용하여 다량의 이종성 단백질을 발현하는 트리코더마 레에세이 세포주를 생산할 수 있으며, 따라서 외래 뉴클레오타이드 서열을 진균 숙주 세포에 도입하기 위한 공지된 절차를 사용할 수 있다. 여기에는 인산칼슘 형질감염, 폴리브렌, 원형질체 융합, 전기천공법, 생물학적 제제, 리포솜, 미세주사, 혈장 벡터, 바이러스 벡터 및 복제된 게놈 DNA, cDNA, 합성 DNA 또는 기타 외래 유전 물질을 숙주 세포에 도입하기 위한 기타 알려진 방법의 사용이 포함된다. 미국 특허 제6,255,115호에 기재된 것과 같은 아그로박테리움-매개 형질감염 방법 또한, 이용된다.

발현 벡터가 세포 내로 도입된 후, 형질전환된 세포는 유전자의 발현을 선호하는 조건 하에 배양된다. 대규모 배치의 형질전환된 세포가 본 설명에 기술된 바와 같이 배양될 수 있다. 마지막으로, 표준 기술을 이용하여 배양물로부터 단백질 산물이 회수된다. 따라서, 본원의 개시내용은 특히 본원에 기재된 상승된 발효 (배양) 온도에서 원하는 목적 단백질의 발현 및 증진된 생산성을 제공한다.

특정 다른 실시형태에서, 본 개시내용은 개선된 단백질 생산성 표현형을 포함하는 유전적으로 변형된 사상성 진균 균주 (세포)에 관한 것이다. 특정 실시형태에서, 본 개시내용의 변형된 진균 균주는 상승된 발효 온도에서 개선된 단백질 생산성 표현형을 포함하였다. 예를 들어, 특정 실시형태에서, 사상성 진균의 변이체 균주는 GEF1 단백질을 암호화하는 유전자의 유전자 변형을 포함하고, 여기서 유전자 변형은 (a) GEF1 유전자(또는 이의 ORF)에서 하나 이상의 뉴클레오타이드의 도입, 치환, 또는 제거, 또는 GEF1 유전자(또는 이의 ORF)의 전사 또는 번역을 위해 요구되는 조절 요소에서 하나 이상의 뉴클레오타이드의 도입, 치환, 또는 제거, (b) 유전자 손상, (c) 유전자 전환, (d) 유전자 결실, (e) 유전자 하향조절, (f) 특이적 돌연변이화 및/또는 (g) 서열번호 2에 대한 서열 동일성을 포함하는 GEF1 단백질을 암호화하는 유전자의 랜덤 돌연변이화를 포함하지만, 이에 제한되지 않는다. 따라서, 특정 실시형태에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 GEF1 단백질의 발현/생산을 제거하도록 유전자 결실에 의해 작제된다.

다른 실시형태에서, 유전자 변형을 포함하는 사상성 진균의 변이체 균주는 천연 GEF1 단백질의 발현/생산을 제거하도록 부분 유전자 결실 또는 유전자 파괴에 의해 작제된다. 예를 들어, 하기 실시예 3(도 3b)에 기술된 바와 같이, 미성숙 정지 코돈(즉, GEF1 단백질을 C-말단에서 절단하는 것; 서열번호 4)을 도입함으로써 모 사상성 진균 균주에서 천연 GEF1 유전자의 불활성화는 25℃에서 발효될 때 모 세포에 비해 개선된 단백질 생산성 표현형을 포함하는 변이체(딸) 균주를 생성하였다. 보다 구체적으로, 모(T4) 및 딸(T4-ΔRho #22D) 균주를 상승된 발효 온도(28℃)에서 발효시켰을 때, 변이체(딸) 균주는 모 균주에 비해 증가된 단백질 생산성 표현형을 나타내었다(표 1, 단백질 생산율).

따라서, 특정 실시형태에서, 변형된 사상성 진균 균주는 GEF1 유전자의 부분 결실을 포함하고, 여기서 부분 결실은 GEF1 유전자의 암호화 서열의 임의의 부분의 부분 결실을 포함하며, 여기서 이러한 변이체 균주는 향상된 단백질 생산성 표현형을 포함한다. 따라서, 특정 다른 실시형태에서, 이러한 변이체 균주는 GEF1 단백질을 발현/생산하지 않거나, 이러한 변이체 균주는 모 균주에 비해 감소된 양의 GEF1 단백질을 발현/생산한다.

따라서, 본원에 일반적으로 개시되고 상기 기재된 바와 같이, 당업자는 본원에 개시된 하나 이상의 핵산 서열 및/또는 단백질 서열을 참조하여 하나 이상의 유전자 변형을 용이하게 수행하고 그의 변이체 사상성 진균 균주를 작제할 수 있다.

예를 들어, 유전자 결실 기법은 유전자의 부분 또는 완전 제거가 가능하게 하여, 단백질의 발현/생산을 제거 또는 감소시키고/시키거나, 암호화된 단백질(예를 들어, GEF1)의 발현/생산을 제거 또는 감소시킨다. 이러한 방법에서, 유전자의 결실은 유전자와 측접하는 5' 및 3' 영역을 인접하여 함유하도록 작제된 통합 플라스미드/벡터를 사용하여 상동성 재조합에 의해 달성될 수 있다. 인접한 5' 및 3' 영역은 플라스미드가 세포에서 통합되게 하도록, 예를 들어 선별 마커와 공동으로 통합성 플라스미드/벡터 상의 사상성 진균 세포로 도입될 수 있다.

다른 실시형태에서, 사상성 진균의 변이체 균주는 단백질(예를 들어, GEF1)을 암호화하는 유전자를 파괴하거나 불활성화하는 유전자 변형을 포함한다. 예시적인 유전자 파괴/불활성화 방법(예를 들어, 도 1~도 3 참조)은 폴리펩타이드 암호화 서열(CDS), 프로모터, 인핸서 또는 다른 조절 요소를 포함하는 유전자의 임의의 부분을 파괴하는 것을 포함하는데, 파괴는 치환, 삽입, 결실, 역위, 및 이들의 조합 및 이들의 변형을 포함한다. 유전자 파괴 기법의 비제한적인 예는 (예를 들어, GEF1) 유전자에 상동성인 핵산 단편을 함유하는 통합 플라스미드를 본 개시내용의 하나 이상의 유전자로 삽입(통합)하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이다. 특정 다른 비제한적인 예에서, 유전자 파괴 기법은 (예를 들어, GEF1) 유전자에 상동성인 핵산 단편을 함유하는 통합 플라스미드를 유전자(예를 들어, GEF1 단백질을 암호화하는 유전자)로 삽입하는 것을 포함하고, 이는 상동성 영역의 중복을 생성하고 중복된 영역들 간에 (인서트) 벡터 DNA를 혼입할 것이고, 여기서 삽입된 벡터 DNA는 예를 들어 GEF1 단백질 암호화 영역으로부터 GEF1 유전자의 프로모터를 분리시키거나 GEF1 유전자의 암호화 서열 또는 비암호화 서열을 중단(파괴)시켜서, 단백질 생산성 표현형을 개선시킨다. 따라서, 파괴 작제물은 GEF1 유전자에 상동성인 5' 및 3' 영역이 동반된 선별 마커 유전자(예를 들어, pyr2)일 수 있다. 선별 마커는 파괴된 유전자를 함유하는 형질전환체의 확인이 가능하게 한다. 따라서, 특정 실시형태에서, 유전자 파괴는 프로모터, 리보솜 결합 부위(RBS), 비번역 영역(UTR), 코돈 변화 등과 같은 유전자의 제어 요소의 변형을 포함한다. 다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 또는 이의 전사 또는 번역에 필요한 조절 요소에서의 하나 이상의 뉴클레오타이드를 도입하거나 치환하거나 제거함으로써 작제된다(즉, 유전자 변형된다). 예를 들어, 뉴클레오타이드는 미성숙 정지 코돈이 도입되거나, 시작 코돈이 제거되거나, 오픈 리딩 프레임(ORF)이 프레임-시프트되도록 삽입되거나 제거될 수 있다. 이러한 변형은 당업계에 알려진 방법에 따라 부위 지정 돌연변이유발 또는 PCR에 의해 생성된 돌연변이유발에 의해 달성될 수 있다(예를 들어, Botstein 및 Shortle의 1985 문헌; Lo 등의 1985 문헌; Higuchi 등의 1988 문헌; Shimada의 1996 문헌; Ho 등의 1989 문헌; Horton 등의 1989 문헌 및 Sarkar 및 Sommer의 1990 문헌 참조).

또 다른 실시형태에서, 사상성 진균의 변이체 균주는 유전자 변환의 과정에 의해 작제된다(예를 들어, Iglesias 및 Trautner의 1983 문헌 참조). 예를 들어, 유전자 변환 방법에서, 표적 유전자에 대응하는 핵산 서열은 결함 핵산 서열을 생산하도록 시험관 내 돌연변이되고, 이후 결함 유전자를 포함하는 변이체 세포를 생산하기 위해 모 세포로 형질전환된다. 상동 재조합에 의해, 결함 핵산 서열은 내인성 유전자를 대체한다. 결함 유전자 또는 유전자 단편이 결함 유전자를 함유하는 형질전환체의 선발에 사용될 수 있는 마커도 암호화하는 것이 바람직할 수 있다. 예를 들어, 결함 유전자는 선택 가능 마커와 회합되어 비복제 또는 온도 감수성 플라스미드 상에 도입될 수 있다. 플라스미드의 통합에 대한 선택은 플라스미드 복제를 허용하지 않는 조건 하에 마커에 대한 선택에 의해 실행된다. 유전자 대체로 이어지는 제2 재조합 사건에 대한 선택은 선택 가능 마커의 손실 및 돌연변이된 유전자의 획득에 대한 콜로니 검사에 의해 실행된다(문헌[Perego, 1993]).

다른 실시형태에서, 사상성 진균의 변이체 균주는 GEF1 유전자의 핵산 서열에 상보성인 뉴클레오타이드 서열을 사용하는 확립된 안티센스 (유전자 침묵) 기법에 의해 작제된다(Parish 및 Stoker의 1997 문헌). 보다 구체적으로는, 사상성 진균 균주에 의한 유전자의 발현은 세포에서 전사되고 세포에서 생산된 mRNA에 혼성화할 수 있는 유전자의 핵산 서열에 상보성인 뉴클레오타이드 서열을 도입함으로써 감소(하향조절)되거나 제거될 수 있다. 따라서, 상보성 안티센스 뉴클레오타이드 서열이 mRNA에 혼성화되게 하는 조건 하에 번역된 단백질의 양은 감소되거나 제거된다. 이러한 안티센스 방법은 RNA 간섭(RNAi), 소간섭 RNA(siRNA), 마이크로RNA(miRNA), 안티센스 올리고뉴클레오타이드 등을 포함하지만, 이들로 제한되지는 않으며, 이들 모두는 당업자에게 잘 알려져 있다.

다른 실시형태에서, 사상성 진균의 변이체 균주는 비제한적인 예로서 화학 돌연변이유발 및 전좌(예를 들어, Youngman 등의 1983 문헌 참조)를 포함하는 당해 분야에 잘 알려진 방법을 사용하여 랜덤 또는 특이적 돌연변이유발에 의해 작제된다. 유전자 변형은, 모 세포에서 돌연변이를 유발시키고 GEF1 유전자의 발현이 감소되거나 제거된 돌연변이체 세포를 스크리닝함으로써 수행될 수 있다. 특이적 또는 무작위적일 수 있는 돌연변이 유발은 예를 들어 적합한 물리적 또는 화학적 돌연변이 유발제를 사용하거나, 적합한 올리고뉴클레오타이드를 사용하거나, PCR에 의해 생성되는 돌연변이유발을 DNA 서열에 가함으로써 수행될 수 있다. 더욱이, 돌연변이유발은 이들 돌연변이유발 방법의 임의의 조합을 사용함으로써 수행될 수 있다. 본 목적에 적합한 물리적 또는 화학적 돌연변이유발제의 예는 자외선(UV) 조사, 하이드록실아민, N-메틸-N'-니트로-N-니트로소구아니딘(MNNG), N-메틸-N'-니트로소구아니딘(NTG), O-메틸 히드록실아민, 아질산, 에틸 메탄 설포네이트(EMS), 아황산수소나트륨, 포름산 및 뉴클레오타이드 유사체를 포함한다. 이러한 유발제가 사용될 때, 돌연변이유발은 전형적으로 적합한 조건 하에 선택된 돌연변이 유발제의 존재 하에 돌연변이유발되는 모 세포를 배양하고, 유전자 발현 감소를 나타내거나 유전자를 발현하지 않는 돌연변이 세포를 선택함으로써 수행된다.

특정 다른 실시형태에서, 사상성 진균의 변이체 균주는 부위 특이적 유전자 편집 기법에 의해 작제된다. 예를 들어, 특정 실시형태에서, 사상성 진균의 변이체 균주는 전사 활성자 유사 엔도뉴클레아제(TALEN), 징크 핑거 엔도뉴클레아제(ZFN), 귀소(메가) 엔도뉴클레아제 등을 사용하여 작제된다(즉, 유전자 변형된다). 보다 구체적으로는, 변형되는 유전자의 부분(예를 들어, 암호화 영역, 비암호화 영역, 리더 서열, 프로-펩타이드 서열, 신호 서열, 전사 종결자, 전사 활성자 또는 암호화 영역의 발현에 필요한 다른 조절 요소)은 ZFN 유전자 편집, TALEN 유전자 편집, 귀소(메가) 엔도뉴클레아제 등에 의해 유전자 변형되고, 변형 방법은 당업자에게 잘 알려져 있고 이용 가능하다.

특정 다른 실시형태에서, 사상성 진균의 변이체 균주는 CRISPR/Cas9 편집에 의해 작제된다(예를 들어, 본원의 실시예 참조). 보다 구체적으로는, CRISPR/Cas9 시스템에 의한 진균 게놈 변형에 대한 조성물 및 방법이 기재되어 있고 당해 분야에 잘 알려져 있다(예를 들어, 국제 PCT 공보 WO2016/100571, WO2016/100568, WO2016/100272, WO2016/100562 등 참조). 따라서, GEF1 단백질을 암호화하는 유전자는 엔도뉴클레아제를 DNA 상의 표적 서열로 동원하는 가이드 RNA(예를 들어, Cas9) 또는 가이드 DNA(예를 들어, NgAgo)에 결합함으로써, 표적 DNA를 찾는, 핵산 가이드된 엔도뉴클레아제에 의해 파괴되거나 결실되거나 돌연변이되거나, 달리 유전자 변형될 수 있고, 여기서 엔도뉴클레아제는 DNA에서 단일쇄 또는 이중쇄 절단을 생성할 수 있다. 이러한 표적화된 DNA 절단은 DNA 복구를 위한 기질이 되고, 유전자를 파괴하거나 결실시키도록 제공된 편집 주형과 재조합된다. 예를 들어, 핵산 가이드된 엔도뉴클레아제를 암호화하는 유전자(예를 들어, 스타필로코커스 피오게네스(S. pyogenes) 유래의 Cas9 또는 Cas9 뉴클레아제를 암호화하는 코돈 최적화된 유전자)는 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결되어 사상성 진균 Cas9 발현 카세트를 생성한다. 마찬가지로, 관심 유전자에 고유한 하나 이상의 표적 부위가 당업자에 의해 쉽게 확인된다.

예를 들어, 관심 유전자 내의 표적 부위로 지시된 gRNA를 암호화하는 DNA 작제물을 작제하기 위해, 가변 표적화(VT) 도메인은 (PAM) 프로토-스페이서 인접 모티프(TGG)의 5'인 표적 부위의 뉴클레오타이드를 포함할 것이며, 이 뉴클레오타이드는 스타필로코커스 피오게네스(S. pyogenes) Cas9에 대한 Cas9 엔도뉴클레아제 인식 도메인(CER)을 암호화하는 DNA에 융합된다. VT 도메인을 암호화하는 DNA와 CER 도메인을 암호화하는 DNA의 조합에 의해 gRNA를 암호화하는 DNA가 생성된다. 따라서, gRNA를 암호화하는 DNA를 사상성 진균 세포에서 활성인 프로모터 및 사상성 진균 세포에서 활성인 종결자에 작동 가능하게 연결함으로써 gRNA에 대한 사상성 진균 발현 카세트가 생성된다. 특정 실시형태에서, 엔도뉴클레아제에 의해 유도된 DNA 절단은 유입 서열로 복구/대체된다. 예를 들어, 상기 기재된 Cas9 발현 카세트 및 gRNA 발현 카세트에 의해 생성된 DNA 절단을 정밀하게 복구하기 위해, 뉴클레오타이드 편집 주형이 제공되어서 세포의 DNA 복구 기작은 편집 주형을 이용할 수 있다. 예를 들어, 표적화된 유전자의 5'인 약 500 bp가 표적화된 유전자의 3'인 약 500 bp에 융합되어 편집 주형을 생성할 수 있고, 이 주형은 사상성 진균 숙주의 기작에 의해 사용되어 RGEN(RNA-가이드된 엔도뉴클레아제)에 의해 생성된 DNA 절단을 복구한다.

Cas9 발현 카세트, gRNA 발현 카세트 및 편집 주형은 많은 상이한 방법(예를 들어, 원형질체 융합, 전기천공, 자연 유능성 또는 유도된 유능성)을 사용하여 사상성 진균 세포에 동시전달될 수 있다. 형질전환된 세포는 PCR에 의해, 정방향 프라이머 및 역방향 프라이머로 표적 유전자위를 증폭시킴으로써 스크리닝된다. 이러한 프라이머는 야생형 좌위 또는 RGEN에 의해 편집된 변형된 좌위를 증폭시킬 수 있다. 이후 시퀀싱 프라이머를 사용하여 이들 단편을 시퀀싱하여 편집된 콜로니를 확인한다.

본 개시내용의 GEF1 단백질을 암호화하는 유전자가 유전자 변형될 수 있는 다른 방식은 관심 유전자의 발현 수준을 변경하는 것에 의한다. 예를 들어, 이러한 뉴클레오타이드-가이드된 엔도뉴클레아제의 뉴클레아제-결함 변이체(예를 들어, Cas9 D10A, N863A 또는 Cas9 D10A, H840A)는 표적 유전자의 전사를 향상시키거나 길항시킴으로써 유전자 발현 수준을 조절하도록 사용될 수 있다. 이 Cas9 변이체는 단백질 서열에 존재하는 모든 뉴클레아제 도메인에 대해 불활성이지만, RNA-가이드된 DNA 결합 활성을 보유한다(즉, 이 Cas9 변이체는 동족 표적 부위에 결합할 때 DNA의 어느 한 가닥을 절단할 수 없음). 따라서, 뉴클레아제-결함 단백질(즉, Cas9 변이체)은 사상성 진균 발현 카세트로서 발현될 수 있어서, Cas9 변이체 단백질은 사상성 진균 gRNA 발현 카세트와 조합될 때 세포 내에 특이적 표적 서열에 지향된다. 특이적 유전자 표적 부위에 대한 Cas9 (변이체) 단백질의 결합은 세포의 DNA 상에서 전사 기작의 결합 또는 이동을 차단하여 유전자 산물의 생산량을 감소시킬 수 있다. 따라서, 본원에 개시된 임의의 유전자는 이 방법을 사용하여 감소한 유전자 발현에 대해 표적화될 수 있다. 유전자 침묵은 뉴클레아제-결함 Cas9 발현 카세트 및 gRNA 발현 카세트(들)를 함유하는 세포에서 RNAseq와 같은 방법을 사용함으로써 모니터링될 수 있다.

V. 관심 단백질

상기 부분에 간단히 기재된 것처럼, 본 개시내용의 균주 및 방법은 사상성 진균의 액침 배양에서 상업적으로 중요한 단백질의 생산에 이용된다. 본 개시내용의 관심 단백질(POI)은 임의의 내인성 단백질 또는 이종성 단백질일 수 있으며, 이것은 이러한 POI의 변이체일 수 있다. 단백질은 하나 이상의 이황화 가교를 함유할 수 있거나, 기능적 형태가 단량체 또는 다량체인 단백질이다. 즉, 단백질은 4차 구조를 가지며, 복수의 동일한(상동성) 또는 동일하지 않은(이종) 서브유닛으로 구성되며, 이때, POI 또는 이의 변이체 POI는 바람직하게는 관심 특성을 갖는 것이다.

특정 실시형태에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 단백질 역가를 나타내고, 여기서 단백질 역가는 부피당 단백질의 양(g/L)으로 정의된다. 예를 들어, 역가는 당업계에 공지된 방법(예를 들어, ELISA, HPLC, Bradford 분석법, LC/MS 등)에 의해 측정될 수 있다. 따라서, 특정 실시형태에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 단백질 역가 증가를 포함한다.

특정 실시형태에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 부피측정 생산성을 나타내고, 여기서 부피측정 생산성은 총 발효 시간(h)에 따른 생물반응기의 공칭 부피(L)에 따른 발효 동안 생산된 단백질의 양(g)으로 정의된다. 예를 들어, 부피 생산성은 당업계에 공지된 방법(예를 들어, ELISA, HPLC, Bradford 분석법, LC/MS 등)에 의해 측정될 수 있다. 따라서, 특정 실시형태에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 부피측정 생산성 증가를 포함한다.

특정 다른 실시형태에서, 사상성 진균의 변이체 균주는 증가된 총 단백질 수율을 나타내고, 여기서 총 단백질 수율은 (비변형된) 모 균주에 비해 공급된 탄수화물의 그램당 생산된 단백질(g)의 양으로 정의된다. 따라서, 본원에서 사용되는 바와 같이, 총 단백질 수율(g/g)은 하기 식을 이용하여 계산될 수 있다:

Y_f = T_p/T_c

여기서, "Y_f"는 총 단백질 수율(g/g)이고, "T_p"는 발효 동안 생산된 총 단백질(g)이고, "T_c"는 발효 (생물반응기) 실행 동안 공급된 총 탄수화물(g)이다. 특정 실시형태에서, 변형된 균주의 총 단백질 수율의 증가(즉, 모 균주에 비해)는 비변형된 (모) 세포와 비교하여 적어도 약 0.1 %, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 증가이다.

총 단백질 수율은 예를 들어 총 단백질에 도입된 공급된 탄소의 백분율(%)에서처럼 탄소 전환 효율/탄소 수율로 또한 기재될 수 있다. 따라서, 특정 실시형태에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 증가된 탄소 전환 효율(예를 들어, 총 단백질로 도입된 공급된 탄소의 백분율(%)의 증가)을 포함한다. 특정 실시형태에서, 변형된 균주의 탄소 전환 효율의 증가(즉, 모 균주에 비해)는 비변형된 (모) 세포와 비교하여 적어도 약 0.1 %, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 증가이다.

특정 실시형태에서, 사상성 진균의 변이체 균주는 (비변형된) 모 균주에 비해 POI의 증가된 비생산성(Qp)을 나타낸다. 예를 들어, 비생산성(Qp)의 검출은 단백질 생산의 속도를 평가하는 데 적합한 방법이다. 비생산성(Qp)은 다음 식을 사용하여 결정될 수 있다:

"Qp = gP/gDCWㆍhr"

여기서, "gP"는 탱크에서 생산된 단백질의 그램이고, "gDCW"는 탱크 내 건조 세포 중량(DCW)의 그램이고, "hr"은 접종 시점으로부터의 발효 시간(h)이고, 이는 생산 시간 및 성장 시간을 포함한다. 따라서, 특정 실시형태에서, 사상성 진균의 변이체 균주는 비변형된 (모) 세포와 비교하여 적어도 약 0.1%, 적어도 약 1%, 적어도 약 5%, 적어도 약 6%, 적어도 약 7%, 적어도 약 8%, 적어도 약 9%, 또는 적어도 약 10% 이상의 비생산성(Qp) 증가를 포함한다.

특정 실시형태에서, POI 또는 이의 변이형 POI는 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나아제, 아라비노푸라노시다제, 탄산무수화효소, 카르복시펩티다제, 카탈라제, 셀룰라제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 히드롤라제, 인버타아제, 이소머라제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다제, 옥시다제, 옥시도리덕타아제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 데폴리머라제, 펙틴 메틸 에스테라제, 펙틴분해 효소, 퍼히드롤라제, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 헥소스 옥시다제, 및 이들의 조합으로 구성된 군으로부터 선택된다.

특정 실시형태에서, POI 또는 변이형 POI는 EC 1, EC 2, EC 3, EC 4, EC 5 또는 EC 6으로 구성된 군으로부터 선택된 효소 위원회(EC: Enzyme Commission) 번호로부터 선택된다.

예를 들어, 특정 실시형태에서 POI는 EC 1.10.3.2(예를 들어, 락카제), EC 1.10.3.3(예를 들어, L-아스코르베이트 옥시다제), EC 1.1.1.1(예를 들어, 알코올 데하이드로게나제), EC 1.11.1.10(예를 들어, 염화물 퍼옥시다제), EC 1.11.1.17(예를 들어, 퍼옥시다제), EC 1.1.1.27(예를 들어, L-락테이트 데하이드로게나제), EC 1.1.1.47(예를 들어, 글루코스 1-탈수소효소), EC 1.1.3.X(예를 들어, 글루코스 옥시다제), EC 1.1.3.10(예를 들어, 피라노스 옥시다제), EC 1.13.11.X(예를 들어, 디옥시게나제), EC 1.13.11.12(예를 들어, 리네올레이트 13S-리포자이게나제), EC 1.1.3.13(예를 들어, 알코올 옥시다제), EC 1.14.14.1(예를 들어, 모노옥시게나제), EC 1.14.18.1(예를 들어, 모노페놀 모노옥시게나제), EC 1.15.1.1(예를 들어, 슈퍼옥사이드 디스뮤타제), EC 1.1.5.9 (이전 EC 1.1.99.10, 예를 들어, 글루코스 데하이드로게나제), EC 1.1.99.18(예를 들어, 셀로비오스 데하이드로게나제), EC 1.1.99.29(예를 들어, 피라노스 데하이드로게나제), EC 1.2.1.X(예를 들어, 지방산 리덕타제), EC 1.2.1.10(예를 들어, 아세트알데하이드 데하이드로게나제), EC 1.5.3.X(예를 들어, 프룩토실 아민 리덕타제), EC 1.8.1.X(예를 들어, 이황화물 리덕타제) 및 EC 1.8.3.2(예를 들어, 티올 옥시다제)로부터 선택되는 EC1 (옥시도리덕타제) 효소를 포함하지만 이에 제한되지 않는 옥시도리덕타제 효소이다.

특정 실시형태에서, POI는 비제한적인 예로서 EC 2.3.2.13(예를 들어, 트랜스글루타미나아제), EC 2.4.1.X(예를 들어, 헥소실트랜스퍼라제), EC 2.4.1.40(예를 들어, 알터나수크라제), EC 2.4.1.18(예를 들어, 1,4 알파-글루칸 분지화 효소), EC 2.4.1.19(예를 들어, 시클로말토덱스트린 글루카노트랜스퍼라제), EC 2.4.1.2(예를 들어, 덱스트린 덱스트라나아제), EC 2.4.1.20(예를 들어, 셀로비오스 포스포릴라제), EC 2.4.1.25(예를 들어, 4-알파-글루카노트랜스퍼라제), EC 2.4.1.333(예를 들어, 1,2-베타-올리고글루칸 포스포르 트랜스퍼라제), EC 2.4.1.4(예를 들어, 아밀로수크라제), EC 2.4.1.5(예를 들어, 덱스트란수크라제), EC 2.4.1.69(예를 들어, 갈락토시드 2-알파-L-푸코실 트랜스퍼라제), EC 2.4.1.9(예를 들어, 이눌로수크라제), EC 2.7.1.17(예를 들어, 자일룰로키나아제), EC 2.7.7.89(이전에 EC 3.1.4.15, 예를 들어, [글루타민 신테타아제]-아데닐-L-티로신 포스포릴라제), EC 2.7.9.4(예를 들어, 알파 글루칸 키나아제) 및 EC 2.7.9.5(예를 들어, 포스포글루칸 키나아제)로부터 선택된 EC 2(트랜스퍼라제) 효소를 포함하는 트랜스퍼라제 효소이다.

다른 실시형태에서 POI는 EC 3.1.X.X(예를 들어, 에스테라제), EC 3.1.1.1(예를 들어, 펙티나제), EC 3.1.1.14(예를 들어, 클로로필라제), EC 3.1.1.20(예를 들어, 탄나제), EC 3.1.1.23(예를 들어, 글리세롤-에스테르 아실하이드롤라제), EC 3.1.1.26(예를 들어, 갈락토리파제), EC 3.1.1.32(예를 들어, 포스포리파제 A1), EC 3.1.1.4 (예를 들어, 포스포리파제 A2), EC 3.1.1.6(예를 들어, 아세틸에스테라제), EC 3.1.1.72(예를 들어, 아세틸자일란 에스테라제), EC 3.1.1.73(예를 들어, 페룰로일 에스테라제), EC 3.1.1.74(예를 들어, 큐티나제), EC 3.1.1.86(예를 들어, 람노갈락투로난 아세틸에스테라제), EC 3.1.1.87(예를 들어, 푸모신 B1 에스테라제), EC 3.1.26.5(예를 들어, 리보뉴클레아제 P), EC 3.1.3.X(예를 들어, 인산 모노에스테르 하이드롤라제), EC 3.1.30.1(예를 들어, 아스퍼질러스(Aspergillus) 뉴클레아제 S1), EC 3.1.30.2(예를 들어, 세라티아 마르케센스(Serratia marcescens) 뉴클레아제), EC 3.1.3.1(예를 들어, 알칼리 포스파타제), EC 3.1.3.2(예를 들어, 산 포스파타제), EC 3.1.3.8(예를 들어, 3-파이타제), EC 3.1.4.1(예를 들어, 포스포디에스테라제 I), EC 3.1.4.11(예를 들어, 포스포이노시티드 포스포리파제 C), EC 3.1.4.3(예를 들어, 포스포리파제 C), EC 3.1.4.4(예를 들어, 포스포리파제 D), EC 3.1.6.1(예를 들어, 아릴수파타제), EC 3.1.8.2(예를 들어, 디이소프로필-플루오로포스파타제), EC 3.2.1.10(예를 들어, 올리고-1,6-글루코시다제), EC 3.2.1.101(예를 들어, 만난 엔도-1,6-알파-만노시다제), EC 3.2.1.11(예를 들어, 알파-1,6-글루칸-6-글루카노하이드롤라제), EC 3.2.1.131(예를 들어, 자일란 알파-1,2-글루쿠로노시다제), EC 3.2.1.132(예를 들어, 키토산 N-아세틸글루코사미노하이드롤라제), EC 3.2.1.139(예를 들어, 알파-글루쿠로니다제), EC 3.2.1.14(예를 들어, 키티나제), EC 3.2.1.151(예를 들어, 자일로글루칸-특이적 엔도-베타-1,4-글루카나제), EC 3.2.1.155(예를 들어, 자일로글루칸-특이적 엑소-베타-1,4-글루카나제), EC 3.2.1.164(예를 들어, 갈락탄 엔도-1,6-베타-갈락토시다제), EC 3.2.1.17(예를 들어, 리소자임), EC 3.2.1.171(예를 들어, 람노갈락투로난 하이드롤라제), EC 3.2.1.174(예를 들어, 람노갈락투로난 람노하이드롤라제), EC 3.2.1.2(예를 들어, 베타-아밀라제), EC 3.2.1.20(예를 들어, 알파-글루코시다제), EC 3.2.1.22(예를 들어, 알파-갈락토시다제), EC 3.2.1.25(예를 들어, 베타-만노시다제), EC 3.2.1.26(예를 들어, 베타-프룩토푸라노시다제), EC 3.2.1.37(예를 들어, 자일란 1,4-베타-자일로시다제), EC 3.2.1.39(예를 들어, 글루칸 엔도-1,3-베타-D-글루코시다제), EC 3.2.1.40(예를 들어, 알파-L-람노시다제), EC 3.2.1.51(예를 들어, 알파-L-푸코시다제), EC 3.2.1.52(예를 들어, 베타-N-아세틸헥소사미니다제), EC 3.2.1.55(예를 들어, 알파-N-아라비노푸라노시다제), EC 3.2.1.58(예를 들어, 글루칸 1,3-베타-글루코시다제), EC 3.2.1.59(예를 들어, 글루칸 엔도-1,3-알파-글루코시다제), EC 3.2.1.67(예를 들어, 갈락투란 1,4-알파-갈락투로니다제), EC 3.2.1.68(예를 들어, 이소아밀라제), EC 3.2.1.7(예를 들어, 1-베타-D-프룩탄 프룩타노하이드롤라제), EC 3.2.1.74(예를 들어, 글루칸 1,4-β-글루코시다제), EC 3.2.1.75(예를 들어, 글루칸 엔도-1,6-베타-글루코시다제), EC 3.2.1.77(예를 들어, 만난 1,2-(1,3)-알파-만노시다제), EC 3.2.1.80(예를 들어, 프룩탄 베타-프룩토시다제), EC 3.2.1.82(예를 들어, 엑소-폴리-알파-갈락투로노시다제), EC 3.2.1.83(예를 들어, 카파-카라기나제), EC 3.2.1.89(예를 들어, 아라비노갈락탄 엔도-1,4-베타-갈락토시다제), EC 3.2.1.91(예를 들어, c셀룰로스 1,4-베타-셀로비오시다제), EC 3.2.1.96(예를 들어, 만노실-당단백질 엔도-베타-N-아세틸글루코사미니다제), EC 3.2.1.99(예를 들어, 아라비난 엔도-1,5-알파-L-아라비나제), EC 3.4.X.X(예를 들어, 펩티다제), EC 3.4.11.X(예를 들어, 아미노펩티다제), EC 3.4.11.1(예를 들어, 류실 아미노펩티다제), EC 3.4.11.18(예를 들어, 메티오닐 아미노펩티다제), EC 3.4.13.9(예를 들어, Xaa-Pro 디펩티다제), EC 3.4.14.5(예를 들어, 디펩티딜-펩티다제 IV), EC 3.4.16.X(예를 들어, 세린형 카르복시펩티다제), EC 3.4.16.5(예를 들어, 카르복시펩티다제 C), EC 3.4.19.3(예를 들어, 피로글루타밀-펩티다제 I), EC 3.4.21.X(예를 들어, 세린 엔도펩티다제), EC 3.4.21.1(예를 들어, 키모트립신), EC 3.4.21.19(예를 들어, 글루타밀 엔도펩티다제), EC 3.4.21.26(예를 들어, 프롤릴 올리고펩티다제), EC 3.4.21.4(예를 들어, 트립신), EC 3.4.21.5(예를 들어, 트롬빈), EC 3.4.21.63(예를 들어, 오리진), EC 3.4.21.65(예를 들어, 써모마이콜린), EC 3.4.21.80(예를 들어, 스트렙토그리신 A), EC 3.4.22.X(예를 들어, 시스테인 엔도펩티다제), EC 3.4.22.14(예를 들어, 악티니다인), EC 3.4.22.2(예를 들어, 파파인), EC 3.4.22.3(예를 들어, 피카인), EC 3.4.22.32(예를 들어, 스템 브로멜라인), EC 3.4.22.33(예를 들어, 프루트 브로멜라인), EC 3.4.22.6(예를 들어, 키모파파인), EC 3.4.23.1(예를 들어, 펩신 A), EC 3.4.23.2(예를 들어, 펩신 B), EC 3.4.23.22(예를 들어, 엔도티아펩신), EC 3.4.23.23 (예를 들어, 뮤코르펩신), EC 3.4.23.3 (예를 들어, 가스트릭신), EC 3.4.24.X(예를 들어, 메탈로엔도펩티다제), EC 3.4.24.39(예를 들어, 듀테롤리신), EC 3.4.24.40(예를 들어, 세랄리신), EC 3.5.1.1(예를 들어, 아스파라기나제), EC 3.5.1.11(예를 들어, 페니실린 아미다제), EC 3.5.1.14(예를 들어, N-아실-지방족-L-아미노산 아미도하이드롤라제), EC 3.5.1.2(예를 들어, L-글루타민 아미도하이드롤라제), EC 3.5.1.28(예를 들어, N-아세틸무라모일-L-알라닌 아미다제), EC 3.5.1.4(예를 들어, 아미다제), EC 3.5.1.44(예를 들어, 단백질-L-글루타민 아미도하이드롤라제), EC 3.5.1.5(예를 들어, 우레아제), EC 3.5.1.52(예를 들어, 펩타이드-N(4)-(N-아세틸-베타-글루코사미닐)아스파라긴 아미다제), EC 3.5.1.81(예를 들어, N-아실-D-아미노산 데아실라제), EC 3.5.4.6(예를 들어, AMP 데아미나제) 및 EC 3.5.5.1(예를 들어, 니트릴라제)로부터 선택된 EC 3(하이드롤라제) 효소를 포함하지만, 이에 제한되지 않는 하이드롤라제 효소이다.

다른 실시형태에서, POI는 EC 4.1.2.10(예를 들어, 만델로니트릴 리아제), EC 4.1.3.3(예를 들어, N-아세틸뉴라미네이트 리아제), EC 4.2.1.1(예를 들어, 탄산탈수효소), EC 4.2.2.-(예를 들어, 람노갈락투로난 리아제), EC 4.2.2.10(예를 들어, 펙틴 리아제), EC 4.2.2.22(예를 들어, 펙테이트 트리사카라이드-리아제), EC 4.2.2.23(예를 들어, 람노갈락투로난 엔도리아제) 및 EC 4.2.2.3(예를 들어, 만누로네이트-특이적 알기네이트 리아제)로부터 선택된 EC 4(리아제) 효소를 포함하지만, 이에 제한되지 않는 리아제 효소이다.

특정한 다른 실시형태에서, POI는 EC 5.1.3.3(예를 들어, 알도스 1-에피머라제), EC 5.1.3.30(예를 들어, D-사이코스 3-에피머라제), EC 5.4.99.11(예를 들어, 이소말툴로스 신타아제) 및 EC 5.4.99.15(예를 들어, (1→4)-α-D-글루칸 1-α-D-글루코실뮤타아제)로부터 선택된 EC 5(이소머라제)를 포함하지만 이에 제한되지 않는 이소머라제 효소이다.

또 다른 실시형태에서, POI는 EC 6.2.1.12(예를 들어, 4-쿠마레이트:조효소 A 리가아제) 및 EC 6.3.2.28(예를 들어, L-아미노산 알파-리가아제)로부터 선택되는 EC 6 (리가아제) 효소를 포함하지만 이에 제한되지 않는 리가아제 효소이다.

본 개시내용의 균주 및 방법의 이들 및 다른 양태 및 실시형태는 본 설명 및 하기 실시예를 고려하여 당업자에게 명확할 것이다.

VII. 발효

일부 실시형태에서, 본 개시내용은 사상성 진균 세포를 발효시키는 단계를 포함하는, 관심 단백질의 생산 방법을 제공하는데, 이때, 진균 세포는 관심 단백질을 분비한다. 다른 실시형태에서, 본 개시내용은 효모 균주에서 증가된 양의 에탄올을 생산하는 방법을 제공한다. 일반적으로, 당해 분야에 잘 알려져 있는 발효 방법이 진균 세포를 발효시키는 데에 사용된다. 일부 실시형태에서, 진균 세포는 회분식 또는 연속 발효 조건 하에서 성장된다. 전통적인 회분식 발효는 배지의 조성이 발효 개시 시 설정되고, 발효 중에는 변경되지 않는 폐쇄 시스템이다. 발효 개시 시, 배지에 요망되는 유기체(들)가 접종된다. 이 방법에서는, 이러한 시스템에 임의의 구성요소를 추가하지 않고도 발효가 일어날 수 있다. 전형적으로, 회분식 발효는 탄소원의 첨가와 관련하여 "회분(batch)"으로서 적합하며, pH 및 산소 농도와 같은 인자를 제어하기 위한 시도가 종종 이루어진다. 회분식 시스템의 대사산물 및 바이오매스 조성은 발효가 중단되는 시점까지 지속적으로 변화한다. 회분식 배양 내에서, 세포는 정적 지연상을 통과해 고성장 로그상으로, 그리고 마지막으로 성장 속도가 감소되거나 중지되는 정지상으로 진행한다. 처리되지 않는 경우, 정지기에 있는 세포는 결국 사멸한다. 일반적으로, 대수기에 있는 세포가 산물의 대량 생산에 관여된다.

표준 회분식 시스템에 대한 적합한 변형은 "유가식 발효" 시스템이다. 전형적인 회분식 시스템의 상기 변형에서는, 발효가 진행됨에 따라 기질이 증분 첨가된다. 유가식 시스템은 이화대사산물 억제가 세포의 대사를 저해할 가능성이 있을 때, 그리고 배지 중에 제한된 양의 기질을 갖는 것이 바람직한 경우 유용하다. 공급-회분식 시스템에서 실제 기질 농도의 측정은 어려우며, 따라서 측정 가능한 요인, 예컨대 pH, 용해 산소 및 폐가스, 예컨대 CO₂ 분압의 변화에 기반하여 추산된다. 회분식 및 유가식 발효는 당해 분야에서 일반적이며 널리 공지되어 있다.

연속식 발효는 정의된 발효 배지가 생물 반응기에 연속적으로 첨가되고, 동량의 조정 배지가 프로세싱을 위하여 동시에 제거되는 개방 시스템이다. 연속식 발효는 일반적으로 배양물을 일정한 고밀도로 유지하는데, 이때 세포는 주로 대수기 성장에 있다. 연속식 발효는 세포 성장 및/또는 생성물 농도에 영향을 미치는 하나 이상의 인자의 조절을 허용한다. 예를 들어, 일 실시형태에서, 탄소원 또는 질소원과 같은 제한 영양소는 고정된 비율로 유지되고 다른 모든 파라미터는 적정 수준이 되도록 한다. 다른 시스템에서는, 배지 탁도에 의해 측정되는 세포 농도를 일정하게 유지하면서, 성장에 영향을 미치는 다수의 인자를 계속 변경할 수 있다. 연속식 시스템은 정상 상태의 성장 조건을 유지하려고 한다. 따라서, 배지의 배출로 인한 세포 손실은 발효에서 세포 성장 속도와 균형을 이룰 것이다. 연속식 발효 공정을 위한 영양소 및 성장 인자를 조절하는 방법뿐만 아니라, 산물 형성 속도를 최대화하기 위한 기법이 산업 미생물학의 분야에 잘 알려져 있다.

본 개시내용의 일부 실시형태는 진균 배양을 위한 발효 절차와 관련이 있다. 셀룰라제 효소의 생산을 위한 발효 절차는 당해 분야에 공지되어 있다. 예를 들어, 셀룰라제 효소는 회분식, 유가식 및 연속 순환식 공정을 포함한 고체 또는 액침 배양에 의해 생산될 수 있다. 배양은 일반적으로 수성 미네랄 염 배지, 유기 성장 인자, 탄소 및 에너지 공급원 물질, 분자 산소, 그리고 물론, 이용되는 사상성 진균 숙주의 개시 접종원을 포함하는 성장 배지 중에서 달성된다.

탄소 및 에너지 공급원, 산소, 동화성 질소, 및 미생물 접종원 이외에도, 적절한 미생물 성장을 확실하게 하기 위하여, 미생물 전환 공정에서 세포에 의한 탄소 및 에너지 공급원의 동화를 최대화하기 위하여, 그리고 발효 배지에서 최대 세포 밀도로 최대 세포 수율을 달성하기 위하여, 적절한 양의 미네랄 영양소를 적당한 비율로 공급하는 것이 필수적이다.

수성 미네랄 배지의 조성은 당해 분야에 공지된 바와 같이, 부분적으로는 사용되는 미생물 및 기질에 따라, 넓은 범위에 걸쳐 달라질 수 있다. 미네랄 배지는 질소 이외에도, 적절한 양의 인, 마그네슘, 칼슘, 칼륨, 황, 및 나트륨을 적절한 가용성의 동화 가능한 이온 형태 및 조합된 형태로 포함해야 하고, 또한, 바람직하게는 일부 미량 원소, 예컨대, 구리, 망간, 몰리브덴, 아연, 철, 붕소, 및 요오드 등이 다시, 적절한 가용성의 동화 가능한 형태로 존재해야 하며, 모두 당해 분야에 공지된 바와 같다.

발효 반응은 미생물 종이 번성하는 식으로 성장하도록 돕는 데 효과적인 적절한 산소 부분압으로 발효 용기의 내용물을 유지하도록 제공된, 분자 산소를 함유하는 기체, 예컨대, 공기, 산소가 풍부한 공기, 또는 심지어 실질적으로 순수한 분자 산소에 의해 필요한 분자 산소가 공급되는 호기성 과정이다.

미생물은 또한, 동화 가능한 질소의 공급원을 요구한다. 동화 가능한 질소원은 임의의 질소를 함유하는 화합물 또는 미생물에 의한 대사 이용에 적합한 형태로 질소를 방출할 수 있는 화합물일 수 있다. 단백질 가수분해물과 같은 다양한 유기 질소원 화합물이 이용될 수 있지만, 통상 값싼 질소 함유 화합물, 예컨대 암모니아, 수산화암모늄, 우레아, 및 다양한 암모늄염, 예컨대 인산암모늄, 황산암모늄, 피로인산암모늄, 염화암모늄, 또는 다양한 기타 암모늄 화합물이 이용될 수 있다. 암모니아 기체 자체는 대규모 작업에 편리하며, 적당한 양으로 수성 발효물(발효 배지)을 통한 버블링에 의해 이용될 수 있다. 동시에, 이러한 암모니아는 또한, pH 제어를 돕기 위해 이용될 수 있다.

수성 미생물 발효물(발효 혼합물) 내 pH 범위는 약 2.0 내지 8.0의 예시적 범위 내에 있어야 한다. 사상성 진균의 경우, pH는 보통 약 2.5 내지 8.0의 범위 내이고; 트리코더마 레에세이의 경우, pH는 보통 약 3.0 내지 7.0의 범위 내이다. 미생물의 pH 범위에 대한 선호는 이용되는 배지에 어느 정도 의존적일 뿐만 아니라, 특정 미생물에도 의존적이며, 따라서 당업자에 의해 용이하게 결정될 수 있는 바와 같이, 배지의 변화에 따라 다소 변화한다. 바람직하게는, 발효는 탄소 함유 기질이 제한 인자로서 제어될 수 있는 방식으로 수행되어, 탄소 함유 기질의 세포로의 양호한 전환을 제공하며 실질적인 양의 비전환 기질로 세포가 오염되는 것을 방지한다. 기질로의 세포 오염은 수용성 기질에 따른 문제는 아닌데, 임의의 잔존 미량물은 용이하게 세척되기 때문이다. 그러나 비수용성 기질의 경우 이는 문제가 될 수 있으며, 적합한 세척 단계와 같은 추가된 생성물 처리 단계를 필요로 한다.

위에 기술된 바와 같이, 이 수준에 도달하는 시간은 중요하지 않으며 특정 미생물 및 수행하는 발효 공정에 따라 다를 수 있다. 그러나 발효 배지 내 탄소원 농도 및 원하는 수준의 탄소원이 달성되었는지를 어떻게 결정하는지는 당해 분야에 잘 알려져 있다.

발효는 회분식 또는 연속식 작업으로서 수행될 수 있지만, 유가식 작업이 제어의 용이함, 생성물의 균일량 제조 및 모든 기기의 가장 경제적인 사용을 위해 많이 선호된다.

원하는 경우, 수성 미네랄 배지를 발효기에 공급하기 전에, 일부 또는 모든 탄소원 및 에너지원 물질 및/또는 일부 동화성 질소원, 예컨대 암모니아가 수성 미네랄 배지에 첨가될 수 있다.

반응기 내로 도입된 각각의 스트림은 바람직하게는 사전에 결정된 속도로, 또는 탄소 및 에너지 기질의 농도, pH, 용존 산소, 발효기로부터의 배출 기체 내 산소 또는 이산화탄소, 건조 세포 중량, 광 투과율에 의해 측정 가능한 세포 밀도 등과 같은 모니터링에 의해 결정할 수 있는 필요성에 따라, 제어된다. 다양한 물질의 공급 속도는, 탄소원 및 에너지원의 효율적 이용과 일치하여, 가능한 한 빠른 세포 성장 속도가 수득되도록, 기질 충전에 대해 가능한 한 높은 수율의 미생물 세포가 수득되도록, 달라질 수 있다.

회분식, 또는 바람직한 유가식 작업에서, 모든 기기, 반응기, 또는 발효 수단, 관(vessel) 또는 용기, 배관, 부수 순환 또는 냉각 장치 등은, 통상 약 121℃에서와 같은 스팀을 적어도 약 15분 동안 이용하여 초기에 멸균된다. 그런 다음, 멸균된 반응기에 산소를 포함한 모든 필요한 영양소 및 탄소를 함유하는 기질의 존재 하에 선택된 미생물의 배양물을 접종한다. 이용되는 발효기의 종류는 중요하지 않다.

발효 배양액으로부터의 단백질의 수집 및 정제는 또한, 당업자에 공지된 절차에 의해 수행될 수 있다. 발효 배양액은 일반적으로 세포를 포함한 세포 잔해, 다양한 부유 고체 및 기타 바이오매스 오염물뿐만 아니라, 원하는 셀룰라제 효소 산물을 함유할 것이며, 이는 바람직하게는 당해 분야에 공지된 수단에 의해 발효 배양액으로부터 제거된다.

이러한 제거를 위한 적합한 방법은 통상적인 고체-액체 분리 기술, 예를 들어 원심분리, 여과, 투석, 미세여과, 회전 진공 여과, 또는 세포 불포함 여과액을 생산하는 기타 공지된 방법들을 포함한다. 한외여과, 증발 또는 침전과 같은 기술을 사용하여 결정화 전에 발효 배양액 또는 세포 불포함 여과액을 추가로 농축하는 것이 바람직할 수 있다.

상청액 또는 여과액의 단백질 성분을 침전시키는 것은 염, 예를 들어 황산암모늄을 이용하고, 다음으로 다양한 크로마토그래피 절차, 예를 들어 이온 교환 크로마토그래피, 친화도 크로마토그래피 또는 비슷한, 업계에서 인지된 절차에 의한 정제가 이어질 수 있다.

VIII. 예시적인 실시형태

본 개시내용의 비제한적 실시형태는 하기를 포함하지만 이에 제한되지는 않는다:

1. 천연 GEF1 단백질을 암호화하는 유전자를 포함하는 모 사상성 진균 균주로부터 유래된 사상성 진균의 변이체(또는 변형된) 균주로서, 상기 변이체 균주는 천연 GEF1 단백질을 암호화하는 유전자를 파괴하거나 결실시키는 유전자 변형을 포함하고, 상기 변이체 균주는 동일한 조건 하에 배양될 때 모 균주에 비해 개선된 단백질 생산성 표현형을 포함하는, 변이체 균주.

2. 실시형태 1에 있어서, 상기 개선된 단백질 생산성 표현형은 증가된 단백질 생산성, 증가된 총 단백질 생산성, 증가된 부피 생산성, 증가된 탄소 전환 효율 및 증가된 비생산성으로 구성된 군으로부터 선택되는, 변이체 균주.

3. 실시형태 1에 있어서, 상기 사상성 진균은 페지조미코티나(Pezizomycotina)인, 변이체 균주.

4. 실시형태 1에 있어서, 상기 사상성 진균은 트리코더마 종(Trichoderma sp.) 균주, 아스퍼질러스 종(Aspergillus sp.) 균주, 푸사리움 종(Fusarium sp.) 균주, 페니실리움 종(Penicillium sp.) 균주, 칸디다 종(Candida sp.) 균주, 크리소스포리움 종(Chrysosporium sp.) 균주, 세팔로스포리움 종(Cephalosporium sp.) 균주, 탈라로마이세스 종(Talaromyces sp.) 균주, 뉴로스포라 종(Neurospora sp.) 균주 및 미셀리오프토라 종(Myceliophthora sp.) 균주로 구성된 군으로부터 선택되는, 변이체 균주.

5. 실시형태 1에 있어서, 변이체 및 모 균주가 25℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 균주.

6. 실시형태 1에 있어서, 변이체 및 모 균주가 26℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 균주.

7. 실시형태 1에 있어서, 변이체 및 모 균주가 27℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 균주.

8. 실시형태 1에 있어서, 변이체 및 모 균주가 28℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 균주.

9. 실시형태 1에 있어서, 내인성 관심 단백질(POI)을 암호화하는 유전자를 포함하는, 변이체 균주.

10. 실시형태 9에 있어서, 내인성 POI는 리그노셀룰로오스 분해 효소인, 변이체 균주.

11. 실시형태 1에 있어서, 이종성 관심 단백질(POI)을 암호화하는 발현 작제물을 포함하는, 변이체 균주.

12. 실시형태 11에 있어서, 상기 이종성 POI는 효소, 항체 또는 이의 단편, 수용체 단백질 및 펩타이드로부터 선택되는, 변이체 균주.

13. 실시형태 12에 있어서, 상기 이종성 POI는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 리아제, 이소머라제 및 리가제로 구성된 군으로부터 선택되는 효소인, 변이체 균주.

14. 실시형태 12에 있어서, 상기 이종성 POI는 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나아제, 아라비노푸라노시다제, 탄산무수화효소, 카르복시펩티다제, 카탈라제, 셀룰라제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 히드롤라제, 인버타아제, 이소머라제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다제, 옥시다제, 옥시도리덕타제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 디폴리머라제, 펙틴 메틸 에스테라제, 펙틴분해 효소, 과가수분해효소, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 파이타제, 폴리갈락투로나제, 프로테아제, 펩티다제, 람노-갈락투로나제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나제, 자일라나제, 및 헥소스 옥시다제로부터 선택되는 효소인, 변이체 균주.

15. 실시형태 1의 변이체 균주에 의해 생산된 관심 단백질.

16. 실시형태 1에 있어서, 상기 암호화된 GEF1 단백질은 서열번호 2에 대한 적어도 70% 서열 동일성을 포함하는, 변이체 균주.

17. 실시형태 1에 있어서, 상기 암호화된 GEF1 단백질은 서열번호 5의 GEF1 도메인에 대한 적어도 90% 서열 동일성을 포함하는, 변이체 균주.

18. 실시형태 1에 있어서, GEF1 단백질을 암호화하는 유전자는 서열번호 1의 GEF1 폴리뉴클레오타이드 서열에 대한 적어도 70% 서열 동일성을 포함하는, 변이체 균주.

19. 실시형태 1에 있어서, GEF1 단백질을 암호화하는 유전자는 서열번호 3의 오픈 리딩 프레임(ORF) 서열에 대한 적어도 70% 서열 동일성을 포함하는, 변이체 균주.

20. 실시형태 1에 있어서, GEF1 단백질을 암호화하는 유전자는 중간 내지 엄격한 혼성화 조건 하에 서열번호 1의 GEF1 유전자 또는 서열번호 3의 GEF1 ORF와 혼성화되는, 변이체 균주.

21. 실시형태 1에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 20개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 20개 아미노산 잔기를 절단하는, 변이체 균주.

22. 실시형태 1에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 200개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 200개 아미노산 잔기를 절단하는, 변이체 균주.

23. 실시형태 1에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 500개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 500개 아미노산 잔기를 절단하는, 변이체 균주.

24. 실시형태 1에 있어서, 상기 유전자 변형은 GEF1 C-말단의 적어도 700 내지 750개 아미노산 잔기를 절단하는, 변이체 균주.

25. 실시형태 1에 있어서, 상기 GEF1 단백질을 암호화하는 유전자가 결실된, 변이체 균주. 26. (a) 천연 GEF1 유전자를 파괴 또는 결실시켜 사상성 진균 균주를 유전자 변형시키는 단계, 및 (b) 관심 단백질(POI) 생산에 적합한 조건 하에 변형된 균주를 발효시키는 단계를 포함하는, 변형된 사상성 진균 균주에서 증가된 양의 내인성 관심 단백질(POI)을 생산하는 방법으로서, 상기 변형된 균주는 25℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.

27. 실시형태 26에 있어서, 상기 사상성 진균은 페지조미코티나(Pezizomycotina)인, 방법.

28. 실시형태 26에 있어서, 상기 사상성 진균은 트리코더마 종(Trichoderma sp.) 균주, 아스퍼질러스 종(Aspergillus sp.) 균주, 푸사리움 종(Fusarium sp.) 균주, 페니실리움 종(Penicillium sp.) 균주, 칸디다 종(Candida sp.) 균주, 크리소스포리움 종(Chrysosporium sp.) 균주, 세팔로스포리움 종(Cephalosporium sp.) 균주, 탈라로마이세스 종(Talaromyces sp.) 균주, 뉴로스포라 종(Neurospora sp.) 균주 및 미셀리오프토라 종(Myceliophthora sp.) 균주로 구성된 군으로부터 선택되는, 방법.

29. 실시형태 26에 있어서, 상기 변형된 균주가 26℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.

30. 실시형태 26에 있어서, 상기 변형된 균주가 27℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.

31. 실시형태 26에 있어서, 상기 변형된 균주가 28℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.

32. 실시형태 26에 있어서, 내인성 POI는 리그노셀룰로오스 분해 효소인, 방법.

33. 실시형태 26에 있어서, 상기 변형된 균주가 이종성 POI를 암호화하는 발현 작제물을 추가로 포함하는, 방법.

34. 실시형태 26에 있어서, 상기 암호화된 GEF1 단백질은 서열번호 2에 대한 적어도 70% 서열 동일성을 포함하는, 방법.

35. 실시형태 26에 있어서, 상기 암호화된 GEF1 단백질은 서열번호 5의 GEF1 도메인에 대한 적어도 90% 서열 동일성을 포함하는, 방법.

36. 실시형태 26에 있어서, GEF1 단백질을 암호화하는 유전자는 서열번호 1의 GEF1 폴리뉴클레오타이드 서열에 대한 적어도 70% 서열 동일성을 포함하는, 방법.

37. 실시형태 26에 있어서, GEF1 단백질을 암호화하는 유전자는 서열번호 3의 오픈 리딩 프레임(ORF) 서열에 대한 적어도 70% 서열 동일성을 포함하는, 방법.

38. 실시형태 26에 있어서, GEF1 단백질을 암호화하는 유전자는 중간 내지 엄격한 혼성화 조건 하에 서열번호 1의 GEF1 유전자 또는 서열번호 3의 GEF1 ORF와 혼성화되는, 방법.

39. 실시형태 26에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 20개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 20개 아미노산 잔기를 절단하는, 방법.

40. 실시형태 26에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 200개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 200개 아미노산 잔기를 절단하는, 방법.

41. 실시형태 26에 있어서, 상기 유전자 변형은 GEF1 N-말단의 적어도 처음 500개 아미노산 잔기를 절단하거나, GEF1 C-말단의 적어도 마지막 500개 아미노산 잔기를 절단하는, 방법.

42. 실시형태 26에 있어서, 상기 유전자 변형은 GEF1 C-말단의 적어도 700 내지 750개 아미노산 잔기를 절단하는, 방법.

43. 실시형태 26에 있어서, 상기 GEF1 단백질을 암호화하는 유전자가 결실된, 방법.

44. (a) 천연 GEF1 유전자를 파괴 또는 결실시키고 이종성 POI를 암호화하는 발현 카세트를 도입시켜 사상성 진균 균주를 유전자 변형시키는 단계, 및 (b) 이종성 POI 생산에 적합한 조건 하에 변형된 균주를 발효시키는 단계를 포함하는, 변형된 사상성 진균 균주에서 증가된 양의 이종성 관심 단백질(POI)을 생산하는 방법으로서, 상기 변형된 균주는 25℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.

45. 실시형태 44에 있어서, 상기 사상성 진균은 페지조미코티나(Pezizomycotina)인, 방법.

46. 실시형태 44에 있어서, 상기 사상성 진균은 트리코더마 종(Trichoderma sp.) 균주, 아스퍼질러스 종(Aspergillus sp.) 균주, 푸사리움 종(Fusarium sp.) 균주, 페니실리움 종(Penicillium sp.) 균주, 칸디다 종(Candida sp.) 균주, 크리소스포리움 종(Chrysosporium sp.) 균주, 세팔로스포리움 종(Cephalosporium sp.) 균주, 탈라로마이세스 종(Talaromyces sp.) 균주, 뉴로스포라 종(Neurospora sp.) 균주 및 미셀리오프토라 종(Myceliophthora sp.) 균주로 구성된 군으로부터 선택되는, 방법.

47. 실시형태 44에 있어서, 상기 변형된 균주가 26℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.

48. 실시형태 44에 있어서, 상기 변형된 균주가 27℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.

49. 실시형태 44에 있어서, 상기 변형된 균주가 28℃에서 동일한 조건 하에 배양될 때 모 균주에 비해 증가된 양의 POI를 생산하는, 방법.

50. 실시형태 44에 있어서, 상기 이종성 POI는 효소, 항체 또는 이의 단편, 수용체 단백질 및 펩타이드로부터 선택되는, 방법.

51. 실시형태 44에 있어서, 상기 이종성 POI는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 리아제, 이소머라제 및 리가제로 구성된 군으로부터 선택되는 효소인, 방법.

52. 실시형태 44에 있어서, 이종성 POI는 아세틸 에스테라제, 아미노펩티다제, 아밀라제, 아라비나아제, 아라비노푸라노시다제, 탄산무수화효소, 카르복시펩티다제, 카탈라제, 셀룰라제, 키티나아제, 키모신, 큐티나아제, 데옥시리보뉴클레아제, 에피머라제, 에스테라제, α-갈락토시다제, β-갈락토시다제, α-글루카나아제, 글루칸 리아제, 엔도-β-글루카나아제, 글루코아밀라제, 글루코스 옥시다제, α-글루코시다제, β-글루코시다제, 글루쿠로니다제, 글리코실 하이드롤라제, 헤미셀룰라제, 헥소스 옥시다제, 히드롤라제, 인버타아제, 이소머라제, 락카아제, 리가아제(ligase), 리파아제, 리아제, 만나나아제, 만노시다제, 옥시다제, 옥시도리덕타아제, 펙테이트 리아제, 펙틴 아세틸 에스테라제, 펙틴 데폴리머라제, 펙틴 메틸 에스테라제, 펙틴분해 효소, 퍼히드롤라제, 폴리올 옥시다제, 퍼옥시다제, 페놀옥시다제, 피타아제, 폴리갈락투로나아제, 프로테아제, 펩티다제, 람노-갈락투로나아제, 리보뉴클레아제, 트랜스퍼라제, 수송 단백질, 트랜스글루타미나아제, 자일라나아제, 및 헥소스 옥시다제로 구성된 군으로부터 선택되는 효소인, 방법.

53. 실시형태 26 또는 실시형태 44의 방법에 의해 생산된 관심 단백질.

54. 효모 발효 공정에서 증가된 양의 에탄올을 생산하는 방법으로서,

(a) 천연 GEF1 유전자를 결실 또는 파괴함으로써 효모 균주를 유전적으로 변형시키는 단계, 및 (b) 에탄올 생산에 적합한 조건 하에서 변형된 균주를 발효시키는 단계로서, 상기 변형된 균주는 동일한 조건에서 배양했을 때 모 균주에 의해 발효 말기(EOF)에 생산된 에탄올의 양에 비해 증가된 양의 에탄올을 EOF에서 생산하는, 단계를 포함하는, 방법.

55. GEF1 단백질 동족체를 암호화하는 유전자를 포함하는 모 균주로부터 유래된 변이체 효모 균주로서, 상기 변이체 균주는 GEF1 단백질 동족체를 암호화하는 유전자를 결실 또는 파괴하는 유전자 변형을 포함하고, 상기 변이체 균주는 동일한 조건에서 발효했을 때 모 균주에 비해 증가된 에탄올 생산성 표현형을 포함하는, 변이체 효모 균주.

실시예

본 개시내용의 특정 양태는 다음의 실시예를 고려함으로써 더 잘 이해될 수 있으며, 이를 제한하는 것으로 해석해서는 안 된다. 재료 및 방법에 대한 변형이 당업자에게는 명백할 것이다.

실시예 1

상승된 배양 온도에서 개선된 단백질 생산성 표현형을 포함하는 돌연변이 트리코더마 균주 확인

트리코더마 레에세이(Trichoderma reesei) 전체 셀룰라제 (T4) 균주를 선택적 조건 하에서 연속적으로 증식시켜, 비생산성(Qp)에 악영향을 미치지 않으면서 고온 단백질 생산이 가능한 돌연변이체를 분리하였다. "T4-E1"로 명명된 돌연변이체 트리코더마 레에세이(T. reesei) 균주는 25℃에서의 모 트리코더마 레에세이(T. reesei) T4 균주에 비해 28℃에서 유사한 비생산성(Qp)으로 동정 및 분리되었다. 예를 들어, T4 모 균주는 BIRD 한천에 포자를 형성하고, 1×10⁷ 포자/mL를 한천 플레이트로부터 수집하고, 물에 현탁하고, 포자의 1%만 생존할때까지 실온에서 2시간 동안 0.15 mg/mL의 1-메틸-3-니트로-1-니트로소구아니딘(Sigma 112, 994-1)으로 처리하였다. 유일한 탄소원으로서 0.5%의 미세결정질 셀룰로스(EMCOCEL, JRS Pharma, Rosenburg, Germany), 카르복시메틸셀룰로스(CMC; Sigma-Aldrich C5678, St. Louis, MO), 또는 산 팽윤된 셀룰로스(예를 들어, 제조용, Wood, 1988 참조)를 함유하는 진화 배지에 포자를 접종하였다. 또한, 1리터 당 황산암모늄(4 g), 일염기인산나트륨(4.5 g), 황산마그네슘 칠수화물(1 g), 염화칼슘 이수화물(1 g) 및 2.5 ml의 400X 미량원소 용액.

보다 구체적으로, 첫 번째 방법에서, 약 일(1)백만 개의 화학적으로 돌연변이된 포자를 유일한 탄소 공급원으로서 Avicel®을 사용하여 상기 기재된 진화 배지를 함유하는 이백오십(250) ml의 함몰된 바닥 플라스크에 접종하였다. 플라스크를 180 rpm, 31℃에서 다섯(5)시간 동안 인큐베이션하였다. 이때, 동일한 방식으로 인큐베이션된 동일한 두 번째 플라스크에 10% 부피/부피를 옮겼다. 연속 전송은 다음과 같이 11 구절(P) 동안 계속되었다: P1 = 오(5)일, P2 = 오(5)일, P3 = 사(4)일, P4 = 사(4)일, P5 = 사(4)일, P6 = 사(4)일, P7 = 사(4)일, P8 = 사(4)일, P9 = 삼(3)일, P10 = 삼(3)일 및 P11 = 이(2)일. P11 진탕 플라스크의 P11 브로스를 4,000 rpm에서 십(10)분 동안 원심분리했다. 상층액을 버리고, 세포를 물에 현탁시키고, BIRD 배지에 플레이팅하였다.

개별 콜로니 형성 단위는 31℃, 200 rpm, 및 80% 습도에서 사(4)일 동안, 서방성 락토스 미세 역가 플레이트(srMTP; 예를 들어, PCT 공개 번호 WO2014/047520 참조)에서의 인큐베이션 후 총 단백질 BCA(제품 # 23228, Thermo Scientific, Rockford, IL)에 대해 평가하였다. 따라서, 25℃에서 모 균주에 의해 생산된 총 단백질의 양에 비해 31℃에서 동일한 양의 총 단백질을 생산하는 돌연변이체 균주는 발효기에서 고온 단백질 생산에 대해 추가로 평가되었다.

두 번째 방법에서, 트리코더마 레에세이(Trichoderma reesei) T4 모 균주의 돌연변이된 포자는 문헌[Bachmann et al. (2013)]에 기재된 방법을 사용하여 물 및 오일 에멀젼 액적으로 캡슐화되었다. 액적은 유일한 탄소원으로서 0.5%의 미세결정질 셀룰로스(EMCOCEL, JRS Pharma, Rosenburg, Germany), 카르복시메틸셀룰로스(Sigma-Aldrich C5678, St. Louis, MO), 또는 산 팽윤된 셀룰로스(Wood, 1988)를 갖는 진화 배지를 함유하였다. 또한, 1리터 당 황산암모늄(4 g), 일염기인산나트륨(4.5 g), 황산마그네슘 칠수화물(1 g), 염화칼슘 이수화물(1 g) 및 2.5 ml의 400X 미량원소 용액. 액적은 삼(3)일 동안 튜브에서 31℃에서 인큐베이션되었으며, 이때 문헌[Bachmann et al. (2013)]에 기재된 방법을 사용하여 에멀젼을 파괴하였다. 세포를 회수하고, 한천 플레이트에 포자를 만들고, 다시 캡슐화하고 31℃에서 삼(3)일 동안 인큐베이션하였다. 이 과정을 10회 반복하였다. 최종 이동 후, 세포를 물에 현탁시키고, BIRD 배지에 플레이팅하였다. 개별 콜로니 형성 단위는 31℃, 200 rpm, 및 80% 습도에서 사(4)일 동안, srMTP 락토스 플레이트(PCT 공개 번호 WO2014/047520)에서의 인큐베이션 후 총 BCA 단백질(제품 # 23228, Thermo Scientific, Rockford, IL)에 대해 평가하였다. 25℃에서 모 균주에 의해 생산된 총 단백질의 양에 비해 31℃에서 동일한 양의 총 단백질을 생산하는 돌연변이체 균주는 발효기에서 고온 단백질 생산에 대해 추가로 평가되었다. 따라서, 위에서 일반적으로 제시되고 아래에 제시되는 바와 같이, "T4-E1"로 명명된 돌연변이체 트리코더마 레에세이(Trichoderma reesei)(T4) 균주는 25℃에서 모 T4 균주의 최적 단백질 생산과 비교하여(에 비해) 28℃에서 최적의 단백질 생산이 가능한 고온 돌연변이체로 확인되었다.

실시예 2

돌연변이된 GEF1 유전자를 포함하는 돌연변이체 트리코더마 균주의 특성

실시예 1에 상기 기재된 트리코더마 변이체(돌연변이체) 균주에서 돌연변이된 유전자는 Joint 게놈 연구소(JGI) 웹사이트(genome.jgi.doe.gov)에서 입수 가능한 야생형 트리코더마 레에세이(Trichoderma reesei) QM6a v2.0 게놈 서열 어셈블리에서 스캐폴드 위치 3:1532639-1538781에 존재한다. 예를 들어, 추론된 아미노산 서열(PID:120482; 서열번호 2)은 Rho/Rac/Cdc42-유사 구아닌 뉴클레오타이드 교환 인자 도메인(GEF1 도메인; Pfam PF00621, Dbl-동종 또는 DH 도메인이라고도 함)과 서열 상동성(예를 들어, 서열번호 4)을 갖는 영역을 포함한다. 이 상동 영역은 추론된 아미노산 서열(즉, PID: 120482; 서열번호 2)에서 아미노산 잔기 위치 1,242~1,454에 있다. Rho 계열의 GTPase는 많은 다른 세포 과정을 조절하며, 여기에서 이러한 GTPase는 결합된 GDP의 방출과 GEF1 계열의 구아닌 교환 인자에 의해 촉매되는 GTP의 후속 결합을 통해 활성화된다. 변이체 T4-E1 균주의 돌연변이는 글루타메이트 코돈(Glu(E); 아미노산 위치 1,245)을 조기 종결 코돈으로 대체하여 GEF1 도메인의 시작 부분 근처에서 단백질을 절단한다(예를 들어, 도 3a~3c 참조).

유사하게, 추론된 아미노산 서열(PID:120482; 서열번호 2)은 또한 서열번호 2의 잔기 위치 1,576~1,677에서 BAR 또는 AH/BAR 도메인(예를 들어, 서열번호 5; Pfam Pf03114)에 대한 상동성을 포함한다. AH/BAR 도메인은 다양한 단백질에서 발견된다. 어떤 경우에는, 골지 복합체에서 막과 상호작용하여, 소포 발아에 관여하는 작은 GTPase인 ARF1을 포함하여, Arf 및 Rho 계열 GTPase를 이합체화하거나 결합하는 것으로 나타났다. AH/BAR 도메인(서열번호 5)은 다른 4개의 트리코더마 레에세이(Trichoderma reesei) GEF1 도메인 단백질에서 관찰되지 않는다.

일부 다른 GEF1 도메인 단백질과 달리, 플랙스트린 상동성 도메인(PH 도메인, Pfam PF00169)은 서열번호 2 (PID:120482)에서 발견되지 않는다. PH 도메인은 막의 포스파티딜이노시톨 및 이종삼량체 G 단백질 또는 단백질 키나제 C의 베타/감마 서브유닛에 결합할 수 있으며, 이에 의해 신호 전달 경로와 연관된다. GEF1 도메인을 함유하는 트리코더마 레에세이 QM6a 게놈에는 4개의 다른 추론된 단백질 서열이 있으며, 그 중 2개는 또한 PH 도메인을 함유한다.

또한, 추론된 아미노산 서열(PID:120482; 서열번호 2)은 푸사리움 푸지쿠로이(Fusarium fujikuroi), 푸사리움 그라미네아룸(Fusarium graminearum), 티에라비아 테레스트리스(Thielavia terrestris), 포도스포라 안세리나(Podospora anserina), 페니실리움 루벤스(Penicillium rubens) 및 아스퍼질러스 니거(Aspergillus niger)를 포함하는, 일부 다른 사상성 진균 GEF1 도메인 단백질과 고도로 보존된 서열번호 2의 1,919~1,990 잔기 위치에 C-말단 서열(예를 들어, 서열번호 6)을 포함한다. 그러나, 이 C-말단 서열 도메인(서열번호 6)은 트리코더마 레에세이(Trichoderma reesei ) 게놈에서 확인된 다른 4개의 GEF1 도메인 단백질에는 없다.

실시예 3

pyr2 유전자의 삽입에 의한 트리코더마 균주에서 GEF1 유전자의 불활성화

서열번호 2(PID:120482)의 GEF1 단백질을 암호화하는 GEF1 유전자(JGI 트리코더마 레에세이 v2.0 스캐폴드 3:1532639-1538781)의 불활성화는 Cas9-기반 방법을 사용하여 트리코더마 레에세이(Trichoderma reesei) 균주에서 수행하였다. 보다 구체적으로, 정제된 Cas9 단백질 및 변형된 EZ tracrRNA는 Synthego Corporation(Redwood City, CA)에서 구입했으며, 변형된 crRNA는 Synthego에서 트리코더마 레에세이(Trichoderma reesei) GEF1 유전자 내의 표적 부위(TS3)에 특이적인 5' 말단(TS3; 서열번호 7)의 하기 서열로 합성하였다.

TS3: CAUUCAUCCAAGAAUCCGAG (서열번호 7)

상기 RNA 서열(서열번호 7)에 의해 결정된, GEF1 유전자내 Cas9 표적 부위(TS)는 코딩 서열내 뉴클레오타이드 위치 3,659~3,678에 있으며, 이는 T4-E1 돌연변이체 균주에서 관찰된 뉴클레오타이드 위치 3,733에서의 돌연변이에 가깝다(실시예 2). tracrRNA 및 crRNA를 어닐링하여 가이드 RNA(gRNA)를 형성한 다음, Cas9-2NLS와 조합하여 제조업체의 지시에 따라 리보핵단백질 복합체(Cas9:RNP)를 형성했다. 사용하기 전, Cas9:RNP를 ThermoFisher Scientific, Inc.(Waltham, MA)에서 구입한 리포펙타민 CRISPR-MAX와 혼합하였다. 트리코더마 레에세이 pyr2 유전자를 함유하고 천연 프로모터 및 종결자 서열을 갖고 492 bp의 트리코더마 레에세이 반복(서열번호 18)이 플랭킹된 선형 DNA 단편을 프라이머 AL950(서열번호 8) 및 AL952(서열번호 9) 프라이머를 사용하는 PCR로 증폭시켰다. 생성된 PCR 산물을 Qiagen QIAquick PCR 정제 키트를 사용하여 정제하였다.

AL950: CCTAACTAACGTCTGACATCG (서열번호 8)

AL952: CGTACCATTTGACTGATACGATG (서열번호 9)

트리코더마 레에세이 모 균주의 원형질체를 pyr2 PCR 산물 + Cas9:RNP로 형질전환시켰다. 우리딘 영양요구성에 대해 형질전환체를 선택하였다. GEF1 유전자내로 pyr2의 원하는 삽입에 대한 형질전환체를 스크리닝하는 것은 정방향 및 역방향 프라이머 쌍 RhoF1(서열번호 10) 및 RhoR1(서열번호 11)을 사용한 PCR로 수행하였으며, 이 프라이머는 GEF1 Cas9에 걸쳐 증폭한다

RhoF1: GAGCTAGACACGGGCGAAG (서열번호 10)

RhoR1: AGGAACCCTTCGTGAGCAAG (서열번호 11)

pyr2의 삽입은 PCR 산물의 크기를 755 bp에서 대략 2.8 kb로 증가시켰다. "ΔRho #22D"로 명명된 형질전환체로부터의 2.8kb PCR 산물의 DNA 서열은 RhoF1 및 RhoR1 프라이머를 사용한 Sanger 시퀀싱에 의해 결정되었으며, Cas9 절단 부위에서의 pyr2의 삽입 및 GEF1 코딩 서열의 파괴를 확인하였다.

표 1에 제시된 바와 같이, ΔRho #22D 형질전환체의 발효기 성능을 실시예 1에 기재된 모 T4 균주 및 T4-E1 균주로 명명된 돌연변이체와 비교하였다. 예를 들어, 28℃에서의 T4, T4-E1 및 T4-ΔRho#22D 균주의 최종 비생산성(Qp) 비율은 표 1에 25℃에서의 대조군 균주 T4의 최종 Qp 비율에 대한 백분율(%)로 표시된다.

[표 1]

실시예 4

이종성 셀룰라제 발현 작제물을 포함하는 트리코더마 균주에서의 부분적 결실에 의한 GEF1 유전자의 불활성화

본 실시예에 기재된 바와 같이, "T4-DXST"로 명명된 트리코더마 균주는 모 트리코더마 레에세이 T4 균주로부터 유래/작제되었으며, 여기서 CBHI, CBHII, EGI 및 EGII 단백질을 암호화하는 천연 셀룰라제 유전자는 (즉, 당업자에게 공지된 일상적인 분자 생물학 기술을 사용하여) 결실 또는 파괴에 의해 불활성화되었으며, 고효율 cbhI 프로모터의 제어하에 회분된 스타필로트리쿰 코코스포룸 엔도글루카나아제 1(STCE1)을 암호화하는 유전자의 복제본으로 형질전환된다. 외인성으로 첨가된 플라스미드 DNA를 사용한 트리코더마 레에세이의 형질전환 방법이 공개되었다(Penttila et al., 1986; Gruber et al., 1990; Smith et al., 1991). 안정적인 형질전환체는 플라스미드 DNA가 숙주의 염색체에 통합되어 발생한다. 통합은 플라스미드 DNA의 영역과 상동성을 갖는 게놈의 부위에 있거나, 비-상동성 부위에 있을 수 있다.

도입된 STCE1 셀룰라제 작제물(예를 들어, 미국 특허 제7,595,182호 참조)의 복제본을 포함하는 모 트리코더마 레에세이 균주에서 GEF1을 암호화하는 유전자의 불활성화는 Cas9-기반 방법을 사용하여 수행하였다. 보다 구체적으로, 정제된 Cas9-2NLS 단백질 및 변형된 EZ tracrRNA를 Synthego Corporation(Redwood City, CA)로부터 구입하였다. 변형된 crRNA는 트리코더마 레에세이 GEF1 유전자 내의 표적 부위 3 및 4(TS3/TS4)에 특이적인 5’-말단에서 하기 RNA 서열을 갖는 Synthego로 합성하였다.

TS3: CAUUCAUCCAAGAAUCCGAG (서열번호 7)

TS4: AUUGUGGAGGAAAUCUACAA (서열번호 12)

상기 RNA 서열에 의해 결정된, GEF1 유전자내 Cas9 표적 부위(TS3/TS4)는 코딩 서열내 뉴클레오타이드 위치 3,659~3,678 및 뉴클레오타이드 위치 3,775~3,794에 있으며, 이는 T4-E1 돌연변이체 균주에서 관찰된 뉴클레오타이드 위치 3,733에서의 돌연변이에 가깝다. tracrRNA 및 crRNA를 어닐링하여 가이드 RNA(gRNA)를 형성한 다음, Cas9-2NLS와 조합하여 제조업체의 지시에 따라 리보핵단백질 복합체(Cas9:RNP)를 형성했다. 사용하기 전, Cas9:RNP를 ThermoFisher Scientific, Inc.(Waltham, MA)에서 구입한 리포펙타민 CRISPR-MAX와 혼합하였다.

뉴로스포라 크라사(Neurospora crassa) cpc1 프로모터(서열번호 14) 및 아스퍼질러스 니둘란스(Aspergillus nidulans) trpC 종결자(서열번호 15)에 작동 가능하게 연결된 박테리아 하이그로마이신 포스포트랜스퍼라제 유전자(서열번호 13)를 함유하는 선형 DNA 단편은 프라이머 HygF1(서열번호 16) 및 HygR1(서열번호 17)을 사용하여 PCR로 증폭시켰다.

HygF1: TGGCTTTCCGTCTCCATTG (서열번호 16)

HygR1: AGTGTACCTGTGCATTCTGGG (서열번호 17)

트리코더마 레에세이 모 균주의 원형질체를 선형 DNA 단편과 두 Cas9:RNP(두 crRNA 모두 포함)의 혼합물로 형질전환시켰다. 적당한 한천 배지에서 하이그로마이신 내성을 위해 형질전환체를 선택하였다. 그러나, 선택적인 한천 플레이트에서 더 작고 느리게 성장하는 형질전환된 콜로니만을 선택하여 비선택적 배지가 있는 한천 플레이트로 옮겼다. 비선택적 배지에서 성장한 후, 형질전환체를 선택하고, 하이그로마이신이 있는 배지에 스폿팅하였다. 하이그로마이신의 존재 하에 성장하지 않은 형질전환체를 추가 연구를 위해 선택하였다. 이들 형질전환체는 일시적으로 하이그로마이신 내성을 나타내었고, 이후 트리코더마 레에세이 게놈에 통합되지 않으면서 하이그로마이신-내성 DNA 마커 단편을 상실한 것으로 추정된다. RhoF1(서열번호 10) 및 RhoR1(서열번호 11) 프라이머를 사용한 PCR을 사용하여, 하이그로마이신-민감성 형질전환체를 스크리닝했다.

Cas9 표적 부위 TS3 및 TS4 사이에 결실이 발생한 경우 예상대로 약 630 bp의 PCR 산물을 제공하는 형질전환체가 확인되었다 야생형 세포에서 이 PCR 산물의 크기는 756 bp이다. PCR 산물은 프라이머 RhoF1(서열번호 10) 및 RhoR1(서열번호 11)을 사용하여 각 말단에서 시퀀싱하였다. 형질전환체 #89(t-AWC88)는 삽입 없이 TS3과 TS4 사이에 125 bp 결실(즉, 코딩 서열의 뉴클레오타이드 위치 3,668~3,791)을 가졌다. 트리코더마(Trichoderma) 형질전환체 #89(t-AWC88)를 후속해서 발효시키고, 표 2에 제시된 바와 같이 25℃ 및 28℃에서의 STCE/DXST 단백질 생산에 대해 비교하여(에 비해) 모 균주(t-AVT84)와 대조하였다.

[표 2]

보다 구체적으로, 상기 표 2에 나타낸 바와 같이, T4-DXST 딸 균주(t-AWC88)는 모 균주(t-AVT84)에 비해 최적인 단백질 생산 온도가 적어도 2~3℃ 더 높다.

참고문헌

PCT 출원 번호 PCT/US2019/27590

PCT 공개 번호 WO2011/153449

PCT 공개 번호 WO2012/145584

PCT 공개 번호 WO2012/145595

PCT 공개 번호 WO2016/100272

PCT 공개 번호 WO2016/100562

PCT 공개 번호 WO2016/100568

미국 특허 제6,022,725호

미국 특허 제6,255,115호

미국 특허 제6,268,328호

미국 특허 제7,595,182호

2018년 7월 30일자로 출원된 미국 가출원 일련 번호 62/711,846.

Altschul et al., J. Mol. Biol. 215:403-10, 1990. Altschul et al., Meth. Enzymol. 266:460-80, 1996.

Ausubel et al., "Current Protocols in Molecular Biology", Green Publishing Associates/ Wiley Interscience , New York, 1994.

Bachmann et al., "Availability of public goods shapes the evolution of competing metabolic strategies", PNAS, 110 (35): 14302-14307, 2013.

Boel et al., EMBO J. 3:1581-1585, 1984.

Botstein and Shortle, Science 229: 4719, 1985.

Campbell et al., Curr. Genet., 16: 53-56, 1989.

Cao et al., Science, 9: 991-1001, 2000.

Devereux et al., Nucleic Acids Res. 12:387-395, 1984.

Gruber et al., 1990

Hakkinen et al., "Screening of candidate regulators for cellulase and hemicellulase production in Trichoderma reesei and identification of a factor essential for cellulase production", Biotechnol Biofuels 7, 14, 2014.

Harkki et al., BioTechnol., 7: 596-603, 1989.

Harkki et al., Enzyme Microb. Technol., 13: 227-233, 1991.

Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989.

Higgins and Sharp, CABIOS 5:151-53, 1989.

Higuchi et al., Nucleic Acids Research 16: 7351, 1988.

Ho et al., Gene 77: 61, 1989.

Horton et al., Gene 77: 61, 1989.

Iglesias and Trautner, Molecular General Genetics 189: 73-76, 1983. Joint Genomes Institute (JGI) website (www.genome.jgi.doe.gov).

Karlin et al., Proc. Natl. Acad. Sci. USA 90:5873-87, 1993.

Lo et al., Proceedings of the National Academy of Sciences USA 81: 2285, 1985. Mullaney et al., MGG 199:37-45, 1985.

Needleman and Wunsch, J. Mol. Biol., 48, 443-99, 1970. Nunberg et al., Mol. Cell Biol. 4, 2306, 1984

Parish and Stoker, FEMS Microbiology Letters 154: 151-157, 1997.Pearson and Lipman, 1988

Penttila et al., "A versatile transformation system for the cellulolytic filamentous fungus Trichoderma reesei", Gene 61, 155-164, 1987.

Perego, 1993, In A. L. Sonneshein, J. A. Hoch, and R. Losick, editors, Bacillus subtilis and Other Gram- Positive Bacteria, Chapter 42, American Society of Microbiology, Washington, D.C.

Sambrook et al., "Molecular Cloning, A Laboratory Manual", 4th Edition, Cold Spring Harbor Laboratory Press, Cold Spring, New York, 2012.

Sarkar and Sommer, BioTechniques 8: 404, 1990.

Shimada, Meth. Mol. Biol. 57: 157; 1996

Smith and Waterman, Adv. Appl. Math. 2, 482, 1981

Wood, "Preparation of crystalline, amorphous, and dyed cellulase substrates", Methods in Enzymology, Vol. 160, pages 19-25, 1988.

Yelton et al., PNAS USA 81:1470-1474, 1984.

Youngman et al., 1983

SEQUENCE LISTING <110> DANISCO US INC. <120> FILAMENTOUS FUNGAL STRAINS COMPRISING ENHANCED PROTEIN PRODUCITIVTY PHENOTYPES AND METHODS THEREOF <130> NB41383-WO-PCT <160> 19 <170> PatentIn version 3.5 <210> 1 <211> 6143 <212> DNA <213> Hypocrea jecorina <400> 1 atggacccgg acccggacct gcacctgcca gcacgagtag agcgcgcgag cctggatggt 60 agcgtgtttg tagcccacga tgcgcatccg ccggctcgcc atctgcccca tctccatctc 120 ccccagctgg cccatccagc ctcaaactca acctccaact tcaccttgcg ctcgcactcg 180 cactcgcccg ctgccggcga cgtcgtcctg cccgcctcaa ccgccaatgc ccacgtcctc 240 gcccaccatg cagctgccac cctagatcct gacgactact acaggagcta cgagacagcc 300 tccagccccg gcggcgagcc acaatcgctc ccaatggcct cgccagtccc gcctcccacg 360 ccggatgggg ctgctgcaag acacctgcag ccgcctgcaa atcgcagtgc tggccgtcag 420 ggtaccagta ataccgccgt gcgctccgcc tcgagccccc tcgaccgcag gccagccgcg 480 gcggcgccgt cgtcaagatc cccctcggcc agcgccccca gcgtgaggga tctgaagaag 540 cgcttcgatc agaacagcgg ccccaactcc atcccaagag ctcctccacg ccaggctgca 600 ccggtggccc gggtcagcaa gcaagagtcc agcaaaccca agcccaagcc caagcccagc 660 ctgtcggccc cttcgtccac gcacccaggc tctcgctcgg cggtccccgc ttccaactcg 720 tccaagcaat ctcggtcgtc gtcgtcgtcc aactcagcct cgacctcgcg ctcgacgtcg 780 acgccggccc cgtcagcccg ctcgcagaag ccacggcacg ttgagcgcga gcaggcggcg 840 ggaagttcgc ggtcgtttgc aaaccgtatt gggaaccatc agcctgagac atccactact 900 aacgggaact cgaacgcctc cagctctatg acaccacgcc cacacaagtc cccaccctca 960 gcctcccagc cgtcgccgcc atccccaaag tctaatcctc agttcccggg cctcctgttt 1020 ggcgaaatcc ccccgggcca gctcgacgtt gccgcgccag gctttggcat cgacaacatc 1080 cgcccgcgac gaacgtccga atccaacgtg cacggcctcg cggggcgtca acgcagcctc 1140 tccgacctcg aagccgagcc cgcgtccccg tccagctggt acagggacgt ccacatgtcc 1200 cgagggagca cgccgaaaac ccacgcgcga tctcgcagcg atctctcggc gctgaagccc 1260 atcctcacaa ccttgcatcc caagtcgcct acgcccgcat cggcgtcggc atcagcaaag 1320 acaagggcga aatcaccaac agtagctgct ttcgcggcag ccacggtaac ggcaacggct 1380 gtcgcagcag gggccgcggc cgccacccct tcggtctcgc acgcgtcggc agccgccagc 1440 tccaaactcc ccgtttccat cagcaggagg cttgcgagcc caaccaactc cagtcctacc 1500 tcttcgcgat cagcctcgcc ctctgcgctt cgcagactgc cagccaatgg tcgtagcaat 1560 agcagacagg ccaaaccgat cgcccccacg aaccgagcga aaacacccac gcagacgggt 1620 cgaaagcagc ctccccaggg gctcgttaca ccgagtaata gcaacaaccg gctccaagcg 1680 tacgtgtcca ccgcaccacc caagctctca ccgccattga ggagctctcg accgcgacag 1740 ccagtctccg tagcgacgac agcaagctcc cggatgaaag aggcggcggc caaggcgaag 1800 ccccctgcac ggccaaatgc acgggacggc ccttcgtcgt ccaagacgta cgatccggcg 1860 aagcgtaaaa tcatagtggg acccatagac ttcgagcagc gtcgggaaca cattcgactg 1920 gcatacacca agaccattcg cgaaagccag gcctttgagg tgcgccagaa agcggtggag 1980 aggaggcgga agcagatgga ggaggccaaa tcggaagccg cagccaccga agctacagcg 2040 acaagtagca cagctacagg cccatctacg tctgcggatt caccgaccac ggtgactgct 2100 ggagatgacg aggcgacgaa taaggggccc tcggacggcc atgcacgagt aattccagaa 2160 gtaatagcgg cagagacagg gctggtcgcg agcccctcgg cacaggagcc ggctgtggaa 2220 ctcccagctg atcatggctc tcgcgctgct gtggagaacc agggaaccct tctagaaatc 2280 ccgacagatg cagcctcgca cccggcatct ggcaagggtg atgattcgcc gacgctgggc 2340 atccccgggg gcttcccaga accctcaccg tcctccgccg cggccagaac gcagcggcct 2400 ctgtcgacca tttcaatcat ttcagccacg tctgctgtta cggagtttga tacagagccc 2460 caggcggagc tcgccgacct ggctatgtcc gatcggccgc tcagccccca gatcatagtg 2520 ccgacgaggg agcgctctca gtatagaagc ccctttgagg acgacgattt cccatcgtcg 2580 ccgcctcggc cgcgtcctgc ggcccatccc catcaaatca gccaagatcg ccaccatatc 2640 gaccagccgt tcatccctga cgcttattac gacaatgagc atcgggagca ccccttggag 2700 acccatgccc agcaagatta ccaaaccatt gtgacgattc tgccgcagcc ctcacgcgag 2760 ccccctgctg ccgaggagac tgcgcaggcg gcatcttttc cccgactaga cattcaagat 2820 gaatctgact gccactcgga tctagaaagc gttccggcaa tggctcgtcg catgcgtagt 2880 gatgtcgacg atgccgccac tgatgcctgc accgaagaga cggacgaccg cgatgggatg 2940 gaggacgagc ggtccccgta ccgctatggc ggcaccctct cgtcgaacag ggcctctaca 3000 tgcgcatcat cggacataga aacgtttgac gaccttttgt acccttcgca tgacgagcag 3060 ctggatgcgg gcccaccaaa cagactactg gcgccgccct cgatctctcg ggccgacaga 3120 tcgagccacc agaccgcatg gacgaatgtc tccgtcgaaa gcattacgcg ctccgaggct 3180 tcagactctc ctgttctacg agccagctcc tggaagatgt ccggttcgtc cgggcgagac 3240 gactcttccc tcagaagcct cccctatagc ggagtcggcg tccgcccttc agtcgactcg 3300 acgcggtcgt cgattcagct tggccagcag ctcccggagc tagacacggg cgaaggcttc 3360 tccatcccgt atctgtccgc agaggcaacc tccgacctct cctacctctc ttcccccggg 3420 aaacacgagc cagcacctca cccgcgctct ggacggaact cggccatcga ctcgcaaacg 3480 tcgagcgtgt tctatgagca gtcccagtat ggcagcacgt tggtcaactc cgatcgcggg 3540 agtggagaat atgtctccca ccattcggaa actcctctgt cgatgatgga cttgacctcg 3600 atggagacta tggatcggta ctatgacggt cgcacccagg tggatagcga tgccaagtca 3660 ttcatccaag aatccgaggg gctaagcagc gaagagcggc atcgccttat ccagaggcgt 3720 aacgtcatca aggagcttgt ggataccgaa gcaatttttg taagagacat gaacattgtg 3780 gaggaaatct acaagggcac cgcagaggcg tgccccaagc tggacaccaa gattgtcaag 3840 ctcatcttca ggaacagcga cgagattatc gagtttcaca cctcgttcct cgtcctcctc 3900 aaagaggcag tggccagcat ttacgtaccg aagggcggcc ggtctctcgt cgcgagagaa 3960 gactccatct attcggaaca aggccagact tccatcgtcg acctcagcga tgccaaggac 4020 agagagacgt cgctcggtcc aactttccaa gccaacatgg agaagatgaa gcttgctcac 4080 gaagggttcc tgcgaaacag cgaccaagca gcaaagaaac tgatccagat ccagcaggac 4140 ccgacggtgc agatatggct gaacgagtgt aatgaggtag ccaaggacct gacagctgcc 4200 tgggatctgg actcccttct catcaagccg atgcaacgaa tcacaaagta tccgaatctg 4260 atcatgacgc tccttcagca cacgccccag gaccaccccg atcgggaggc cctcgtgatg 4320 gccaaagagg cgctcgaaga ggccattatc gagatcaaca agacgaagaa gaactttgag 4380 ctggtcggac agatcgtcgg tagaaaacgt aaggagtccg acgtgaaggc cggactcgct 4440 cgtgcctttg gcaagaaggt ggacaagctg caaggcggaa ctcggccacc ggaggatcca 4500 gaatatctca agctggagga aaggttcagc gacgattact tgcggctaca ggtcgtcttg 4560 cgcgatgtcg agttctacac ccggcaagtc tcatcgtatg tgcacgagtt cctgcagtac 4620 ctatcagcca tcgagctggt catgcgtctt cagccgggca gcttccccga gctggagagc 4680 aagtgggtgc gcttcaatat ctccattcgc gacattgaga aggtagcgct cgagcagcat 4740 gtaagcttcg caaacctccc tttcccttgc cccccctaaa gcaaattttc ctcgcaaagg 4800 actatactga ctttctattg caacagctgt cacagattcg aaagcatgtc attgagcctt 4860 ttgagcaggt catcaagtcc tacgggaacc cctcgctggc tatgaagaag agacaaaagc 4920 gccgagtcgt gtgggagcgc gcagagcagc tgaagaaggc aggcaaaagc gtcgatccca 4980 agcttaagga gctggttgag cagtatgaag ctctcaacga tacgctaatc aaggagcttc 5040 ccaagctttc ggcgctgacg gagaaggtgg gaaacatttg tctcagcaat ctcatcaaca 5100 tccaggccaa ttggtacttc atttggaggg agaagatgag agctgtgctg ccggactcgc 5160 ccacgatgcc agacattgag gaaatagtct cgactttcca gcgagacttt ccctatgcga 5220 acgagatgat ggccagcatc ggcatcatca acccagccta ccgcggaagg acatcacaat 5280 caacgaacca cggagacgac gccggcctgc ccaggactag aggccgaacc tcagagtcgg 5340 tagatagggg atggagtcag tctttcaacg gcgaaggcgc accaagccta ccgcctcccg 5400 attttggcaa acggcatagc ggctcgttta ccctctcccc catcagcgcc ggcccgtcct 5460 cctctggctt cgggacgtca gctcccagtc cccaccagta ctattatcgt gacttttatg 5520 ccggcctgtc aagcaaccag gcgggaatga catccccgag atcggccgag gtaccagcaa 5580 cctctcgatc gctcggaggc acgcggccga gtacgggcaa aagctacgat tcgtcggcaa 5640 tctcaatgcc gagacagagc acggagtcgg cgcctcacat ccgacgggac tcgggcacgg 5700 cgtactattc cagctaccac cagcacgaca gccgtagatt ctcaaatctc tttcactctg 5760 cccttcctct accggacggc cccgaagaga gtcagcggtc ctctagagca tcatcgcggg 5820 agcgagcaca tgcttctgat gggtacaata tcctatggct ggcagcgtcg ctcttcgagt 5880 ttaacatctc gacaaccaag cacgaggctg gctatcctta tctgacgtat caggccggcg 5940 aggtatgttt tttttttttt ctagtatccc agagctcgca ccgtctcttg tggagctaga 6000 catgctgaca atgagaatct tgacagatat tcgatgtaat tgccgagaaa ggcgagcttt 6060 ggcttgccaa gaatcaagac gacccaacgg accaggtggg ctggatctgg tccaaacact 6120 ttgcgaaatt ggccgactca tag 6143 <210> 2 <211> 1990 <212> PRT <213> Hypocrea jecorina <400> 2 Met Asp Pro Asp Pro Asp Leu His Leu Pro Ala Arg Val Glu Arg Ala 1 5 10 15 Ser Leu Asp Gly Ser Val Phe Val Ala His Asp Ala His Pro Pro Ala 20 25 30 Arg His Leu Pro His Leu His Leu Pro Gln Leu Ala His Pro Ala Ser 35 40 45 Asn Ser Thr Ser Asn Phe Thr Leu Arg Ser His Ser His Ser Pro Ala 50 55 60 Ala Gly Asp Val Val Leu Pro Ala Ser Thr Ala Asn Ala His Val Leu 65 70 75 80 Ala His His Ala Ala Ala Thr Leu Asp Pro Asp Asp Tyr Tyr Arg Ser 85 90 95 Tyr Glu Thr Ala Ser Ser Pro Gly Gly Glu Pro Gln Ser Leu Pro Met 100 105 110 Ala Ser Pro Val Pro Pro Pro Thr Pro Asp Gly Ala Ala Ala Arg His 115 120 125 Leu Gln Pro Pro Ala Asn Arg Ser Ala Gly Arg Gln Gly Thr Ser Asn 130 135 140 Thr Ala Val Arg Ser Ala Ser Ser Pro Leu Asp Arg Arg Pro Ala Ala 145 150 155 160 Ala Ala Pro Ser Ser Arg Ser Pro Ser Ala Ser Ala Pro Ser Val Arg 165 170 175 Asp Leu Lys Lys Arg Phe Asp Gln Asn Ser Gly Pro Asn Ser Ile Pro 180 185 190 Arg Ala Pro Pro Arg Gln Ala Ala Pro Val Ala Arg Val Ser Lys Gln 195 200 205 Glu Ser Ser Lys Pro Lys Pro Lys Pro Lys Pro Ser Leu Ser Ala Pro 210 215 220 Ser Ser Thr His Pro Gly Ser Arg Ser Ala Val Pro Ala Ser Asn Ser 225 230 235 240 Ser Lys Gln Ser Arg Ser Ser Ser Ser Ser Asn Ser Ala Ser Thr Ser 245 250 255 Arg Ser Thr Ser Thr Pro Ala Pro Ser Ala Arg Ser Gln Lys Pro Arg 260 265 270 His Val Glu Arg Glu Gln Ala Ala Gly Ser Ser Arg Ser Phe Ala Asn 275 280 285 Arg Ile Gly Asn His Gln Pro Glu Thr Ser Thr Thr Asn Gly Asn Ser 290 295 300 Asn Ala Ser Ser Ser Met Thr Pro Arg Pro His Lys Ser Pro Pro Ser 305 310 315 320 Ala Ser Gln Pro Ser Pro Pro Ser Pro Lys Ser Asn Pro Gln Phe Pro 325 330 335 Gly Leu Leu Phe Gly Glu Ile Pro Pro Gly Gln Leu Asp Val Ala Ala 340 345 350 Pro Gly Phe Gly Ile Asp Asn Ile Arg Pro Arg Arg Thr Ser Glu Ser 355 360 365 Asn Val His Gly Leu Ala Gly Arg Gln Arg Ser Leu Ser Asp Leu Glu 370 375 380 Ala Glu Pro Ala Ser Pro Ser Ser Trp Tyr Arg Asp Val His Met Ser 385 390 395 400 Arg Gly Ser Thr Pro Lys Thr His Ala Arg Ser Arg Ser Asp Leu Ser 405 410 415 Ala Leu Lys Pro Ile Leu Thr Thr Leu His Pro Lys Ser Pro Thr Pro 420 425 430 Ala Ser Ala Ser Ala Ser Ala Lys Thr Arg Ala Lys Ser Pro Thr Val 435 440 445 Ala Ala Phe Ala Ala Ala Thr Val Thr Ala Thr Ala Val Ala Ala Gly 450 455 460 Ala Ala Ala Ala Thr Pro Ser Val Ser His Ala Ser Ala Ala Ala Ser 465 470 475 480 Ser Lys Leu Pro Val Ser Ile Ser Arg Arg Leu Ala Ser Pro Thr Asn 485 490 495 Ser Ser Pro Thr Ser Ser Arg Ser Ala Ser Pro Ser Ala Leu Arg Arg 500 505 510 Leu Pro Ala Asn Gly Arg Ser Asn Ser Arg Gln Ala Lys Pro Ile Ala 515 520 525 Pro Thr Asn Arg Ala Lys Thr Pro Thr Gln Thr Gly Arg Lys Gln Pro 530 535 540 Pro Gln Gly Leu Val Thr Pro Ser Asn Ser Asn Asn Arg Leu Gln Ala 545 550 555 560 Tyr Val Ser Thr Ala Pro Pro Lys Leu Ser Pro Pro Leu Arg Ser Ser 565 570 575 Arg Pro Arg Gln Pro Val Ser Val Ala Thr Thr Ala Ser Ser Arg Met 580 585 590 Lys Glu Ala Ala Ala Lys Ala Lys Pro Pro Ala Arg Pro Asn Ala Arg 595 600 605 Asp Gly Pro Ser Ser Ser Lys Thr Tyr Asp Pro Ala Lys Arg Lys Ile 610 615 620 Ile Val Gly Pro Ile Asp Phe Glu Gln Arg Arg Glu His Ile Arg Leu 625 630 635 640 Ala Tyr Thr Lys Thr Ile Arg Glu Ser Gln Ala Phe Glu Val Arg Gln 645 650 655 Lys Ala Val Glu Arg Arg Arg Lys Gln Met Glu Glu Ala Lys Ser Glu 660 665 670 Ala Ala Ala Thr Glu Ala Thr Ala Thr Ser Ser Thr Ala Thr Gly Pro 675 680 685 Ser Thr Ser Ala Asp Ser Pro Thr Thr Val Thr Ala Gly Asp Asp Glu 690 695 700 Ala Thr Asn Lys Gly Pro Ser Asp Gly His Ala Arg Val Ile Pro Glu 705 710 715 720 Val Ile Ala Ala Glu Thr Gly Leu Val Ala Ser Pro Ser Ala Gln Glu 725 730 735 Pro Ala Val Glu Leu Pro Ala Asp His Gly Ser Arg Ala Ala Val Glu 740 745 750 Asn Gln Gly Thr Leu Leu Glu Ile Pro Thr Asp Ala Ala Ser His Pro 755 760 765 Ala Ser Gly Lys Gly Asp Asp Ser Pro Thr Leu Gly Ile Pro Gly Gly 770 775 780 Phe Pro Glu Pro Ser Pro Ser Ser Ala Ala Ala Arg Thr Gln Arg Pro 785 790 795 800 Leu Ser Thr Ile Ser Ile Ile Ser Ala Thr Ser Ala Val Thr Glu Phe 805 810 815 Asp Thr Glu Pro Gln Ala Glu Leu Ala Asp Leu Ala Met Ser Asp Arg 820 825 830 Pro Leu Ser Pro Gln Ile Ile Val Pro Thr Arg Glu Arg Ser Gln Tyr 835 840 845 Arg Ser Pro Phe Glu Asp Asp Asp Phe Pro Ser Ser Pro Pro Arg Pro 850 855 860 Arg Pro Ala Ala His Pro His Gln Ile Ser Gln Asp Arg His His Ile 865 870 875 880 Asp Gln Pro Phe Ile Pro Asp Ala Tyr Tyr Asp Asn Glu His Arg Glu 885 890 895 His Pro Leu Glu Thr His Ala Gln Gln Asp Tyr Gln Thr Ile Val Thr 900 905 910 Ile Leu Pro Gln Pro Ser Arg Glu Pro Pro Ala Ala Glu Glu Thr Ala 915 920 925 Gln Ala Ala Ser Phe Pro Arg Leu Asp Ile Gln Asp Glu Ser Asp Cys 930 935 940 His Ser Asp Leu Glu Ser Val Pro Ala Met Ala Arg Arg Met Arg Ser 945 950 955 960 Asp Val Asp Asp Ala Ala Thr Asp Ala Cys Thr Glu Glu Thr Asp Asp 965 970 975 Arg Asp Gly Met Glu Asp Glu Arg Ser Pro Tyr Arg Tyr Gly Gly Thr 980 985 990 Leu Ser Ser Asn Arg Ala Ser Thr Cys Ala Ser Ser Asp Ile Glu Thr 995 1000 1005 Phe Asp Asp Leu Leu Tyr Pro Ser His Asp Glu Gln Leu Asp Ala 1010 1015 1020 Gly Pro Pro Asn Arg Leu Leu Ala Pro Pro Ser Ile Ser Arg Ala 1025 1030 1035 Asp Arg Ser Ser His Gln Thr Ala Trp Thr Asn Val Ser Val Glu 1040 1045 1050 Ser Ile Thr Arg Ser Glu Ala Ser Asp Ser Pro Val Leu Arg Ala 1055 1060 1065 Ser Ser Trp Lys Met Ser Gly Ser Ser Gly Arg Asp Asp Ser Ser 1070 1075 1080 Leu Arg Ser Leu Pro Tyr Ser Gly Val Gly Val Arg Pro Ser Val 1085 1090 1095 Asp Ser Thr Arg Ser Ser Ile Gln Leu Gly Gln Gln Leu Pro Glu 1100 1105 1110 Leu Asp Thr Gly Glu Gly Phe Ser Ile Pro Tyr Leu Ser Ala Glu 1115 1120 1125 Ala Thr Ser Asp Leu Ser Tyr Leu Ser Ser Pro Gly Lys His Glu 1130 1135 1140 Pro Ala Pro His Pro Arg Ser Gly Arg Asn Ser Ala Ile Asp Ser 1145 1150 1155 Gln Thr Ser Ser Val Phe Tyr Glu Gln Ser Gln Tyr Gly Ser Thr 1160 1165 1170 Leu Val Asn Ser Asp Arg Gly Ser Gly Glu Tyr Val Ser His His 1175 1180 1185 Ser Glu Thr Pro Leu Ser Met Met Asp Leu Thr Ser Met Glu Thr 1190 1195 1200 Met Asp Arg Tyr Tyr Asp Gly Arg Thr Gln Val Asp Ser Asp Ala 1205 1210 1215 Lys Ser Phe Ile Gln Glu Ser Glu Gly Leu Ser Ser Glu Glu Arg 1220 1225 1230 His Arg Leu Ile Gln Arg Arg Asn Val Ile Lys Glu Leu Val Asp 1235 1240 1245 Thr Glu Ala Ile Phe Val Arg Asp Met Asn Ile Val Glu Glu Ile 1250 1255 1260 Tyr Lys Gly Thr Ala Glu Ala Cys Pro Lys Leu Asp Thr Lys Ile 1265 1270 1275 Val Lys Leu Ile Phe Arg Asn Ser Asp Glu Ile Ile Glu Phe His 1280 1285 1290 Thr Ser Phe Leu Val Leu Leu Lys Glu Ala Val Ala Ser Ile Tyr 1295 1300 1305 Val Pro Lys Gly Gly Arg Ser Leu Val Ala Arg Glu Asp Ser Ile 1310 1315 1320 Tyr Ser Glu Gln Gly Gln Thr Ser Ile Val Asp Leu Ser Asp Ala 1325 1330 1335 Lys Asp Arg Glu Thr Ser Leu Gly Pro Thr Phe Gln Ala Asn Met 1340 1345 1350 Glu Lys Met Lys Leu Ala His Glu Gly Phe Leu Arg Asn Ser Asp 1355 1360 1365 Gln Ala Ala Lys Lys Leu Ile Gln Ile Gln Gln Asp Pro Thr Val 1370 1375 1380 Gln Ile Trp Leu Asn Glu Cys Asn Glu Val Ala Lys Asp Leu Thr 1385 1390 1395 Ala Ala Trp Asp Leu Asp Ser Leu Leu Ile Lys Pro Met Gln Arg 1400 1405 1410 Ile Thr Lys Tyr Pro Asn Leu Ile Met Thr Leu Leu Gln His Thr 1415 1420 1425 Pro Gln Asp His Pro Asp Arg Glu Ala Leu Val Met Ala Lys Glu 1430 1435 1440 Ala Leu Glu Glu Ala Ile Ile Glu Ile Asn Lys Thr Lys Lys Asn 1445 1450 1455 Phe Glu Leu Val Gly Gln Ile Val Gly Arg Lys Arg Lys Glu Ser 1460 1465 1470 Asp Val Lys Ala Gly Leu Ala Arg Ala Phe Gly Lys Lys Val Asp 1475 1480 1485 Lys Leu Gln Gly Gly Thr Arg Pro Pro Glu Asp Pro Glu Tyr Leu 1490 1495 1500 Lys Leu Glu Glu Arg Phe Ser Asp Asp Tyr Leu Arg Leu Gln Val 1505 1510 1515 Val Leu Arg Asp Val Glu Phe Tyr Thr Arg Gln Val Ser Ser Tyr 1520 1525 1530 Val His Glu Phe Leu Gln Tyr Leu Ser Ala Ile Glu Leu Val Met 1535 1540 1545 Arg Leu Gln Pro Gly Ser Phe Pro Glu Leu Glu Ser Lys Trp Val 1550 1555 1560 Arg Phe Asn Ile Ser Ile Arg Asp Ile Glu Lys Val Ala Leu Glu 1565 1570 1575 Gln His Leu Ser Gln Ile Arg Lys His Val Ile Glu Pro Phe Glu 1580 1585 1590 Gln Val Ile Lys Ser Tyr Gly Asn Pro Ser Leu Ala Met Lys Lys 1595 1600 1605 Arg Gln Lys Arg Arg Val Val Trp Glu Arg Ala Glu Gln Leu Lys 1610 1615 1620 Lys Ala Gly Lys Ser Val Asp Pro Lys Leu Lys Glu Leu Val Glu 1625 1630 1635 Gln Tyr Glu Ala Leu Asn Asp Thr Leu Ile Lys Glu Leu Pro Lys 1640 1645 1650 Leu Ser Ala Leu Thr Glu Lys Val Gly Asn Ile Cys Leu Ser Asn 1655 1660 1665 Leu Ile Asn Ile Gln Ala Asn Trp Tyr Phe Ile Trp Arg Glu Lys 1670 1675 1680 Met Arg Ala Val Leu Pro Asp Ser Pro Thr Met Pro Asp Ile Glu 1685 1690 1695 Glu Ile Val Ser Thr Phe Gln Arg Asp Phe Pro Tyr Ala Asn Glu 1700 1705 1710 Met Met Ala Ser Ile Gly Ile Ile Asn Pro Ala Tyr Arg Gly Arg 1715 1720 1725 Thr Ser Gln Ser Thr Asn His Gly Asp Asp Ala Gly Leu Pro Arg 1730 1735 1740 Thr Arg Gly Arg Thr Ser Glu Ser Val Asp Arg Gly Trp Ser Gln 1745 1750 1755 Ser Phe Asn Gly Glu Gly Ala Pro Ser Leu Pro Pro Pro Asp Phe 1760 1765 1770 Gly Lys Arg His Ser Gly Ser Phe Thr Leu Ser Pro Ile Ser Ala 1775 1780 1785 Gly Pro Ser Ser Ser Gly Phe Gly Thr Ser Ala Pro Ser Pro His 1790 1795 1800 Gln Tyr Tyr Tyr Arg Asp Phe Tyr Ala Gly Leu Ser Ser Asn Gln 1805 1810 1815 Ala Gly Met Thr Ser Pro Arg Ser Ala Glu Val Pro Ala Thr Ser 1820 1825 1830 Arg Ser Leu Gly Gly Thr Arg Pro Ser Thr Gly Lys Ser Tyr Asp 1835 1840 1845 Ser Ser Ala Ile Ser Met Pro Arg Gln Ser Thr Glu Ser Ala Pro 1850 1855 1860 His Ile Arg Arg Asp Ser Gly Thr Ala Tyr Tyr Ser Ser Tyr His 1865 1870 1875 Gln His Asp Ser Arg Arg Phe Ser Asn Leu Phe His Ser Ala Leu 1880 1885 1890 Pro Leu Pro Asp Gly Pro Glu Glu Ser Gln Arg Ser Ser Arg Ala 1895 1900 1905 Ser Ser Arg Glu Arg Ala His Ala Ser Asp Gly Tyr Asn Ile Leu 1910 1915 1920 Trp Leu Ala Ala Ser Leu Phe Glu Phe Asn Ile Ser Thr Thr Lys 1925 1930 1935 His Glu Ala Gly Tyr Pro Tyr Leu Thr Tyr Gln Ala Gly Glu Ile 1940 1945 1950 Phe Asp Val Ile Ala Glu Lys Gly Glu Leu Trp Leu Ala Lys Asn 1955 1960 1965 Gln Asp Asp Pro Thr Asp Gln Val Gly Trp Ile Trp Ser Lys His 1970 1975 1980 Phe Ala Lys Leu Ala Asp Ser 1985 1990 <210> 3 <211> 5973 <212> DNA <213> Hypocrea jecorina <400> 3 atggacccgg acccggacct gcacctgcca gcacgagtag agcgcgcgag cctggatggt 60 agcgtgtttg tagcccacga tgcgcatccg ccggctcgcc atctgcccca tctccatctc 120 ccccagctgg cccatccagc ctcaaactca acctccaact tcaccttgcg ctcgcactcg 180 cactcgcccg ctgccggcga cgtcgtcctg cccgcctcaa ccgccaatgc ccacgtcctc 240 gcccaccatg cagctgccac cctagatcct gacgactact acaggagcta cgagacagcc 300 tccagccccg gcggcgagcc acaatcgctc ccaatggcct cgccagtccc gcctcccacg 360 ccggatgggg ctgctgcaag acacctgcag ccgcctgcaa atcgcagtgc tggccgtcag 420 ggtaccagta ataccgccgt gcgctccgcc tcgagccccc tcgaccgcag gccagccgcg 480 gcggcgccgt cgtcaagatc cccctcggcc agcgccccca gcgtgaggga tctgaagaag 540 cgcttcgatc agaacagcgg ccccaactcc atcccaagag ctcctccacg ccaggctgca 600 ccggtggccc gggtcagcaa gcaagagtcc agcaaaccca agcccaagcc caagcccagc 660 ctgtcggccc cttcgtccac gcacccaggc tctcgctcgg cggtccccgc ttccaactcg 720 tccaagcaat ctcggtcgtc gtcgtcgtcc aactcagcct cgacctcgcg ctcgacgtcg 780 acgccggccc cgtcagcccg ctcgcagaag ccacggcacg ttgagcgcga gcaggcggcg 840 ggaagttcgc ggtcgtttgc aaaccgtatt gggaaccatc agcctgagac atccactact 900 aacgggaact cgaacgcctc cagctctatg acaccacgcc cacacaagtc cccaccctca 960 gcctcccagc cgtcgccgcc atccccaaag tctaatcctc agttcccggg cctcctgttt 1020 ggcgaaatcc ccccgggcca gctcgacgtt gccgcgccag gctttggcat cgacaacatc 1080 cgcccgcgac gaacgtccga atccaacgtg cacggcctcg cggggcgtca acgcagcctc 1140 tccgacctcg aagccgagcc cgcgtccccg tccagctggt acagggacgt ccacatgtcc 1200 cgagggagca cgccgaaaac ccacgcgcga tctcgcagcg atctctcggc gctgaagccc 1260 atcctcacaa ccttgcatcc caagtcgcct acgcccgcat cggcgtcggc atcagcaaag 1320 acaagggcga aatcaccaac agtagctgct ttcgcggcag ccacggtaac ggcaacggct 1380 gtcgcagcag gggccgcggc cgccacccct tcggtctcgc acgcgtcggc agccgccagc 1440 tccaaactcc ccgtttccat cagcaggagg cttgcgagcc caaccaactc cagtcctacc 1500 tcttcgcgat cagcctcgcc ctctgcgctt cgcagactgc cagccaatgg tcgtagcaat 1560 agcagacagg ccaaaccgat cgcccccacg aaccgagcga aaacacccac gcagacgggt 1620 cgaaagcagc ctccccaggg gctcgttaca ccgagtaata gcaacaaccg gctccaagcg 1680 tacgtgtcca ccgcaccacc caagctctca ccgccattga ggagctctcg accgcgacag 1740 ccagtctccg tagcgacgac agcaagctcc cggatgaaag aggcggcggc caaggcgaag 1800 ccccctgcac ggccaaatgc acgggacggc ccttcgtcgt ccaagacgta cgatccggcg 1860 aagcgtaaaa tcatagtggg acccatagac ttcgagcagc gtcgggaaca cattcgactg 1920 gcatacacca agaccattcg cgaaagccag gcctttgagg tgcgccagaa agcggtggag 1980 aggaggcgga agcagatgga ggaggccaaa tcggaagccg cagccaccga agctacagcg 2040 acaagtagca cagctacagg cccatctacg tctgcggatt caccgaccac ggtgactgct 2100 ggagatgacg aggcgacgaa taaggggccc tcggacggcc atgcacgagt aattccagaa 2160 gtaatagcgg cagagacagg gctggtcgcg agcccctcgg cacaggagcc ggctgtggaa 2220 ctcccagctg atcatggctc tcgcgctgct gtggagaacc agggaaccct tctagaaatc 2280 ccgacagatg cagcctcgca cccggcatct ggcaagggtg atgattcgcc gacgctgggc 2340 atccccgggg gcttcccaga accctcaccg tcctccgccg cggccagaac gcagcggcct 2400 ctgtcgacca tttcaatcat ttcagccacg tctgctgtta cggagtttga tacagagccc 2460 caggcggagc tcgccgacct ggctatgtcc gatcggccgc tcagccccca gatcatagtg 2520 ccgacgaggg agcgctctca gtatagaagc ccctttgagg acgacgattt cccatcgtcg 2580 ccgcctcggc cgcgtcctgc ggcccatccc catcaaatca gccaagatcg ccaccatatc 2640 gaccagccgt tcatccctga cgcttattac gacaatgagc atcgggagca ccccttggag 2700 acccatgccc agcaagatta ccaaaccatt gtgacgattc tgccgcagcc ctcacgcgag 2760 ccccctgctg ccgaggagac tgcgcaggcg gcatcttttc cccgactaga cattcaagat 2820 gaatctgact gccactcgga tctagaaagc gttccggcaa tggctcgtcg catgcgtagt 2880 gatgtcgacg atgccgccac tgatgcctgc accgaagaga cggacgaccg cgatgggatg 2940 gaggacgagc ggtccccgta ccgctatggc ggcaccctct cgtcgaacag ggcctctaca 3000 tgcgcatcat cggacataga aacgtttgac gaccttttgt acccttcgca tgacgagcag 3060 ctggatgcgg gcccaccaaa cagactactg gcgccgccct cgatctctcg ggccgacaga 3120 tcgagccacc agaccgcatg gacgaatgtc tccgtcgaaa gcattacgcg ctccgaggct 3180 tcagactctc ctgttctacg agccagctcc tggaagatgt ccggttcgtc cgggcgagac 3240 gactcttccc tcagaagcct cccctatagc ggagtcggcg tccgcccttc agtcgactcg 3300 acgcggtcgt cgattcagct tggccagcag ctcccggagc tagacacggg cgaaggcttc 3360 tccatcccgt atctgtccgc agaggcaacc tccgacctct cctacctctc ttcccccggg 3420 aaacacgagc cagcacctca cccgcgctct ggacggaact cggccatcga ctcgcaaacg 3480 tcgagcgtgt tctatgagca gtcccagtat ggcagcacgt tggtcaactc cgatcgcggg 3540 agtggagaat atgtctccca ccattcggaa actcctctgt cgatgatgga cttgacctcg 3600 atggagacta tggatcggta ctatgacggt cgcacccagg tggatagcga tgccaagtca 3660 ttcatccaag aatccgaggg gctaagcagc gaagagcggc atcgccttat ccagaggcgt 3720 aacgtcatca aggagcttgt ggataccgaa gcaatttttg taagagacat gaacattgtg 3780 gaggaaatct acaagggcac cgcagaggcg tgccccaagc tggacaccaa gattgtcaag 3840 ctcatcttca ggaacagcga cgagattatc gagtttcaca cctcgttcct cgtcctcctc 3900 aaagaggcag tggccagcat ttacgtaccg aagggcggcc ggtctctcgt cgcgagagaa 3960 gactccatct attcggaaca aggccagact tccatcgtcg acctcagcga tgccaaggac 4020 agagagacgt cgctcggtcc aactttccaa gccaacatgg agaagatgaa gcttgctcac 4080 gaagggttcc tgcgaaacag cgaccaagca gcaaagaaac tgatccagat ccagcaggac 4140 ccgacggtgc agatatggct gaacgagtgt aatgaggtag ccaaggacct gacagctgcc 4200 tgggatctgg actcccttct catcaagccg atgcaacgaa tcacaaagta tccgaatctg 4260 atcatgacgc tccttcagca cacgccccag gaccaccccg atcgggaggc cctcgtgatg 4320 gccaaagagg cgctcgaaga ggccattatc gagatcaaca agacgaagaa gaactttgag 4380 ctggtcggac agatcgtcgg tagaaaacgt aaggagtccg acgtgaaggc cggactcgct 4440 cgtgcctttg gcaagaaggt ggacaagctg caaggcggaa ctcggccacc ggaggatcca 4500 gaatatctca agctggagga aaggttcagc gacgattact tgcggctaca ggtcgtcttg 4560 cgcgatgtcg agttctacac ccggcaagtc tcatcgtatg tgcacgagtt cctgcagtac 4620 ctatcagcca tcgagctggt catgcgtctt cagccgggca gcttccccga gctggagagc 4680 aagtgggtgc gcttcaatat ctccattcgc gacattgaga aggtagcgct cgagcagcat 4740 ctgtcacaga ttcgaaagca tgtcattgag ccttttgagc aggtcatcaa gtcctacggg 4800 aacccctcgc tggctatgaa gaagagacaa aagcgccgag tcgtgtggga gcgcgcagag 4860 cagctgaaga aggcaggcaa aagcgtcgat cccaagctta aggagctggt tgagcagtat 4920 gaagctctca acgatacgct aatcaaggag cttcccaagc tttcggcgct gacggagaag 4980 gtgggaaaca tttgtctcag caatctcatc aacatccagg ccaattggta cttcatttgg 5040 agggagaaga tgagagctgt gctgccggac tcgcccacga tgccagacat tgaggaaata 5100 gtctcgactt tccagcgaga ctttccctat gcgaacgaga tgatggccag catcggcatc 5160 atcaacccag cctaccgcgg aaggacatca caatcaacga accacggaga cgacgccggc 5220 ctgcccagga ctagaggccg aacctcagag tcggtagata ggggatggag tcagtctttc 5280 aacggcgaag gcgcaccaag cctaccgcct cccgattttg gcaaacggca tagcggctcg 5340 tttaccctct cccccatcag cgccggcccg tcctcctctg gcttcgggac gtcagctccc 5400 agtccccacc agtactatta tcgtgacttt tatgccggcc tgtcaagcaa ccaggcggga 5460 atgacatccc cgagatcggc cgaggtacca gcaacctctc gatcgctcgg aggcacgcgg 5520 ccgagtacgg gcaaaagcta cgattcgtcg gcaatctcaa tgccgagaca gagcacggag 5580 tcggcgcctc acatccgacg ggactcgggc acggcgtact attccagcta ccaccagcac 5640 gacagccgta gattctcaaa tctctttcac tctgcccttc ctctaccgga cggccccgaa 5700 gagagtcagc ggtcctctag agcatcatcg cgggagcgag cacatgcttc tgatgggtac 5760 aatatcctat ggctggcagc gtcgctcttc gagtttaaca tctcgacaac caagcacgag 5820 gctggctatc cttatctgac gtatcaggcc ggcgagatat tcgatgtaat tgccgagaaa 5880 ggcgagcttt ggcttgccaa gaatcaagac gacccaacgg accaggtggg ctggatctgg 5940 tccaaacact ttgcgaaatt ggccgactca tag 5973 <210> 4 <211> 1244 <212> PRT <213> Hypocrea jecorina <400> 4 Met Asp Pro Asp Pro Asp Leu His Leu Pro Ala Arg Val Glu Arg Ala 1 5 10 15 Ser Leu Asp Gly Ser Val Phe Val Ala His Asp Ala His Pro Pro Ala 20 25 30 Arg His Leu Pro His Leu His Leu Pro Gln Leu Ala His Pro Ala Ser 35 40 45 Asn Ser Thr Ser Asn Phe Thr Leu Arg Ser His Ser His Ser Pro Ala 50 55 60 Ala Gly Asp Val Val Leu Pro Ala Ser Thr Ala Asn Ala His Val Leu 65 70 75 80 Ala His His Ala Ala Ala Thr Leu Asp Pro Asp Asp Tyr Tyr Arg Ser 85 90 95 Tyr Glu Thr Ala Ser Ser Pro Gly Gly Glu Pro Gln Ser Leu Pro Met 100 105 110 Ala Ser Pro Val Pro Pro Pro Thr Pro Asp Gly Ala Ala Ala Arg His 115 120 125 Leu Gln Pro Pro Ala Asn Arg Ser Ala Gly Arg Gln Gly Thr Ser Asn 130 135 140 Thr Ala Val Arg Ser Ala Ser Ser Pro Leu Asp Arg Arg Pro Ala Ala 145 150 155 160 Ala Ala Pro Ser Ser Arg Ser Pro Ser Ala Ser Ala Pro Ser Val Arg 165 170 175 Asp Leu Lys Lys Arg Phe Asp Gln Asn Ser Gly Pro Asn Ser Ile Pro 180 185 190 Arg Ala Pro Pro Arg Gln Ala Ala Pro Val Ala Arg Val Ser Lys Gln 195 200 205 Glu Ser Ser Lys Pro Lys Pro Lys Pro Lys Pro Ser Leu Ser Ala Pro 210 215 220 Ser Ser Thr His Pro Gly Ser Arg Ser Ala Val Pro Ala Ser Asn Ser 225 230 235 240 Ser Lys Gln Ser Arg Ser Ser Ser Ser Ser Asn Ser Ala Ser Thr Ser 245 250 255 Arg Ser Thr Ser Thr Pro Ala Pro Ser Ala Arg Ser Gln Lys Pro Arg 260 265 270 His Val Glu Arg Glu Gln Ala Ala Gly Ser Ser Arg Ser Phe Ala Asn 275 280 285 Arg Ile Gly Asn His Gln Pro Glu Thr Ser Thr Thr Asn Gly Asn Ser 290 295 300 Asn Ala Ser Ser Ser Met Thr Pro Arg Pro His Lys Ser Pro Pro Ser 305 310 315 320 Ala Ser Gln Pro Ser Pro Pro Ser Pro Lys Ser Asn Pro Gln Phe Pro 325 330 335 Gly Leu Leu Phe Gly Glu Ile Pro Pro Gly Gln Leu Asp Val Ala Ala 340 345 350 Pro Gly Phe Gly Ile Asp Asn Ile Arg Pro Arg Arg Thr Ser Glu Ser 355 360 365 Asn Val His Gly Leu Ala Gly Arg Gln Arg Ser Leu Ser Asp Leu Glu 370 375 380 Ala Glu Pro Ala Ser Pro Ser Ser Trp Tyr Arg Asp Val His Met Ser 385 390 395 400 Arg Gly Ser Thr Pro Lys Thr His Ala Arg Ser Arg Ser Asp Leu Ser 405 410 415 Ala Leu Lys Pro Ile Leu Thr Thr Leu His Pro Lys Ser Pro Thr Pro 420 425 430 Ala Ser Ala Ser Ala Ser Ala Lys Thr Arg Ala Lys Ser Pro Thr Val 435 440 445 Ala Ala Phe Ala Ala Ala Thr Val Thr Ala Thr Ala Val Ala Ala Gly 450 455 460 Ala Ala Ala Ala Thr Pro Ser Val Ser His Ala Ser Ala Ala Ala Ser 465 470 475 480 Ser Lys Leu Pro Val Ser Ile Ser Arg Arg Leu Ala Ser Pro Thr Asn 485 490 495 Ser Ser Pro Thr Ser Ser Arg Ser Ala Ser Pro Ser Ala Leu Arg Arg 500 505 510 Leu Pro Ala Asn Gly Arg Ser Asn Ser Arg Gln Ala Lys Pro Ile Ala 515 520 525 Pro Thr Asn Arg Ala Lys Thr Pro Thr Gln Thr Gly Arg Lys Gln Pro 530 535 540 Pro Gln Gly Leu Val Thr Pro Ser Asn Ser Asn Asn Arg Leu Gln Ala 545 550 555 560 Tyr Val Ser Thr Ala Pro Pro Lys Leu Ser Pro Pro Leu Arg Ser Ser 565 570 575 Arg Pro Arg Gln Pro Val Ser Val Ala Thr Thr Ala Ser Ser Arg Met 580 585 590 Lys Glu Ala Ala Ala Lys Ala Lys Pro Pro Ala Arg Pro Asn Ala Arg 595 600 605 Asp Gly Pro Ser Ser Ser Lys Thr Tyr Asp Pro Ala Lys Arg Lys Ile 610 615 620 Ile Val Gly Pro Ile Asp Phe Glu Gln Arg Arg Glu His Ile Arg Leu 625 630 635 640 Ala Tyr Thr Lys Thr Ile Arg Glu Ser Gln Ala Phe Glu Val Arg Gln 645 650 655 Lys Ala Val Glu Arg Arg Arg Lys Gln Met Glu Glu Ala Lys Ser Glu 660 665 670 Ala Ala Ala Thr Glu Ala Thr Ala Thr Ser Ser Thr Ala Thr Gly Pro 675 680 685 Ser Thr Ser Ala Asp Ser Pro Thr Thr Val Thr Ala Gly Asp Asp Glu 690 695 700 Ala Thr Asn Lys Gly Pro Ser Asp Gly His Ala Arg Val Ile Pro Glu 705 710 715 720 Val Ile Ala Ala Glu Thr Gly Leu Val Ala Ser Pro Ser Ala Gln Glu 725 730 735 Pro Ala Val Glu Leu Pro Ala Asp His Gly Ser Arg Ala Ala Val Glu 740 745 750 Asn Gln Gly Thr Leu Leu Glu Ile Pro Thr Asp Ala Ala Ser His Pro 755 760 765 Ala Ser Gly Lys Gly Asp Asp Ser Pro Thr Leu Gly Ile Pro Gly Gly 770 775 780 Phe Pro Glu Pro Ser Pro Ser Ser Ala Ala Ala Arg Thr Gln Arg Pro 785 790 795 800 Leu Ser Thr Ile Ser Ile Ile Ser Ala Thr Ser Ala Val Thr Glu Phe 805 810 815 Asp Thr Glu Pro Gln Ala Glu Leu Ala Asp Leu Ala Met Ser Asp Arg 820 825 830 Pro Leu Ser Pro Gln Ile Ile Val Pro Thr Arg Glu Arg Ser Gln Tyr 835 840 845 Arg Ser Pro Phe Glu Asp Asp Asp Phe Pro Ser Ser Pro Pro Arg Pro 850 855 860 Arg Pro Ala Ala His Pro His Gln Ile Ser Gln Asp Arg His His Ile 865 870 875 880 Asp Gln Pro Phe Ile Pro Asp Ala Tyr Tyr Asp Asn Glu His Arg Glu 885 890 895 His Pro Leu Glu Thr His Ala Gln Gln Asp Tyr Gln Thr Ile Val Thr 900 905 910 Ile Leu Pro Gln Pro Ser Arg Glu Pro Pro Ala Ala Glu Glu Thr Ala 915 920 925 Gln Ala Ala Ser Phe Pro Arg Leu Asp Ile Gln Asp Glu Ser Asp Cys 930 935 940 His Ser Asp Leu Glu Ser Val Pro Ala Met Ala Arg Arg Met Arg Ser 945 950 955 960 Asp Val Asp Asp Ala Ala Thr Asp Ala Cys Thr Glu Glu Thr Asp Asp 965 970 975 Arg Asp Gly Met Glu Asp Glu Arg Ser Pro Tyr Arg Tyr Gly Gly Thr 980 985 990 Leu Ser Ser Asn Arg Ala Ser Thr Cys Ala Ser Ser Asp Ile Glu Thr 995 1000 1005 Phe Asp Asp Leu Leu Tyr Pro Ser His Asp Glu Gln Leu Asp Ala 1010 1015 1020 Gly Pro Pro Asn Arg Leu Leu Ala Pro Pro Ser Ile Ser Arg Ala 1025 1030 1035 Asp Arg Ser Ser His Gln Thr Ala Trp Thr Asn Val Ser Val Glu 1040 1045 1050 Ser Ile Thr Arg Ser Glu Ala Ser Asp Ser Pro Val Leu Arg Ala 1055 1060 1065 Ser Ser Trp Lys Met Ser Gly Ser Ser Gly Arg Asp Asp Ser Ser 1070 1075 1080 Leu Arg Ser Leu Pro Tyr Ser Gly Val Gly Val Arg Pro Ser Val 1085 1090 1095 Asp Ser Thr Arg Ser Ser Ile Gln Leu Gly Gln Gln Leu Pro Glu 1100 1105 1110 Leu Asp Thr Gly Glu Gly Phe Ser Ile Pro Tyr Leu Ser Ala Glu 1115 1120 1125 Ala Thr Ser Asp Leu Ser Tyr Leu Ser Ser Pro Gly Lys His Glu 1130 1135 1140 Pro Ala Pro His Pro Arg Ser Gly Arg Asn Ser Ala Ile Asp Ser 1145 1150 1155 Gln Thr Ser Ser Val Phe Tyr Glu Gln Ser Gln Tyr Gly Ser Thr 1160 1165 1170 Leu Val Asn Ser Asp Arg Gly Ser Gly Glu Tyr Val Ser His His 1175 1180 1185 Ser Glu Thr Pro Leu Ser Met Met Asp Leu Thr Ser Met Glu Thr 1190 1195 1200 Met Asp Arg Tyr Tyr Asp Gly Arg Thr Gln Val Asp Ser Asp Ala 1205 1210 1215 Lys Ser Phe Ile Gln Glu Ser Glu Gly Leu Ser Ser Glu Glu Arg 1220 1225 1230 His Arg Leu Ile Gln Arg Arg Asn Val Ile Lys 1235 1240 <210> 5 <211> 213 <212> PRT <213> Hypocrea jecorina <400> 5 Val Ile Glu Glu Leu Val Asp Thr Glu Ala Ile Phe Val Arg Asp Met 1 5 10 15 Asn Ile Val Glu Glu Ile Tyr Lys Gly Thr Ala Glu Ala Cys Pro Lys 20 25 30 Leu Asp Thr Lys Ile Val Lys Leu Ile Phe Arg Asn Ser Asp Glu Ile 35 40 45 Ile Glu Phe His Thr Ser Phe Leu Val Leu Leu Lys Glu Ala Val Ala 50 55 60 Ser Ile Tyr Val Pro Lys Gly Gly Arg Ser Leu Val Ala Arg Glu Asp 65 70 75 80 Ser Ile Tyr Ser Glu Gln Gly Gln Thr Ser Ile Val Asp Leu Ser Asp 85 90 95 Ala Lys Asp Arg Glu Thr Ser Leu Gly Pro Thr Phe Gln Ala Asn Met 100 105 110 Glu Lys Met Lys Leu Ala His Glu Gly Phe Leu Arg Asn Ser Asp Gln 115 120 125 Ala Ala Lys Lys Leu Ile Gln Ile Gln Gln Asp Pro Thr Val Gln Ile 130 135 140 Trp Leu Asn Glu Cys Asn Glu Val Ala Lys Asp Leu Thr Ala Ala Trp 145 150 155 160 Asp Leu Asp Ser Leu Leu Ile Lys Pro Met Gln Arg Ile Thr Lys Tyr 165 170 175 Pro Asn Leu Ile Met Thr Leu Leu Gln His Thr Pro Gln Asp His Pro 180 185 190 Asp Arg Glu Ala Leu Val Met Ala Lys Glu Ala Leu Glu Glu Ala Ile 195 200 205 Ile Glu Ile Asn Lys 210 <210> 6 <211> 102 <212> PRT <213> Hypocrea jecorina <400> 6 Ala Leu Glu Gln His Leu Ser Gln Ile Arg Lys His Val Ile Glu Pro 1 5 10 15 Phe Glu Gln Val Ile Lys Ser Tyr Gly Asn Pro Ser Leu Ala Met Lys 20 25 30 Lys Arg Gln Lys Arg Arg Val Val Trp Glu Arg Ala Glu Gln Leu Lys 35 40 45 Lys Ala Gly Lys Ser Val Asp Pro Lys Leu Lys Glu Leu Val Glu Gln 50 55 60 Tyr Glu Ala Leu Asn Asp Thr Leu Ile Lys Glu Leu Pro Lys Leu Ser 65 70 75 80 Ala Leu Thr Glu Lys Val Gly Asn Ile Cys Leu Ser Asn Leu Ile Asn 85 90 95 Ile Gln Ala Asn Trp Tyr 100 <210> 7 <211> 72 <212> PRT <213> Hypocrea jecorina <400> 7 Gly Tyr Asn Ile Leu Trp Leu Ala Ala Ser Leu Phe Glu Phe Asn Ile 1 5 10 15 Ser Thr Thr Lys His Glu Ala Gly Tyr Pro Tyr Leu Thr Tyr Gln Ala 20 25 30 Gly Glu Ile Phe Asp Val Ile Ala Glu Lys Gly Glu Leu Trp Leu Ala 35 40 45 Lys Asn Gln Asp Asp Pro Thr Asp Gln Val Gly Trp Ile Trp Ser Lys 50 55 60 His Phe Ala Lys Leu Ala Asp Ser 65 70 <210> 8 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> synthetic <400> 8 cauucaucca agaauccgag 20 <210> 9 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 9 cctaactaac gtctgacatc g 21 <210> 10 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 10 cgtaccattt gactgatacg atg 23 <210> 11 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 11 gagctagaca cgggcgaag 19 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 12 aggaaccctt cgtgagcaag 20 <210> 13 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> synthetic <400> 13 auuguggagg aaaucuacaa 20 <210> 14 <211> 1026 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 14 atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60 agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120 gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180 cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240 ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300 caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat 360 gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420 atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480 cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540 ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600 tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660 atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720 tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780 cgcctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840 ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900 gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960 tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020 gaatag 1026 <210> 15 <211> 801 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 15 catcagcgtt ggctttccgt ctccattggc tcttggcaat tcggtcagcg gggctgactg 60 cctcaggtgg ggcagtgcta gtgtgtgtac cgacccgcag gattggtgct ttgcccagag 120 ctctacagaa tagcgcgcgc atccatatgt tagttctgca attttcttgt atcggtgctg 180 tgactcatac ttcccccttt ggctggcctt gcggcaacca ataagaacgc acagtgaaat 240 cttgcgggtg gggagtggat ccatggcgcc tgcattggct tggggacgcg cactgtcgca 300 cacttccatc tgacctttca gaagggtttc gtggtgggca aggaccaacc ggttgcgcgg 360 ccgtgcgtgg gtgcctcgcc cggcactgcc agggccactg cagtggcagt ttgctgcctg 420 atacaaaatc cttccctccg cccagttttc cctctttgac cttcctttct tcttctctgc 480 aaccaaatcc accctatcaa accaaaacag tatctcgacc gaggtatcaa cctgaatcag 540 caacatcgta gccagcattt gtctccgtct ctgcagaacc agcgagttgc aaacattatc 600 caggcaacag ggcaccaact cacttcttcg gctttcacca atcggtacag ctcttctcag 660 aactcgcgtc cgcaacagtt ctacgcttcc tcagcacctt cttcagcttc aatcctgaac 720 actcagaacc gcgcacagca gcgccctcct gttcccttgt ttcccaaaag taccggtagt 780 atttcgcacg gaaagcaggg c 801 <210> 16 <211> 741 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 16 agtagatgcc gaccgggatc cacttaacgt tactgaaatc atcaaacagc ttgacgaatc 60 tggatataag atcgttggtg tcgatgtcag ctccggagtt gagacaaatg gtgttcagga 120 tctcgataag atacgttcat ttgtccaagc agcaaagagt gccttctagt gatttaatag 180 ctccatgtca acaagaataa aacgcgtttc gggtttacct cttccagata cagctcatct 240 gcaatgcatt aatgcattgg acctcgcaac cctagtacgc ccttcaggct ccggcgaagc 300 agaagaatag cttagcagag tctattttca ttttcgggag acgagatcaa gcagatcaac 360 ggtcgtcaag agacctacga gactgaggaa tccgctcttg gctccacgcg actatatatt 420 tgtctctaat tgtactttga catgctcctc ttctttactc tgatagcttg actatgaaaa 480 ttccgtcacc agcccctggg ttcgcaaaga taattgcact gtttcttcct tgaactctca 540 agcctacagg acacacattc atcgtaggta taaacctcga aaatcattcc tactaagatg 600 ggtatacaat agtaaccatg gttgcctagt gaatgctccg taacacccaa tacgccggcc 660 gaaacttttt tacaactctc ctatgagtcg tttacccaga atgcacaggt acacttgttt 720 agaggtaatc cttctttcta g 741 <210> 17 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 17 tggctttccg tctccattg 19 <210> 18 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 18 agtgtacctg tgcattctgg g 21 <210> 19 <211> 1957 <212> DNA <213> Artificial Sequence <220> <223> synthetic <400> 19 attaaggagg ggacgataca cgcaccatgg accccagtgg ggaagcaaga gcgggaagga 60 gagctgcgag acgtacagtg tgaattgctt cacgtctaaa gtatcaaggt atggagctgg 120 atggatgggc taaggtagta gacggcttcc ctcagcaact gagcttagtt atgatgctat 180 aacgtccact ttgatctgcg aaattgggca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 240 aaaaaaaaaa gaatctattg cattaatgga catatataaa ggtcaaaagg ccgcagaatt 300 gacgtcgtag tctagccagg tagttgatgc cggatctatg ctcttcaccg ttcagagacg 360 aaacttttac ttcattaggg ggagtccaac ttttcattct cactctgtga gaagctgtgt 420 cacaatactt cagaggcatt aaagctacct cagctcttta aacatgtcaa ttctatcaaa 480 attaggtatg tgattcaagt agtgaacaat atgtggccgt tactcgagtt tataggtgac 540 aacatgctct caaagcgctc atggctggca caagcctgga aagaaccaac acaaagcata 600 ctgcagcaaa tcagctgaat tcgtcaccaa ttaagtgaac atcaacctga aggcagagta 660 tgaggccaga agcacatctg gatcgcagat catggattgc ccctcttgtt gaagatgaga 720 atctagaaag atggcggggt atgagataag agcgatgggg gggcacatca tcttccaaga 780 caaacaacct ttgcagagtc aggcaatttt tcgtataaga gcaggaggag ggagtccagt 840 catttcatca gcggtaaaat cactctagac aatcttcaag atgagttctg ccttgggtga 900 cttatagcca tcatcatacc tagacagaag cttgtgggat actaagacca acgtacaagc 960 tcgcactgta cgctttgact tccatgtgaa aactcgatac ggcgcgcctc taaattttat 1020 agctcaacca ctccaatcca acctctgcat ccctctcact cgtcctgatc tactgttcaa 1080 atcagagaat aaggacacta tccaaatcca acagaatggc taccacctcc cagctgcctg 1140 cctacaagca ggacttcctc aaatccgcca tcgacggcgg cgtcctcaag tttggcagct 1200 tcgagctcaa gtccaagcgg atatccccct acttcttcaa cgcgggcgaa ttccacacgg 1260 cgcgcctcgc cggcgccatc gcctccgcct ttgcaaagac catcatcgag gcccaggaga 1320 aggccggcct agagttcgac atcgtcttcg gcccggccta caagggcatc ccgctgtgct 1380 ccgccatcac catcaagctc ggcgagctgg cgccccagaa cctggaccgc gtctcctact 1440 cgtttgaccg caaggaggcc aaggaccacg gcgagggcgg caacatcgtc ggcgcttcgc 1500 tcaagggcaa gagggtcctg attgtcgacg acgtcatcac cgccggcacc gccaagaggg 1560 acgccattga gaagatcacc aaggagggcg gcatcgtcgc cggcatcgtc gtggccctgg 1620 accgcatgga gaagctcccc gctgcggatg gcgacgactc caagcctgga ccgagtgcca 1680 ttggcgagct gaggaaggag tacggcatcc ccatctttgc catcctcact ctggatgaca 1740 ttatcgatgg catgaagggc tttgctaccc ctgaggatat caagaacacg gaggattacc 1800 gtgccaagta caaggcgact gactgattga ggcgttcaat gtcagaaggg agagtaagac 1860 tgaaaaggtg gaaagaagag gcaaattgtt gttattatta ttattctatc tcgaatcttc 1920 tagatcttgt cgtaaataaa caagcgtaac tagctag 1957

Claims

GEF1 단백질을 암호화하는 유전자를 포함하는 모 세포로부터 유래된 변이체 사상성 진균 세포로서, 상기 변이체 세포는 상기 GEF1 단백질을 암호화하는 유전자를 결실 또는 파괴하는 유전자 변형을 포함하고, 상기 변이체 세포는 동일한 조건에서 발효했을 때 모 세포에 비해 개선된 단백질 생산성 표현형을 포함하는, 변이체 사상성 진균 세포.
제1항에 있어서,
상기 개선된 단백질 생산성 표현형은 증가된 단백질 생산성, 증가된 총 단백질 생산성, 증가된 부피 생산성, 증가된 탄소 전환 효율 및 증가된 비생산성으로 구성된 군으로부터 선택되는, 변이체 세포.
제1항에 있어서,
변이체 및 모 세포가 26℃에서 동일한 조건 하에 발효될 때 모 세포에 비해 증가된 단백질 생산성 표현형을 포함하는, 변이체 세포.
제1항에 있어서,
내인성 관심 단백질(POI)을 암호화하는 유전자를 포함하고/하거나 이종성 POI를 암호화하는 발현 카세트를 포함하는, 변이체 세포.
제4항에 있어서,
내인성 POI는 리그노셀룰로오스 분해 효소인, 변이체 세포.
제5항에 있어서,
리그노셀룰로오스 분해 효소는 셀로바이오하이드롤라제, 자일라나제, 엔도글루카나제 및 β-글루코시다제로 구성된 군으로부터 선택되는, 변이체 세포.
제4항에 있어서,
상기 발현 카세트는 효소, 항체, 수용체 및 펩타이드로부터 선택된 이종성 POI를 암호화하는, 변이체 세포.
제7항에 있어서,
상기 효소는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 리아제, 이소머라제 및 리가제로 구성된 군으로부터 선택되는, 변이체 세포.
제1항의 변이체 세포에 의해 생산된 관심 단백질.
변형된 사상성 진균 세포에서 증가된 양의 내인성 관심 단백질(POI)을 생산하는 방법으로서,
(a) 천연 GEF1 유전자를 파괴 또는 결실시켜 사상성 진균 모세포를 유전자 변형시키는 단계, 및
(b) POI의 생산에 적합한 조건 하에 상기 변형된 세포를 발효시키는 단계로서, 상기 변형된 세포가 25℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 양의 POI를 생산하는 단계
를 포함하는, 방법.
제10항에 있어서,
상기 내인성 POI는 리그노셀룰로오스 분해 효소인, 방법.
제11항에 있어서,
상기 리그노셀룰로오스 분해 효소는 셀로바이오하이드롤라제, 자일라나제, 엔도글루카나제 및 β-글루코시다제로 구성된 군으로부터 선택되는, 방법.
제10항에 있어서,
상기 변형된 균주가 이종성 POI를 암호화하는 발현 작제물을 추가로 포함하는, 방법.
변형된 사상성 진균 세포에서 증가된 양의 이종성 관심 단백질(POI)을 생산하는 방법으로서,
(a) 천연 GEF1 유전자를 파괴 또는 결실시키고 이종성 POI를 암호화하는 발현 카세트를 도입하여 사상성 진균 세포를 유전자 변형시키는 단계, 및
(b) 상기 변형된 세포를 이종성 POI 생산에 적합한 조건 하에 발효시키는 단계로서, 상기 변형된 세포가 25℃에서 동일한 조건 하에 발효될 때 모 균주에 비해 증가된 양의 POI를 생산하는 단계
를 포함하는, 방법.
제14항에 있어서,
상기 이종성 POI는 효소, 항체 또는 이의 단편, 수용체 단백질 및 펩타이드로부터 선택되는, 방법.
제14항에 있어서,
상기 이종성 POI는 옥시도리덕타제, 트랜스퍼라제, 하이드롤라제, 리아제, 이소머라제 및 리가제로 구성된 군으로부터 선택되는 효소인, 방법.
제10항 또는 제14항의 방법에 의해 생산된 관심 단백질.
효모 발효 공정에서 증가된 양의 에탄올을 생산하는 방법으로서,
(a) 천연 GEF1 유전자를 파괴 또는 결실시켜서 효모 균주를 유전자 변형시키는 단계, 및
(b) 에탄올 생산에 적합한 조건 하에서 상기 변형된 균주를 발효시키는 단계로서, 상기 변형된 균주는 동일한 조건에서 발효했을 때 모 균주에 의해 발효 말기(EOF)에 생산된 에탄올의 양에 비해 증가된 양의 에탄올을 EOF에서 생산하는, 단계
를 포함하는, 방법.
GEF1 단백질 동족체를 암호화하는 유전자를 포함하는 모 균주로부터 유래된 변이체 효모 균주로서, 상기 변이체 균주는 GEF1 단백질 동족체를 암호화하는 유전자를 결실 또는 파괴하는 유전자 변형을 포함하고, 상기 변이체 균주는 동일한 조건에서 발효했을 때 모 균주에 비해 증가된 에탄올 생산성 표현형을 포함하는, 변이체 효모 균주.