KR20100017905A - 리보스위치, 리보스위치의 사용 방법 및 리보스위치를 함유하는 조성물 - Google Patents
리보스위치, 리보스위치의 사용 방법 및 리보스위치를 함유하는 조성물 Download PDFInfo
- Publication number
- KR20100017905A KR20100017905A KR1020097026872A KR20097026872A KR20100017905A KR 20100017905 A KR20100017905 A KR 20100017905A KR 1020097026872 A KR1020097026872 A KR 1020097026872A KR 20097026872 A KR20097026872 A KR 20097026872A KR 20100017905 A KR20100017905 A KR 20100017905A
- Authority
- KR
- South Korea
- Prior art keywords
- riboswitch
- riboswitches
- reactive
- rna
- compound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/66—General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Animal Behavior & Ethology (AREA)
- Medicinal Chemistry (AREA)
- Oncology (AREA)
- General Chemical & Material Sciences (AREA)
- Communicable Diseases (AREA)
- Veterinary Medicine (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
리보스위치(riboswitch)는 항생제 및 다른 소분자 요법에 대한 표적이다. 리보스위치 및 이의 일부는 RNA 분자 및 다른 요소 및 분자의 발현 또는 기능을 조절하는 데 사용될 수 있다. 리보스위치 및 이의 일부는 다양한 다른 방법에서 예를 들어, 화합물을 동정하고 검출하기 위해 사용될 수 있다. 화합물은 리보스위치의 자극, 활성화, 억제 및/또는 불활성화에 사용될 수 있다. 리보스위치 및 이의 일부는 단독으로 또는 다른 핵산과 함께 다양한 구축물(construct) 및 RNA 분자에서 사용될 수 있고 핵산에 의해 코딩될 수 있다.
Description
개시된 본 발명은 일반적으로 유전자 발현 분야, 구체적으로 유전자 발현의 조절 분야에 관한 것이다.
관련된 출원의 상호-참조
본원은 2007년 5월 29일자로 출원된 미국 가출원 제60/932,112호를 우선권 주장한다. 2007년 5월 29일자로 출원된 미국 가출원 제60/932,112호는 그 전체가 본원에 참고로 도입된다.
연방정부 지원 연구에 대한 선언
본 발명은 NIH에 의해 부여된 승인번호 GM068819, RR19895-02 및 R33 DK07027; NHLBI에 의해 부여된 승인번호 HV28186; 국립 종합 의학 연구소에 의해 부여된 승인번호 T32GM007223; 및 NSF에 의해 부여된 승인번호 EIA-0323510 하의 정부 지원으로 완성되었다. 정부는 본 발명에 대한 일정 권리를 갖는다.
배경기술
정확한 유전적 조절은 살아있는 시스템의 본질적인 특징인데, 이것은 세포가 유전적 발현 패턴을 변화시켜 무수한 생화학적 신호 및 환경적 신호에 반응해야 하기 때문이다. 공지된 유전적 조절 기작의 대다수는 화학적 또는 물리적 자극을 감지한 후 관련 DNA 또는 메신저 RNA 서열과 선별적으로 상호작용함으로써 유전자 발현을 조절하는 단백질 인자들의 사용을 수반한다. 단백질은 복잡한 형태를 채택할 수 있고 살아있는 시스템이 그의 화학적 환경 및 물리적 환경을 정확히 감지하게 하는 다양한 기능을 수행할 수 있다. 대사물질에 반응하는 단백질 인자는 전형적으로 DNA에 결합하여 전사 개시를 조절하는 작용을 하거나(예를 들어, lac 발현억제제(represser) 단백질; 문헌(Matthews, K.S., and Nichols, J.C., 1998, Prog. Nucleic Acids Res. Mol. Biol. 58, 127-164)), 또는 RNA에 결합하여 전사 종결(예를 들어, PyrR 단백질; 문헌(Switzer, R.L., et al., 1999, Prog. Nucleic Acids Res. Mol. Biol. 62, 329-367)) 또는 번역(예를 들어, TRAP 단백질; 문헌(Babitzke, P., and Gollnick, P., 2001, J. Bacteriol. 183, 5795-5802))을 조절하는 작용을 한다. 단백질 인자는 알로스테릭(allosteric) 조절 또는 번역 후 변경과 같은 다양한 기작에 의해 환경적 자극에 반응하고 상기 기작들을 활용하는 데 능통하여 고도 반응성 유전적 스위치로서 작용한다(예를 들어, 문헌(Ptashne, M., and Gann, A. (2002). Genes and Signals. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) 참조).
유전적 조절에 있어서 단백질 인자의 광범위한 참여 이외에, RNA도 유전적 조절에 있어서 능동적인 역할을 수행할 수 있는 것으로 공지되어 있다. 최근 연구는 파괴할 mRNA를 선별적으로 표적화하여 유전자 발현을 하향-조절하는 데 있어서 작은 비-코딩 RNA가 수행하는 실질적인 역할을 밝혀내기 시작하였다(예를 들어, 문헌(Hannon, G.J. 2002, Nature 418, 244-251) 및 상기 문헌에서 언급된 참고문헌 참조). 이러한 RNA 간섭 과정은 와슨-크릭 염기쌍 형성을 통해 원하는 mRNA 표적을 인식하는 짧은 RNA의 능력을 이용하는데, 상기 인식 후 결합된 mRNA는 단백질의 작용에 의해 파괴된다. RNA는 이 시스템에서 분자 인식을 위한 이상적인 물질인데, 이는 신규하되 고도로 특이적인 RNA 결합 부위를 갖는 단백질 인자를 생성하는 것보다는 진화적 과정을 통해 신규한 표적-특이적 RNA 인자를 생성하는 것이 훨씬 더 용이하기 때문이다.
단백질이 효소, 수용체 및 구조적 기능에 대해 생물학적 면에서 요구되는 대다수의 요건을 충족시킨다 하더라도, RNA 또한 이러한 능력들을 가질 수 있다. 예를 들어, RNA는 상당한 효소적 능력 및 정확한 분자 인식을 보이는 다수의 리보자임 도메인(Cech & Golden, Building a catalytic active site using only RNA. In: The RNA World R. F. Gesteland, T. R. Cech, J. F. Atkins, eds., pp. 321-350 (1998); Breaker, In vitro selection of catalytic polynucleotides. Chem. Rev. 97, 371-390 (1997)) 및 수용체 도메인(Osborne & Ellington, Nucleic acid selection and the challenge of combinatorial chemistry. Chem. Rev. 97, 349-370 (1997); Hermann & Patel, Adaptive recognition by nucleic acid aptamers. Science 287, 820-825 (2000))을 형성하기에 충분한 구조적 유연성을 갖는다. 나 아가, 이 활성들은 조합되어 이펙터(effector) 분자에 의해 선별적으로 조절되는 알로스테릭 리보자임을 생성할 수 있다(Soukup & Breaker, Engineering precision RNA molecular switches. Proc. Natl. Acad. Sci. USA 96, 3584-3589 (1999); Seetharaman et al., Immobilized riboswitches for the analysis of complex chemical and biological mixtures. Nature Biotechnol. 19, 336-341 (2001)).
세균 리보스위치 RNA는 특정 mRNA의 주 코딩 영역의 5'-비-번역 영역(5'-UTR) 내에 주로 위치하는 유전적 조절 요소이다. 구조적 프로빙 연구(이하에 더 논의됨)는 리보스위치 요소가 일반적으로 2종의 도메인, 즉 리간드 결합 도메인으로서 작용하는 천연 앱타머(T. Hermann, D. J. Patel, Science 2000, 287, 820; L. Gold, et al., Annual Review of Biochemistry, 1995, 64, 763), 및 유전자 발현에 관여하는 RNA 요소(예컨대, 샤인-달가노(SD) 요소; 전사 종결요소 줄기)와 접하는 "발현 플랫폼"으로 구성됨을 보여준다.
본 명세서에 도입되어 있고 본 명세서의 일부를 구성하는 첨부된 도면은 본 발명의 방법 및 조성물의 여러 실시양태를 예시하고 본 발명의 상세한 설명과 함께 본 발명의 방법 및 조성물의 원리를 설명하기 위한 것이다.
도 1은 동정된 22종의 모티프 중 7종의 모티프에 대해 표시된 컨센서스 서열 및 구조를 보여준다. 뉴클레오티드 종류(identity)/존재의 보존도에 대한 계산 및 공변이(covariation)의 증가는 실시예 1에 기재되어 있다. 비-정규 뉴클레오티드 또는 누락된 뉴클레오티드가 5%보다 많은 제시된 염기쌍은 공변이하는 것으로서 분류되지 않는다. 뉴클레오티드 보존 수준은 모티프에 대한 생화학적 구속 및 계통발생적 다양성 둘다에 의해 영향을 받음을 유념해야 한다. 제한된 범위를 갖는 모티프(예를 들어, 프리-쿠에오오신1(pre-queuosine1; preQ1)-II 또는 COG4708 모티프)는 더 잘 보존되는 것으로 보일 것이고, 가변-길이 줄기 내의 일부 공변이 위치들은 표시되어 있지 않다.
도 2는 환경, 막 및 운동성에 대한 유전자(GEMM) 모티프의 공통된 특징을 보여준다. 2종의 GEMM 모티프는 이 종의 GEMM 모티프가 전체 322종의 GEMM 모티프들을 대표하는 것은 아니지만 공통된 특징을 보이도록 선택되었다. (A) 이 잠재적 RNA는 일반적인 GNRA 테트라루프(tetraloop) 및 수용체(회색 영역)를 포함한다. GEMM 모티프의 약 50%는 아마도 테트라루프 수용체를 포함할 것이다. 다운스트림(downstream) 오페론(operon) 내의 첫 번째 유전자만이 도시되어 있다. (B) 일부 GEMM RNA는 테트라루프 수용체를 갖지 않지만, 수용체가 결여된 서열들의 대략 절반에서 발견되는 2개의 여분의 융기된(bulged) A 잔기(회색 음영)가 존재한다. 위에 회색선이 표시되어 있는 뉴클레오티드들은 폴딩되어 rho-의존적 전사 종결요소(이 요소 다음에 3'-U 테일이 존재함)의 줄기를 형성할 수 있다. 상기 종결요소는 P2 줄기의 3' 부분(우측-대부분 헤어핀)과 경쟁할 것으로 예측된다. 322종의 GEMM 모티프 중 78종의 GEMM 모티프는 P2와 중첩되는 예측된 전사 종결요소를 갖는다.
도 3은 사이클릭 다이-구아노신 모노포스페이트(GMP) 앱타머를 보여준다. (A) 제2 메신저 사이클릭 다이-GMP의 화학적 구조. (B) 1형 GEMM RNA 및 2형 GEMM RNA의 컨센서스 서열 및 구조. (C) 비브리오 콜레라(Vibrio cholerae) 2번 염색체로부터 유래된 Vc2 RNA의 서열 및 구조, 및 상기 RNA와 VC1722의 오픈 리딩 프레임(open reading frame; ORF)의 인접성. 표시된 뉴클레오티드들은 110 Vc2 RNA 구축물(construct)에 상응한다. 진하게 표시된 숫자는 (D)에 표시된 리간드-매개된 구조 조절의 영역을 나타낸다. 괄호는 10 nM 사이클릭 다이-GMP를 사용하여 시험한 경우 구조적 조절을 보이는 최소한의 5' 또는 3' 말단(110 Vc2 RNA의 경우 대립되는 말단이 보유됨)을 나타낸다. 뉴클레오티드 13-20의 서열은 CGCACAGG이다. (D) 5' 32P-표지된 110 Vc2 RNA의 인-라인 프로빙(in-line probing)에 의해 발생된 RNA 생성물의 폴리아크릴아마이드 겔 전기영동(PAGE) 분리. NR(반응 없음); T1(RNase T1에 의한 부분적 절단); -OH(알칼리에 의한 부분적 절단). RNA는 100 μM의 사이클릭 다이-GMP의 부재(-) 또는 존재(+) 하에서 항온처리하였다.
도 4는 사이클릭 다이-GMP에 대한 Vc2 앱타머의 친화성 및 특이성을 보여준다. (A) 사이클릭 다이-GMP 농도에 대한 절단된 110 Vc2 앱타머의 표준화된 분율을 작도한 것이다. 구조적 조절 부위는 도 3에 표시된 바와 같다. (B) 사이클릭 다이-GMP에 대한 110 Vc2 앱타머의 KD 값과 다양한 유사체에 대한 110 Vc2 앱타머의 KD 값의 비교. G(구아노신); pG, pGpG, pGpA(5' 인산화된 모노뉴클레오티드 및 다 이뉴클레오티드); GpGpG(트라이뉴클레오티드), AMP(아데노신 모노포스페이트) 및 GMP. (C) 인-라인 프로빙 조건 하에서 항온처리 시간에 대한 온전한 잔존 사이클릭 다이-GMP의 분율의 자연 대수를 작도한 것이다. 직선의 음의 기울기는 제2 메신저의 절단에 대한 비-촉진된 속도 상수(kuncat)를 반영한다.
도 5는 사이클릭 다이-GMP 앱타머가 유전자 조절 요소들의 구성요소임을 보여준다. (A) 레포터 융합 구축물은 비브리오 콜레라(Vc2)로부터 유래된 야생형(WT) 또는 돌연변이체(M1 내지 M3) 리보스위치를 보유하거나, 바실러스 세레우스(Bacillus cereus)(Bc1 및 Bc2) 또는 클로스트리디움 디피실(Chrostridium difficile)(Cd1)로부터 유래된 등가의 WT 리보스위치 및 M3 리보스위치를 보유한다. (B) 에스케리치아 콜라이(Escherichia coli) 또는 이. 콜라이(E. coli) 내로 형질전환된, A에 도시된 구축물에 대한 β-갈락토시다제 레포터 유전자 분석. 상기 4종의 대표적 리보스위치들에 대해 측정된 최대 밀러 유니트(Miller unit)는 각각 436, 47, 5 및 51이었다. (C) WT 또는 M3 CD1 리보스위치의 다운스트림에 융합된 β-갈락토시다제 레포터 유전자(lacZ)를 보유하며 X-gal을 함유하는 아가 상에서 생장된 바실러스 서브틸러스(Bacillus subtilis) 세포.
도 6은 사이클릭 다이-GMP 포스포다이에스터라제의 발현이 Cd1 리보스위치에 의해 조절되는 레포터 유전자의 발현을 변화시킴을 보여준다. (A) WT Cd1 리보스위치에 융합된 β-갈락토시다제를 보유하고, EAL 포스포다이에스터라제(PDE)를 코딩하는 정상(+) 또는 돌연변이cp(E170A) 비브리오 콜레라 vieA 유전자를 갖지 않거 나(-) 갖는 플라스미드로 형질전환된 바실러스 서브틸러스 세포. (B) 표시된 바와 같이 WT 또는 M3 리보스위치에 융합되어 있는 레포터 유전자를 보유하고 (A)에 기재된 바와 같이 플라스미드로 형질전환된 바실러스 서브틸러스의 β-갈락토시다제 레포터 분석. Cd1에 대해 1의 표준화된 유전자 발현 값은 102 밀러 유니트를 나타낸다.
도 7은 대표적인 유기체에 대한 사이클릭 다이-GMP 리보스위치 또는 앱타머의 게놈상 위치를 보여준다. 상기 리보스위치 또는 앱타머의 바로 다운스트림에 존재하는 유전자들이 표시되어 있는데, 이때 다수의 유전자들은 예측된 오페론을 표시한다. 유전자의 부재는 사이클릭 다이-GMP 앱타머가 임의의 ORF에 대해 5' 방향으로 근접하여 위치하지 않음을 의미한다. COG3070은 TfoX(93, 94)와 유사한 단백질 정렬인 pfamO4994 도메인에 연결되어 있다. 염색체는 음영 선으로 표시되어 있고, ori는 복제기점이다.
도 8은 진정세균(eubacteria)에서의 전형적인 S-아데노실메티오닌(SAM) 대사 주기를 보여준다. 이. 콜라이(균주 K-12) 또는 슈도모나스 시린가(Pseudomonas syringae)의 유전자 명칭이 각 효소 다음에 표시된 가로 내에 기재되어 있다. 음영으로 표시된 박스는 S-아데노실호모시스테인(SAH) 요소의 바로 다운스트림에 위치한 ORF를 보여주는 반면, 개방된 박스는 SAH 요소가 존재하는 경우 SAH 가수분해효소 유전자 ahcY의 다운스트림(및 가능하게는 동일한 오페론)에 종종 존재하는 ORF를 보여준다. THF는 테트라하이드로폴레이트이다.
도 9는 SAH 요소가 다수의 그람-양성 세균 및 그람-음성 세균에서 발견되는 고도로 보존된 RNA 모티프임을 보여준다. (A) SAH 재활용에 관여하는 유전자의 5' UTR에 위치한 보존된 RNA 요소의 컨센서스 뉴클레오티드 서열 및 2차 구조 모델. 상기 컨센서스 서열 및 구조 모델은 거의 동일한 게놈 DNA들로부터 확인된 중복 모티프를 제외한 모티프를 대표하는 68개의 모티프를 조사함으로써 확인하였다. P1 내지 P4는 예측된 염기-페어링된 영역을 확인시켜주고, 임의적 구성요소인 P3 줄기를 보유하거나 보유하지 않는 다수의 비-중복 모티프들이 표시되어 있다. (B) 밀접하게 관련되어 있는 세균 균주에서 동일한 서열의 중복 횟수를 포함하는, 생물정보(bioinformatics) 검색에 의해 동정되고 게놈 내용에 의해 검증된 SAH 요소들의 계통발생적 분포. "기타" 카테고리에는 환경 유래 서열에서 발견되는 빈도가 기재되어 있다.
도 10은 데클로로모나스 아로마티카(Dechloromonas aromatica)의 metH 5'-UTR로부터 유래된 SAH 요소가 SAH에 선별적으로 결합될 때 구조적 변화를 겪음을 보여준다. (A) 보존된 SAH 앱타머를 함유하는, 68 metH RNA의 서열 및 2차 구조 모델. (B)에 표시된 데이터로부터 5' 32P-표지된 RNA의 인-라인 프로빙 동안에 일어나는 천연 발생적 RNA 절단 부위가 확인되었다. 천연 RNA에 존재하지 않는 2개의 구아노실 잔기는 T7 RNA 중합효소에 의한 시험관내 전사를 촉진하도록 구축물의 5' 말단에 부가되었다. 영역 1 내지 8 및 63 내지 68 내의 뉴클레오티드들은 (B)에서 도시된 겔 상에서 가시화될 수 없으므로, 가닥 절개(scission)는 이 잔기들에 대해 정량화되지 않았다. (B) 100 pM 내지 300 μM 농도의 SAH의 부재(-) 및 존재 하에서 68 metH RNA의 인-라인 프로빙으로부터 발생된 천연 발생적 절단 패턴. NR, T1 및 -OH 레인은 각각 비-처리된 전구체 RNA, RNase T1로 부분적으로 절단된 전구체 RNA, 또는 상승된 pH에서 부분적으로 절단된 전구체 RNA를 보여준다. RNase T1 절단(G 잔기 다음에서 절단됨)에 의해 발생된 몇몇 밴드가 확인되고(화살표로 표시됨), Pre는 절단되지 않은 전구체 RNA 밴드를 표시한다. 천연 발생적 RNA 절단의 조절 영역은 수직 막대로 표시되어 있고, 결합 친화성을 평가하기 위해 정량된 부위는 1 내지 3으로 표시되어 있다. 별표(*)는 G11 다음에서 일어나는 절단에 상응하는 생성물 밴드를 표시하지만, 이때 2',3'-사이클릭 포스페이트 중간체는 가수분해되어 PAGE 동안 다소 더 빨리 이동하는 2'-포스페이트 생성물과 3'-포스페이트 생성물의 혼합물을 제공한다. (C) 도표는 SAH 및 화합물 3의 농도(c)에 대한, (B)에 표시된 부위에서의 68 metH RNA 천연 발생적 절단의 의존성을 보여준다. 수집된 데이터에 대한 최적 피트 곡선을 사용하고 2-상태 결합 모델을 가정함으로써 각 화합물에 대한 겉보기 해리 상수(KD) 값을 평가하였다. 최대 구조적 조절의 절반을 유도하는 데 필요한 리간드의 농도는 상기 겉보기 KD를 반영한다.
도 11은 68 metH RNA가 여러 크기 차수로 SAM을 식별함을 보여준다. (A) 탈메틸화에 의한 방사성 [3H]SAM의 분해는 비-방사성 SAH를 생성한다. (B) 평형화 투석은 공지된 SAM 앱타머(156 metA)(Corbino et al., 2005)의 SAM 결합 친화성을 68 metH RNA와 비교하는 데 사용되었다. 각 평형화 투석의 챔버 a 및 b는 분자량 컷- 오프(MWCO)가 5,000 달톤인 투과성 막에 의해 분리된다. 표시된 [3H]SAM(100 nM) 또는 RNA는 각각 챔버 a 및 b에 첨가된다. SAM에 대한 SAM-II 앱타머 156 metA의 겉보기 KD는 약 1 μM이므로(Corbino et al., 2005), 챔버 b로의 3H의 이동은 이용된 조건 하에 최대이어야 한다. 68 metH RNA가 과도하게 존재하기 때문에, 챔버 사이의 3H 분포에 대한 ([3H]SAM의 천연 발생적 탈메틸화로부터 유래된) 비-방사성 SAH의 효과는 무시되어야 한다. 나타낸 데이터는 수회 반복 실험을 대표한다. (C) SAH와 68 metH RNA의 결합 및 평형화 투석 동안에 사용된 68 metH RNA의 농도에 대한 예측된 곡선의 비교. 68 metH RNA가 25 μM 농도로 존재할 때 상기 RNA가 [3H]SAM을 최대로 이동시키지 못한다는 결과는 SAM에 대한 겉보기 KD가 약 1,000-배 더 약하거나 낮음을 암시한다. M6은 위치 및 뉴클레오티드 종류 면에서 도 13A에 도시된 구축물 M6과 동등한 2종의 돌연변이(G12U 및 A13U)를 보유한다.
도 12는 68 metH SAH 앱타머의 분자 인식 특징을 보여준다. 68 metH RNA를 사용한 인-라인 프로빙에 의해 리간드 결합 친화성이 확립된 화합물들의 화학 구조 및 겉보기 KD 값. 겉보기 KD 값은 도 10C에서 SAH에 대해 기재된 바와 같이 평가되었다. (B) SAH에 대한 68 metH RNA의 공지된 분자 인식 특징의 요약.
도 13은 SAH 리보스위치가 레포터 유전자 발현을 조절함을 보여준다. (A) 슈도모나스 시린가의 ahcY 5 '-UTR의 서열 및 2차 구조 모델, 및 유전자 발현 연구 를 위해 도입된 다양한 돌연변이들. (B) (A)에 정의된 바와 같은 WT ahcY 리더 서열 및 돌연변이 ahcY 리더 서열의 다운스트림에 융합된 β-갈락토시다제 레포터 유전자(lacZ)에 대한 발현 수준을 비교하는 도표. pRA301은 lacZ의 전방에서 임의의 삽입이 없이 원(original) 플라스미드 pRA301로 형질전환된 레포터 균주를 표시한다. 사용된 다양한 성장 배지는 실험 절차에서 정의되어 있다. 값은 3회의 독립적 실험으로부터의 평균치이고, 오차 막대는 표준 편차를 나타낸다.
도 14는 상승된 SAH 수준이 리보스위치-레포터 융합체의 발현을 증가시킴을 보여준다. (A) 25 μM의 Ado-2',3'-dial 또는 250 μM의 나열된 다른 화합물들로 보충되지 않은(-) 또는 보충된 보겔-본너(Vogel-Bonner) 배지에서 생장된 WT 및 돌연변이체(M6) 레포터 균주(도 13A)의 β-갈락토시다제 발현 수준이 작도되어 있다. 화합물 약어: Ado-2',3'-dial(아데노신-2',3'-다이알데하이드); Ado(아데노신); Hcy(호모시스테인); L-met(L-메티오닌). (B) 표시된 농도의 Ado-2',3'-dial을 사용한, (A)에 기재된 레포터 분석에서 분석된 WT, M1 및 M7 구축물. 값은 3회의 독립적 실험으로부터의 평균치이고, 오차 막대는 표준 편차를 나타낸다.
도 15는 COG4708 RNA 모티프 서열의 정렬을 보여준다. COG4708 RNA 모티프 서열들의 97% 이상에서 존재하는 뉴클레오티드는 대문자로 표시되어 있고, COG4708 RNA 모티프 서열들의 75% 이상에서 존재하는 뉴클레오티드는 소문자로 표시되어 있다(R = A, G; Y = C, U). 착색된 영역은 2차 구조 요소 P1(청색), P2(녹색), P3(주황색) 및 P4(자색)를 표시한다. 표시된 모든 서열들은 1 카피씩 존재한다. 그러나, 일부 서열들은 Nx로 표시된 루프 영역들에서만 상이하므로 동일한 것처럼 보인다. 유기체 약어: (Smu) 스트렙토코커스(Streptococcus) 돌연변이체, (Spn-1) 스트렙토코커스 뉴모니아(S. pneumoniae) R6, (Spn-2) 스트렙토코커스 뉴모니아 SP18-BS74, (Spn-3) 스트렙토코커스 뉴모니아 SP19-BS75, (Spn-4) 스트렙토코커스 뉴모니아 SP6-BS73, (Spy) 스트렙토코커스 피오게네스(S. pyogenes), (Sag-1) 스트렙토코커스 아갈락티아(S. agalactiae) 2630V/R, (Sag-2) 스트렙토코커스 아갈락티아 COH1, (Ssa) 스트렙토코커스 상귀이니스(S. sanguinis), (Ssu) 스트렙토코커스 수이스(S. suis), (Lla-1) 락토코커스 락티스 하위종 락티스(Lactococcus lactis subsp. lactis), (Lla-2) 락토코커스 락티스 하위종 크레모리스(L. lactis subsp . cremoris) SK11, (Lca) 락토바실러스 카세이(Lactobacillus casei). 다양한 스트렙토코커스 피오게네스 균주들 모두에서 Spy 서열의 12개 추가 예가 존재한다. 다양한한 스트렙토코커스 뉴모니아 균주들 모두에서 Spn-1의 7개 추가 예가 존재한다. 다양한 스트렙토코커스 아갈락티아 균주들 모두에서 Sag-1의 6개 추가 예가 존재한다. 다양한 스트렙토코커스 수이스 균주에서 발견된 Ssu의 1개 추가 예가 존재하고, 다양한 락토코커스 락티스 균주에서 발견된 Lla-1의 1개 추가 예가 존재한다.
도 16은 preQ1에 의한 COG4708 RNA의 구조적 조절을 보여준다. (A) COG4708 RNA 모티프에 대한 컨센서스 서열 및 2차 구조 모델. 비-보존된 뉴클레오티드는 검은 직선 또는 개방 원으로 표시되어 있고, 보존된 페어링 요소 P1 내지 P4도 표시되어 있다. 화살표는 앱타머 기능을 보유하는 말단-결실된(truncated) 구축물에 존재하는 뉴클레오티드를 표시한다(도 17 참조). 음영으로 표시된 뉴클레오티드는 보존된 SD 서열을 포함한다. (B) 변성 PAGE에 의해 분리된 스트렙토코커스 뉴모니아 R6 preQ1-II 앱타머(1-103 RNA)의 천연 발생적 절단 생성물. NR, T1, -OH 및 (-)는 각각 반응 없음, 부분적 RNase T1 절단, 부분적 알칼리 절단 및 리간드 부재를 표시한다. 선택된 RNase T1 절단 생성물(G 잔기의 3'이 절단됨)은 좌측에 표시되어 있다. 우측에 기재된 숫자*는 preQ1에 반응한 구조적 조절의 위치를 표시한다. (C) 예측된 2차 구조 상으로 맵핑된 1-103 RNA의 천연 발생적 절단 패턴. 소문자 g 표시는 전사를 개선시키기 위해 부가된 구아노신 잔기를 확인시켜주고, 숫자*는 (B)에서 숫자로 표시된 영역들을 확인시켜준다.
도 17은 WT 및 돌연변이체 17-90 RNA의 리간드 결합 친화성을 보여준다. (A) preQ1의 몰 농도의 대수에 대한, 17-90 RNA의 여러 뉴클레오티드간 결합에서의 인-라인 프리빙 동안에 일어나는 천연 발생적 RNA 절단의 조절에 관한 도표. (B) 0.5 nM(좌측) 내지 10 μM(우측) 농도의 preQ1와 함께 항온처리된 17-90 RNA의 인-라인 프로빙 겔. 우측에서 밴드를 가리키는 화살표는 (A)에서 결합 곡선을 작도하는 데 사용되었다. 다른 표시들은 도 16B에 대한 범례에 기재된 바와 같다. (C) 확인된 파괴적 돌연변이 및 보상적 돌연변이 M1 내지 M6을 갖는 17-90 RNA의 서열 및 구조. (D) 17-90 RNA, 33-90 RNA 및 (C)에 표시된 돌연변이체 17-90 RNA M1 내 지 M6이 나타내는 preQ1에 대한 KD 값. 개방 원은 실제 KD 값이 100 μM보다 높음을 표시한다.
도 18은 평형화 투석을 이용한, 17-90 RNA 앱타머에 의한 대사물질 결합의 분석을 보여준다. (A) 평형화 투석 장치를 3H-preQ1 및 RNA로 로딩하였다. 챔버 a 및 b는 5,000 MOCO 막에 의해 분리되었다. (B) RNA가 없는 챔버 b(-), 17-90 RNA(1-81)의 말단-결실된 불활성 유도체를 함유하는 챔버 b, 및 17-90 RNA를 함유하는 챔버 b를 사용한 평형화 투석의 결과. 경쟁 실험을 위해, 과량의 비-표지된 preQ1 및 구아닌을 17-90 RNA 및 3H-preQ1이 함유된 미리 평형화시킨 장치에 첨가하였다. 오차 막대는 3회의 독립적인 실험의 표준 편차를 나타낸다. (C) 이동하지 않은 3H-표지된 물질이 RNA에 결합할 수 있는지를 확인하기 위한 평형화 투석 방법. 1차 평형화를 위해, 3H-preQ1을 17-90 RNA로 평형화시키거나(좌측) 또는 RNA의 부재 하에서 평형화시켰다(우측). 3H 분포를 평가하기 위해 장치의 각 측면으로부터 분취액을 분리하였다. 2차 평형화를 위해, RNA가 없는 챔버(이동하지 않은 3H-표지를 함유하는 챔버 a)로부터의 완충제를 새 장치로 옮기고 17-90 RNA가 함유된 챔버 b로 재평형화시켰다. 3H 분포를 평가하기 위해 분취액을 다시 분리하였다. (D) (C)에 기재된 평형화 투석 실험의 결과. 오차 막대는 3회의 독립적인 실험의 표준 편 차를 나타낸다.
도 19는 17-90 preQ1-II 앱타머의 분자 인식 분석을 보여준다. (A) preQ1 및 리간드 유사체에 대한 17-90 RNA의 분자 인식 특징(원)과 preQ1 및 리간드 유사체에 대한 preQ1-I 리보스위치의 분자 인식 특징(정사각형)을 비교한 것이다. preQ1-I 리보스위치에 대한 KD 값은 이미 공지되어 있다(Roth et al., 2007). 화학 구조 상의 음영은 유사체와 preQ1의 차이점을 확인시켜준다. 채색되지 않은 부호는 인-라인 프로빙 분석에서 시험된 리간드의 최대 농도를 표시하는데, 이때 KD 값이 상기 최대 농도보다 더 높음을 알 수 있다. (B) (A)의 데이터로부터 유추된 분자 인식 접촉부의 요약.
도 20은 변경된 리간드에 대한 돌연변이체 17-90 앱타머의 식별력을 보여준다. 다양한 농도의 (A) preQ1 및 (B) DAP에서 WT17-90 RNA(C41) 및 돌연변이체 17-90 RNA(U41)의 인-라인 프로빙에 의한 RNA 구조의 조절을 보여주는 도표. 점은 여러 조절 밴드에 대한 절단된 평균 표준화된 분율을 나타내고, 오차 막대는 상기 평균의 표준 편차를 나타낸다. (C) 스트렙토코커스 뉴모니아 R6으로부터 유래된 preQ1-II 앱타머에 대한 분자 인식 모델 및 돌연변이 분석 데이터와 일치하는 가능한 앱타머-리간드 상호작용.
도 21은 COG4708 단백질에 대한 유전자를 보유하는 종들의 분류학적 나무(taxonomy tree)를 보여준다. 상기 유전자를 2 카피씩 함유하는 종은 별표(*)로 표시되었다. COG4708을 코딩하는 유전자가 preQ1-I 리보스위치 다음에 위치하고 있는 종은 I로 표시되고, 상기 유전자가 preQ1-II 모티프 다음에 위치하고 있는 종은 II로 표시된다.
도 22는 176종의 몰리브데늄 보조인자(Moco) RNA로부터 유래된 가장 공통된 형태의 Moco RNA 모티프의 컨센서스 서열 및 2차 구조 모델을 보여준다. R은 A 또는 G를 나타내고, Y는 C 또는 U를 나타낸다. RBS로 표시되는 박스 내의 뉴클레오티드들은 몇몇 Moco RNA에서 인접한 ORF에 대한 리보좀 결합 부위인 것으로 예측된다.
도 23은 이. 콜라이의 moaABCDE 오페론을 개략적으로 보여준다. moaA ORF의 업스트림에 위치한 게놈 영역에 대한 뉴클레오티드 수는 제1 전사 개시 부위(S1)을 +1로 표시하고 제2 전사 개시 부위(S2)를 -87로 표시함으로써 확립하였다. Fnr 및 ModE 결합 부위의 대략적인 위치는 채색된 박스로 표시되고, Moco RNA 모티프로서 명명된 영역은 P1의 말단 뉴클레오티드들로 시작되고 종결된다(도 22). 다양한 특징의 넘버링 시스템 및 위치는 이미 보고되어 있다(Anderson et al., 2000). (b) 진정세균의 몰리브데늄 보조인자 생합성 경로(Schearz, 2005). 약칭된 단백질들은 ABC-타입의 몰리브데이트 수송자인 ModABC를 제외한, 상기 경로의 효소들이다. 구조 연구(Sanihvili et al., 2004; Bader et al., 2004)는 상기 단백질이 MogA와 유사하므로 몰리브도프테린 생합성에 관여할 가능성이 높음을 시사한다. 물음(?) 표시는 전환에 대한 생합성 효소가 공지되어 있지 않음을 의미한다. 나열된 다른 단 백질들은 Moco 유도체를 보조효소로서 사용하는 효소들이다. 1종 이상의 유기체 내에서 코딩 영역이 Moco RNA 모티프와 인접하여 상기 Moco RNA 모티프의 다운스트림에 위치하는 단백질들은 흑색 음영으로 강조되어 있다.
도 24는 Moco RNA의 인-라인 프로빙 분석을 보여준다. (a) 비교 서열 분석 데이터(도 22a)로부터 예측된 2차 구조 모델에 일치하도록 표시된 이. 콜라이의 138 moaA RNA의 서열. 회색 음영으로 표시된 뉴클레오티드들은 보다 높은 천연 발생적 3' 포스포다이에스터 절단 속도를 겪는데((b)에 나타낸 데이터로부터 얻음), 이 결과는 전형적으로 안정한 2차 또는 3차 구조에 존재하는 뉴클레오티드간 결합에 비해 상대적으로 구조적 유연성 수준이 상승됨을 보여준다. 막대는 리보좀 결합 부위로서 작용하는 것으로 예측되는 퓨린 뉴클레오티드를 표시하고, moaA에 대한 번역 개시 코돈은 박스로 표시되어 있다. (b) 이. 콜라이의 138 moaA RNA의 인-라인 프로빙 분석 동안 발생된 생성물의 겔 이미지. 레인 1 내지 3은 항온처리되지 않은(반응 없음) 겔 상의 5' 32P-표지된 전구체 RNA(Pre)(NR), T1 RNase에 의해 부분적으로 분해된 겔 상의 5' 32P-표지된 전구체 RNA(Pre)(T1), 또는 알칼리에 의해 부분적으로 분해된 겔 상의 5' 32P-표지된 전구체 RNA(Pre)(-OH)를 함유한다. 레인 4는 가능한 리간드 화합물의 부재(-) 하에서 인-라인 프로빙 조건 하에서 항온처리된 후 표지된 전구체 RNA로 로딩되었다. 염기-페어링될 것으로 예측되는 뉴클레오티드 다음 위치에서 절단된 방사성-표지된 RNA 단편을 함유하는 겔의 영역이 표시되어 있다.
도 25는 이. 콜라이의 Moco RNA가 유전자 발현억제(repression)를 위한 Moco 생합성을 필요로 함을 보여준다. (a) 이. 콜라이 149 moaA RNA의 P3 영역이 도시되어 있는데, 이때 상기 영역의 상응하는 DNA 주형은 β-갈락토시다제 레포터 유전자에 융합되어 있다. M1 및 M2는 WT RNA를 기준으로 표시된 뉴클레오티드 변이를 보유한다. (b) 다양한 Moco 농도 하에서 WT Moco RNA 및 돌연변이체 Moco RNA에 융합된 β-갈락토시다제 레포터 mRNA의 발현. Moco 농도는 아라비노스-유도성 프로모터에 의해 조절되는 형질전환 moa 오페론의 존재로 인해 생장 배지 중의 아라비노스의 존재 또는 부재에 의해 각각 증가되거나 감소된다. (c) 상기 레포터 유전자들의 발현은 세포 내에서의 몰리브데이트 또는 텅스테이트의 이용률에 의존한다. 분석에서 사용되는 이. 콜라이 균주에서 기능적 몰리브데이트 수송자 단백질의 존재(modC) 또는 부재(ΔmodC)가 표시되어 있다. 세포는 0.2% 아라비노스가 함유된 LB에서 생장되었다. 레포터 유전자 발현 분석은 3회 반복 수행되었고, 이 반복 수행 분석의 평균 값이 작도되었는데, 이때 오차 막대는 반복 분석에 대한 표준 편차를 나타낸다.
도 26은 WT 149 moaA RNA에 대한 DNA 주형에 융합된 β-갈락토시다제 레포터 유전자의 발현에 대한, 이. 콜라이 Moco 생합성 경로 내의 다양한 유전자들의 넉아웃의 영향을 보여준다. 형질전환 균주는 아라비노스-유도성 프로모터의 조절 하에 이. 콜라이 moaABCDE를 코딩하는 플라스미드를 각각 보유한다.
도 27은 Moco RNA의 크기 및 구조가 이. 콜라이의 다른 리보스위치 앱타머와 유사함을 보여준다. (a) 이. 콜라이 moaA Moco 앱타머의 길이를, 단백질에 결합되 거나 리보스위치 앱타머로서 기능하는 것으로 공지되어 있는 이. 콜라이의 조절 RNA 요소들의 길이와 비교한 결과. 리보좀 단백질에 대한 RNA 표적은 이 분석에 포함되어 있지 않다. (b) (a)에 표시된 RNA에 대한 2차 구조 모델. 도시되지 않은 RNA는 확립된 2차 구조를 갖지 않는다.
도 28은 SAM-I 모티프를 SAM-IV 모티프와 비교한 결과를 보여준다. 줄기는 P1 내지 P5로 표시되어 있다. SAM-IV의 P5는 종종 누락되어 있지만, 슈도노트(pseudoknot)에 관여하는 그의 5' 부분은 항상 존재한다. 리간드의 5 Å 내에 위치하는, 공개된 SAM-I 3-D 구조(Montange and Batey, 2006)의 뉴클레오티드 위치들은 진하게 표시되어 있는데, SAM-IV에서 상기 뉴클레오티드 위치에 상응하는 위치로서 추정되는 위치도 진하게 표시되어 있다. 리간드(예를 들어, A45)에 직접 접촉하는 것으로 제안된 6개의 위치들은 SAM-I 넘버링(Montange and Batey, 2006)에 따라 모티프 둘다에서 표지되어 있다. 보존된 특징(뉴클레오티드 종류, 융기부(bulge) 및 줄기)은 이 특징이 상기 모티프 둘다에 공통되거나(황색), SAM-I에만 존재하거나(핑크색) 또는 SAM-IV에만 존재함(청색)을 나타내기 위해 음영으로 표시되어 있다.
도 29는 SAM-IV RNA가 SAM에 선별적으로 결합함을 보여준다. (A) 132 Sc RNA의 서열 및 추측된 2차 구조. (B) 인-라인 프로빙 겔. NR = 반응 없음(RNA 단독), T1 = 부분적 RNase T1 절단(구아노실 잔기에 대해 3' 방향에서 절단함), -OH = 부분적 알칼리 절단(모든 뉴클레오티드간 결합을 절담함), (-) = 화합물이 반응물 에 첨가되지 않음. SAM, SAH, Ade(아데노신) 및 Met(메티오닌)을 표시한 바와 같이 첨가하였다. G21-G117: G 잔기 다음 위치에서 일어나는 절단에 상응하는 선택된 밴드의 확인. R1-R5: 리간드-매개된 조절을 겪는 영역. (C) 조절 영역(R1-R5)은 다양한 SAM 농도를 이용하여 겔로부터 정제하고(나타내지 않음), 0(SAM 없음) 내지 1(포화 SAM 농도)로 표준화하였다. 겉보기 KD는 그의 이론상 2-상태 결합 곡선이 기재된 데이터에 최적으로 피팅됨을 보여준다. KD = 150 nM에 대한 이론상 곡선이 도시되어 있다.
도 30은 SAM-IV가 유전적 조절 요소임을 보여준다. (A) 시험된 돌연변이체(M1, M2 및 M3)의 전체 유전자간 영역(IGR)이 레포터 분석에서 사용되었지만(재료 및 방법 단락 참조) 상기 돌연변이체는 앱타머 2차 구조로 도시되어 있다. (B) XylE 레포터 활성은 A375/분(20분에 걸쳐 측정됨)/총 단백질 g의 변화로서 정량되었다. 세포 균주는 다음과 같았다: "WT" = 야생형 IGR, "M1"-"M3" = 돌연변이된 IGR, "벡터 없음" = 세포가 xylE 레포터 유전자가 함유된 벡터를 갖지 않음. (C) (B)로부터 선택된 3종의 전형적인 실험에 대한 흡광도 대 시간 곡선.
발명의 개요
본 명세서에는 코딩 영역에 작동가능하게 연결된 리보스위치를 포함하는 RNA를 코딩하는 핵산 분자를 포함하는 조절가능한 유전자 발현 구축물이 개시되어 있는데, 상기 리보스위치는 RNA의 발현을 조절하고, 상기 리보스위치 및 상기 코딩 영역은 이종 영역이다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 상기 리보스위치는 앱타머 도메인 및 발현 플랫폼(platform) 도메인을 포함할 수 있고, 이때 상기 앱타머 도메인 및 상기 발현 플랫폼 도메인은 이종 도메인이다. 리보스위치는 2개 이상의 앱타머 도메인 및 발현 플랫폼 도메인을 포함할 수도 있고, 이때 상기 앱타머 도메인 중 1개 이상의 앱타머 도메인 및 상기 발현 플랫폼 도메인은 이종 도메인이다. 앱타머 도메인 중 2개 이상의 앱타머 도메인은 상호협동적(cooperative) 결합을 나타낼 수 있다.
천연 발생적 리보스위치의 비-천연 유도체인 리보스위치도 개시되어 있다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 리보스위치는 앱타머 도메인 및 발현 플랫폼 도메인을 포함할 수 있고, 이때 상기 앱타머 도메인 및 상기 발현 플랫폼 도메인은 이종 도메인이다. 리보스위치는 1개 이상의 앱타머 도메인을 추가로 포함할 수 있다. 상기 앱타머 도메인 중 2개 이상의 앱타머 도메인은 상호협동적 결합을 나타낼 수 있다. 리보스위치는 유발 분자에 의해 활성화될 수 있고, 이때 상기 리보스위치는 상기 유발 분자에 의해 활성화되었을 때 신호를 발생시킨다.
본 명세서에는, 샘플을 리보스위치와 접촉시키는 단계를 포함하는, 상기 리보스위치를 활성화시키는 목적 화합물의 검출 방법도 개시되는데, 이때 상기 리보스위치는 샘플이 상기 목적 화합물을 함유하는 경우 상기 목적 화합물에 의해 활성화되었을 때 신호를 발생시키고 리보스위치 또는 리보스위치의 유도체를 포함한다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 리보스위치는 상기 목적 화합물에 의해 활성화되었을 때 구조 의존적 표지를 통해 신호를 발생시키는 구조적 변화를 겪을 수 있다. 또한, 리보스위치는 상기 목적 화합물에 의해 활성화되었을 때 상기 리보스위치에 연결된 RNA의 발현 변화를 야기하는 구조적 변화를 겪을 수 있고, 이때 상기 발현 변화는 신호를 발생시킨다. 상기 신호는 상기 리보스위치에 연결된 RNA로부터 발현된 레포터 단백질에 의해 발생될 수 있다.
또한, 본 명세서에는 (a) 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현의 억제에 대해 화합물을 시험하는 단계로서, 이때 상기 억제가 상기 리보스위치를 통해 일어나고, 상기 리보스위치가 리보스위치 또는 리보스위치의 유도체를 포함하는, 단계; 및 (b) 단계 (a)에서 유전자 발현을 억제하는 화합물을 세포와 접촉시켜 유전자 발현을 억제하는 단계로서, 이때 상기 세포가 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물이 상기 리보스위치와의 결합을 통해 상기 유전자의 발현을 억제하는, 단계를 포함하는 방법이 개시된다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다.
또한, 본 명세서에는 (a) 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현의 탈억제에 대해 화합물을 시험하는 단계로서, 이때 상기 탈억제가 상기 리보스위치를 통해 일어나고, 상기 리보스위치가 리보스위치 또는 리보스위치의 유도체를 포함하는, 단계; 및 (b) 단계 (a)에서 유전자 발현을 탈억제하는 화합물을 세포와 접촉시켜 유전자 발현을 탈억제하는 단계로서, 이때 상기 세포가 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물이 상기 리보스위치와의 결합을 통해 상기 유전자의 발현을 탈억제하는, 단계를 포함하는 방법이 개시된다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다.
본 명세서에는 유발 분자의 존재 및 부재 하에서 RNA 분자의 인-라인 천연 발생적 절단을 평가하는 단계를 포함하는, 리보스위치의 동정 방법이 개시되는데, 이때 상기 RNA 분자는 상기 유발 분자에 의해 조절되는 유전자에 의해 코딩되고, 상기 RNA 분자의 인-라인 천연 발생적 절단 패턴의 변화는 상기 유발 분자에 반응하는 리보스위치를 표시한다. 상기 유발 분자는 사이클릭 다이-GMP, SAH, preQ1, Moco 또는 SAM일 수 있다.
사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 사이클릭 다이-GMP-반응성 리보스위치를 활성화시킬 수 있는 사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG의 유도체일 수도 있다. 또한, SAH인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법이 개시된다. 상기 화합물은 SAH-반응성 리보스위치를 활성화시킬 수 있는 SAH의 유도체일 수도 있다. 예를 들어, 상기 화합물은 S-아데노실-L-시스테인(SAC)일 수 있다. preO1인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 preO1-반응성 리보스위치를 활성화시킬 수 있는 preO1의 유도체일 수도 있다. Moco인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 Moco-반응성 리보스위치를 활성화시킬 수 있는 Moco의 유도체일 수도 있다. 또한, SAM인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 SAM-반응성 리보스위치를 활성화시킬 수 있는 SAM의 유도체일 수도 있다. SAM-IV 리보스위치를 활성화시키는 화합물은 MeAzaAdoMet일 수도 있다.
preQ1-반응성 리보스위치(및 preQ1-반응성 리보스위치로부터 유래된 리보스위치)에서 유용한 화합물은, 위치 1에서 있는 N이 C, O 또는 S로 치환될 수 있고 위치 2에 있는 아미노 기가 수소결합 공여체로 치환될 수 있으며 위치 6에 있는 산소가 수소결합 수용체로 치환될 수 있고 위치 7에 있는 아미노 기가 수소결합 수용체로 치환될 수 있고 질소가 수소결합 공여체로 치환될 수 있거나 유도체화될 수 있는 preQ1의 유도체를 포함한다.
수소결합 공여체 및 수용체의 예로는 NH, NH2 +, NH3 +, O, OH, SH, C-R5, CH-R5, N-R5, NH-R5, OR5 또는 S-R5가 있고, 이때 R5는 NH2 +, NH3 +, CO2H, B(OH)2, CH(NH2)2, C(NH2)2 +, CNH2NH3 +, C(NH3 +)3, 하이드록시메틸, 1-하이드록시에틸, 2-하이드록시에틸, 1,2-다이하이드록시에틸, 2-하이드록시-1-메틸에틸, 1-하이드록시프로필, 2-하이드록시프로필, 3-하이드록시프로필, 1,3-다이하이드록시프로필, 2,3-다이하이드록시프로필, 1-하이드록시부틸, 2-하이드록시부틸, 3-하이드록시부틸, 4-하이드록시부틸, 1,4-다이하이드록시부틸, 2,4-다이하이드록시부틸, 1-하이드록시-2-메틸프로필, 2-하이드록시-2-메틸프로필, 3-하이드록시-2-메틸프로필, 1-하이드록시메틸-1-메틸에틸, 트라이스하이드록시메틸메틸, 티올메틸, 1-티올에틸, 2-티올에틸, 1,2-다이티올에틸, 2-티올-1-메틸에틸, 1-티올프로필, 2-티올프로필, 3-티올프로필, 1,3-다이티올프로필, 2,3-다이티올프로필, 1-티올부틸, 2-티올부틸, 3-티올부틸, 4-티올부틸, 1,4-다이티올부틸, 2,4-다이티올부틸, 1-티올-2-메틸프로필, 2-티올-2-메틸프로필, 3-티올-2-메틸프로필, 1-티올메틸-1-메틸에틸, 트라이스티올메틸메틸, 아미노메틸, 1-아미노에틸, 2-아미노에틸, 1,2-다이아미노에틸, 2-아미노-1-메틸에틸, 1-아미노프로필, 2-아미노프로필, 3-아미노프로필, 1,3-다이아미노프로필, 2,3-다이아미노프로필, 1-아미노부틸, 2-아미노부틸, 3-아미노부틸, 4-아미노부틸, 1,4-다이아미노부틸, 2,4-다이아미노부틸, 1-아미노-2-메틸프로필, 2-아미노-2-메틸프로필, 3-아미노-2-메틸프로필, 1-아미노메틸-1-메틸에틸 또는 트라이스아미노메틸메틸이다.
세포는 변화된 유전자 발현이 필요한 세포로서 동정될 수 있다. 상기 세포는 세균 세포일 수 있다. 화합물은 세균 세포를 사멸시킬 수 있거나 세균 세포의 생장을 억제할 수 있다. 화합물과 세포는 상기 화합물을 개체(subject)에게 투여함으로써 접촉할 수 있다. 상기 세포는 개체 내의 세균 세포일 수 있고, 이때 상기 화합물의 상기 세균 세포를 사멸하거나 상기 세균 세포의 생장을 억제한다. 상기 개체는 세균에 감염된 개체일 수 있다. 상기 세포는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치를 함유할 수 있다. 상기 화합물은 또 다른 항생제 화합물과 함께 투여될 수 있다. 상기 화합물은 생체막(biofilm)에서의 세균 생장을 억제할 수 있다.
사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG인 화합물을 세포와 접촉시키는 단계를 포함하는, 세포의 생리학적 상태를 변화시키는 방법도 개시된다. 상기 화합물은 사이클릭 다이-GMP-반응성 리보스위치를 활성화시킬 수 있는 사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG의 유도체일 수도 있다.
유발 분자를 생성할 수 있는 돌연변이체 세균 세포를 배양하는 단계; 및 세포 배양물로부터 상기 유발 분자를 단리하여 유발 분자를 제조하는 단계를 포함하는, 유발 분자의 제조 방법도 개시되는데, 이때 상기 돌연변이체 세균 세포는 유발 분자에 반응하는 리보스위치 내의 돌연변이를 포함하고, 상기 돌연변이는 이 돌연변이를 갖지 않는 세포에 비해 상기 돌연변이체 세균 세포에 의한 상기 유발 분자의 생성을 증가시킨다. 상기 유발 분자는 예를 들어, 사이클릭 다이-GMP, SAH, preQ1, Moco 또는 SAM일 수 있다. 상기 방법은 리보스위치 내에 돌연변이를 포함하지 않는 세균 세포를 배양한 경우에 비해 유발 분자의 생성을 10% 이상 증가시킬 수 있다. 상기 방법은 리보스위치 내에 돌연변이를 포함하지 않는 세균 세포를 배양한 경우에 비해 유발 분자의 생성을 15% 이상 증가시킬 수 있다. 상기 방법은 리보스위치 내에 돌연변이를 포함하지 않는 세균 세포를 배양한 경우에 비해 유발 분자의 생성을 25% 이상 증가시킬 수 있다. 상기 리보스위치는 넉아웃(knockout) 돌연변이를 포함할 수 있다. 또한, 리보스위치 내에 돌연변이를 포함하는 세균 세포도 개시되는데, 이때 상기 돌연변이는 이 돌연변이를 갖지 않는 세포에 비해 상기 세포에 의한 리보스위치에 대한 유발 분자의 생성을 측정가능하게 증가시킨다.
세포를 리보스위치에 결합하는 화합물과 접촉시키는 단계를 포함하는, 세균 세포 생장을 억제하는 방법도 개시되는데, 이때 상기 세포는 상기 화합물에 반응하는 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물은 상기 리보스위치와 결합하여 상기 유전자의 발현을 변화시킴으로써 세균 세포 생장을 억제한다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 상기 방법은 상기 화합물과 접촉하지 않은 세포에 비해 세균 세포 생장을 10% 이상 감소시킬 수 있다. 화합물과 세포는 상기 화합물을 개체에게 투여함으로써 접촉할 수 있다. 상기 세포는 개체 내의 세균 세포일 수 있고, 이때 상기 화합물은 상기 세균 세포를 사멸시키거나 상기 세균 세포의 생장을 억제한다. 상기 개체는 세균에 감염된 개체일 수 있다. 상기 화합물은 또 다른 항생제 화합물과 함께 투여될 수 있다.
또한, 화합물에 반응하는 리보스위치를 샘플과 접촉시키는 단계; 및 상기 화합물과 상기 리보스위치 사이의 상호작용을 검출하는 단계를 포함하는, 샘플 중의 화합물을 검출하는 방법이 개시되는데, 이때 상기 화합물과 리보스위치 사이의 상호작용은 상기 화합물의 존재를 표시한다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 상기 리보스위치는 표지될 수 있다.
유전자의 유전자 발현 억제에 대해 화합물을 시험함으로써 유전자의 유전자 발현을 억제하는 화합물로서 동정된 화합물을 세포와 접촉시켜 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현을 억제하는 단계를 포함하는 방법도 개시되는데, 이때 상기 억제는 상기 리보스위치를 통해 일어난다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치, SAM-반응성 리보스위치 또는 이들의 유도체일 수 있다.
또한, 유전자의 유전자 발현 탈억제에 대해 화합물을 시험함으로써 유전자의 유전자 발현을 탈억제하는 화합물로서 동정된 화합물을 세포와 접촉시켜 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현을 탈억제하는 단계를 포함하는 방법도 개시되는데, 이때 상기 탈억제는 상기 리보스위치를 통해 일어난다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치, SAM-반응성 리보스위치 또는 이들의 유도체일 수 있다.
개시된 방법 및 조성물의 추가 이점은 부분적으로는 하기 상세한 설명에 기재될 것이고 부분적으로는 상세한 설명으로부터 이해되거나 또는 개시된 방법 및 조성물의 실시를 통해 인식될 수 있다. 개시된 방법 및 조성물의 이점은 첨부된 청구의 범위에서 구체적으로 언급되어 있는 요소 및 조합을 통해 인식되고 달성될 것이다. 상기 일반적인 설명 및 하기 상세한 설명은 예시 및 설명을 위한 것일 뿐 청구된 본 발명을 한정하기 위한 것이 아님을 이해해야 한다.
발명의 상세한 설명
본 명세서에 개시된 본 방법 및 조성물은 구체적인 실시양태에 대한 하기 상세한 설명 및 그에 포함된 실시예, 및 도면 및 도면에 대한 상기 설명 및 하기 설명을 참조함으로써 더 용이하게 이해될 수 있다.
메신저 RNA는 전형적으로 번역 과정 동안에 단백질-조절 또는 작은 RNA-조절 인자 및 리보좀이 작용하는 유전정보의 수동 운반체로서 여겨진다. 일부 mRNA는 천연 앱타머 도메인을 보유하고 이 RNA 도메인과 특정 대사물질의 직접적 결합은 유전자 발현의 조절을 초래함이 밝혀져 있다. 천연 리보스위치는 전형적으로 천연 RNA와 관련되어 있지 않은 2종의 놀라운 기능을 나타낸다. 첫째, mRNA 요소는 상이한 구조적 상태를 채택할 수 있는데, 이때 한 구조는 그의 표적 대사물질에 대한 정확한 결합 포켓(pocket)으로서 작용한다. 둘째, 구조적 상태 사이에서 대사물질에 의해 유도된 알로스테릭 상호전환은 여러 상이한 기작 중 한 기작에 의해 유전자 발현의 수준 변화를 야기한다. 리보스위치는 전형적으로 2종의 분리된 도메인, 즉 표적에 선별적으로 결합하는 도메인(앱타머 도메인)과 유전적 조절에 영향을 미치는 도메인(발현 플랫폼 도메인)으로 절단될 수 있다. 유전자 발현의 대사물질-의존적 알로스테릭 조절을 야기하는 것은 상기 2종의 도메인 사이의 동적 상호작용이다.
다양한 클래스의 리보스위치가 동정되어 있고 활성 화합물(본원에서 유발 분자로서 지칭됨)을 선별적으로 인식하는 것으로 밝혀져 있다. 예를 들어, 보조효소 B12, 글라이신, 티아민 피로포스페이트(TPP) 및 플라빈 모노뉴클레오티드(FMN)는 상기 화합물의 대사 경로 또는 수송 경로에서 핵심 효소를 코딩하는 유전자에 존재하는 리보스위치를 활성화시킨다. 각 클래스의 리보스위치의 앱타머 도메인은 고도로 보존된 컨센서스 서열 및 구조를 따른다. 따라서, 서열 유사성 검색은 관련된 리보스위치 도메인들을 동정하는 데 이용될 수 있다. 리보스위치 도메인은 다양한 세균계, 고세균계(archae) 및 진핵생물계 유기체에서 발견되어 왔다.
A. 리보스위치 RNA의 일반적인 구성
세균의 리보스위치 RNA는 특정 mRNA의 주 코딩 영역의 5' UTR 내에 주로 위치한 유전적 조절 요소이다. 구조적 프로빙 연구(이하, 더 논의됨)는 리보스위치 요소가 일반적으로 2개의 도메인, 즉 리간드-결합 도메인으로서 작용하는 천연 앱타머(T. Hermann, D. J. Patel, Science, 2000, 287, 820; L. Gold, et al., Annual Review of Biochemistry, 1995, 64, 763), 및 유전자 발현에 관여하는 RNA 요소와 상호접촉하는 "발현 플랫폼"(예를 들어, SD 요소; 전사 종결요소 줄기)으로 구성되어 있다. 이 결론은 시험관내에서 합성된 앱타머 도메인이 발현 플랫폼의 부재 하에서 적절한 리간드에 결합한다는 관찰로부터 도출되었다(미국 특허출원 공개 제2005-0053951호의 실시예 2, 3 및 6 참조). 뿐만 아니라, 구조적 프로빙 연구는 대다수의 리보스위치의 앱타머 도메인이 독립적으로 조사된 경우 특정 2차-구조 및 3차-구조 폴드(fold)(전체 5' 리더 RNA 면에서 조사되었을 때 앱타머 구조와 본질적으로 동일함)를 채택함을 시사한다. 이것은 많은 경우 앱타머 도메인이 발현 플랫폼과 무관하게 폴딩하는 모듈 유니트(modular unit)임을 의미한다(미국 특허출원 공개 제2005-0053951호의 실시예 2, 3 및 6 참조).
궁극적으로, 앱타머 도메인의 리간드-결합된 또는 비결합된 상태는 유전자 발현에 대한 영향 발휘를 담당하는 발현 플랫폼을 통해 해석된다. 리보스위치를 모듈 요소로서 보는 것은 앱타머 도메인이 다양한 유기체 사이에서 고도로 보존되어 있다는 점(심지어 계(kingdom) 사이에서도 TPP 리보스위치에 대해 관찰됨)에 의해 더 지지되지만(N. Sudarsan, et al., RNA, 2003, 9, 644), 발현 플랫폼은 서열, 구조, 및 첨부된 ORF의 발현이 조절되는 기작 면에서 다양하다. 예를 들어, 바실러스 서브틸리의 tenA mRNA의 TPP 리보스위치에 결합하는 리간드는 전사 종결을 야기한다(A. S. Mironov et al., Cell, 2002, 111, 747). 이 발현 플랫폼은 이. 콜라이의 thiM mRNA 내의 TPP 리보스위치의 발현 플랫폼과 비교될 때 서열 및 구조 면에서 상이하고, 이때 TPP 결합은 SD 차단 기작에 의해 번역 억제를 야기한다(미국 특허출원 공개 제2005-0053951호의 실시예 2 참조). TPP 앱타머 도메인은 용이하게 인식될 수 있고 상기 2개의 전사 유니트 사이에 거의 동일한 기능적 특성을 갖지만, 유전적 조절 기작 및 이를 수행하는 발현 플랫폼은 매우 상이하다.
리보스위치 RNA에 대한 앱타머 도메인은 전형적으로 그 길이가 -70 내지 170 뉴클레오티드이다(미국 특허출원 공개 제2005-0053951호의 도 11). 이 관찰은 시험관내 진화 실험이 길이 면에서 상당히 더 짧고 구조적 복잡성 면에서 상당히 더 단순한 매우 다양한 소분자-결합 앱타머를 동정시켜주기 때문에 다소 예측되지 않은 결과이다(T. Hermann, D. J. Patel, Science, 2000, 287, 820; L. Gold et al., Annual Review of Biochemistry, 1995, 64, 763; M. Famulok, Current Opinion in Structural Biology, 1999, 9, 324). 인공 앱타머와 비교할 때 천연 앱타머 서열의 복잡성 및 정보 내용에 있어서의 상당한 증가에 대한 이유가 입증되어 있지만, 이 복잡성은 높은 친화성 및 선별성으로 작용하는 RNA 수용체를 형성하는 데 필요한 것으로 생각된다. 리간드-리보스위치 결합체에 대한 겉보기 KD 값은 낮은 nM 내지 낮은 μM이다. 첨부된 발현 플랫폼으로부터 단리된 일부 앱타머 도메인들이 완전한 리보스위치에 비해 표적 리간드에 대한 개선된 친화성(약 10배 내지 100배)(미국 특허출원 공개 제2005-0053951호의 실시예 2 참조)을 나타낸다는 사실도 주목할만하다. 추정컨대, 완전한 리보스위치 RNA는 다수의 상이한 RNA 구조를 샘플링하는 데 있어서 에너지를 필요로 하고, 이것이 리간드 친화성의 손실로 반영된다. 앱타머 도메인은 분자 스위치로서 작용해야 하기 때문에, 이것은 천연 앱타머의 보다 정교한 구조를 재구성하는 것을 보조해야 한다는 기능적 요구를 천연 앱타머에 부가할 수도 있다.
B. 사이클릭 다이-GMP 리보스위치(GEMM 모티프)
GEMM 모티프를 함유하는 사이클릭 다이-GMP-반응성 리보스위치(사이클릭 다이-GMP 리보스위치 또는 GEMM 리보스위치로도 지칭될 수 있음)는 P1 및 P2로서 명명된 2개의 인접한 헤어핀(페어링된 영역)을 포함한다(도 1 및 3 참조). P1은 서열 및 구조 면에서 고도로 보존되어 있고, 3-뉴클레오티드 내부 루프에 의해 분리되어 있고 말단 루프에 의해 캡핑되어 있는 2-염기쌍 줄기 및 6-염기쌍 줄기로 구성되어 있다. 상기 내부 루프는 고도로 보존되어 있고, 상기 말단 루프는 거의 항상 GNRA 테트라루프이다(Hendrix, 1997). P1 줄기는 여러 위치에서 공변이의 상당한 증거를 보이고, 광범위한 세균에 걸쳐 구조 면에서 고도로 보존되어 있다. 이러한 사실, 및 P2의 보다 낮은 공변이 및 가변-길이 줄기는 GEMM 모티프가 조직화된 RNA로서 작용함을 강력히 뒷받침하는 증거를 제공한다. 실시예 2는 GEMM 모티프가 리보스위치에서 작용함을 입증한다. P1과 P2를 연결하는 서열은 332종의 예에서 2개의 예만을 제외하고 사실상 항상 AAA이다.
P2 헤어핀은 P1보다 더 낮은 보존도를 보인다. P1 테트라루프가 GAAA인 경우, GNRA 테트라루프 수용체는 통상적으로 P2에서 발견된다. 상기 수용체는 종종 GAAA 루프가 선호할 것으로 예측되는 잘 공지된 11-뉴클레오티드 모티프이지만, 일부 서열은 신규 테트라루프 수용체일 수 있다. P1이 GYRA 테트라루프를 갖는 경우, 수용체-유사 서열은 거의 항상 존재하지 않지만, P2 염기에 더 가까운 융기부가 종종 발견된다(도 2).
GEMM RNA는 1형 및 2형으로 지칭되는 2개의 유사한 구조체 중 하나와 일치한다(도 3B). 상기 1형 및 2형은 동정된 503종의 GEMM RNA에서 광범위한 공변이를 보이는 2개의 염기-페어링된 영역(P1 및 P2)을 보유한다(Weinberg, 2007). 1형 RNA(303종의 예)는 제2 위치에서 퓨린(R)을 가지면서 P1 상에서 GNRA 테트라루프(Heus, 1991)를 갖는다. GRRA 서열의 존재는 P2의 말단에 있는 테트라루프 수용체의 존재와 상호관련되어 있고, 상기 P2는 상기 테트라루프 타입으로 도킹되는 것으로 공지되어 있다(Costa, 1995). 대조적으로, 2형 RNA(171종의 예)는 테트라루프의 제2 위치에서 피리미딘(Y)을 갖고, 일부 경우 GYRA 테트라루프로의 도킹을 선호하는 P2 상의 구조체를 포함한다(Costa, 1995). 29종의 추가 비-배정된 GEMM RNA가 존재하는데, 이들 중 24종은 비-페어링된 뉴클레오티드들에 의해 플랭킹된 GNRA 테트라루프를 보유하고, 5종은 테트라루프 서열을 갖지 않는다.
GNRA 테트라루프 및 이의 수용체는 조직화된 RNA에서 통상적으로 발견되고 리보스위치 앱타머에서 이미 관찰되었다(Regulski, 2008). 그러나, P1 및 P2 헤어핀의 정점(tip)에 있는 서열 및 구조의 가변성은 사이클릭 다이-GMP에 대한 임의의 결합 부위가 가장 잘 보존된 특징을 보유하는 중심 위치 또는 기저부(basal) 위치에 존재할 것임을 시사한다.
GEMM의 대다수는 rho-독립적 전사 종결요소 헤어핀을 포함한다. 상기 종결요소의 5' 측면은 종종 P2 줄기의 3' 측면과 중첩된다(중첩되어 아마도 경쟁한다)(도 2B). GEMM이 리보스위치인 경우, 리간드 결합은 제안된 P1 및 P2 구조를 안정화시켜 경쟁하는 전사 종결요소가 형성되는 것을 방지할 수 있다. 이 모델에서, 보다 높은 리간드 농도는 유전자 발현을 증가시킨다. δ-프로테오박테리아 내의 GEMM의 1/3 및 다른 분류군 내의 일부 GEMM은 "탠덤(tandem)" 정렬로 존재하는데, 이때 한 GEMM은 동일한 UTR 내의 또 다른 GEMM에 인접하여 3' 방향으로 존재한다. 조절 RNA의 이러한 정렬은 단순한 조절 RNA 구조에 의해 허용되는 것보다 더 복잡한 유전자 발현 조절에 관여한다(Sudarsan, 2006; Welz, 2007; Mandal, 2006).
GEMM은 세균에 광범위하게 분포되어 있고 잠재적 RNA에 실질적인 생화학적 구속을 부가하는 기능을 암시하는 고도로 보존된 서열 및 구조를 갖는 것으로 보인다. 322종의 GEMM 서열이 그람-양성 세균 및 그람-음성 세균 둘다에서 발견되었다. GEMM은 δ-프로테오박테리아, 특히 게오박터 및 관련된 속(genus)에서 공통적으로 발견된다. GEMM은 δ-프로테오박테리아 내에서 알테로모나달레스(Alteromonadales) 및 비브리오날레스(Vibrionales)에 편재되어 있다. GEMM은 퍼미큐트(Firmicute) 및 플란토마이세트(Plantomycete) 문(phylum)의 일부 목(order)에서도 공통적으로 발견된다. GEMM을 갖는 저명한 병원체는 콜레라 및 탄저 병원체를 포함한다.
서열 데이터가 유전자 해석을 포함하는 309종의 GEMM 예 중에서 297종의 예서 GEMM은 유전자에 대해 5' 조절 배향으로 존재하는데, 이것은 시스(cis)-조절 역할을 암시한다. GEMM에 의해 조절되는 것으로 추정되는 유전자는 다양한 기능을 나타내지만, 다수의 유전자는 세포외 환경 또는 막과 관련되고 많은 유전자가 운동성과 관련된다.
GEMM의 생물학적 역할의 이해는 GEMM이 조절하는 것으로 추측되는 매우 다양한 미생물 과정에서 유용하게 이용될 수 있다. 사실상, GEMM은 이미 여러 연구의 목적인 2개의 시스템, 즉 비브리오 콜레라 및 게오박테리아 설퍼리덕센스 종과 관련되어 있다. 비브리오 콜레라는 인간에서 콜레라를 유발하지만 그의 수명의 대부분을 물에서 보내고, 비브리오 콜레라는 물에서 많은 갑각류의 키틴-함유 외골격에 부착될 수 있다. GlcNAc(N-아세틸글루코사민)의 중합체인 키틴은 많은 비브리오 콜레라 유전자의 발현에 영향을 미치는 것으로 밝혀졌다(Meibom, 2004). GEMM은 이 키틴-유도된 유전자들 중 2종의 유전자를 조절하는 듯하다. 첫 번째 키틴-유도된 유전자인 gbpA는 키틴 비드(Meibom, 2004) 및 인간 상피세포(Kirn, 2005)에의 부착에 중요할 뿐만 아니라 마우스의 감염(Kirn, 2005)에도 중요하다.
두 번째 키틴-유도된 유전자는 tfoX VC이다. 놀랍게도, 키틴은 비브리오 콜레라에서 천연 경쟁을 유도하고(Meibom, 2004), tfoX VC의 발현은 상기 경쟁에 필수적이다. 비브리오 콜레라는 분리된 2종의 tfoX 도메인들에 상응하는 CDD 모델 COG3070 및 pfamO4994와 일치하는 2종의 유전자를 갖는다. 상기 2종의 도메인들은 10-25보다 더 우수한 RPSBLAST(Schaffer, 2001) E-값을 제공한다. 상기 도메인들 중 1종은 tfoX VC(좌위 VC1153)이다. GEMM은 tfoX GEMM(VC1722)으로 지칭되는 나머지 1종의 도메인을 조절하는 듯하다. 따라서, 비브리오 콜레라 및 관련된 세균에서 GEMM은 키틴-유도된 경쟁에 참여하거나, 또는 심지어 키틴 농도가 상승되어 있지 않은 환경 하에서 경쟁을 조절할 것이다.
게오박테리아 설퍼리덕센스 및 관련된 δ-프로테오박테리아는 전자 수용체로서 Fe(III)와 같은 금속 이온을 사용하여 유기 화합물을 산화시켜 ATP를 발생시킬 수 있다(Methe, 2003). GEMM은 게오박터 종에서 선모 조립 유전자와 관련되어 있다. 게오박터 설퍼리덕센스(Geobacter sulfurreducens) 내의 선모는 전기를 전도하는 것으로 밝혀져 있으므로(Reguera, 2005), 금속 이온을 환원하는 과정의 일부이다.
뿐만 아니라, GEMM은 게오박터 설퍼리덕센스 내의 7종의 사이토크롬 c 유전자를 조절하는 듯하다. 상기 세균은 111종의 잠재적 사이토크롬 c 유전자를 갖지만, 7종의 GEMM-관련 유전자들 중 5종의 GEMM-관련 유전자가 이전 연구에서 동정되었고 특별한 역할을 수행할 것이다. OmcS(외막 사이토크롬 S)는 게오박터 설퍼리덕센스의 외막 상에 매우 풍부하게 존재하는 2종의 단백질 중 1종이고 불용성 Fe(III) 산화물을 환원시키는 데에는 필요하지만 가용성 Fe(III) 시트레이트를 산화시키는 데에는 필요하지 않다(Mehta, 2005). OmcG 및 OmcH는 많은 조건 하에서 필수적인 사이토크롬 c인 OmcB의 생성에 필요하다(Kimm, 2006). OmcA 및 OmcT는 OmcG, OmcH 또는 OmcS와 관련되어 있다. 나머지 4종의 Omc, 즉 OmcB, OmcC, OmcE 및 OmcF의 해석만이 GEMM과 직접적으로 관련되지 않은 게오박터 설퍼리덕센스에서 남아있다.
공지된 리보스위치와 달리, GEMM은 매우 다양한 유전자 기능과 관련되어 있다(실시예 1의 표 2). 이 결과는 GEMM 리보스위치가 대사 경로의 조절을 위한 전형적인 피드백(feedback) 센서로서 기능하지 않음을 의미한다. 오히려, GEMM은 신호 전달도입 또는 가능하게는 세포-세포 정보교환에 관여하는 제2 메신저 분자를 감지한다(Bassler, 2006). 실시예 2는 상기 제2 메신저인 GEMM 모티프의 유발 분자가 사이클릭 다이-GMP임을 입증한다. 이 방식으로, 다양한 세균이 GEMM 및 그의 신호전달 분자를 사용하여 다양한 과정을 조절한다. 많은 GEMM-관련 유전자가 신호 전달도입 도메인을 코딩한다는 사실은 신호 전달도입 단백질의 대다수가 한 기작에 의해 조절됨을 암시한다. 실시예 2는 GEMM RNA가 실제로 새로이 발견된 리보스위치 클래스의 앱타머 구성요소로서 기능함을 입증한다.
C. SAH 리보스위치
SAH 모티프를 함유하는 SAH-반응성 리보스위치(SAH 리보스위치로도 지칭될 수 있음)는 분지된 줄기 구조를 포함한다(도 1 및 9A). 상기 SAH 모티프는 모듈 및 가변-길이 줄기를 포함하는 예측된 줄기 영역 내에서 공변이를 보이면서 서열 및 구조 면에서 고도로 보존되어 있다(도 1 및 9A). SAH 리보스위치는 실시예 1 및 3에 기재되어 있다. SAH 모티프는 주로 β-프로테오박테리아 및 일부 γ-프로테오박테리아, 및 특히 슈도모나스 속에서 SAH 대사와 관련되어 있는 유전자들에 대해 5' 조절 배향으로 발견된다. SAH는 SAM 대사 주기의 일부인데, 상기 대사 주기의 주요 구성요소들은 아미노산 메티오닌 및 이의 유도체인 호모시스테인을 포함한다. SAH는 메틸화 반응을 위해 보조인자로서 SAM을 사용하는 효소의 부산물이다. 전형적으로, SAH는 호모시스테인 및 아데노신으로 가수분해된다. 그 후, 호모시스테인은 메티오닌 및 궁극적으로 SAM을 합성하는 데 사용된다.
높은 농도의 SAH는 세포에게 유해한데, 이는 SAH가 많은 SAM-의존적 메틸트랜스퍼라제를 억제하기 때문이다(Ueland 1982). 따라서, 세포는 SAH의 농도가 독성을 나타내는 수준에 도달하기 전에 상응하는 SAH 농도 및 SAH의 처리를 감지할 필요가 있을 것이다. SAH 모티프와 관련된 유전자는 5-아데노실호모시스테인 가수분해효소(ahcY), 코발라민(cobalamin)-의존적 메티오닌 합성효소(metH), 및 메티오닌 합성에서 사용되는 메틸 공여체를 합성하는 메틸렌테트라하이드로폴레이트 환원효소(metF)이다. SAH 모티프의 이러한 유전적 정렬 및 그의 높은 보존도는 SAH를 감지하고 SAH의 파괴에 필요한 생성물을 발현하는 유전자의 발현을 활성화시키는 SAH 모티프의 역할과 일치한다. 실제로, 생화학적 증거 및 유전학적 증거는 상기 모티프가 SAH-감지 리보스위치임을 입증한다.
D. preQ
1
리보스위치(preQ
1
-II 또는 COG4708 모티프)
preQ1-반응성 리보스위치는 preQ1-II(COG4708 모티프로도 지칭될 수 있음)를 함유한다. preQ1 리보스위치, preQ1-II 리보스위치 또는 COG4708 리보스위치로도 지칭될 수 있는 상기 리보스위치는 스트렙토코커스의 몇몇 종 및 락토코커스 락티스에서 COG4708 유전자의 업스트림에서 발견되지만, 스트렙토코커스의 COG4708 유전자 패밀리의 일부는 이 리보스위치로서 추정되는 RNA 모티프를 갖지 않는다. COG4708 유전자는 막 단백질을 코딩하는 것으로 예측된다. preQ1-II 리보스위치는 실시예 1 및 4에 기재되어 있다.
COG4708 모티프가 계통발생적으로 고도로 구속되어 있고 6종의 서열들만을 각각 1 카피씩 갖지만, 상기 모티프는 공변이, 모듈 줄기 및 가변-길이 줄기를 보인다(도 1, 15 및 16A). 상기 모티프는 COG4708 유전자의 SD 서열과 중첩되는 슈도노트를 갖는데, 이것은 상기 모티프가 상기 유전자의 시스-조절자를 코딩함을 입증한다.
변경된 뉴클레오염기 preQ1을 감지하는 리보스위치는 최근에 특징규명되었다(Roth, 2007). 상기 리보스위치가 COG4708과 관련되어 있기 때문에, COG4708이 preQ1과 관련된 대사물질의 수송자라는 주장이 제기되었다. 따라서, COG4708 모티프 또한 preQ1-감지 리보스위치로 인정되었다. 실험은 이를 뒷받침한다. COG4708 모티프는 이전에 특징규명된 preQ1-감지 리보스위치와 서열 및 구조 면에서 유사성을 공유하지 않는다(Roth, 2007).
E. 세균에서 전사 종결의
리보스위치
조절
세균은 주로 2종의 전사 종결 방법을 이용한다. 일부 유전자들은 Rho 단백질에 의존하는 종결 신호를 도입하지만(J. P. Richardson, Biochimica et Biophysica Acta, 2002, 1577, 251), 다른 유전자들은 Rho-독립적 종결요소(고유 종결요소)를 사용하여 전사 연장 복합체(complex)를 불안정화시킨다(I. Gusarov, E. Nudler, Molecular Cell, 1999, 3, 495; E. Nudler, M. E. Gottesman, Genes to Cells, 2002, 7, 755). 후자 RNA 요소는 GC-풍부 줄기-루프에 이어 6 내지 9개의 유리딜 잔기로 이루어진 스트레치로 구성된다. 고유 종결요소는 세균 게놈 전체에 널리 분포되어 있고(F. Lillo, et al., 2002, 18, 971), 전형적으로 유전자 또는 오페론의 3'-말단에 위치한다. 흥미롭게는, 증가하는 수의 예가 5'-UTR 내에 위치한 고유 종결요소에 대해 관찰되고 있다.
세균에 의해 사용되는 매우 다양한 유전적 조절 방법 중에서 RNA 중합효소가 조절된 방식으로 5'-UTR 내의 종결 신호에 반응하는 부류에 속하는 유전적 조절 방법이 증가하고 있다(T. M. Henkin, Current Opinion in Microbiology, 2000, 3, 149). 일부 조건 하에서 RNA 중합효소 복합체는 외부 신호에 의해 종결 신호를 인지하거나 무시하도록 지시받는다. 전사 개시가 조절 없이 일어날지라도, mRNA 합성(및 유전자 발현)에 대한 조절은 궁극적으로 고유 종결요소의 조절에 의해 영향을 받는다. 2종 이상의 상호 배타적인 mRNA 구조 중 하나는 전사 종결 신호를 보내는 RNA 구조의 형성 또는 파괴를 초래한다. 일부 경우 RNA이고(F. J. Grundy, et al., Proceedings of the National Academy of Sciences of the United States of America, 2002, 99, 11121; T. M. Henkin, C. Yanofsky, Bioessays, 2002, 24, 700) 일부 경우 단백질인(J. Stulke, Archives of Microbiology, 2002, 177, 433) 트랜스-작용 인자는 일반적으로 특정 세포내 신호를 수용한 후 RNA 구조 중 하나를 안정화시키기 위해 필요하다. 리보스위치는 유전적 조절 기구에 의해 해석되는 대사 신호와 RNA 구조 조절 사이의 직접적 연결을 제공한다.
대다수의 임상적 항균 화합물은 4종의 세포내 과정 중 하나만을 표적으로 삼는다(Wolfson, 2006). 세균은 상기 과정들을 보호하기 위한 내성 기작을 잘 발달시켜 왔기 때문에(D'Costa, 2006), 약물 치료에 매우 민감한 새로운 표적을 발견하는 것이 유용하다. 민감한 과정 중 하나는 리보스위치에 의한 유전자 발현의 조절이다(Winkler, 2005). 전형적으로 일부 세균 mRNA의 5'-UTR에서 발견되는 공지된 리보스위치 클래스 각각의 구성원들은 특정한 기초 대사물질에 결합하도록 진화된 구조화된 수용체(또는 "앱타머")(Mandal, 2004)를 형성한다. 많은 경우, 리간드 결합은 결합된 대사물질의 합성 또는 수송에 관여하는 유전자 또는 유전자 군의 발현을 조절한다. 리보스위치에 의해 조절되는 생화학적 경로가 세균 생존을 위해 종종 필요하기 때문에, 리보스위치 표적화를 통한 상기 경로의 억제는 치명적일 수 있다.
몇몇 항균 대사물질 유사체는 리보스위치를 표적화시킴으로써 작용한다(Sudarsan, 2003; Sudarsan, 2005; Woolley, 1943). 예를 들어, 항균 티아민 유사체 피리티아민(Woolley 1943)은 티아민 피로포스페이트-결합 리보스위치를 표적화함으로써 작용할 가능성이 가장 높다(Sudarsan, 2005). 유사하게, 항균 라이신 유사체 L-아미노에틸시스테인(Shiota 1958)(AEC, 도 1b)은 바실러스 서브틸러스로부터의 lysC 리보스위치에 결합하고 lysC-조절된 레포터 유전자의 발현을 억제한다(Sudarsan, 2006). 뿐만 아니라, lysC 리보스위치는 AEC에 대한 내성을 나타내는 바실러스 서브틸러스(Lu, 1991) 및 이. 콜라이(Patte, 1998) 균주에서 돌연변이되어 있다.
본 명세서에 개시된 방법 및 조성물은 달리 명시하지 않은 한 특정 합성 방법, 특정 분석 기법 또는 특정 시약으로 한정되지 않고 따라서 다양할 수 있음을 이해해야 한다. 또한, 본 명세서에서 사용된 용어는 특정 실시양태를 설명하기 위한 것일 뿐 본 발명을 한정하기 위한 것이 아님을 이해해야 한다.
재료
본 명세서에 개시된 방법 및 조성물을 위해 사용될 수 있거나, 상기 방법 및 조성물과 병용될 수 있거나, 상기 방법 및 조성물의 제조에 사용될 수 있거나 상기 방법 및 조성물의 생성물인 재료, 조성물 및 성분이 개시되어 있다. 이 재료들 및 다른 재료들은 본 명세서에 개시되어 있고, 상기 재료의 조합, 서브세트, 상호작용, 군 등이 개시되어 있는 경우, 상기 화합물들의 다양한 개별적 및 집합적 조합 및 치환 각각에 대한 구체적 언급이 명시적으로 개시되어 있지 않더라도 각각이 본 명세서에 구체적으로 고려되고 개시되어 있음을 이해해야 한다. 예를 들어, 리보스위치 또는 앱타머 도메인이 개시되고 논의되어 있으며 리보스위치 또는 앱타머 도메인을 포함한 다수의 분자에 부가할 수 있는 다수의 변경이 논의되어 있는 경우, 리보스위치 또는 앱타머 도메인의 각각 및 모든 조합 및 치환 및 가능한 변경은 달리 명시되어 있지 않은 한 구체적으로 고려된다. 따라서, 분자 A, B 및 C의 클래스뿐만 아니라 분자 D, E 및 F의 클래스가 개시되어 있고 조합 분자 A-D의 예가 개시되어 있는 경우, 심지어 각각이 개별적으로 개시되어 있지 않더라도 각각은 개별적으로 및 총체적으로 고려된다. 따라서, 이 예에서, 조합 A-E, A-F, B-D, B-E, B-F, C-D, C-E 및 C-F가 각각 구체적으로 고려되고 A, B 및 C; D, E 및 F; 및 예시적 조합 A-D의 개시로부터 개시된 것으로 인정되어야 한다. 마찬가지로, 임의의 서브세트 또는 이의 조합도 구체적으로 고려되고 개시된다. 따라서, 예를 들어, A-E, B-F 및 C-E의 하위-군이 구체적으로 고려되고 A, B 및 C; D, E 및 F; 및 예시적 조합 A-D의 개시로부터 개시된 것으로 인정되어야 한다. 이 개념은 본 명세서에 개시된 조성물의 제조 방법 및 사용 방법에서 수반되는 단계를 포함하나 이로 한정되지 않는 본원의 모든 측면에 적용된다. 따라서, 수행될 수 있는 다양한 추가 단계가 존재하는 경우, 이 추가 단계는 본 명세서에 개시된 방법의 임의의 구체적 실시양태 또는 실시양태들의 조합을 이용하여 각각 수행할 수 있고, 이러한 조합은 각각 구체적으로 고려되고 개시된 것으로 인정되어야 함을 이해해야 한다.
A. 리보스위치
리보스위치는, 발현될 RNA 분자의 일부이면서 유발 분자와 결합하였을 때 상태를 변화시키는 발현 조절 요소이다. 리보스위치는 전형적으로 2개의 분리된 도메인, 즉 표적에 선별적으로 결합하는 도메인(앱타머 도메인)과 유전적 조절에 영향을 미치는 또 다른 도메인(발현 플랫폼 도메인)으로 절단될 수 있다. 유전자 발현의 대사물질-의존적 알로스테릭 조절을 야기하는 것은 상기 2개의 도메인 사이의 동적 상호작용이다. 단리된 리보스위치 및 재조합 리보스위치, 이러한 리보스위치를 함유하는 재조합 구축물, 상기 리보스위치에 작동가능하게 연결되어 있는 이종 서열, 및 상기 리보스위치, 리보스위치 재조합 구축물, 및 상기 이종 서열에 작동가능하게 연결된 리보스위치를 보유하는 세포 및 형질전환 유기체가 개시되어 있다. 이종 서열은 예를 들어, 레포터 단백질 또는 펩티드를 포함하는 원하는 단백질 또는 펩티드를 코딩하는 서열일 수 있다. 바람직한 리보스위치는 천연 발생적 리보스위치, 예컨대, 천연 발생적 사이클릭 다이-GMP 리보스위치이거나 이 리보스위치로부터 유도된다. 리보스위치는 인공 앱타머를 포함할 수 있거나 경우에 따라 인공 앱타머를 포함하지 않을 수 있다. 예를 들어, 인공 앱타머는 시험관내 진화 및/또는 시험관내 선별을 통해 디자인되거나 선별된 앱타머를 포함한다. 리보스위치는 천연 발생적 리보스위치의 컨센서스 서열, 예컨대, 사이클릭 다이-GMP 리보스위치, SAH 리보스위치, preQ1 리보스위치, Moco 리보스위치 또는 SAM-IV 리보스위치의 컨센서스 서열을 포함할 수 있다. 사이클리 다이-GMP 리보스위치의 컨센서스 서열은 도 1 및 3B에 표시되어 있다. 사이클릭 다이-GMP 리보스위치의 예는 도 2 및 3C에 표시되어 있다. SAH 리보스위치의 컨센서스 서열은 도 1 및 9A에 표시되어 있다. preQ1-II(preQ1-II 또는 COG4708 모티프) 리보스위치의 컨센서스 서열은 도 1, 15(서열) 및 16A(구조)에 표시되어 있다.
천연 발생적 리보스위치의 비-천연 유도체인 리보스위치가 개시되어 있다. 이 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 천연 발생적 리보스위치 및 드 노보(de novo)로 디자인된 리보스위치를 포함하는 개시된 리보스위치(이의 유도체 및 재조합 형태를 포함함)는 일반적으로 임의의 공급원으로부터 유래될 수 있다. 이러한 리보스위치들 중 임의의 리보스위치가 개시된 본 방법에서 또는 본 방법과 함께 사용될 수 있다. 그러나, 다양한 타입의 리보스위치가 정의될 수 있고, 이러한 서브타입들 중 일부는 특정 방법(일반적으로 본 명세서의 모든 곳에 기재되어 있음)에서 유용할 수 있다. 리보스위치의 종류에는 예를 들어, 천연 발생적 리보스위치, 천연 발생적 리보스위치의 유도체 및 변경된 형태, 키메라 리보스위치 및 재조합 리보스위치가 있다. 천연 발생적 리보스위치는 천연 상태로 발견되는 리보스위치의 서열을 갖는 리보스위치이다. 이러한 천연 발생적 리보스위치는 천연 상태로 발생되기 때문에 천연 발생적 리보스위치의 단리된 또는 재조합 형태일 수 있다. 즉, 리보스위치는 동일한 1차 구조를 가질 수 있되 새로운 유전적 면에서 또는 핵산 면에서 단리되어 있거나 개조되어 있을 수 있다. 컨센서스 리보스위치는 천연 발생적 리보스위치의 컨센서스 구조의 서열 및 특징을 갖는다. 키메라 리보스위치는 예를 들어, 임의의 클래스 또는 타입의 리보스위치에 속하는 리보스위치 또는 특정 클래스 또는 타입의 리보스위치에 속하는 리보스위치의 일부, 및 동일한 클래스 또는 타입의 리보스위치에 속하는 상이한 리보스위치 또는 임의의 상이한 클래스 또는 타입의 리보스위치에 속하는 상이한 리보스위치의 일부; 또는 임의의 클래스 또는 타입의 리보스위치에 속하는 리보스위치 또는 특정 클래스 또는 타입의 리보스위치에 속하는 리보스위치의 일부, 및 임의의 비-리보스위치 서열 또는 요소로 구성될 수 있다. 재조합 리보스위치는 새로운 유전적 면에서 또는 핵산 면에서 단리되어 있거나 개조되어 있는 리보스위치이다.
리보스위치는 단일 또는 다중 앱타머 도메인을 가질 수 있다. 다중 앱타머를 갖는 리보스위치 내의 앱타머 도메인들은 유발 분자의 상호협동적 결합을 보일 수 있거나 유발 분자의 상호협동적 결합을 보이지 않을 수 있다(즉, 앱타머들은 상호협동적 결합을 보일 필요가 없음). 엡타머 도메인들이 상호협동적 결합을 보이지 않는 경우, 앱타머 도메인들은 독립적 결합제인 것으로 지칭될 수 있다. 다중 앱터머를 갖는 리보스위치는 단일 또는 다중 발현 플랫폼 도메인을 가질 수 있다. 예를 들어, 유발 분자의 상호협동적 결합을 보이는 2개의 앱타머 도메인을 갖는 리보스위치는 상기 2개의 앱타머 도메인에 의해 조절되는 단일 발현 플랫폼 도메인에 연결될 수 있다. 다중 앱타머를 갖는 리보스위치는 링커를 통해 연결된 1개 이상의 앱타머를 가질 수 있다. 이러한 앱타머가 유발 분자의 상호협동적 결합을 보이는 경우, 링커는 상호협동적 링커일 수 있다.
앱타머 도메인들은 이들이 x와 x-1 사이에서 힐(Hill) 계수를 갖는 경우 상호협동적 결합을 보인다고 기재될 수 있고, 이때 x는 상호협동적 결합에 대해 분석될 앱타머 도메인의 수(또는 앱타머 도메인 상의 결합 부위의 수)이다. 따라서, 예를 들어, 2개의 앱타머 도메인을 갖는 리보스위치는 이 리보스위치가 2와 1 사이의 힐 계수를 갖는 경우 상호협동적 결합을 보인다고 기재될 수 있다. 사용된 x의 값은 상호협동적 결합에 대해 분석될 앱타머의 수(그러나, 반드시 리보스위치 내에 존재하는 앱타머 도메인의 수는 아님)에 좌우됨을 이해해야 한다. 이것은 리보스위치가 다중 앱타머 도메인을 가질 수 있고, 이때 일부 앱타머 도메인들만이 상호협동적 결합을 보이기 때문인 것으로 이해된다.
본 명세서에는 이종 앱타머 도메인 및 발현 플랫폼 도메인을 포함하는 키메라 리보스위치가 개시되어 있다. 즉, 키메라 리보스위치는 한 공급원으로부터 유래된 앱타머 도메인 및 또 다른 공급원으로부터 유래된 발현 플랫폼 도메인으로 구성될 수 있다. 이종 공급원은 예를 들어, 상이한 특정 리보스위치, 상이한 타입의 리보스위치 또는 상이한 클래스의 리보스위치일 수 있다. 또한, 이종 앱타머는 비-리보스위치 앱타머로부터 유래될 수 있다. 이종 발현 플랫폼 도메인은 비-리보스위치 공급원으로부터 유래될 수도 있다.
변경된 리보스위치 또는 유도체 리보스위치는 시험관내 선별 및 진화 기법을 이용하여 제조할 수 있다. 일반적으로, 리보스위치에 적용되는 시험관내 진화 기법은 리보스위치 서열의 일부가 변경되어 있지만 리보스위치의 나머지 부분이 변경되지 않은 상태로 유지되어 있는 변이체 리보스위치 세트를 제조하는 단계를 포함한다. 그 다음, 변이체 리보스위치 세트의 활성화, 불활성화 또는 차단(또는 다른 기능적 또는 구조적 기준)을 평가할 수 있고, 원하는 기준을 충족시키는 변이체 리보스위치를 사용 또는 추가 진화 순환을 위해 선별할 수 있다. 변이체의 발생에 유용한 염기 리보스위치는 본 명세서에 개시된 특정 또는 컨센서스 리보스위치이다. 컨센서스 리보스위치는 시험관내 선별 및 진화를 위해 리보스위치의 어느 부분을 변경시켜야 할지를 알아내는 데 사용될 수 있다.
본 명세서에는 조절이 변화된 변경된 리보스위치도 개시되어 있다. 리보스위치의 조절은 앱타머 도메인을 리보스위치(키메라 리보스위치)의 발현 플랫폼에 작동가능하게 연결함으로써 변경시킬 수 있다. 이어서, 앱타머 도메인은 예를 들어, 상기 앱타머 도메인의 유발 분자의 작용을 통해 리보스위치의 조절을 매개할 수 있다. 앱타머 도메인은 예를 들어, 리보스위치의 정상 또는 천연 앱타머 도메인을 신규 앱타머 도메인으로 치환시키는 방법을 포함하는 임의의 적당한 방법으로 리보스위치의 발현 플랫폼 도메인에 작동가능하게 연결시킬 수 있다. 일반적으로, 앱타머 도메인의 출처인 리보스위치를 활성화시킬 수 있거나, 불활성화시킬 수 있거나 또는 차단할 수 있는 임의의 화합물 또는 조건은 키메라 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 데 사용될 수 있다.
본 명세서에는 불활성화된 리보스위치도 개시되어 있다. 리보스위치는 리보스위치를 공유결합적으로 변경시킴으로써(예를 들어, 리보스위치의 일부를 가교결합시키거나 화합물을 리보스위치에 커플링시킴으로써) 불활성화시킬 수 있다. 이러한 방식의 리보스위치 불활성화는 예를 들어, 유발 분자가 리보스위치에 결합하는 것을 방해하거나, 유발 분자의 결합 시 리보스위치의 상태 변화를 방해하거나, 또는 유발 분자의 결합 시 리보스위치의 발현 플랫폼 도메인이 발현에 영향을 미치는 것을 방해하는 변경으로부터 비롯될 수 있다.
또한, 본 명세서에는 바이오센서 리보스위치가 개시되어 있다. 바이오센서 리보스위치는 그의 동족 유발 분자의 존재 하에서 검출가능한 신호를 발생시키는 개조된 리보스위치이다. 유용한 바이오센서 리보스위치는 유발 분자의 역치 수준 이상에서 유발될 수 있다. 바이오센서 리보스위치는 생체내 또는 시험관내에서 사용되도록 디자인될 수 있다. 예를 들어, 신호로서 작용하는 단백질 또는 신호를 발생시키는 데 관여하는 단백질을 코딩하는 레포터 RNA에 작동가능하게 연결된 바이오센서 리보스위치는 리보스위치/레포터를 코딩하는 핵산 구축물을 보유하도록 세포 또는 유기체를 개조함으로써 생체 내에서 사용할 수 있다. 시험관내에서 사용되는 바이오센서 리보스위치의 일례는 리보스위치의 활성화 상태에 의존하는 변화를 표시하는 신호인 구조-의존적 표지를 포함하는 리보스위치이다. 이러한 바이오센서 리보스위치는 바람직하게는 천연 발생적 리보스위치의 앱타머 도메인 또는 천연 발생적 리보스위치로부터 유도된 앱타머 도메인을 사용한다. 바이오센서 리보스위치는 다양한 상황 및 플랫폼에서 사용될 수 있다. 예를 들어, 바이오센서 리보스위치는 고체 지지체, 예컨대, 플레이트, 칩, 스트립 및 웰과 함께 사용될 수 있다.
본 명세서에는 새로운 유발 분자를 인식하는 변경된 리보스위치 또는 유도체 리보스위치가 개시되어 있다. 새로운 유발 분자를 인식하는 새로운 리보스위치 및/또는 새로운 앱타머는 공지된 리보스위치에 대해 선별될 수 있거나, 공지된 리보스위치로부터 디자인될 수 있거나, 또는 공지된 리보스위치로부터 유도될 수 있다. 이것은 예를 들어, 리보스위치 내의 앱타머 변이체 세트를 생성하는 단계, 원하는 화합물의 존재 하에서 변이체 리보스위치의 활성화를 평가하는 단계, 활성화된 변이체 리보스위치(또는, 예를 들어, 가장 고도로 또는 가장 선별적으로 활성화된 리보스위치)를 선별하는 단계, 및 원하는 활성, 특이성, 활성과 특이성의 조합 또는 성질들의 다른 조합을 갖는 변이체 리보스위치를 수득할 때까지 상기 단계들을 반복하는 단계에 의해 달성될 수 있다.
일반적으로, 임의의 앱타머 도메인은 발현 플랫폼 도메인 내의 조절된 가닥이 앱타머 도메인의 조절 가닥에 상보적이도록 설계하거나 개조함으로써 임의의 발현 플랫폼 도메인과 함께 사용되도록 개조될 수 있다. 별법으로, 앱타머의 서열 및 앱타머 도메인의 조절 가닥의 서열은 상기 조절 가닥이 발현 플랫폼 내의 기능적으로 유의한 서열에 상보적이도록 개조될 수 있다. 예를 들어, 조절 가닥은 이 조절 가닥과 SD 서열 사이에 줄기 구조가 형성될 때 상기 SD 서열이 리보좀에 접근할 수 없게 되어 번역 개시가 감소되거나 방해되도록 RNA의 SD 서열에 상보적이게끔 개조될 수 있다. 앱타머 가닥이, 앱타머 도메인 내에서 P1 줄기가 형성되도록 상응하는 서열 변화를 가질 것임을 인식해야 한다. 상호협동적 결합을 나타내는 다수의 앱타머를 갖는 리보스위치의 경우, 활성화 앱타머(발현 플랫폼 도메인과 상호작용하는 앱타머)의 P1 줄기만이 SD 서열과 함께 줄기 구조를 형성하도록 디자인될 필요가 있다.
또 다른 예로서, 전사 종결요소가 RNA 분자(가장 편리하게는 RNA의 비-번역 영역)에 부가될 수 있고, 이때 상기 전사 종결요소의 서열의 일부는 앱타머 도메인의 조절 가닥에 상보적이다. 이것은 앱타머 도메인의 조절 서열이 앱타머 가닥 및 조절된 가닥과 함께 대안적 줄기 구조를 형성하게 하여 리보스위치의 활성화 또는 불활성화 시 전사 종결요소 줄기가 형성되거나 파괴되게 할 것이다. 임의의 다른 발현 요소는 대안적 줄기 구조의 유사한 디자인에 의한 리보스위치의 조절 하에 놓일 수 있다.
리보스위치에 의해 조절되는 전사 종결요소의 경우, 전사의 속도 및 리보스위치 및 발현 플랫폼 요소의 공간적 배치가 적당한 조절에 중요할 수 있다. 전사 속도는 예를 들어, 전사를 중단시키고 리보스위치로 하여금 유발 분자를 형성하고 감지할 수 있게 하는 중합효소 중단 요소(예컨대, 일련의 유리딘 잔기)를 포함시킴으로써 조절할 수 있다.
본 명세서에는 코딩 영역에 작동가능하게 연결된 리보스위치를 포함하는 RNA를 코딩하는 핵산 분자를 포함하는 조절가능한 유전자 발현 구축물이 개시되어 있는데, 이때 상기 리보스위치는 상기 RNA의 발현을 조절하고, 상기 리보스위치 및 상기 코딩 영역은 이종 영역이다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치, SAM-반응성 리보스위치 또는 이들의 유도체일 수 있다. 리보스위치는 앱타머 도메인 및 발현 플랫폼 도메인을 포함하고, 이때 상기 앱타머 도메인 및 상기 발현 플랫폼 도메인은 이종 도메인이다. 상기 리보스위치는 2개 이상의 앱타머 도메인 및 발현 플랫폼 도메인을 포함할 수 있고, 이때 상기 앱타머 도메인 중 1개 이상의 앱타머 도메인 및 상기 발현 플랫폼 도메인은 이종 도메인이다. 앱타머 도메인 중 2개 이상의 앱타머 도메인은 상호협동적 결합을 나타낼 수 있다.
본 명세서에는 이종 리보스위치 및 코딩 영역을 포함하는 RNA 분자도 개시되어 있다. 즉, 상기 RNA 분자는 한 공급원으로부터의 리보스위치 및 또 다른 공급원으로부터의 코딩 영역으로 구성된다. 상기 이종 공급원은 예를 들어, 상이한 RNA 분자, 상이한 전사체, 상이한 유전자로부터의 RNA 또는 전사체, 상이한 세포로부터의 RNA 또는 전사체, 상이한 유기체로부터의 RNA 또는 전사체, 상이한 종으로부터의 RNA 또는 전사체, 천연 서열 및 인공 또는 개조된 서열, 특정 리보스위치, 상이한 타입의 리보스위치 또는 상이한 클래스의 리보스위치일 수 있다.
본 명세서에서 사용된 용어 "코딩 영역"은 아미노산을 코딩하는 핵산의 임의의 영역을 지칭한다. 이것은 코돈 또는 코돈에 대한 주형을 포함하는 핵산 가닥, 이중가닥 핵산 분자의 경우 상기 핵산 가닥의 상보체 둘다를 포함할 수 있다. 코딩 영역이 아닌 핵산의 영역은 비-코딩 영역으로 지칭될 수 있다. 전형적으로 전사되는 메신저 RNA 분자는 5' 말단 및 3' 말단 둘다에서 비-코딩 영역을 포함한다. 진핵 mRNA 분자는 내부 비-코딩 영역, 예컨대, 인트론도 포함할 수 있다. 특정 타입의 RNA 분자는 기능성 코딩 영역, 예컨대, tRNA 및 rRNA 분자를 포함하지 않는다. 기능성 코딩 영역을 포함하지 않는 RNA 분자(비-코딩 RNA 분자로 지칭될 수 있음)의 발현 또한 본 명세서에 개시된 리보스위치에 의해 조절되거나 영향을 받을 수 있다. 따라서, 본 명세서에 개시된 리보스위치는 리보스위치와 코딩 영역의 작동가능한 연결에 대해 본 명세서에 개시된 바와 같이 임의의 방법으로 비-코딩 RNA 분자에 작동가능하게 연결시킬 수 있다. 상기 리보스위치는 코딩 영역에 작동가능하게 연결된 리보스위치를 포함하는 RNA의 조절에 대해 본 명세서에 개시된 바와 같이 상기 비-코딩 RNA의 발현을 조절할 수 있다. 임의의 핵산 분자의 기능도 본 명세서에 개시된 리보스위치에 의해 조절되거나 영향을 받을 수 있다. 그 예로는 RNA; DNA; 및 펩티드 핵산(PNA), 모폴리노 및 잠겨진(locked) 핵산(LNA)뿐만 아니라 글리콜 핵산(GNA) 및 트레오스 핵산(TNA)을 포함하는 인공 핵산이 있으나 이들로 한정되지 않는다. 개시된 본 방법에서, 리보스위치는 예를 들어, 코딩 영역의 발현, 코딩된 단백질의 발현, 비-코딩 RNA 분자의 발현, RNA 또는 코딩 영역의 전사 또는 코딩된 단백질의 번역을 조절할 수 있다.
1. 앱타머 도메인
앱타머는 특정 화합물 및 특정 클래스의 화합물에 선별적으로 결합할 수 있는 핵산 분절 및 구조체이다. 리보스위치는 유발 분자의 결합 시 상기 리보스위치의 상태 또는 구조를 변화시키는 앱타머 도메인을 갖는다. 기능적 리보스위치에서, 앱타머 도메인에 연결된 발현 플랫폼 도메인의 상태 또는 구조는 유발 분자가 상기 앱타머 도메인에 결합할 때 변한다. 리보스위치의 앱타머 도메인은 예를 들어, 리보스위치의 천연 앱타머 도메인, 인공 앱타머, 개조된, 선별된, 진화된 또는 유도된 앱타머 또는 앱타머 도메인을 포함하는 임의의 공급원으로부터 유래될 수 있다. 리보스위치 내의 앱타머는 일반적으로 예컨대, 줄기 구조를 형성함으로써 상기 연결된 발현 플랫폼 도메인의 일부와 상호작용할 수 있는 1개 이상의 부분을 갖는다. 상기 줄기 구조는 유발 분자의 결합 시 형성되거나 파괴될 것이다.
다양한 천연 리보스위치의 컨센서스 앱타머 도메인은 미국 특허출원 공개 제2005-0053951호의 도 11 및 본 명세서의 임의의 부분에 개시되어 있다. 사이클릭 다이-GMP 리보스위치의 컨센서스 서열 및 구조는 도 1 및 3에서 확인할 수 있다. SAH 리보스위치의 컨센서스 서열은 도 1 및 9A에 개시되어 있다. preQ1-II(preQ1-II 또는 COG4708 모티프) 리보스위치의 컨센서스 서열은 도 1, 15(서열) 및 16A(구조)에 개시되어 있다. 이 앱타머 도메인들(이 도메인에서 구현되는 직접적인 변이체 모두를 포함함)은 리보스위치에서 사용될 수 있다. 상기 컨센서스 서열 및 구조는 서열 및 구조에서의 변이를 표시하고 있다. 표시된 변이 내의 앱타머 도메인은 본 명세서에서 직접적인 변이체로서 지칭된다. 상기 앱타머 도메인(이 도메인에서 구형되는 모든 직접적인 변이체를 포함함)은 리보스위치 내에서 사용될 수 있다. 컨센서스 서열 및 구조는 서열 및 구조 내의 변경을 표시한다. 표시된 변경 내에 있는 앱타머 도메인은 본 명세서에서 직접적 변이체로서 지칭된다. 상기 앱타머 도메인은 변경된 또는 변이체 앱타머 도메인을 생성하도록 변경될 수 있다. 보존적 변경은 염기쌍 내의 뉴클레오티드가 상보적인 상태를 유지하도록 염기쌍이 형성된 뉴클레오티드에서의 임의의 변화를 포함한다. 중등도(moderate) 변경은 표시된 길이 범위의 20% 이하의 줄기 또는 루프(이에 대한 길이 또는 길이 범위는 표시되어 있음) 길이의 변화를 포함한다. 루프 및 줄기 길이는 컨센서스 구조가 특정 길이의 줄기 또는 루프를 보여주는 경우 또는 길이 범위가 기재되어 있거나 표시되어 있는 경우 "표시된" 것으로 간주된다. 중등도 변경은 표시된 길이 범위의 40% 이하의 줄기 또는 루프(이에 대한 길이 또는 길이 범위는 표시되어 있지 않음) 길이의 변화를 포함한다. 중등도 변경은 앱타머 도메인의 비-특정된 부분의 기능적 변이체도 포함한다.
개시된 리보스위치의 앱타머 도메인은 임의의 다른 목적을 위해 사용될 수도 있고 임의의 다른 내용에서 앱타머로서 사용될 수도 있다. 예를 들어, 앱타머는 구조 변화가 RNA의 기능에 영향을 미칠 수 있는 경우 라이보자임, 다른 분자 스위치 및 임의의 RNA 분자를 조절하는 데 사용될 수 있다.
2. 발현 플랫폼 도메인
발현 플랫폼 도메인은 리보스위치를 포함하는 RNA 분자의 발현에 영향을 미치는 리보스위치의 일부이다. 발현 플랫폼 도메인은 일반적으로, 예컨대, 줄기 구조를 형성함으로써 그 자신에 연결된 앱타머 도메인의 일부와 상호작용할 수 있는 1개 이상의 부위를 갖는다. 이 줄기 구조는 유발 분자의 결합 시 형성되거나 파괴될 것이다. 상기 줄기 구조는 일반적으로 발현 조절 구조이거나 발현 조절 구조의 형성을 방해한다. 발현 조절 구조는 상기 구조를 보유하는 RNA 분자의 발현을 허용하거나, 방해하거나, 상승시키거나 또는 억제하는 구조이다. 그 예로는 SD 서열, 개시 코돈, 전사 종결요소, 안정성 신호, 및 프로세싱 신호, 예컨대, RNA 스플라이싱 접합부 및 조절 요소가 있다.
B. 유발 분자
유발 분자는 리보스위치를 활성화시킬 수 있는 분자 및 화합물이다. 이것은 리보스위치에 대한 천연 또는 통상의 유발 분자 및 리보스위치를 활성화시킬 수 있는 다른 화합물을 포함한다. 천연 또는 통상의 유발 분자는 천연 상태의 소정의 리보스위치에 대한 유발 분자이거나, 또는 일부 비-천연 리보스위치의 경우 리보스위치의 디자인 또는 리보스위치의 선별(예컨대, 시험관내 선별 또는 시험관내 진화 기법에 의한 선별)에서 사용되는 유발 분자이다.
C. 화합물
본 명세서에는 리보스위치를 활성화시킬 수 있거나, 불활성화시킬 수 있거나 또는 차단할 수 있는 화합물, 및 상기 화합물을 함유하는 조성물도 개시되어 있다. 리보스위치는 유발 분자의 결합 또는 제거를 통해 유전자 발현을 조절하는 기능을 수행한다. 화합물은 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 데 사용될 수 있다. 리보스위치에 대한 유발 분자(및 다른 활성화 화합물)는 리보스위치를 활성화시키는 데 사용될 수 있다. 상기 유발 분자 이외의 화합물은 일반적으로 리보스위치를 불활성화시키거나 차단하는 데 사용될 수 있다. 리보스위치는 예를 들어, 리보스위치의 존재 하에서 유발 분자를 제거함에 의해 불활성화될 수도 있다. 리보스위치는 예를 들어, 리보스위치를 활성화시키지 않는 유발 분자의 유사체의 결합에 의해 차단될 수 있다.
본 명세서에는 RNA 분자의 발현 또는 RNA 분자를 코딩하는 유전자의 발현을 변화시키는 화합물도 개시되어 있는데, 이때 상기 RNA 분자는 리보스위치를 포함한다. 이것은 화합물을 RNA 분자와 접촉시켜 달성할 수 있다. 리보스위치는 유발 분자의 결합 또는 제거를 통해 유전자 발현을 조절하는 기능을 수행한다. 따라서, 리보스위치를 포함하는 원하는 RNA 분자를 상기 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 조건으로 처리함으로써 RNA의 발현을 변화시킬 수 있다. 발현은 예를 들어, 전사의 종결 또는 라이보좀과 RNA의 결합 차단의 결과로서 변화될 수 있다. 유발 분자의 결합은 리보스위치의 성질에 따라 RNA 분자의 발현을 감소시키거나 방해하거나, 또는 RNA 분자의 발현을 촉진하거나 증가시킬 수 있다.
본 명세서에는 RNA 분자의 발현, 또는 RNA 분자를 코딩하는 유전자의 발현을 조절하는 화합물도 개시되어 있다. 또한, 본 명세서에는 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단함으로써 리보스위치를 함유하는 천연 발생적 유전자 또는 RNA의 발현을 조절하는 화합물이 개시되어 있다. 상기 유전자가 이 유전자를 보유하는 세포 또는 유기체의 생존에 필수적인 경우, 리보스위치의 활성화, 불활성화 또는 차단은 상기 세포 또는 유기체의 사망, 생장 정지 또는 약화를 초래할 수 있다.
본 명세서에는 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단함으로써 상기 리보스위치를 포함하는 단리된, 개조된 또는 재조합 유전자 또는 RNA의 발현을 조절하는 화합물도 개시되어 있다. 유전자가 원하는 발현 생성물을 코딩하는 경우, 리보스위치의 활성화 또는 불활성화를 이용하여 상기 유전자의 발현을 유도함으로써 발현 생성물이 생성되게 할 수 있다. 유전자가 유전자 발현 또는 또 다른 세포내 과정의 유도자 또는 억제자를 코딩하는 경우, 리보스위치의 활성화, 불활성화 또는 차단은 다른 조절되는 유전자 또는 세포내 과정의 유도, 억제 또는 탈억제를 야기할 수 있다. 많은 이러한 2차적 조절 효과는 공지되어 있고 리보스위치와 함께 이용하기에 적합할 수 있다. 이러한 조절을 위한 1차 조절로서의 리보스위치의 이점은 리보스위치 유발 분자가 작은 비-항원성 분자일 수 있다는 점이다.
본 명세서에는 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 화합물을 동정하는 방법도 개시되어 있다. 예를 들어, 리보스위치를 활성화시키는 화합물은 시험 화합물과 리보스위치를 접촉시키고 리보스위치의 활성화를 평가함으로써 동정할 수 있다. 리보스위치가 활성화되는 경우, 시험 화합물은 리보스위치를 활성화시키는 화합물로서 동정된다. 리보스위치의 활성화는 임의의 적절한 방식으로 평가될 수 있다. 예를 들어, 리보스위치는 레포터 RNA에 연결될 수 있고, 상기 레포터 RNA의 발현, 발현 수준 또는 발현 수준 변화가 시험 화합물의 존재 및 부재 하에서 측정될 수 있다. 또 다른 예로서, 리보스위치는 리보스위치의 활성화 상태에 의존하는 변화를 표시하는 신호인 구조-의존적 표지를 포함할 수 있다. 이러한 리보스위치는 바람직하게는 천연 발생적 리보스위치의 앱타머 도메인 또는 천연 발생적 리보스위치로부터 유도된 앱타머 도메인을 사용한다. 알 수 있는 바와 같이, 리보스위치의 활성화 평가는 대조군 분석 또는 측정을 이용하거나 이용하지 않고 수행할 수 있다. 리보스위치를 불활성화시키는 화합물의 동정 방법은 유사한 방식으로 수행할 수 있다.
리보스위치를 차단하는 화합물의 동정은 임의의 적절한 방식으로 달성할 수 있다. 예를 들어, 분석은 리보스위치를 활성화시키거나 불활성화시키는 것으로 공지되어 있는 화합물의 존재 및 시험 화합물의 존재 하에서 리보스위치의 활성화 또는 불활성화를 평가하기 위해 수행할 수 있다. 활성화 또는 불활성화가 시험 화합물의 부재 하에서 관찰되는 것처럼 관찰되지 않는 경우, 시험 화합물은 리보스위치의 활성화 또는 불활성화를 차단하는 화합물로서 동정된다.
본 명세서에는 사이클릭 다이-GMP, SAH, preQ1, Moco 및 SAM-IV 리보스위치와 상호작용하는 화합물들이 개시된다. 이 화합물들의 추가 변형된 버전은 RNA 구조 내에서 다른 작용기와의 새로운 접촉을 형성하여 리보스위치에의 개선된 결합을 보일 수 있다. 나아가, 스카폴드(scaffold)의 두 영역을 변경시킴으로써 (다른 특징들 중에서) 생체이용률, 독성 및 합성 용이성의 조절을 조율할 수 있는데, 이는 리보스위치에 대한 구조 모델이, 많은 변경이 이 부위들에서 가능함을 보여주기 때문이다.
또한, 고처리 스크리닝을 이용하여 분자 인식의 표준 또는 비-표준 모드로 리보스위치 RNA에도 결합하는 신규 화학적 스카폴드를 전체적으로 밝힐 수 있다. 겔-기초 검출 방법 및 칩-기초 검출 방법을 이용한 알로스테릭 리보자임 분석 및 인-라인 프로빙 분석을 포함하는 다수의 다양한 방법을 이용하여 대사물질 결합 RNA를 검출할 수 있다. 본 명세서에는 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 화합물을 동정하고 동정된 화합물을 제조함으로써 수득된 화합물도 개시되어 있다. 이것은 예를 들어, 본 명세서의 임의의 부분에 개시되어 있는 화합물 동정 방법을 동정된 화합물의 제조 방법과 병용함으로써 달성할 수 있다. 예를 들어, 화합물은 시험 화합물과 리보스위치를 접촉시키고, 리보스위치의 활성화를 평가하고, 리보스위치가 시험 화합물에 의해 활성화되는 경우, 리보스위치를 활성화시키는 시험 화합물을 상기 화합물로서 제조함으로써 수득할 수 있다.
또한, 본 명세서에는 화합물에 의한 리보스위치의 활성화, 불활성화 또는 차단을 조사하고 조사된 화합물을 제조함으로써 수득한 화합물도 개시되어 있다. 이것은 예를 들어, 본 명세서의 임의의 부분에 개시된 화합물 활성화, 불활성화 또는 차단 평가 방법과 조사된 화합물의 제조 방법을 병용함으로써 달성할 수 있다. 예를 들어, 화합물은 시험 화합물과 리보스위치를 접촉시키고, 리보스위치의 활성화를 평가하고, 리보스위치가 시험 화합물에 의해 활성화되는 경우, 리보스위치를 활성화시키는 시험 화합물을 상기 화합물로서 제조함으로써 수득할 수 있다. 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 화합물의 능력에 대해 화합물을 조사하는 것은 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 것으로 이전에 공지되지 않은 화합물을 동정하는 것, 및 화합물이 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 것으로 이미 공지되어 있는 경우 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단화하는 화합물의 능력을 평가하는 것 둘다를 의미한다.
본 명세서에서 사용된 바와 같이, 용어 "치환된"은 유기 화합물의 모든 허용가능한 치환기를 포함한다. 넓은 의미에서, 허용가능한 치환기는 유기 화합물의 비환형 및 환형, 분지된 및 비분지된, 탄소환 및 헤테로환, 및 방향족 및 비-방향족 치환기를 포함한다. 예시적인 치환기는 예를 들어, 하기에 기재된 치환기를 포함한다. 허용가능한 치환기는 1종 이상일 수 있고 적절한 유기 화합물에 대해 동일하거나 상이할 수 있다. 본 개시의 목적상, 헤테로원자, 예컨대, 질소는 수소 치환기, 및/또는 헤테로원자의 원자가를 충족시키는, 본 명세서에 기재된 유기 화합물의 임의의 허용가능한 치환기를 가질 수 있다. 본 개시내용은 유기 화합물의 허용가능한 치환기에 의해 임의의 방식으로 한정되어서는 안 된다. 또한, 용어 "치환" 또는 "로 치환된"은 이러한 치환이 치환된 원자 및 치환기의 허용된 원자가에 따르고 상기 치환이 안정한 화합물, 예를 들어, 재정렬, 고리화, 제거 등과 같은 변환을 천연적으로 겪지 않은 화합물을 생성시키는 한 함축적 의미를 포함한다.
"A1", "A2", "A3" 및 "A4"는 본 명세서에서 다양한 특정 치환기들을 나타내는 부호로서 사용된다. 상기 부호들은 본 명세서에 개시된 치환기로 한정되지 않고 임의의 치환기일 수 있으며, 상기 부호들이 한 경우에서 특정 치환기인 것으로 정의되는 경우 다른 경우에서는 다른 치환기들로서 정의될 수 있다.
본 명세서에서 사용된 용어 "알킬"은 탄소 원자수 1 내지 24의 분지된 또는 비-분지된 포화 탄화수소 기, 예컨대, 메틸, 에틸, n-프로필, 아이소프로필, n-부틸, 아이소부틸, t-부틸, 펜틸, 헥실, 헵틸, 옥틸, 노닐, 데실, 도데실, 테트라데실, 헥사데실, 에이코실, 테트라코실 등이다. 또한, 알킬 기는 치환되거나 비-치환될 수 있다. 알킬 기는 이하에 기재되는 바와 같이 알킬, 할로겐화된 알킬, 알콕시, 알케닐, 알키닐, 아릴, 헤테로아릴, 알데하이드, 아미노, 카복실산, 에스터, 에테르, 할라이드, 하이드록시, 케톤, 설포-옥소, 설포닐, 설폰, 설폭사이드 또는 티올을 포함하나 이들로 한정되지 않는 1종 이상의 기로 치환될 수 있다. 용어 "저급 알킬"은 6개 이하의 탄소 원자를 갖는 알킬 기, 예컨대, 메틸, 에틸, 프로필, 아이소프로필, 부틸, sec-부틸, 아이소-부틸, tert-부틸, 펜틸, 헥실 등이다.
명세서 전체에 걸쳐 "알킬"은 일반적으로 비-치환된 알킬 기 및 치환된 알킬 기 둘다를 지칭하기 위해 사용되나, 치환된 알킬 기는 알킬 기 상의 특정 치환기를 확인함으로써 본 명세서에서 구체적으로 지칭되기도 한다. 예를 들어, 용어 "할로겐화된 알킬"은 구체적으로 1개 이상의 할라이드, 예컨대, 불소, 염소, 브롬 또는 요오드로 치환된 알킬 기를 지칭한다. 용어 "알콕시알킬"은 구체적으로 이하에 기재되는 바와 같이 1개 이상의 알콕시 기로 치환된 알킬 기를 지칭한다. 용어 "알킬아미노"는 구체적으로 이하에 기재되는 바와 같이 1종 이상의 기로 치환된 알킬 기를 지칭한다. 용어 "알킬"이 한 경우에서 사용되고 "할로겐화된 알킬"과 같은 특정 용어가 또 다른 경우에서 사용되는 경우, 용어 "알킬"이 "할로겐화된 알킬"과 같은 특정 용어를 지칭하지 않음을 내포하는 것은 아니다.
이 관행은 본 명세서에 기재된 다른 기의 경우에도 적용된다. 즉, "사이클로알킬"과 같은 용어가 비-치환된 사이클로알킬 기 및 치환된 사이클로알킬 기 둘다를 지칭하지만, 치환된 기는 본 명세서에서 구체적으로 확인될 수 있고, 예를 들어, 특정 치환된 사이클로알킬은 예컨대, "알킬사이클로알킬"로 지칭될 수 있다. 유사하게, 치환된 알콕시는 예를 들어, "할로겐화된 알콕시"로 구체적으로 지칭될 수 있고, 특정 치환된 알케닐은 예를 들어, "알케닐알코올"일 수 있다. 또한, "사이클로알킬"과 같은 일반적 용어 및 "알킬사이클로알킬"과 같은 특정 용어의 사용 관행은 상기 일반적 용어가 상기 특정 용어를 포함하지 않음을 내포하는 것은 아니다.
본 명세서에서 사용된 용어 "알콕시"는 단일 말단 에테르 결합을 통해 결합된 알킬 기이고, 즉 "알콕시" 기는 A1이 상기 정의된 알킬인 -OA1로서 정의될 수 있다.
본 명세서에서 사용된 용어 "알케닐"은 1개 이상의 탄소-탄소 이중 결합을 함유하는 화학식으로 표시되는, 탄소 원자수 2 내지 24의 탄화수소 기이다. 비대칭 구조, 예컨대, (A1A2)C=C(A3A4)는 E 이성질체 및 Z 이성질체 둘다를 포함한다. 이것은 본 명세서에서 비대칭 알켄이 존재하는 화학식에서 추정될 수 있거나, 결합 부호 C=C로 명확히 표시될 수 있다. 알케닐 기는 이하에 기재되는 바와 같이 알킬, 할로겐화된 알킬, 알콕시, 알케닐, 알키닐, 아릴, 헤테로아릴, 알데하이드, 아마이드, 카복실산, 에스터, 에테르, 할라이드, 하이드록시, 케톤, 설포-옥소, 설포닐, 설폰, 설폭사이드 또는 티올를 포함하나 이들로 한정되지 않는 1종 이상의 기로 치환될 수 있다.
본 명세서에서 사용된 용어 "알키닐"은 1개 이상의 탄소-탄소 삼중 결합을 함유하는 화학식으로 표시되는, 탄소 원자수 2 내지 24의 탄화수소 기이다. 알키닐 기는 이하에 기재되는 바와 같이 알킬, 할로겐화된 알킬, 알콕시, 알케닐, 알키닐, 아릴, 헤테로아릴, 알데하이드, 아마이드, 카복실산, 에스터, 에테르, 할라이드, 하이드록시, 케톤, 설포-옥소, 설포닐, 설폰, 설폭사이드 또는 티올을 포함하나 이들로 한정되지 않는 1종 이상의 기로 치환될 수 있다.
본 명세에서 사용된 용어 "아릴"은 벤젠, 나프탈렌, 페닐, 바이페닐, 페녹시벤젠 등을 포함하나 이들로 한정되지 않는 임의의 탄소-기재 방향족 기를 함유하는 기이다. 또한, 용어 "아릴"은 방향족 기의 고리 내에 도입된 1개 이상의 헤테로원자를 갖는 방향족 기를 함유하는 기로서 정의되는 "헤테로아릴"을 포함한다. 헤테로원자의 예로는 질소, 산소, 황 및 인이 있으나 이들로 한정되지 않는다. 마찬가지로, 용어 "아릴"에도 포함되는 용어 "비-헤테로아릴"은 헤테로원자를 포함하지 않는 방향족 기를 함유하는 기로 정의된다. 아릴 기는 치환되거나 비-치환될 수 있다. 아릴 기는 본 명세서에 기재된 바와 같이 알킬, 할로겐화된 알킬, 알콕시, 알케닐, 알키닐, 아릴, 헤테로아릴, 알데하이드, 아미노, 카복실산, 에스터, 에테르, 할라이드, 하이드록시, 케톤, 설포-옥소, 설포닐, 설폰, 설폭사이드 또는 티올을 포함하나 이들로 한정되지 않는 1종 이상의 기로 치환될 수 있다. 용어 "바이아릴"은 아릴 기의 일종이고 아릴의 정의에 포함된다. 바이아릴은 나프탈렌에서와 같이 융합된 고리 구조를 통해 서로 결합되거나 바이페닐에서와 같이 1개 이상의 탄소-탄소 결합을 통해 부착된 2개의 아릴 기를 지칭한다.
본 명세서에서 사용된 용어 "사이클로알킬"은 3개 이상의 탄소 원자로 구성된 비-방향족 탄소-기재 고리이다. 사이클로알킬 기의 예로는 사이클로프로필, 사이클로부틸, 사이클로펜틸, 사이클로헥실 등을 포함하나 이들로 한정되지 않는다. 용어 "헤테로사이클로알킬"은 고리 탄소 원자들 중 1개 이상의 탄소 원자가 헤테로원자, 예컨대, 질소, 산소, 황 또는 인(이들로 한정되지 않음)으로 치환되어 있는, 상기 정의된 바와 같은 사이클로알킬 기이다. 사이클로알킬 기 및 헤테로사이클로알킬 기는 치환되거나 비-치환될 수 있다. 사이클로알킬 기 및 헤테로사이클로알킬 기는 본 명세서에 기재된 바와 같이 알킬, 알콕시, 알케닐, 알키닐, 아릴, 헤테로아릴, 알데하이드, 아미노, 카복실산, 에스터, 에테르, 할라이드, 하이드록시, 케톤, 설포-옥소, 설포닐, 설폰, 설폭사이드 또는 티올을 포함하나 이들로 한정되지 않는 1종 이상의 기로 치환될 수 있다.
본 명세서에서 사용된 용어 "사이클로알케닐"은 3개 이상의 탄소 원자로 구성되어 있고 1개 이상의 이중 결합, 즉 C=C를 함유하는 비-방향족 탄소-기재 고리이다. 사이클로알케닐 기의 예로는 사이클로프로페닐, 사이클로부테닐, 사이클로펜테닐, 사이클로펜타다이에닐, 사이클로헥세닐, 사이클로헥사다이에닐 등이 있으나 이들로 한정되지 않는다. 용어 "헤테로사이클로알케닐"은 상기 정의된 사이클로알케닐 기의 일종이고 용어 "사이클로알케닐"의 의미 내에 포함되며, 이때 고리 탄소 원자들 중 1개 이상의 탄소 원자는 헤테로원자, 예컨대, 질소, 산소, 황 또는 인(이들로 한정되지 않음)으로 치환된다. 사이클로알케닐 기 및 헤테로사이클로알케닐 기는 치환되거나 비-치환될 수 있다. 사이클로알케닐 기 및 헤테로사이클로알케닐 기는 본 명세서에 기재된 바와 같이 알킬, 알콕시, 알케닐, 알키닐, 아릴, 헤테로아릴, 알데하이드, 아미노, 카복실산, 에스터, 에테르, 할라이드, 하이드록시, 케톤, 설포-옥소, 설포닐, 설폰, 설폭사이드 또는 티올을 포함하나 이들로 한정되지 않는 1종 이상의 기로 치환될 수 있다.
본 명세서에서 사용된 용어 "사이클릭 기"는 아릴 기, 비-아릴 기(즉, 사이클로알킬, 헤테로사이클로알킬, 사이클로알케닐 및 헤테로사이클로알케닐 기) 또는 이들 둘다를 지칭한다. 사이클릭 기는 치환되거나 비-치환될 수 있는 1개 이상의 고리 시스템을 갖는다. 사이클릭 기는 1개 이상의 아릴 기, 1개 이상의 비-아릴 기, 또는 1개 이상의 아릴 기 및 1개 이상의 비-아릴 기를 가질 수 있다.
본 명세서에서 사용된 용어 "알데하이드"는 화학식 -C(O)H로 표시된다. 본 명세서 전체에서 "C(O)"는 C=O에 대한 단축 표현이다.
본 명세서에서 사용된 용어 "아민" 또는 "아미노"는 화학식 NA1A2A3으로 표시되고, 이때 A1, A2 및 A3은 독립적으로 수소, 알킬, 할로겐화된 알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 사이클로알킬, 사이클로알케닐, 헤테로사이클로알킬 또는 헤테로사이클로알케닐 기일 수 있다.
본 명세서에서 사용된 용어 "카복실산"은 화학식 -C(O)OH로 표시된다. 본 명세서에서 사용된 "카복실레이트"는 화학식 -C(O)O-로 표시된다.
본 명세서에서 사용된 용어 "에스터"는 화학식 -OC(O)A1 또는 -C(O)OA1로 표시되고, 이때 A1은 알킬, 할로겐화된 알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 사이클로알킬, 사이클로알케닐, 헤테로사이클로알킬 또는 헤테로사이클로알케닐 기일 수 있다.
본 명세서에서 사용된 용어 "에테르"는 화학식 A1OA2로 표시되고, 이때 A1 및 A2는 독립적으로 알킬, 할로겐화된 알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 사이클로알킬, 사이클로알케닐, 헤테로사이클로알킬 또는 헤테로사이클로알케닐 기일 수 있다.
본 명세서에서 사용된 용어 "케톤"은 화학식 A1C(O)A2로 표시되고, 이때 A1 및 A2는 독립적으로 알킬, 할로겐화된 알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 사이클로알킬, 사이클로알케닐, 헤테로사이클로알킬 또는 헤테로사이클로알케닐 기일 수 있다.
본 명세서에서 사용된 용어 "할라이드"는 할로겐, 즉 불소, 염소, 브롬 및 요오드를 지칭한다.
본 명세서에서 사용된 용어 "하이드록실"은 화학식 -OH로 표시된다.
본 명세서에서 사용된 용어 "설포-옥소"는 화학식 -S(O)A1(즉, "설포닐"), A1S(O)A2(즉, "설폭사이드"), -S(O)2A1, A1SO2A2(즉, "설폰"), -OS(O)2A1 또는 -OS(O)2OA1로 표시되고, 이때 A1 및 A2는 수소, 알킬, 할로겐화된 알킬, 알케닐, 알키닐, 아릴, 헤테로아릴, 사이클로알킬, 사이클로알케닐, 헤테로사이클로알킬 또는 헤테로사이클로알케닐 기일 수 있다. 본 명세서 전체에서 "S(O)"는 S=O의 단축 표현이다.
본 명세서에서 사용된 용어 "설포닐아미노" 또는 "설폰아마이드"는 화학식 -S(O)2NH-로 표시된다.
본 명세서에서 사용된 용어 "티올"은 화학식 -SH로 표시된다.
본 명세서에서 사용된 바와 같이, n이 정수인 "Rn"은 전술된 기들 중 1종 이상의 기를 독립적으로 가질 수 있다. 선택되는 기에 따라, 제1 기는 제2 기 내에 도입될 수 있거나, 또는 제1 기는 제2 기에 대한 펜던트 기(즉, 부착된 기)일 수 있다. 예를 들어, 어구 "아미노 기를 포함하는 알킬 기"에서, 아미노 기는 알킬 기의 골격 내에 도입될 수 있다. 별법으로, 아미노 기는 알킬 기의 골격에 부착될 수 있다. 선택되는 기의 성질은 제1 기가 파묻히는지 아니면 제2 기에 부착되는지를 결정할 것이다.
달리 명시하지 않은 한, 직선으로만 표시되고 쐐기 또는 대시(-) 선으로 표시되지 않은 화학적 결합을 갖는 화학식은 각각의 가능한 이성질체, 예컨대, 각각의 거울상이성질체 및 부분입체이성질체, 및 이성질체의 혼합물, 예컨대, 라세미체 또는 스칼레미체 혼합물을 고려한 것이다.
본 명세서에 개시된 일부 물질, 화합물, 조성물 및 성분은 상업적으로 입수할 수 있거나, 또는 당업자에게 일반적으로 공지되어 있는 기법을 이용하여 용이하게 합성할 수 있다. 예를 들어, 개시된 본 화합물 및 조성물을 제조하는 데 있어서 사용되는 출발 물질 및 시약은 상업적 공급처, 예컨대, 알드리치 케미칼 캄퍼니(미국 위스콘신주 밀워키 소재), 아크로스 오가닉스(미국 뉴저지주 모리스 플레인스 소재), 피셔 사이언티픽(미국 펜실베니아주 피츠버그 소재) 또는 시그마(미국 미조리주 세인트 루이스 소재)로부터 입수할 수 있거나, 또는 문헌, 예컨대, 문헌[Fieser and Fieser's Reagents for Organic Synthesis, Volumes 1-17 (John Wiley and Sons, 1991); Rodd's Chemistry of Carbon Compounds, Volumes 1-5 and Supplementals (Elsevier Science Publishers, 1989); Organic Reactions, Volumes 1-40 (John Wiley and Sons, 1991); March's Advanced Organic Chemistry, (John Wiley and Sons, 4th Edition); and Larock's Comprehensive Organic Transformations (VCH Publishers Inc., 1989)]에 기재된 절차에 따라 당업자에게 공지된 방법에 의해 제조된다.
개시된 리보스위치를 활성화시키는 화합물은 사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG; 사이클릭 다이-GMP-반응성 리보스위치를 활성화시킬 수 있는 사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG의 유도체; SAH; SAH-반응성 리보스위치를 활성화시킬 수 있는 SAH의 유도체; preQ1; preQ1-반응성 리보스위치를 활성화시킬 수 있는 preQ1의 유도체; Moco; Moco-반응성 리보스위치를 활성화시킬 수 있는 Moco의 유도체; SAM; 및 SAM-반응성 리보스위치를 활성화시킬 수 있는 SAM의 유도체를 포함한다. SAM-IV 리보스위치를 활성화시키는 화합물은 MeAzaAdoMet일 수도 있다.
SAH-반응성 리보스위치의 활성화의 경우, 화합물은 SAH일 수 있다. 상기 화합물은 SAH-반응성 리보스위치를 활성화시킬 수 있는 SAH의 유도체일 수도 있다. 예를 들어, 상기 화합물은 SAC일 수 있다. 도 12B는 SAH-반응성 리보스위치를 활성화시킬 수 있는 화합물에 중요한 구조 요소를 보여준다.
preQ1-반응성 리보스위치(및 preQ1-반응성 리보스위치로부터 유도된 리보스위치)의 활성화의 경우, 화합물은 위치 1에서 있는 N이 C, O 또는 S로 치환될 수 있고 위치 2에 있는 아미노 기가 수소결합 공여체로 치환될 수 있으며 위치 6에 있는 산소가 수소결합 수용체로 치환될 수 있고 위치 7에 있는 아미노 기가 수소결합 수용체로 치환될 수 있고 질소가 수소결합 공여체로 치환될 수 있거나 유도체화될 수 있는 preQ1의 유도체일 수 있다.
특정 잔기 또는 기가 본 명세서에서 수소결합 공여체 또는 수용체로 지칭될 수 있지만 이 용어는 언급 용이성을 위해 다양한 치환기를 단순히 분류하는 데 사용됨을 이해해야 한다. 이러한 용어는 특정 잔기가 리보스위치 또는 몇몇 다른 화합물과의 수소결합에 실제로 참여함을 의미하는 것으로 해석되어서는 안 된다. 예를 들어, 본 명세서에서 수소결합 수용체(또는 공여체)로 지칭되는 잔기는 리보스위치 또는 다른 화합물의 소수성 상호작용, 이온성 상호작용, 반데르발스 상호작용 또는 다른 타입의 상호작용에 단독으로 또는 부가적으로 관여할 수 있다.
본 명세서에 개시된 일부 기들은 본 명세서에서 수소결합 수용체 및 수소결합 공여체 둘다로서 언급될 수 있다는 것도 이해해야 한다. 예를 들어, -OH는 수소 원자를 공여함으로써 수소결합 공여체일 수 있지만, 산소 원자 상의 1개 이상의 비-결합된 전자쌍을 통해 수소결합 수용체로 기능할 수도 있다. 따라서, 본 명세서 전체에서 다양한 잔기들은 수소결합 공여체 및 수용체일 수 있고 그 자체로서 언급될 수 있다.
상기 정의 내에 있는 모든 화합물은 본 명세서에 구체적으로 개시되고 본 명세서에 구체적으로 개시되는 것으로 간주되어야 한다. 또한, 상기 정의 내에서 확인될 수 있는 모든 하위-군은 본 명세서에 구체적으로 개시되고 본 명세서에 구체적으로 개시되는 것으로 간주되어야 한다. 따라서, 임의의 화합물 또는 화합물의 하위-군은 화합물의 사용에 구체적으로 포함될 수 있거나 사용으로부터 배제될 수 있거나, 또는 화합물의 목록에 포함될 수 있거나 화합물의 목록으로부터 배제될 수 있다. 예를 들어, 각 화합물이 상기 정의된 바와 같고 사이클릭 다이-GMP-반응성 리보스위치를 활성화시킬 수 있는 일군의 화합물이 고려된다.
리보스위치와 상호작용하는 화합물에 대해 본 명세서에 기재된 특정한 접촉 및 상호작용(예컨대, 수소결합 공여 또는 수용)은 바람직하지만 화합물과 리보스위치의 상호작용에 필수적이지는 않음을 이해해야 한다. 예를 들어, 화합물은 개시된 접촉 및 상호작용을 갖는 화합물보다 더 낮은 친화성 및/또는 선별성으로 리보스위치와 상호작용할 수 있다. 또한, 화합물 상의 상이한 또는 추가 작용기는 리보스위치와의 새로운 접촉, 상이한 접촉 및/또는 보상적 접촉을 도입할 수 있다. 이러한 작용기는 리보스위치의 다른 부분과의 접촉 및 상호작용을 가질 수 있고 갖도록 디자인될 수 있다. 이러한 접촉 및 상호작용은 유발 분자 및 모핵 구조의 접촉 및 상호작용을 보상할 수 있다.
D. 구축물, 벡터 및 발현 시스템
개시된 리보스위치는 임의의 적절한 발현 시스템과 함께 사용될 수 있다. 재조합 발현은 벡터, 예컨대, 플라스미드를 사용하여 유용하게 달성한다. 상기 벡터는 발현될 리보스위치-코딩 서열 및 RNA(예컨대, 단백질 코딩 RNA)에 작동가능하게 연결된 프로모터를 포함할 수 있다. 또한, 벡터는 전사 및 번역에 필요한 다른 요소들도 포함할 수 있다. 본 명세서에서 사용된 바와 같이, 벡터는 외래 DNA를 코딩하는 임의의 운반체를 지칭한다. 따라서, 벡터는 외래 핵산을 분해 없이 세포 내로 수송하는 물질이고 핵산이 전달되는 세포 내에서 핵산을 발현시키는 프로모터를 포함한다. 벡터는 플라스미드, 바이러스 핵산, 바이러스, 파지 핵산, 파지, 코스미드 및 인공 염색체를 포함하나 이들로 한정되지 않는다. 리보스위치-조절된 구축물을 운반하기에 적합한 다양한 원핵 발현 벡터 및 진핵 발현 벡터를 제조할 수 있다. 이러한 발현 벡터는 예를 들어, pET, pET3d, pCR2.1, pBAD, pUC 및 효모 벡터를 포함한다. 상기 벡터는 예를 들어, 다양한 생체내 및 시험관내 조건 하에서 사용될 수 있다.
바이러스 벡터는 아데노바이러스, 아데노-관련 바이러스, 허피스 바이러스, 백시니아 바이러스, 폴리오 바이러스, AIDS 바이러스, 향신경성 바이러스, 신드비스(Sindbis) 및 다른 RNA 바이러스(HIV 골격을 갖는 바이러스를 포함함)를 포함한다. 벡터로서 사용되기에 적합하게 만드는 바이러스의 성질을 공유하는 임의의 바이러스 패밀리도 유용하다. 버마(Verma)(1995)에 기재된 레트로바이러스 벡터는 뮤린 말로니 백혈병 바이러스(MMLV), 및 벡터로서의 MMLV의 바람직한 성질을 발현하는 레트로바이러스를 포함한다. 전형적으로, 바이러스 벡터는 비-구조적 초기 유전자, 구조적 후기 유전자, RNA 중합효소 III 전사체, 복제 및 캡시드화에 필수적인 도립된 말단 반복부, 및 바이러스 게놈의 전사 및 복제를 조절하는 프로모터를 함유한다. 바이러스가 벡터로서 개조된 경우, 전형적으로 바이러스의 초기 유전자들 중 1종 이상은 제거되고, 유전자 또는 유전자/프로모터 카세트는 제거된 바이러스 DNA 대신에 바이러스 게놈 내로 삽입된다.
"프로모터"는 일반적으로 전사 개시 부위에 대해 상대적으로 고정된 위치에 있을 때 기능하는 DNA의 서열 또는 서열들이다. "프로모터"는 RNA 중합효소 및 전사 인자의 기본 상호작용에 필요한 핵심 요소를 함유하고 업스트림 요소 및 반응 요소를 함유할 수 있다.
"인핸서"는 일반적으로 전사 개시 부위로부터 고정되지 않은 거리에서 기능하는 DNA의 서열을 의미하고 전사 유니트에 대해 5'(Laimins, 1981) 또는 3'(Lusky et al., 1983) 방향에 존재할 수 있다. 나아가, 인핸서는 인트론 내에 존재할 수 있을 뿐만 아니라(Banerji et al., 1983) 코딩 서열 자체 내에도 존재할 수 있다(Osborne et al., 1984). 인핸서의 길이는 통상 10 내지 300 bp이고, 인핸서는 시스 조절자로 작용한다. 인핸서는 근처에 있는 프로모터로부터의 전사를 증가시키는 작용을 한다. 프로모터처럼 인핸서도 종종 전사 조절을 매개하는 반응 요소를 함유한다. 인핸서는 종종 발현의 조절을 결정한다.
진핵 숙주 세포(효모, 진균, 곤충, 식물, 동물, 인간 또는 유핵 세포)에서 사용되는 발현 벡터는 mRNA 발현에 영향을 미칠 수 있는 전사 종결에 필요한 서열을 함유할 수도 있다. 이 영역은 조직 인자 단백질을 코딩하는 mRNA의 비-번역 부분 내에 있는 폴리아데닐화된 분절로서 전사된다. 3' 비-번역 영역은 전사 종결 부위도 포함한다. 전사 유니트는 폴리아데닐화 영역도 함유하는 것이 바람직하다. 이 영역의 한 이점은 상기 영역이, 전사되는 유니트가 mRNA처럼 프로세싱되고 수송될 가능성을 증가시킨다는 점이다. 발현 구축물 내의 폴리아데닐화 신호의 확인 및 사용은 잘 확립되어 있다. 트랜스진 구축물 내의 동종 폴리아데닐화 신호를 사용하는 것이 바람직하다.
벡터는 마커 생성물을 코딩하는 핵산 서열을 포함할 수 있다. 이 마커 생성물은 유전자가 세포로 전달되고 일단 전달되면 발현되는지를 확인하는 데 사용된다. 바람직한 마커 유전자는 β-갈락토시다제 및 녹색 형광 단백질을 코딩하는 에스케리치아 콜라이 lacZ 유전자이다.
일부 실시양태에서, 마커는 선별가능한 마커일 수 있다. 이러한 선별가능한 마커가 숙주 세포 내로 성공적으로 전달된 경우, 형질전환된 숙주 세포는 선별 압력 하에 놓였을 때 생존할 수 있다. 널리 이용되는 2종의 상이한 선별 방법이 있다. 첫 번째 방법은 세포 대사, 및 보충된 배지와 무관하게 생장하는 능력을 결여하는 돌연변이체 세포주의 사용에 기초한 방법이다. 두 번째 방법은 임의의 타입의 세포에서 이용되며 돌연변이체 세포주의 사용을 필요로 하지 않는 선별 방법을 의미하는 우성 선별이다. 상기 방법은 전형적으로 숙주 세포의 생장을 정지시키기 위한 약물을 사용한다. 신규 유전자를 갖는 세포는 약물 내성을 전달하는 단백질을 발현할 것이고 선별에서 생존할 것이다. 상기 우성 선별의 예는 네오마이신(Southern and Berg, 1982), 마이코페놀산(Mulligan and Berg, 1980) 또는 하이그로마이신(Sugden et al., 1985)을 사용한다.
유전자 전달은 플라스미드, 바이러스 벡터, 바이러스 핵산, 파지 핵산, 파지, 코스미드 및 인공 염색체를 포함하나 이들로 한정되지 않는 유전 물질의 직접적인 전달, 또는 세포 또는 담체, 예컨대, 양이온성 리포좀 내의 유전 물질의 전달을 통해 달성될 수 있다. 상기 방법은 당업계에 잘 공지되어 있고 본 명세서에 기재된 방법에서 사용될 수 있도록 용이하게 개조될 수 있다. 전달 벡터는 유전자를 세포 내로 전달하는 데 사용되는 임의의 뉴클레오티드 구축물(예컨대, 플라스미드)일 수 있거나, 또는 유전자를 전달하기 위한 일반적 수단의 일부, 예컨대, 재조합 레트로바이러스 또는 아데노바이러스의 일부일 수 있다(Ram et al., Cancer Res. 53:83-88, (1993)). 바이러스 벡터, 화학적 형질감염체, 또는 물리-기계적 방법, 예컨대, 전기천공 및 DNA의 직접적 확산을 비롯한, 형질감염에 적합한 수단은 예를 들어, 문헌(Wolff, J. A., et al., Science, 247, 1465-1468, (1990); and Wolff, J. A. Nature, 352, 815-818, (1991))에 기재되어 있다.
1. 바이러스 벡터
바람직한 바이러스 벡터는 아데노바이러스, 아데노-관련 바이러스, 허피스 바이러스, 백시니아 바이러스, 폴리오 바이러스, AIDS 바이러스, 향신경성 바이러스, 신드비스 및 다른 RNA 바이러스(HIV 골격을 갖는 바이러스를 포함함)이다. 벡터로서 사용되기에 적합하게 만드는 바이러스의 성질을 공유하는 임의의 바이러스 패밀리도 바람직하다. 바람직한 레트로바이러스는 MMLV, 및 벡터로서의 MMLV의 바람직한 성질을 발현하는 레트로바이러스를 포함한다. 레트로바이러스 벡터는 다른 바이러스 벡터보다 큰 유전적 적재물, 즉 트랜스진 또는 마커 유전자를 운반할 수 있고 이러한 이유로 통상적으로 사용되는 벡터이다. 그러나, 레트로바이러스 벡터는 비-증식 세포에서는 유용하지 않다. 아데노바이러스 벡터는 비교적 안정하고 다루기 용이하며 높은 역가를 갖고 에어로졸 제제로 전달될 수 있고 비-분열 세포를 형질감염시킬 수 있다. 폭스 바이러스 벡터는 유전자를 삽입하기 위한 여러 부위를갖기 때문에 열적안정성을 나타내며 실온에서 저장될 수 있다. 바람직한 실시양태는 바이러스 항원에 의해 유발되는 숙주 유기체의 면역 반응을 억제하도록 개조된 바이러스 벡터이다. 이러한 타입의 바람직한 벡터는 인터루킨 8 또는 10에 대한 코딩 영역을 운반할 것이다.
바이러스 벡터는 유전자를 세포 내로 도입하는 대다수의 화학적 또는 물리적 방법보다 더 높은 처리능력(유전자 도입 능력)을 갖는다. 전형적으로, 바이러스 벡터는 비-구조적 초기 유전자, 구조적 후기 유전자, RNA 중합효소 III 전사체, 복제 및 캡시드화에 필요한 도립된 말단 반복부, 및 바이러스 게놈의 전사 및 복제를 조절하는 프로모터를 함유한다. 바이러스가 벡터로서 개조된 경우, 전형적으로 바이러스의 초기 유전자들 중 1종 이상의 초기 유전자가 제거되어 있고 유전자 또는 유전자/프로모터 카세트는 제거된 바이러스 DNA 대신에 바이러스 게놈 내로 삽입되어 있다. 이러한 타입의 구축물은 약 8 kb 이하의 외래 유전 물질을 운반할 수 있다. 제거된 초기 유전자의 필수적 기능은 전형적으로 상기 초기 유전자의 유전자 생성물을 트랜스(trans)로 발현하도록 개조된 세포주에 의해 공급된다.
i. 레트로바이러스 벡터
레트로바이러스는 임의의 타입, 서브패밀리, 속 또는 주성을 비롯한 레트로비리대의 바이러스 패밀리에 속하는 동물 바이러스이다. 레트로바이러스 벡터는 일반적으로 본 명세서에 참고로 도입되는 문헌(Verma, I.M., Retroviral vectors for gene transfer. In Microbiology-1985, American Society for Microbiology, pp. 229-232, Washington, (1985))에 기재되어 있다. 유전자 요법을 위해 레트로바이러스 벡터를 사용하는 방법의 예는 그 교시가 본원에 참고로 도입되는 미국 특허 제4,868,116호 및 제4,980,286호, 국제특허출원 공개 제WO 90/02806호 및 제WO 89/07136호, 및 문헌(Mulligan, Science 260:926-932 (1993))에 기재되어 있다.
레트로바이러스는 본질적으로 핵산 적재물로 채워진 팩키지이다. 핵산 적재물은 복제된 딸분자가 팩키지 코트 내에 효율적으로 팩키징되게 하는 팩키징 신호를 보유한다. 팩키징 신호 이외에, 복제 및 복제된 바이러스의 팩키징을 위해 시스로 요구되는 다수의 분자가 존재한다. 전형적으로, 레트로바이러스 게놈은 단백질 코트의 제조에 관여하는 gag, pol 및 env 유전자를 함유한다. 표적 세포로 전달되는 외래 DNA에 의해 전형적으로 치환되는 유전자는 gag, pol 및 env 유전자이다. 레트로바이러스 벡터는 전형적으로 팩키지 코트 내로의 도입을 위한 팩키징 신호; gag 전사 유니트의 시작 부위임을 알려주는 서열; 역전사의 tRNA 프라이머와 결합하는 프라이머 결합 부위를 포함하는 역전사에 필요한 요소; DNA 합성 과정 동안에 RNA 가닥의 전환을 안내하는 말단 반복부 서열; DNA 합성의 제2 가닥의 합성을 위한 프라이밍 부위로서 작용하는 5' 방향으로부터 3' 방향으로의 퓨린 풍부 서열 LTR; 및 DNA 상태의 레트로바이러스가 숙주 게놈 내로 삽입될 수 있게 하는, LTR의 말단 근처에 있는 특정 서열을 함유한다. gag, pol 및 env 유전자의 제거는 약 8 kb의 외래 서열이 바이러스 게놈 내로 삽입되어 역전사될 수 있게 하고 복제 시 새로운 레트로바이러스 입자 내로 팩키징될 수 있게 한다. 이러한 양의 핵산은 각 전사체의 크기에 따라 1개 유전자 내지 많은 수의 유전자의 전달에 충분하다. 다른 유전자들과 함께 양성 또는 음성 선별가능한 마커를 삽입체 내에 포함시키는 것이 바람직하다.
대다수의 레트로바이러스 벡터 내의 복제 기구 및 팩키징 단백질(gag, pol 및 env)은 제거되어 있기 때문에, 벡터는 전형적으로 상기 벡터를 팩키징 세포주 내에 도입함으로써 발생시킨다. 팩키징 세포주는 복제 및 팩키징 기구를 함유하나 임의의 팩키징 신호를 갖지 않은 레트로바이러스로 형질감염되거나 형질전환된 세포주이다. 선택된 DNA를 운반하는 벡터가 상기 세포주 내로 형질감염되는 경우, 원하는 유전자를 함유하는 벡터는 헬퍼 세포에 의해 시스로 제공된 기구에 의해 복제되어 새로운 레트로바이러스 입자 내로 팩키징된다. 상기 기구에 대한 게놈은 상기 게놈이 필수적인 신호를 결여하고 있기 때문에 팩키징되지 않는다.
ii. 아데노바이러스 벡터
복제-결손 아데노바이러스의 구축은 문헌(Berkner et al., J. Virology 61:1213-1220 (1987); Massie et al., Mol. Cell. Biol. 6:2872-2883 (1986); Haj-Ahmad et al., J. Virology 51:261-21 A (1986); Davidson et al., J. Virology 61:1226-1239 (1987); Zhang "Generation and identification of recombinant adenovirus by liposome-mediated transfection and PCR analysis" BioTechniques 15:868-872 (1993))에 기재되어 있다. 벡터로서의 상기 바이러스 사용의 이점은 상기 바이러스가 초기 감염된 세포 내에서 복제할 수 있되 새로운 감염성 바이러스 입자를 형성할 수 없기 때문에 다른 타입의 세포로 퍼질 수 있는 정도에 있어서 한계가 있다는 점이다. 재조합 아데노바이러스는 기도 상피, 간세포, 혈관 상피, 중추신경계(CNS) 실질조직 및 다수의 다른 조직 부위로의 직접적인 생체내 전달 후 고효율 유전자 전달을 달성하는 것으로 밝혀져 있다(Morsy, J. Clin. Invest. 92:1580-1586 (1993); Kirshenbaum, J. Clin. Invest. 92:381-387 (1993); Roessler, J. Clin. Invest. 92:1085-1092 (1993); Moullier, Nature Genetics 4:154-159 (1993); La Salle, Science 259:988-990 (1993); Gomez-Foix, J. Biol. Chem. 267:25129-25134 (1992); Rich, Human Gene Therapy 4:461-476 (1993); Zabner, Nature Genetics 6:75-83 (1994); Guzman, Circulation Research 73:1201-1207 (1993); Bout, Human Gene Therapy 5:3-10 (1994); Zabner, Cell 75:207-216 (1993); Caillaud, Eur. J. Neuroscience 5:1287-1291 (1993); and Ragot, J. Gen. Virology 74:501-507 (1993)). 재조합 아데노바이러스는 이 바이러스가 특정 세포 표면 수용체에 결합한 후 상기 바이러스가 야생형 또는 동일한 방식 또는 복제-결손 아데노바이러스와 동일한 방식으로 수용체-매개된 세포내이입에 의해 내부이입됨으로써 유전자 형질도입을 달성한다(Chardonnet and Dales, Virology 40:462-477 (1970); Brown and Burlingham, J. Virology 12:386-396 (1973); Svensson and Persson, J. Virology 55:442-449 (1985); Seth, et al., J. Virol. 51:650-655 (1984); Seth, et al., Mol. Cell. Biol. 4:1528-1533 (1984); Varga et al., J. Virology 65:6061-6070 (1991); Wickham et al., Cell 73:309-319 (1993)).
바람직한 바이러스 벡터는 E1 유전자가 제거되어 있는 아데노바이러스를 기초로 한 바이러스 벡터이고, 이 비리온은 인간 293 세포주와 같은 세포주 내에서 발생된다. 또 다른 바람직한 실시양태에서, E1 유전자 및 E3 유전자 둘다 아데노바이러스 게놈으로부터 제거된다.
또 다른 타입의 바이러스 벡터는 아데노-관련 바이러스(AAV)를 기초로 한 것이다. 이 결손 파보바이러스는 이것이 많은 타입의 세포를 감염시킬 수 있고 인간에 대해 비-병원성을 나타내기 때문에 바람직한 벡터이다. AAV 타입 벡터는 약 4 내지 5 kb를 수송할 수 있고, 야생형 AAV는 19번 염색체 내로 안정하게 삽입되는 것으로 공지되어 있다. 이 부위 특이적 삽입 성질을 갖는 벡터가 바람직하다. 이러한 타입의 벡터의 특히 바람직한 실시양태는 미국 캘리포니아주 샌 프란시스코에 소재하는 아비겐(Avigen)에 의해 제조된 P4.1 C 벡터인데, 이 벡터는 허피스 심플렉스 바이러스 티미딘 키나제 유전자인 HSV-tk 및/또는 마커 유전자, 예컨대, 녹색 형광 단백질인 GFP를 코딩하는 유전자를 함유할 수 있다.
바이러스 및 레트로바이러스 내에 삽입된 유전자는 통상 프로모터, 및/또는 원하는 유전자 생성물의 발현을 조절하는 데 도움을 주는 인핸서를 함유한다. 프로모터는 일반적으로 전사 개시 부위에 대해 상대적으로 고정된 위치에 존재하는 경우 작용하는 DNA의 서열 또는 서열들이다. 프로모터는 RNA 중합효소와 전사 인자의 기본 상호작용에 필요한 코어 요소를 함유하고 업스트림 요소 및 반응 요소를 함유할 수 있다.
2. 바이러스 프로모터 및 인핸서
포유동물 숙주 세포 내에서 벡터로부터의 전사를 조절하는 바람직한 프로모터는 다양한 공급원, 예를 들어, 폴리오마, 원숭이 바이러스 40(SV40), 아데노바이러스, 레트로바이러스, B형 간염 바이러스 및 가장 바람직하게는 사이토메갈로바이러스와 같은 바이러스의 게놈으로부터 수득될 수 있거나, 또는 이종 포유동물 프로모터, 예를 들어, 베타 액틴 프로모터로부터 수득될 수 있다. SV40 바이러스의 초기 프로모터 및 후기 프로모터는 SV40 바이러스 복제 기점 또한 함유하는 SV40 제한 단편으로서 편리하게 수득된다(Fiers et al., Nature, 273: 113 (1978)). 인간 사이토메갈로바이러스의 즉시 초기 프로모터는 HindIII E 제한 단편으로서 편리하게 수득된다(Greenway, P.J. et al., Gene 18: 355-360 (1982)). 물론, 숙주 세포 또는 관련된 종으로부터 유래된 프로모터도 본원에서 유용하다.
인핸서는, 일반적으로 전사 개시 부위로부터 고정되지 않은 거리에서 작용하고 전사 유니트에 대해 5' 방향(Laimins, L. et al., Proc. Natl. Acad. Sci. 78: 993 (1981)) 또는 3' 방향(Lusky, M.L., et al., Mol. Cell Bio. 3: 1108 (1983))으로 존재할 수 있는 DNA의 서열을 의미한다. 나아가, 인핸서는 한 인트론 내에 존재할 수 있을 뿐만 아니라(Banerji, J.L. et al., Cell 33: 729 (1983)) 코딩 서열 자체 내에서도 존재할 수 있다(Osborne, T.F., et al., Mol. Cell Bio. 4: 1293 (1984)). 인핸서의 길이는 통상 10 내지 300 bp이고 인핸서는 시스로 작용한다. 인핸서는 근처에 있는 프로모터로부터의 전사를 증가시키는 작용을 한다. 또한, 인핸서는 전사의 조절을 매개하는 반응 요소를 종종 함유한다. 프로모터 또한 전사의 조절을 매개하는 반응 요소를 함유할 수 있다. 인핸서는 종종 유전자의 발현의 조절을 결정한다. 현재 많은 인핸서 서열이 포유동물 유전자(글로빈, 엘라스타제, 알부민, α-태아단백질 및 인슐린)로부터 공지되어 있지만, 전형적으로 진핵 세포 바이러스로부터 유래된 인핸서가 사용될 것이다. 바람직한 예는 복제 기점의 후측 상에 존재하는 SV40 인핸서(100 내지 270 bp), 사이토메갈로바이러스 초기 프로모터 인핸서, 복제 기점의 후측 상에 존재하는 폴리오마 인핸서 및 아데노바이러스 인핸서이다.
프로모터 및/또는 인핸서는 이들의 작용을 유발하는 광 또는 특정 화학적 사건에 의해 특이적으로 활성화될 수 있다. 시스템은 테트라사이클린 및 덱사메타손과 같은 시약에 의해 조절될 수 있다. 조사, 예컨대, 감마 조사 또는 알킬화 화학요법 약물에의 노출을 통해 바이러스 벡터 유전자 발현을 상승시키는 방법도 있다.
프로모터 및/또는 인핸서 영역은 모든 타입의 진핵 세포에서 활성을 나타내는 것이 바람직하다. 이러한 타입의 바람직한 프로모터는 CMV 프로모터(650개 염기)이다. 다른 바람직한 프로모터는 SV40 프로모터, 사이토메갈로바이러스(전장 프로모터) 및 레트로바이러스 벡터 LTF이다.
모든 특이적 조절 요소가 클로닝되어 특정 타입의 세포, 예컨대, 흑색종 세포 내에서 선별적으로 발현되는 발현 벡터를 구축하는 데 사용될 수 있다. 신경교원섬유 산 단백질(GEAP) 프로모터가 신경교원 유래의 세포 내에서 유전자를 선별적으로 발현하는 데 사용되어 왔다.
진핵 숙주 세포(효모, 진균, 곤충, 식물, 동물, 인간 또는 유핵 세포)에서 사용되는 발현 벡터는 mRNA 발현에 영향을 미칠 수 있는 전사 종결에 필요한 서열도 함유할 수 있다. 이 영역은 조직 인자 단백질을 코딩하는 mRNA의 비-번역 부위 내에 있는 폴리아데닐화된 분절로서 전사된다. 3' 비-번역 영역은 전사 종결 부위도 포함한다. 전사 유니트는 폴리아데닐화 영역도 함유하는 것이 바람직하다. 이 영역의 한 이점은 상기 영역이, 전사되는 유니트가 mRNA처럼 프로세싱되고 수송될 가능성을 증가시킨다는 점이다. 발현 구축물 내의 폴리아데닐화 신호의 확인 및 사용은 잘 확립되어 있다. 트랜스진 구축물 내의 동종 폴리아데닐화 신호를 사용하는 것이 바람직하다. 전사 유니트의 바람직한 실시양태에서, 폴리아데닐화 영역은 SV40 초기 폴리아데닐화 신호로부터 유래되고 약 400개의 염기로 구성된다. 또한, 전사된 유니트는 다른 표준 서열만을 함유하거나 상기 서열과 함께 구축물의 발현 또는 안정성을 개선시키는 것이 바람직하다.
3. 마커
벡터는 마커 생성물을 코딩하는 핵산 서열을 포함할 수 있다. 이 마커 생성물은 유전자가 세포로 전달되고 일단 전달되면 발현되는지를 확인하는 데 사용된다. 바람직한 마커 유전자는 β-갈락토시다제 및 녹색 형광 단백질을 코딩하는 이. 콜라이 lacZ 유전자이다.
일부 실시양태에서, 마커는 선별가능한 마커일 수 있다. 포유동물 세포에 적합한 선별가능한 마커의 예는 다이하이드로폴레이트 리덕타제(DHFR), 티미딘 키나제, 네오마이신, 네오마이신 유사체 G418, 하이그로마이신 및 퓨로마이신이다. 이러한 선별가능한 마커가 포유동물 숙주 세포 내로 성공적으로 전달된 경우, 형질전환된 포유동물 숙주 세포는 선별 압력 하에 놓였을 때 생존할 수 있다. 널리 이용되는 2종의 상이한 선별 방법이 있다. 첫 번째 방법은 세포 대사, 및 보충된 배지와 무관하게 생장하는 능력을 결여하는 돌연변이체 세포주의 사용에 기초한 방법이다. 이의 두 예는 CHO DHFR- 세포 및 마우스 LTK- 세포이다. 상기 세포들은 티미딘 또는 하이포잔틴과 같은 영양분을 첨가하지 않은 상태에서 생장하는 능력을 결여하고 있다. 상기 세포들이 완전한 뉴클레오티드 합성 경로에 필수적인 일부 유전자를 결여하고 있기 때문에, 상기 세포들은 빠진 뉴클레오티드가 보충된 배지 중에 제공되어 있지 않은 한 생존할 수 없다. 배지를 보충하는 다른 방법은 완전한 DHFR 또는 TK 유전자를 이 유전자가 결여된 세포 내로 도입하여 상기 세포의 생장 요건을 변경하는 것이다. DHFR 또는 TK 유전자로 형질전환되지 않은 개개의 세포는 비-보충된 배지 중에서 생존할 수 없을 것이다.
두 번째 방법은 임의의 타입의 세포에서 이용되며 돌연변이체 세포주의 사용을 필요로 하지 않는 선별 방법을 의미하는 우성 선별이다. 이 방법은 전형적으로 숙주 세포의 생장을 정지시키기 위한 약물을 사용한다. 신규한 유전자를 갖는 세포는 약물 내성을 전달하는 단백질을 발현할 것이고 선별에서 생존할 것이다. 상기 우성 선별의 예는 네오마이신(Southern P. and Berg, P., J. Molec. Appl. Genet. 1 : 327 (1982)), 마이코페놀산(Mulligan, R.C. and Berg, P. Science 209: 1422 (1980)) 또는 하이그로마이신(Sugden, B. et al., Mol. Cell. Biol. 5: 410-413 (1985))을 사용한다. 이 3종의 예는 적절한 약물인 G418 또는 네오마이신(제네티신), xgpt(마이코페놀산) 또는 하이그로마이신에 대한 내성을 전달하기 위해 진핵 조절 하에서 세균 유전자를 사용한다. 다른 예로는 네오마이신 유사체인 G418 및 퓨로마이신이 있다.
E. 바이오센서 리보스위치
또한, 본 명세서에는 바이오센서 리보스위치가 개시되어 있다. 바이오센서 리보스위치는 그의 동족 유발 분자의 존재 하에서 검출가능한 신호를 발생시키는 개조된 리보스위치이다. 유용한 바이오센서 리보스위치는 유발 분자의 역치 수준 이상에서 유발될 수 있다. 바이오센서 리보스위치는 생체내에서 또는 시험관내에서 사용되도록 디자인될 수 있다. 예를 들어, 신호로서 작용하는 단백질 또는 신호를 발생시키는 데 관여하는 단백질을 코딩하는 레포터 RNA에 작동가능하게 연결된 사이클릭 다이-GMP 바이오센서 리보스위치는 이 사이클릭 다이-GMP 바이오센서 리보스위치를 코딩하는 핵산 구축물을 보유하도록 세포 또는 유기체를 개조함으로써 생체내에서 사용될 수 있다. 시험관내에서 사용되는 바이오센서 리보스위치의 일례는 리보스위치의 활성화 상태에 의존하는 변화를 표시하는 신호인 구조-의존적 표지를 포함하는 리보스위치이다. 이러한 바이오센서 리보스위치는 바람직하게는 천연 발생적 리보스위치의 앱타머 도메인 또는 천연 발생적 리보스위치, 예컨대, 사이클릭 다이-GMP 리보스위치로부터 유도된 앱타머 도메인을 사용한다.
F. 레포터 단백질 및 펩티드
리보스위치 또는 바이오센서 리보스위치의 활성화 평가를 위해 레포터 단백질 또는 펩티드를 사용할 수 있다. 레포터 단백질 또는 펩티드는 리보스위치에 의해 조절되는 발현을 보이는 RNA에 의해 코딩될 수 있다. 본 실시예는 일부 특정 레포터 단백질의 사용을 개시하고 있다. 레포터 단백질 및 펩티드의 사용은 잘 공지되어 있고 리보스위치와 함께 사용될 수 있도록 용이하게 개조될 수 있다. 레포터 단백질은 검출될 수 있거나 검출가능한 신호를 생성할 수 있는 임의의 단백질 또는 펩티드일 수 있다. 바람직하게는, 단백질 또는 펩티드의 존재는 표준 기법(예를 들어, 방사선면역분석, 방사선-표지, 면역분석, 효소 활성 분석, 흡광도, 형광도, 발광도 및 웨스턴 블롯)을 이용하여 검출할 수 있다. 보다 바람직하게는, 레포터 단백질의 수준은 낮은 수준에서조차도 표준 기법에 의해 용이하게 정량될 수 있다. 유용한 레포터 단백질은 루시퍼라제, GFP 및 이들의 유도체, 예컨대, 포티누스 피랄리스(Photinus pyralis)로부터의 초파리 루시퍼라제(FL) 및 레닐라 레니포르미스(Renilla reniformis)로부터의 레닐라 루시퍼라제(RL)를 포함한다.
G. 구조-의존적 표지
구조-의존적 표지는 표지와 결합되어 있는 분자 또는 화합물(예컨대, 리보스위치)의 형태 또는 구조의 변화를 기초로 한 형광 강도 또는 파장의 변화를 발생시키는 모든 표지를 지칭한다. 프로브 및 프라이머 면에서 사용되는 구조-의존적 표지의 예는 분자 비콘(beacon), 앰플리플루오르(Amplifluor), FRET 프로브, 절단가능한 FRET 프로브, TaqMan 프로브, 스코르피온(scorpion) 프라이머, 형광 삼중 올리고(삼중 분자 비콘 또는 삼중 FRET 프로브를 포함하나 이들로 한정되지 않음), 형광 수용성 접합 중합체, 펩티드 핵산(PNA) 프로브 및 QPNA 프로브를 포함한다. 이러한 표지 및 특히 이의 작용 원리는 리보스위치와 함께 사용될 수 있도록 개조될 수 있다. 여러 타입의 구조-의존적 표지가 문헌(Schweitzer and Kingsmore, Curr. Opin. Biotech. 12:21-27 (2001))에 기재되어 있다.
구조-의존적 표지의 한 형태인 줄기 켄칭된(stem quenched) 표지는 줄기 구조가 켄칭 부분을 형성하는 경우 상기 표지로부터의 형광이 켄칭되도록 인접하여 존재할 수 있게끔 핵산 상에 위치한 형광 표지이다. 줄기가 파괴되는 경우(예컨대, 표지를 함유하는 리보스위치가 활성화되는 경우), 켄칭 부분은 더 이상 형광 표지에 인접하여 존재하지 않고 형광도는 증가한다. 이 효과의 예는 분자 비콘, 형광 삼중 올리고, 삼중 분자 비콘, 삼중 FRET 프로브 및 QPNA 프로브에서 발견될 수 있고, 이들의 작용 원리는 리보스위치와 함께 사용될 수 있도록 개조될 수 있다.
구조-의존적 표지의 한 형태인 줄기 활성화된 표지는 형광도가 줄기 구조의 형성에 의해 증가되거나 변화된 경우 표지 또는 표지 쌍이다. 줄기 활성화된 표지는 (상기 표지를 함유하는 핵산 가닥이 줄기 구조를 형성하는 경우) 수용체 형광 표지 및 공여체 부분이 인접하여 존재할 때 공여체 부분으로부터 수용체 형광 표지로의 형광 공명 에너지 전달이 수용체로 하여금 형광을 발휘하도록 상기 수용체 형광 표지 및 공여체 부분을 포함할 수 있다. 전형적으로, 줄기 활성화된 표지는 줄기 구조가 핵산 분자 내에서 형성되는 경우 상기 수용체 형광 표지 및 공여체 부분이 인접하여 존재하도록 핵산 분자(예컨대, 리보스위치) 상에 위치한 표지 쌍이다. 줄기 활성화된 표지의 공여체 부분 자체가 형광 표지인 경우, 상기 공여체 부분은 수용체와 인접하여 존재하지 않는 경우(즉, 줄기 구조가 형성되지 않은 경우) (전형적으로 수용체 형광 표지의 형광과 상이한 파장에서) 에너지를 형광으로서 방출할 수 있다. 줄기 구조가 형성된 경우, 전체적인 효과는 공여체 형광도의 감소 및 수용체 형광도의 증가일 것이다. FRET 프로브는 줄기 활성화된 표지 사용의 일례이고, 이의 작용 원리는 리보스위치와 함께 사용되도록 개조될 수 있다.
H. 검출 표지
리보스위치 활성화, 불활성화 또는 차단의 검출 및 정량화, 또는 리보스위치의 활성화, 불활성화 또는 차단 시 일어나는 핵산 또는 단백질의 발현의 검출 및 정량화를 돕기 위해, 검출 표지를 검출 프로브 또는 검출 분자 내로 도입할 수 있거나 발현된 핵산 또는 단백질 내로 직접 도입할 수 있다. 본 명세서에서 사용된 바와 같이, 검출 표지는 핵산 또는 단백질과 직접적으로 또는 간접적으로 결합하여 측정가능하고 검출가능한 신호를 직접적으로 또는 간접적으로 발생시키는 임의의 분자이다. 이러한 많은 분자들이 당업자에게 공지되어 있다. 본 명세서에 개시된 방법에서 사용되기에 적합한 검출 표지의 예는 방사성 동위원소, 형광 분자, 인광 분자, 효소, 항체 및 리간드이다.
적절한 형광 표지의 예는 플루오레세인 아이소티오시아네이트(FITC), 5,6-카복시메틸 플루오레세인, 텍사스 레드, 니트로벤즈-2-옥사-1,3-다이아졸-4-일(NBD), 쿠마린, 댄실 클로라이드, 로다민, 아미노-메틸 쿠마린(AMCA), 에오신, 에리쓰로신, BODIPY , 캐스캐이드 블루 , 오레곤 그린 , 피렌, 리스아민, 잔텐, 아크리딘, 옥사진, 피코에리쓰린, 란타나이드 이온의 거대환형 킬레이트, 예컨대, 양자 안료™, 형광 에너지 전달 안료, 예컨대, 티아졸 오랜지-에티듐 이종이량체, 및 시아닌 안료 Cy3, Cy3.5, Cy5, Cy5.5 및 Cy7을 포함한다. 다른 구체적인 형광 표지의 예는 3-하이드록시피렌 5,8,10-트라이설폰산, 5-하이드록시 트립타민(5-HT), 산 푸치신, 알리자린 콤플렉손, 알리자린 레드, 알로피코시아닌, 아미노쿠마린, 안쓰로일 스테아레이트, 아스트라존 브릴리안트 레드 4G, 아스트라존 오랜지 R, 아스트라존 레드 6B, 아스트라존 옐로우 7 GLL, 아타브린, 아우라민, 아우로포스핀, 아우로포스핀 G, BAO 9(비스아미노페닐옥사다이아졸), BCECF, 버베린 설페이트, 비스벤즈아마이드, 블란코포르 FFG 솔푸션, 블란코포르 SV, 보다이피 F1, 브릴리안트 설포플라빈 FF, 칼시엔 블루, 칼슘 그린, 칼코플루오르 RW 솔루션, 칼코플루오르 화이트, 칼코포르 화이트 ABT 솔루션, 칼코포르 화이트 스탠다드 솔루션, 카보스티릴, 캐스캐이드 옐로우, 카테콜아민, 키나크린, 코리포스핀 O, 쿠마린-팔로이딘, CY3.1 8, CY5.1 8, CY7, 단스(1-다이메틸 아미노 나팔린 5 설폰산), 댄사(다이아미노 나프틸 설폰산), 댄실 NH-CH3, 다이아미노 페닐 옥시다이아졸(DAO), 다이메틸아미노-5-설폰산, 다이피로메탄보론 다이플루오라이드, 다이페닐 브릴리안트 플라빈 7GFF, 도파민, 에리쓰로신 ITC, 유크리신, FIF(포름알데하이드 유도된 형광), 플라조 오랜지, 플루오 3, 플루오레스카민, 푸라-2, 제나크릴 브릴리안트 레드 B, 제나크릴 브릴리안트 옐로우 10GF, 제나크릴 핑크 3G, 제나크릴 옐로우 5GF, 글록살산, 크래뉼라 블루, 해마토포피린, 인도-1, 인트라화이트 Cf 리퀴드, 류코포르 PAF, 류코포르 SF, 류코포르 WS, 리사민 로다민 B200(RD200), 루시퍼 옐로우 CH, 루시퍼 옐로우 VS, 마그달라 레드, 마리나 블루, 맥실론 브릴리안트 플라빈 10 GFF, 맥실론 브릴리안트 플라빈 8 GFF, MPS(메틸 그린 피로닌 스틸벤), 미쓰라마이신, NBD 아민, 니트로벤족사디돌, 노르아드레날린, 뉴클리어 패스트 레드, 뉴클리어 옐로우, 나일로산 브릴리안트 플라빈 E8G, 옥사다이아졸, 파시픽 블루, 파라로사닐린(페울겐), 포르와이트 AR 솔루션, 포르와이트 BKL, 포르와이트 Rev, 포르와이트 RPA, 포스핀 3R, 프탈로시아닌, 피코에리쓰린 R, 폴리아자인다센 폰토크롬 블루 블랙, 포피린, 프리뮬린, 프로시온 옐로우, 피로닌, 피로닌 B, 피로잘 브릴리안트 플라빈 7GF, 퀴나크린 무스타드, 로다민 123, 로다민 5 GLD, 로다민 6G, 로다민 B, 로다민 B 200, 로다민 B 엑스트라, 로다민 BB, 로다민 BG, 로다민 WT, 세로토닌, 세브론 브릴리안트 레드 2B, 세브론 브릴리안트 레드 4G, 세브론 브릴리안트 레드 B, 세브론 오랜지, 세브론 옐로우 L, SITS(프리뮬린), SITS(스틸벤 아이소티오설폰산), 스틸벤, Snarf 1, 설포 로다민 B Can C, 설포 로다민 G 엑스트라, 테트라사이클린, 티아진 레드 R, 티오플라빈 S, 티오플라빈 TCN, 티오플라빈 5, 티올라이트, 티오졸 오랜지, 티노폴 CBS, 트루 블루, 울트라라이트, 유라닌 B, 유비텍스 SFC, 크실렌 오랜지 및 XRITC를 포함한다.
유용한 형광 표지는 플루오레세인(5-카복시플루오레세인-N-하이드록시석신이미드 에스터), 로다민(5,6-테트라메틸 로다민), 및 시아닌 안료 Cy3, Cy3.5, Cy5, Cy5.5 및 Cy7이다. 이 형광 표지들에 대한 흡수 및 방출 최대 파장은 각각 다음과 같으므로 이들의 동시적인 검출이 가능하다: FITC(490 nm; 520 nm), Cy3(554 nm; 568 nm), Cy3.5(581 nm; 588 nm), Cy5(652 nm: 672 nm), Cy5.5(682 nm; 703 nm) 및 Cy7(755 nm; 778 nm). 형광 안료의 다른 예는 6-카복시플루오레세인(6-FAM), 2',4',1,4,-테트라클로로플루오레세인(TET), 2',4',5',7',1,4-헥사클로로플루오레세인(HEX), 2',7'-다이메톡시-4',5'-다이클로로-6-카복시로다민(JOE), 2'-클로로-5'-플루오로-7',8'-융합된 페닐-1,4-다이클로로-6-카복시플루오레세인(NED), 및 2'-클로로-7'-페닐-1,4-다이클로로-6-카복시플루오레세인(VIC)을 포함한다. 형광 표지는 아머샴 파마샤 바이오테크(미국 뉴저지주 피스카타웨이 소재), 몰레큘라 프로브스(미국 오레곤주 유진 소재) 및 리서치 오가닉스(미국 오하이오주 클리브랜드 소재)를 비롯한 다양한 시판 공급처로부터 구입할 수 있다.
흥미로운 다른 표지는 표지와 결합된 프로브가 표적 분자에 특이적으로 결합된 경우에만 신호를 방출하는 표지이고, 이때 상기 표지는 문헌(Tyagi & Kramer, Nature Biotechnology (1996) 14:303) 및 유럽 특허 제0 070 685 B1호에 기재된 "분자 비콘"을 포함한다. 흥미로운 다른 표지는 미국 특허 제5,563,037호, 및 국제특허출원 공개 제WO 97/17471호 및 제WO 97/17076호에 기재된 표지를 포함한다.
표지된 뉴클레오티드는 합성 과정 동안에 발현된 핵산 내로 직접 도입되는 검출 표지의 유용한 형태이다. 핵산 내로 도입될 수 있는 검출 표지의 예는 뉴클레오티드 유사체, 예컨대, BrdUrd(5-브로모데옥시유리딘, Hoy and Schimke, Mutation Research 290:217-230 (1993)), 아미노알릴데옥시유리딘(Henegariu et al., Nature Biotechnology 18:345-348 (2000)), 5-메틸사이토신(Sano et al., Biochim. Biophys. Acta 951:157-165 (1988)), 브로모유리딘(Wansick et al., J. Cell Biology 122:283-293 (1993)), 및 바이오틴(Langer et al., Proc. Natl. Acad. Sci. USA 78:6633 (1981)) 또는 적절한 햅텐(예컨대, 디곡시제닌)(Kerkhof, Anal. Biochem. 205:359-364 (1992))으로 변경된 뉴클레오티드를 포함한다. 적절한 형광-표지된 뉴클레오티드는 플루오레세인-아이소티아시아네이트-dUTP, 시아닌-3-dUTP 및 시아닌-5-dUTP(Yu et al., Nucleic Acids Res., 22:3226-3232 (1994))이다. DNA에 도입하기에 바람직한 뉴클레오티드 유사체 검출 표지는 BrdUrd(브로모데옥시유리딘, BrdUrd, BrdU, BUdR, 시그마-알드리치 캄퍼니)이다. 검출 표지를 DNA 내로 도입하는 데 유용한 다른 뉴클레오티드 유사체는 AA-dUTP(아미노알릴-데옥시유리딘 트라이포스페이트, 시그마-알드리치 캄퍼니) 및 5-메틸-dCTP(로슈 몰레큘라 바이오케미칼스)이다. 검출 표지를 RNA 내로 도입하는 데 유용한 뉴클레오티드 유사체는 바이오틴-16-UTP(바이오틴-16-유리딘-5'-트라이포스페이트, 로슈 몰레큘라 바이오케미칼스)이다. 플루오레세인, Cy3 및 Cy5는 직접적인 표지를 위해 dUTP에 연결될 수 있다. Cy3.5 및 Cy7은 바이오틴-표지된 또는 디곡시제닌-표지된 프로브의 2차 검출을 위한 아비딘 또는 항-디곡시제닌 접합체로서 사용될 수 있다.
핵산 내로 도입되는 검출 표지, 예컨대, 바이오틴은 당업계에 잘 공지되어 있는 민감한 방법들을 이용하여 추후에 검출할 수 있다. 예를 들어, 바이오틴은 바이오틴에 결합된 후 적절한 기질(예를 들어, 화학발광 기질 CSPD: 다이소듐, 3-(4-메톡시스피로-[1,2-다이옥세탄-3-2'-(5'-클로로)트라이사이클로[3.3.1.13'7]데칸]-4-일)페닐 포스페이트: 트로픽스 인코포레이티드)의 화학발광에 의해 검출되는 스트렙타비딘-알칼리성 포스파타제 접합체(트로픽스 인코포레이티드)를 사용하여 검출할 수 있다. 표지는 예를 들어, 화학 신호 증폭을 이용하거나 광(예를 들어, 화학발광 1,2-다이옥세탄 기질) 또는 형광 신호를 발생시키는 효소에 대한 기질을 사용하여 검출할 수 있는 효소, 예컨대, 알칼리성 포스파타제, 대두 퍼록시다제, 호스라디쉬 퍼록시다제 및 중합효소일 수도 있다.
이 검출 표지들 중 둘 이상을 겸비하는 분자도 검출 표지로서 간주된다. 공지된 검출 표지들 중 임의의 검출 표지는 개시된 프로브, 태그, 분자 및 방법과 함께 사용되어 활성화된 또는 불활성화된 리보스위치, 또는 개시된 방법에서 생성된 핵산 또는 단백질을 검출할 수 있다. 검출 표지에 의해 발생된 신호를 검출하고 측정하는 방법도 당업자에게 공지되어 있다. 예를 들어, 방사성 동위원소는 신틸레이션 계수 또는 직접적 가시화로 검출할 수 있고, 형광 분자는 형광 분광계로 검출할 수 있으며, 인광 분자는 분광계로 검출할 수 있거나 카메라로 직접적으로 가시화할 수 있고, 효소는 이 효소에 의해 촉진된 반응의 생성물의 검출 또는 가시화를 통해 검출할 수 있으며, 항체는 이 항체에 커플링된 2차 검출 표지를 검출하여 검출할 수 있다. 본 명세서에서 사용된 바와 같이, 검출 분자는 1종 이상의 검출 표지에 커플링되어 검출될 화합물 또는 조성물과 상호작용하는 분자이다.
I. 서열 유사성
본 명세서에 개시된 바와 같이 용어 "유사성" 및 "동일성"의 사용은 유사할 만큼 동일한 것을 의미함을 이해해야 한다. 따라서, 예를 들어, 용어 "유사성"이 2개의 서열(예컨대, 비-천연 서열) 사이에서 사용되는 경우, 이것은 반드시 상기 2개의 서열 사이의 진화적 관계를 의미하는 것이라기보다는 오히려 그들의 핵산 서열 사이의 유사성 또는 관련성에 관한 것임을 이해해야 한다. 2개의 진화적으로 관련된 분자들 사이의 유사성을 측정하는 방법들 중 대다수의 방법이 상기 2개의 서열들이 진화적으로 관련되어 있는지와 관계없이 서열 유사성을 측정하기 위한 목적으로 임의의 2개 이상의 핵산 또는 단백질에 관용적으로 적용된다.
일반적으로, 본 명세서에 개시된 리보스위치, 앱타머, 발현 플랫폼, 유전자 및 단백질의 임의의 공지된 변이체 및 유도체, 또는 본 명세서에 개시된 리보스위치, 앱타머, 발현 플랫폼, 유전자 및 단백질로부터 유래될 수 있는 변이체 및 유도체를 정의하는 한 방법은 특정 공지된 서열들에 대한 유사성 면에서 상기 변이체 및 유도체를 정의하는 것임을 이해해야 한다. 본 명세서에 개시된 특정 서열들의 동일성도 본 명세서의 모든 부분에서 논의되어 있다. 일반적으로, 본 명세서에 개시된 리보스위치, 앱타머, 발현 플랫폼, 유전자 및 단백질의 변이체는 전형적으로 언급된 서열 또는 천연 서열에 대해 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 유사성을 나타낸다. 당업자라면 2종의 단백질 또는 핵산, 예컨대, 유전자의 유사성을 측정하는 방법을 용이하게 이해한다. 예를 들어, 유사성은 유사성이 최대 수준에 있도록 2개의 서열을 정렬한 후 계산할 수 있다.
유사성을 계산하는 또 다른 방법은 공개된 알고리즘에 의해 수행될 수 있다. 비교할 서열들의 최적 정렬은 문헌(Smith and Waterman Adv. Appl. Math. 2: 482 (1981))의 국지적 유사성 알고리즘, 문헌(Needleman and Wunsch, J. Mol. Biol. 48: 443 (1970))의 유사성 정렬 알고리즘, 문헌(Pearson and Lipman, Proc. Natl. Acad. Sci. U.S.A. 85: 2444 (1988))의 유사성 검색 방법, 상기 알고리즘들의 전산화된 실시(GAP, BESTFIT, FASTA 및 TFASTA(미국 위스콘신주 매디슨 사이언스 드라이브 575에 소재하는 위스콘신 제네틱스 소프트웨어 팩키지 제네틱스 컴퓨터 그룹)) 또는 검사에 의해 수행될 수 있다.
핵산에 대한 동일한 타입의 유사성이 예를 들어, 문헌(Zuker, M. Science 244:48-52, 1989, Jaeger et al., Proc. Natl. Acad. Sci. USA 86:7706-7710, 1989, Jaeger et al., Methods Enzymol. 183:281-306, 1989)(적어도 핵산 정렬에 관련된 물질에 대해 참고로 본원에 도입되어 있음)에 개시된 알고리즘에 의해 수득될 수 있다. 상기 방법들 중 임의의 방법이 이용될 수 있고 일부 경우 이 다양한 방법들의 결과는 상이할 수 있음을 이해해야 하지만, 당업자라면 상기 방법들 중 1종 이상의 방법에서 동일성이 발견되면 서열들이 언급된 동일성을 나타낸다고 기재될 수 있음을 이해할 것이다.
예를 들어, 본 명세서에서 사용된 바와 같이, 또 다른 서열에 대해 특정 비율의 유사성을 나타낸다고 언급된 서열은 전술한 계산 방법들 중 임의의 1종 이상의 방법에 의해 계산된 경우 언급된 유사성을 나타내는 서열을 의미한다. 예를 들어, 본 명세서에서 정의되는 바와 같이, 제1 서열이 주커(Zuker) 문헌에 기재된 계산 방법을 이용하였을 때 제2 서열에 대해 80%의 유사성을 나타낸다고 계산된 경우 심지어 상기 제1 서열이 나머지 다른 임의의 계산 방법에 의해 계산되었을 때 상기 제2 서열에 대해 80%의 유사성을 나타내지 않는 경우조차도 상기 제1 서열은 상기 제2 서열에 대해 80%의 유사성을 나타낸다. 또 다른 예로서, 본 명세서에서 정의되는 바와 같이, 제1 서열이 주커 문헌에 기재된 계산 방법 및 피어슨(Pearson) 및 립만(Lipman)의 문헌에 기재된 계산 방법을 이용하였을 때 제2 서열에 대해 80%의 유사성을 나타낸다고 계산된 경우 심지어 상기 제1 서열이 스미스(Smith) 및 와터만(Waterman) 문헌에 기재된 계산 방법, 니들만(Needleman) 및 분슈(Wunsch) 문헌에 기재된 계산 방법, 재거(Jaeger) 문헌에 기재된 계산 방법 또는 임의의 다른 계산 방법에 의해 계산되었을 때 상기 제2 서열에 대해 80%의 유사성을 나타내지 않는 경우조차도 상기 제1 서열은 상기 제2 서열에 대해 80%의 유사성을 나타낸다. 또 다른 예로서, 본 명세서에서 정의되는 바와 같이, 제1 서열이 모든 계산 방법들 각각을 이용하였을 때(비록, 실제로 다양한 계산 방법들이 다양한 계산된 유사성 비율을 산출할지라도) 제2 서열에 대해 80%의 유사성을 나타낸다고 계산된 경우 상기 제1 서열은 상기 제2 서열에 대해 80%의 유사성을 나타낸다.
J. 혼성화 및 선별적 혼성화
용어 "혼성화"는 전형적으로 2종 이상의 핵산 분자, 예컨대, 프라이머 또는 프로브와 리보스위치 또는 유전자 사이의 서열-매개된 상호작용을 의미한다. 서열-매개된 상호작용은 2종의 뉴클레오티드 또는 뉴클레오티드 유사체 또는 뉴클레오티드 유도체 사이에 뉴클레오티드 특이적 방식으로 일어나는 상호작용을 의미한다. 예를 들어, C와 상호작용하는 G, 또는 T와 상호작용하는 A는 서열-매개된 상호작용이다. 전형적으로 서열-매개된 상화작용은 뉴클레오티드의 와슨-크릭 면 또는 호오그스틴(Hoogsteen) 면에서 일어난다. 2종의 핵산의 혼성화는 당업자에게 공지되어 있는 다수의 조건 및 파라미터에 의해 영향을 받는다. 예를 들어, 염 농도, pH 및 반응 온도 모두가 2종의 핵산 분자가 혼성화할지에 대해 영향을 미친다.
2종의 핵산 분자 사이의 선별적 혼성화를 위한 파라미터는 당업자에게 잘 공지되어 있다. 예를 들어, 일부 실시양태에서, 선별적 혼성화 조건은 엄격한 혼성화 조건으로서 정의될 수 있다. 예를 들어, 혼성화의 엄격도는 혼성화 단계 및 세척 단계 중 하나 또는 이들 단계 둘다의 온도 및 염 농도 둘다에 의해 조절된다. 예를 들어, 선별적 혼성화를 달성하는 혼성화 조건은 Tm(분자의 절반이 그들의 혼성화 파트너로부터 해리되는 용융 온도)보다 약 12 내지 25℃ 낮은 온도에서 높은 이온 강도 용액(6X SSC 또는 6X SSPE) 중에서의 혼성화에 이어서 세척 온도가 Tm보다 약 5 내지 20℃ 더 낮도록 선택된 온도와 염 농도의 조합 조건에서 세척하는 것을 포함할 수 있다. 상기 온도 및 염 조건은 필터 상에 고정된 기준 DNA 샘플이 원하는 표지된 핵산에 혼성화된 후 엄격도가 상이한 조건 하에서 세척되는 예비 실험에서 실험적으로 용이하게 결정된다. 혼성화 온도는 전형적으로 DNA-RNA 및 RNA-RNA 혼성화의 경우 더 높다. 상기 조건들은 엄격도를 달성하기 위해 전술한 바와 같이 이용될 수 있거나 당업계에 공지되어 있는 바와 같이 이용될 수 있다(Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989; Kunkel et al., Methods Enzymol. 1987:154:367, 1987); 적어도 핵산의 혼성화에 관련된 물질에 대해 본원에 참고로 도입되어 있음). DNA:DNA 혼성화에 바람직한 엄격한 혼성화 조건은 약 68℃의 (수용액 상태의) 6X SSC 또는 6X SSPE 중에서의 혼성화 후 68℃에서의 세척일 수 있다. 필요에 따라 혼성화 및 세척의 엄격도는 원하는 상보성 정도가 감소됨에 따라 상응하게 감소될 수 있고 가변성이 검색되는 임의의 영역의 G-C 또는 A-T 풍부도에 따라 감소될 수 있다. 마찬가지로, 필요에 따라 혼성화 및 세척의 엄격도는 당업계에 공지되어 있는 바와 같이 원하는 유사성이 증가됨에 따라 상응하게 증가될 수 있고 높은 유사성이 필요한 임의의 영역의 G-C 또는 A-T 풍부도에 따라 증가될 수 있다.
선별적 혼성화를 정의하는 또 다른 방법은 핵산들 중 한 핵산에 결합된 다른 핵산의 양(비율)을 측정하는 것이다. 예를 들어, 일부 실시양태에서, 선별적 혼성화 조건은 약 60, 65, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 이상의 제한 핵산이 비-제한 핵산에 결합된 경우 선별적 혼성화가 일어날 것이다. 전형적으로, 비-제한 핵산은 예를 들어, 10, 100 또는 1000배 과량으로 존재한다. 이러한 타입의 분석은 제한 핵산 및 비-제한 핵산 둘다가 예를 들어, 그들의 kd보다 10배, 100배 또는 1000배 더 적은 조건, 상기 핵산 분자들 중 하나만이 그들의 kd보다 10배, 100배 또는 1000배 더 적은 조건, 또는 상기 핵산 분자들 중 하나 또는 둘다가 그들의 kd를 초과하는 조건 하에서 수행될 수 있다.
선별적 혼성화를 정의하는 또 다른 방법은 원하는 효소적 개조를 촉진하기 위해 요구되는 혼성화 조건 하에서 효소적으로 개조된 핵산의 비율을 측정하는 것이다. 예를 들어, 일부 실시양태에서, 선별적 혼성화 조건은 약 60, 65, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 핵산이 효소적 개조를 촉진하는 조건 하에서 효소적으로 개조된 경우의 혼성화 조건일 것이고, 예를 들어, 효소적 개조가 DNA 연장인 경우, 선별적 혼성화 조건은 약 60, 65, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100%의 핵산 분자가 연장된 경우의 혼성화 조건일 것이다. 바람직한 조건은 시판사에 의해 제시된 조건, 또는 개조를 수행하는 효소에 적합한 것으로서 당업계에 공지되어 있는 조건을 포함한다.
유사성과 마찬가지로, 2개의 핵산 분자 사이의 혼성화 수준을 측정하는, 본 명세서에 개시된 다양한 방법들이 있음을 이해해야 한다. 상기 방법 및 조건은 2개의 핵산 분자 사이에 상이한 혼성화 비율을 제공할 수 있지만, 달리 명시하지 않은 한 상기 방법들 중 임의의 방법의 파라미터를 충족시키는 것만으로 충분할 것임을 이해해야 한다. 예를 들어, 80% 혼성화가 필요한 경우 혼성화가 상기 방법들 중 어느 한 방법에서 요구되는 파라미터 내에서 일어나기만 하면 80% 혼성화는 본 명세서에 개시된 것으로 간주된다.
당업자라면 조성물 또는 방법이 총체적으로 또는 단독으로 혼성화를 측정하기 위한 상기 기준들 중 어느 하나를 충족시키는 경우, 상기 조성물 또는 방법이 본 명세서에 개시된 조성물 또는 방법임을 이해할 것이다.
K. 핵산
예를 들어, 리보스위치, 앱타머, 및 리보스위치 및 앱타머를 코딩하는 핵산을 비롯하여, 본 명세서에 개시된 다양한 핵산-기재 분자들이 존재한다. 상기 개시된 핵산들은 예를 들어, 뉴클레오티드, 뉴클레오티드 유사체 또는 뉴클레오티드 대체물로 구성될 수 있다. 이 분자들 및 다른 분자들의 비-제한적 예는 본 명세서에 기재되어 있다. 예를 들어, 벡터가 세포 내에서 발현되는 경우 발현된 mRNA는 전형적으로 A, C, G 및 U로 구성될 것임을 이해해야 한다. 마찬가지로, 핵산 분자가 예를 들어, 외래 전달을 통해 세포 또는 세포 환경 내로 도입되는 경우, 핵산 분자는 세포 환경 내에서 상기 핵산 분자의 분해를 감소시키는 뉴클레오티드 유사체로 구성되는 것이 유리할 수 있음을 이해해야 한다.
리보스위치, 앱타머, 발현 플랫폼 및 임의의 다른 올리고뉴클레오티드 및 핵산은 이들의 관련 기능이 유지되는 한 변경된 뉴클레오티드(뉴클레오티드 유사체)로 구성될 수 있거나 변경된 뉴클레오티드(뉴클레오티드 유사체)를 포함할 수 있다. 많은 변경된 뉴클레오티드들이 공지되어 있고 올리고뉴클레오티드 및 핵산에서 사용될 수 있다. 뉴클레오티드 유사체는 염기, 당 또는 포스페이트 부분에 대한 일부 타입의 변경을 갖는 뉴클레오티드이다. 염기 부분에 대한 변경은 A, C, G 및 T/U의 천연 또는 합성 변경뿐만 아니라 다른 퓨린 또는 피리미딘 염기, 예컨대, 우라실-5-일, 하이포잔틴-9-일(I) 및 2-아미노아데닌-9-일의 천연 또는 합성 변경도 포함한다. 변경된 염기는 5-메틸사이토신(5-me-C), 5-하이드록시메틸 사이토신, 잔틴, 하이포잔틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 유도체 및 다른 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 다른 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오사이토신, 5-할로우라실 및 사이토신, 5-프로피닐 우라실 및 사이토신, 6-아조 우라실, 사이토신 및 티민, 5-우라실(슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-하이드록실 및 다른 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트라이플루오로메틸 및 다른 5-치환된 우라실 및 사이토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함하나 이들로 한정되지 않는다. 추가 염기 변경은 예를 들어, 미국 특허 제3,687,808호, 및 문헌(Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613, and Sanghvi, Y. S., Chapter 15, Antisense Research and Applications, pages 289-302, Crooke, S. T. and Lebleu, B. ed., CRC Press, 1993)에서 찾을 수 있다. 일부 뉴클레오티드 유사체, 예컨대, 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐사이토신을 비롯한 5-치환된 피리미딘, 6-아자피리미딘, 및 N-2, N-6 및 O-6 치환된 퓨린은 이중가닥 형성의 안정성을 증가시킬 수 있다. 다른 변경된 염기는 보편적인 염기로서 작용하는 염기이다. 보편적인 염기는 3-니트로피롤 및 5-니트로인돌을 포함한다. 보편적인 염기는 일반 염기를 치환시키지만 염기쌍 형성에 있어서 편향되지 않는다. 즉, 보편적인 염기는 임의의 다른 염기와 염기쌍을 형성할 수 있다. 염기 변경은 종종 예를 들어, 당 변경, 예컨대, 2'-O-메톡시에틸과 조합되어 증가된 이중가닥 안정성과 같은 독특한 성질을 제공할 수 있다. 염기 변경의 범위를 상세히 기술하는 다수의 미국 특허, 예컨대, 미국 특허 제4,845,205호, 제5,130,302호, 제5,134,066호, 제5,175,273호, 제5,367,066호, 제5,432,272호, 제5,457,187호, 제5,459,255호, 제5,484,908호, 제5,502,177호, 제5,525,711호, 제5,552,540호, 제5,587,469호, 제5,594,121호, 제5,596,091호, 제5,614,617호 및 제5,681,941호가 있다. 상기 특허들 각각은 그 전체, 구체적으로 염기 변경, 이의 합성, 이의 용도, 및 올리고뉴클레오티드 및 핵산 내로의 상기 염기 변경의 도입에 대한 설명이 본원에 참고로 도입된다.
뉴클레오티드 유사체는 당 부분의 변경도 포함할 수 있다. 당 부분에 대한 변경은 리보스 및 데옥시리보스의 천연 변경 및 합성 변경을 포함한다. 당 변경은 2' 위치에서의 하기 변경들을 포함하나 이들로 한정되지 않는다: OH; F; O-, S- 또는 N-알킬; O-, S- 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-0-알킬(이때, 알킬, 알케닐 및 알키닐은 치환된 또는 비-치환된 C1 내지 C10 알킬, 또는 C2 내지 C10 알케닐 및 알키닐일 수 있음). 2' 당 변경은 -O[(CH2)nO]mCH3, -O(CH2)nOCH3, -O(CH2)nNH2, -O(CH2)nCH3, -O(CH2)n-ONH2 및 -O(CH2)nON[(CH2)nCH3)]2도 포함하나 이들로 한정되지 않고, 이때 n 및 m은 1 내지 약 10이다.
2' 위치에서의 다른 변경은 C1 내지 C10 저급 알킬, 치환된 저급 알킬, 알크아릴, 아르알킬, O-알크아릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, 헤테로사이클로알킬, 헤테로사이클로알크아릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 이탈기, 레포터 기, 인터킬레이터, 올리고뉴클레오티드의 약동학적 성질을 개선시키는 기, 또는 올리고뉴클레오티드의 약력학적 성질을 개선시키는 기, 및 유사한 성질을 갖는 다른 치환기를 포함하나 이들로 한정되지 않는다. 유사한 변경을, 당의 다른 위치, 특히 3' 말단 뉴클레오티드 또는 2'-5' 결합된 올리고뉴클레오티드의 당의 3' 위치, 및 5' 말단 뉴클레오티드의 5' 위치에서 만들 수도 있다. 변경된 당은 가교 고리 산소에서 변경, 예컨대, CH2 및 S를 갖는 당도 포함할 것이다. 뉴클레오티드 당 유사체는 펜토푸라노실 당 대신에 사이클로부틸 부분과 같은 당 모사체도 가질 수 있다. 이러한 변경된 당 구조의 제조를 교시하는 다수의 미국 특허, 예컨대, 미국 특허 제4,981,957호, 제5,118,800호, 제5,319,080호, 제5,359,044호, 제5,393,878호, 제5,446,137호, 제5,466,786호, 제5,514,785호, 제5,519,134호, 제5,567,811호, 제5,576,427호, 제5,591,722호, 제5,597,909호, 제5,610,300호, 제5,627,053호, 제5,639,873호, 제5,646,265호, 제5,658,873호, 제5,670,633호 및 제5,700,920호가 있다(상기 특허들 각각은 그 전체, 구체적으로 변경된 당 구조, 이의 합성, 이의 용도, 및 뉴클레오티드, 올리고뉴클레오티드 및 핵산 내로의 상기 변경된 당 구조의 도입에 대한 설명이 본원에 참고로 도입됨).
뉴클레오티드 유사체는 포스페이트 부분에서도 변경될 수 있다. 변경된 포스페이트 부분은 2개의 뉴클레오티드 사이의 결합이 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로다이티오에이트, 포스포트라이에스터, 아미노알킬포스포트라이에스터, 메틸 및 다른 알킬 포스포네이트(3'-알킬렌 포스포네이트 및 키랄 포스포네이트를 포함함), 포스피네이트, 포스포르아미데이트(3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 포함함), 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트라이에스터, 및 보라노포스페이트를 갖도록 변경될 수 있는 포스페이트 부분을 포함하나 이들로 한정되지 않는다. 2개의 뉴클레오티드 사이의 상기 포스페이트 또는 변경된 포스페이트 결합이 3'-5' 결합 또는 2'-5' 결합을 통해 형성될 수 있고 상기 결합이 도립된 극성, 예컨대, 3'-5'로부터 5'-3', 또는 2'-5'로부터 5'-2'를 가질 수 있음을 이해해야 한다. 다양한 염, 혼합된 염 및 유리산 형태도 포함된다. 다수의 미국 특허가 변경된 포스페이트를 갖는 뉴클레오티드를 제조하고 사용하는 방법을 교시하고 상기 미국 특허는 미국 특허 제3,687,808호, 제4,469,863호, 제4,476,301호, 제5,023,243호, 제5,177,196호, 제5,188,897호, 제5,264,423호, 제5,276,019호, 제5,278,302호, 제5,286,717호, 제5,321,131호, 제5,399,676호, 제5,405,939호, 제5,453,496호, 제5,455,233호, 제5,466,677호, 제5,476,925호, 제5,519,126호, 제5,536,821호, 제5,541,306호, 제5,550,111호, 제5,563,253호, 제5,571,799호, 제5,587,361호 및 제5,625,050호를 포함하나 이들로 한정되지 않는다(상기 미국 특허들 각각은 그 전체, 구체적으로 변경된 포스페이트, 이의 합성, 이의 용도, 및 뉴클레오티드, 올리고뉴클레오티드 및 핵산 내로의 상기 변경된 포스페이트의 도입에 대한 설명이 본원에 참고로 도입됨).
뉴클레오티드 유사체는 단일 변경뿐만 아니라 한 부분 내에서 또는 상이한 부분 사이에서 다수의 변경도 가질 수 있음을 이해해야 한다.
뉴클레오티드 대체물은 뉴클레오티드와 유사한 기능적 성질을 갖되 포스페이트 부분을 갖지 않는 분자, 예컨대, PNA이다. 뉴클레오티드 대체물은 와슨-크릭 또는 호오그스틴 방식으로 상보적인 핵산을 인식하여 상기 상보적인 핵산에 혼성화하되(염기쌍을 형성하되) 포스페이트 부분 이외의 다른 부분을 통해 서로 연결되어 있는 분자이다. 뉴클레오티드 대체물은 적절한 표적 핵산과 상호작용하는 경우 이중 나선형 구조를 따를 수 있다.
뉴클레오티드 대체물은 포스페이트 부분 및/또는 당 부분이 치환되어 있는 뉴클레오티드 또는 뉴클레오티드 유사체이다. 뉴클레오티드 대체물은 표준 인 원자를 갖지 않는다. 포스페이트에 대한 대체물은 예를 들어, 단쇄 알킬 또는 사이클로알킬 인터뉴클레오시드 결합, 혼합된 헤테로원자 및 알킬 또는 사이클로알킬 인터뉴클레오시드 결합, 또는 1개 이상의 단쇄 헤테로원자 또는 헤테로사이클릭 인터뉴클레오시드 결합일 수 있다. 이들은 (부분적으로 뉴클레오시드의 당 부분으로부터 형성된) 모르폴리노 결합을 갖는 것; 실록산 골격; 설파이드, 설폭사이드 및 설폰 골격; 포름아세틸 및 티오포름아세틸 골격; 메틸렌 포름아세틸 및 티오포름아세틸 골격; 알켄 함유 골격; 설파메이트 골격; 메틸렌이미노 및 메틸렌하이드라지노 골격; 설포네이트 및 설폰아마이드 골격; 아마이드 골격; 및 혼합된 N, O, S 및 CH2 성분 부분을 갖는 골격들을 포함한다. 다수의 미국 특허가 이러한 타입의 포스페이트 대체물들을 제조하고 사용하는 방법을 개시하고 있으며, 상기 미국 특허는 미국 특허 제5,034,506호, 제5,166,315호, 제5,185,444호, 제5,214,134호, 제5,216,141호, 제5,235,033호, 제5,264,562호, 제5,264,564호, 제5,405,938호, 제5,434,257호, 제5,466,677호, 제5,470,967호, 제5,489,677호, 제5,541,307호, 제5,561,225호, 제5,596,086호, 제5,602,240호, 제5,610,289호, 제5,602,240호, 제5,608,046호, 제5,610,289호, 제5,618,704호, 제5,623,070호, 제5,663,312호, 제5,633,360호, 제5,677,437호 및 제5,677,439호를 포함하나 이들로 한정되지 않는다(상기 미국 특허들 각각은 그 전체, 구체적으로 포스페이트 대체물, 이의 합성, 이의 용도, 및 뉴클레오티드, 올리고뉴클레오티드 및 핵산 내로의 상기 포스페이트 대체물의 도입에 대한 설명이 본원에 참고로 도입됨).
또한, 뉴클레오티드 대체물에서 뉴클레오티드의 당 부분 및 포스페이트 부분은 예를 들어, 아마이드 타입 결합(아미노에틸글리신)(PNA)으로 치환될 수 있음을 이해해야 한다. 미국 특허 제5,539,082호, 제5,714,331호 및 제5,719,262호는 PNA 분자의 제조 및 사용 방법을 교시하고 있으며, 상기 특허들 각각은 본원에 참고로 도입된다(문헌(Nielsen et al., Science 254:1497-1500 (1991)) 또한 참조).
올리고뉴클레오티드 및 핵산은 뉴클레오티드로 구성될 수 있고 상이한 타입의 뉴클레오티드 또는 동일한 타입의 뉴클레오티드로 구성될 수 있다. 예를 들어, 올리고뉴클레오티드 내의 1개 이상의 뉴클레오티드는 리보뉴클레오티드, 2'-O-메틸 리보뉴클레오티드, 또는 리보뉴클레오티드와 2'-O-메틸 리보뉴클레오티드의 혼합물일 수 있고, 약 10 내지 약 50%의 뉴클레오티드가 리보뉴클레오티드, 2'-O-메틸 리보뉴클레오티드, 또는 리보뉴클레오티드와 2'-O-메틸 리보뉴클레오티드의 혼합물일 수 있고, 모든 뉴클레오티드가 리보뉴클레오티드, 2'-O-메틸 리보뉴클레오티드, 또는 리보뉴클레오티드와 2'-O-메틸 리보뉴클레오티드의 혼합물일 수 있다. 이러한 올리고뉴클레오티드 및 핵산은 키메라 올리고뉴클레오티드 및 키메라 핵산으로서 지칭될 수 있다.
L. 고체 지지체
고체 지지체는 분자(예컨대, 유발 분자) 및 리보스위치(또는 개시된 방법에서 사용되거나 개시된 방법에 의해 제조된 다른 성분들)가 결합될 수 있는 고체-상태 기판 또는 지지체이다. 리보스위치 및 다른 분자는 고체 지지체와 직접적으로 또는 간접적으로 결합될 수 있다. 예를 들어, 피분석물(예컨대, 유발 분자, 시험 화합물)은 고체 지지체의 표면에 결합될 수 있거나 고체 지지체 상에 고정된 포획제(예를 들어, 피분석물에 결합하는 화합물 또는 분자)와 결합될 수 있다. 또 다른 예로서, 리보스위치는 고체 지지체의 표면에 결합될 수 있거나 고체 지지체 상에 고정된 프로브와 결합될 수 있다. 어레이는 다수의 리보스위치, 프로브 또는 다른 분자가 어레이, 격자 또는 다른 조직화된 패턴으로 결합되어 있는 고체 지지체이다.
고체 지지체에서 사용되는 고체-상태 기판은 성분들이 직접적으로 또는 간접적으로 결합될 수 있는 임의의 고체 물질을 포함할 수 있다. 이것은 아크릴아마이드, 아가로스, 셀룰로스, 니트로셀룰로스, 유리, 금, 폴리스티렌, 폴리에틸렌 비닐 아세테이트, 폴리프로필렌, 폴리메타크릴레이트, 폴리에틸렌, 폴리에틸렌 옥사이드, 폴리실리케이트, 폴리카보네이트, 테플론, 플루오로카본, 나일론, 실리콘 고무, 폴리안하이드라이드, 폴리글리콜산, 폴리아세트산, 폴리오르토에스터, 작용기화된 실란, 폴리프로필푸메레이트, 콜라겐, 글리코스아미노글리칸 및 폴리아미노산을 포함한다. 고체-상태 기판은 박막, 막, 병, 접시, 섬유, 직조 섬유, 성형된 중합체, 입자, 비드, 마이크로입자 또는 조합물을 포함하는 임의의 유용한 형태를 가질 수 있다. 고체-상태 기판 및 고체 지지체는 다공성 또는 비-다공성 기판 및 지지체일 수 있다. 칩은 직사각형 또는 정사각형의 작은 물질 조각이다. 고체-상태 기판에 있어서 바람직한 형태는 박막, 비드 또는 칩이다. 고체-상태 기판에 있어서 유용한 형태는 마이크로타이터 접시이다. 일부 실시양태에서, 다중웰 유리 슬라이드가 사용될 수 있다.
어레이는 고체 지지체 상의 확인된 위치 또는 소정의 위치에 고정되어 있는 복수의 리보스위치, 유발 분자, 다른 분자, 화합물 또는 프로브를 포함할 수 있다. 고체 지지체 상의 소정의 위치는 일반적으로 한 타입의 성분을 각각 갖는다(즉, 상기 위치에서 모든 성분이 동일하다). 별법으로, 다수의 타입의 성분들이 고체 지지체 상의 상기 소정의 위치에 고정될 수 있다. 각 위치는 주어진 성분들의 다수의 카피를 가질 것이다. 고체 지지체 상에서의 다양한 성분들의 공간적 분리는 분리된 검출 및 확인을 가능하게 한다.
유용할지라도 고체 지지체가 단일 유니트 또는 구조일 필요는 없다. 리보스위치, 유발 분자, 다른 분자, 화합물 및/또는 프로브로 구성된 한 세트가 임의의 수의 고체 지지체 상에 분포될 수 있다. 예를 들어, 극단적으로, 각 성분은 분리된 반응 튜브 또는 용기 내에, 또는 분리된 비드 또는 마이크로입자 상에 고정될 수 있다.
올리고뉴클레오티드를 고체-상태 기판에 고정시키는 방법은 잘 확립되어 있다. 어드레스(address) 프로브 및 검출 프로브를 포함하는 올리고뉴클레오티드는 확립된 커플링 방법을 이용하여 기판에 커플링시킬 수 있다. 예를 들어, 적절한 부착 방법은 문헌(Pease et al., Proc. Natl. Acad. Sd. USA 91(11):5022-5026 (1994), and Khrapko et al., Mol. Biol. (Mosk) (USSR) 25:718-730 (1991))에 기재되어 있다. 카세인-코팅된 슬라이드 상에 3'-아민 올리고뉴클레오티드를 고정시키는 방법은 문헌(Stimpson et al., Proc. Natl. Acad. Sci. USA 92:6379-6383 (1995))에 기재되어 있다. 올리고뉴클레오티드를 고체-상태 기판에 부착시키는 유용한 방법은 문헌(Guo et al., Nucleic Acids Res. 22:5456-5465 (1994))에 기재되어 있다.
고체 지지체 상에 고정된 성분들 각각(예를 들어, 리보스위치, 유발 분자 또는 다른 분자)은 고체 지지체의 다양한 소정의 영역 내에 위치할 수 있다. 다양한 위치들은 다양한 반응 챔버일 수 있다. 상기 다양한 소정의 영역들은 각각 서로 물리적으로 분리되어 있을 수 있다. 고체 지지체의 다양한 소정의 영역들 사이의 거리는 고정될 수 있거나 변동될 수 있다. 예를 들어, 어레이에서 성분들은 각각 서로로부터 고정된 거리를 두고 정렬될 수 있지만, 비드와 결합된 성분들은 고정된 공간적 관계에 있지 않을 것이다. 특히, 다수의 고체 지지체 유니트(예를 들어, 다수의 비드)의 사용은 변동가능한 거리를 제공할 것이다.
성분들은 임의의 밀도로 고체 지지체 상에 결합될 수 있거나 고정될 수 있다. 성분들은 400종의 다양한 성분들/㎤를 초과하는 밀도로 고체 지지체에 고정될 수 있다. 성분들의 어레이는 임의의 수의 성분들을 가질 수 있다. 예를 들어, 어레이는 고체 지지체 상에 고정된 1,000종의 이상의 다양한 성분들을 가질 수 있거나, 고체 지지체 상에 고정된 10,000종의 이상의 다양한 성분들을 가질 수 있거나, 고체 지지체 상에 고정된 100,000종의 이상의 다양한 성분들을 가질 수 있거나, 또는 고체 지지체 상에 고정된 1,000,000 이상의 다양한 성분들을 가질 수 있다.
M. 키트
상기 물질들 및 다른 물질들은 개시된 본 방법의 실시 또는 실시 보조에 유용한 키트로서 임의의 적절한 조합물 형태로 함께 팩키징될 수 있다. 이것은 소정의 키트 내의 키트 성분들이 개시된 본 방법에서 함께 사용되도록 디자인되고 개조된 경우 유용하다. 예를 들어, 1종 이상의 바이오센서 리보스위치를 포함하는, 화합물을 검출하기 위한 키트가 개시되어 있다. 상기 키트는 리보스위치의 활성화를 검출하기 위한 시약 및 표지도 함유할 수 있다.
N. 혼합물
본 명세서에는 개시된 본 방법을 수행함으로써 형성된 혼합물, 또는 개시된 본 방법을 수행하기 위해 제조함으로써 형성된 혼합물이 개시되어 있다. 예를 들어, 리보스위치 및 유발 분자를 포함하는 혼합물이 개시되어 있다.
본 방법이 조성물, 성분 또는 시약을 혼합하거나 접촉시키는 단계를 포함할 때마다, 본 방법의 수행은 많은 다양한 혼합물을 발생시킨다. 예를 들어, 본 방법이 3개의 혼합 단계를 포함하는 경우, 이 단계들이 따로 수행되는 경우 상기 단계들 각각을 수행한 후 독특한 혼합물이 형성된다. 또한, 혼합물은 단계들이 수행되는 방법과 무관하게 단계들 모두의 완결 시 형성된다. 본 개시내용은 개시된 본 방법의 수행에 의해 수득된 혼합물, 및 임의의 개시된 시약, 조성물 또는 성분, 예를 들어, 본 명세서에 개시된 시약, 조성물 또는 성분을 함유하는 혼합물도 고려한다.
O. 시스템
본 명세서에는 개시된 본 방법의 수행 또는 개시된 본 방법의 수행 보조에 유용한 시스템이 개시되어 있다. 시스템은 일반적으로 제품, 예컨대, 구조체, 기구, 장치 등과 조성물, 화합물, 물질 등의 조합물을 포함한다. 개시되어 있거나 개시내용으로부터 자명한 상기 조합물이 고려된다. 예를 들어, 바이오센서 리보스위치, 고체 지지체 및 신호-판독 장치를 포함하는 시스템이 개시되어 있고 고려된다.
P. 데이터 구조 및 컴퓨터 제어
본 명세서에는 개시된 본 방법에서 사용되거나, 개시된 본 방법에 의해 발생되거나, 또는 개시된 본 방법으로부터 발생된 데이터 구조가 개시되어 있다. 데이터 구조는 일반적으로 조성물 또는 매질 형태로 수집되고/되거나, 조직화되고/되거나, 저장되고/되거나 구현된 임의의 형태의 데이터, 정보 및/또는 물체이다. 전자적 형태, 예컨대, RAM 형태로 저장되거나 저장 디스크 상에 저장된 리보스위치 구조 및 활성화 측정치는 데이터 구조의 한 타입이다.
개시된 본 방법, 또는 이의 일부 또는 이를 위한 제제는 컴퓨터 제어에 의해 제어될 수 있거나, 관리될 수 있거나 또는 보조될 수 있다. 이러한 컴퓨터 제어는 컴퓨터 제어된 프로세스 또는 방법에 의해 달성될 수 있고, 데이터 구조를 사용하고/하거나 발생시킬 수 있으며, 컴퓨터 프로그램을 사용할 수 있다. 상기 컴퓨터 제어, 컴퓨터 제어된 프로세스, 데이터 구조 및 컴퓨터 프로그램이 고려되고 본 명세서에 개시된 것으로 이해되어야 한다.
방법
본 명세서에는 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 방법이 개시되어 있다. 상기 방법은 예를 들어, 리보스위치를 활성화시킬 수 있거나, 불활성화시킬 수 있거나 또는 차단할 수 있는 화합물 또는 유발 분자를 리보스위치와 접촉시키는 단계를 포함할 수 있다. 리보스위치는 유발 분자의 결합 또는 제거를 통해 유전자 발현을 조절하는 기능을 수행한다. 화합물은 리보스위치를 활성화시키거나, 불활성화시키거나 차단하는 데 사용될 수 있다. 리보스위치에 대한 유발 분자(및 다른 활성화 화합물)를 사용하여 리보스위치를 활성화시킬 수 있다. 일반적으로, 유발 분자 이외의 화합물을 사용하여 리보스위치를 불활성화시킬 수 있거나 차단할 수 있다. 리보스위치는 예를 들어, 리보스위치의 존재로부터 유발 분자를 제거함으로써 불활성화시킬 수도 있다. 따라서, 리보스위치를 불활성화시키는 개시된 방법은 예를 들어, 리보스위치의 존재로부터 또는 리보스위치와의 접촉으로부터 유발 분자(또는 다른 활성화 화합물)을 제거하는 단계를 포함할 수 있다. 리보스위치는 예를 들어, 리보스위치를 활성화시키지 않는 유발 분자의 유사체의 결합에 의해 차단될 수 있다.
또한, 본 명세서에는 리보스위치를 포함하는 RNA 분자와 화합물을 접촉시켜 상기 RNA 분자의 발현 또는 상기 RNA 분자를 코딩하는 유전자의 발현을 변화시키는 방법이 개시되어 있다. 리보스위치는 유발 분자의 결합 또는 제거를 통해 유전자 발현을 조절하는 기능을 수행한다. 따라서, 리보스위치를 포함하는 원하는 RNA 분자를, 상기 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 조건 하에 둠으로써 RNA의 발현을 변화시킬 수 있다. 발현은 예를 들어, 전사 종결의 결과로서 변화될 수 있거나 또는 리보좀과 RNA의 결합 차단의 결과로서 변화될 수 있다. 유발 분자의 결합은 리보스위치의 성질에 따라 RNA 분자의 발현을 감소시키거나 방해할 수 있거나, 또는 RNA 분자의 발현을 촉진하거나 증가시킬 수 있다.
본 명세서에는 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단함으로써 리보스위치를 포함하는 천연 발생적 유전자 또는 RNA의 발현을 조절하는 방법도 개시되어 있다. 상기 유전자가 이것을 보유하는 세포 또는 유기체의 생존에 필수적인 경우, 리보스위치의 활성화, 불활성화 또는 차단은 세포 또는 유기체의 사멸, 생장 저지 또는 약화를 초래할 수 있다. 예를 들어, 미생물의 생존에 필수적인 천연 발생적 유전자 내의 천연 발생적 리보스위치를 활성화시키면 상기 미생물이 사멸할 수 있다(상기 리보스위치의 활성화가 발현을 차단하거나 억제하는 경우). 이것은 항균 효과 및 항진균 효과를 위해 개시된 화합물 및 방법을 이용하는 것에 대한 근거이다. 이 항균 효과를 나타내는 화합물은 세균 생장 저지, 살균 또는 살진균 화합물인 것으로 간주된다.
또한, 본 명세서에는 리보스위치를 활성화시킬 수 있거나, 불활성화시킬 수 있거나 또는 차단할 수 있는 화합물을 선별하고 확인하는 방법이 개시되어 있다. 리보스위치의 활성화는 유발 분자의 결합 시 리보스위치의 상태 변화를 의미한다. 리보스위치는 유발 분자의 결합 이외의 방법으로 유발 분자 이외의 화합물에 의해 활성화될 수 있다. 본 명세서에서 용어 "유발 분자"는 리보스위치를 활성화시킬 수 있는 분자 및 화합물을 지칭하는 데 사용된다. 이것은 리보스위치에 대한 천연 또는 통상의 유발 분자, 및 리보스위치를 활성화시킬 수 있는 다른 화합물을 포함한다. 천연 또는 통상의 유발 분자는 천연 상태의 소정의 리보스위치에 대한 유발 분자이거나, 또는 일부 비-천연 리보스위치의 경우, 리보스위치를 디자인하는 데 사용되거나 리보스위치를 선별하는 데(예를 들어, 시험관내 선별 또는 시험관내 진화 기법에서 선별하는 데) 사용된 유발 분자이다. 비-천연 유발 분자는 비-천연 유발 분자로서 지칭될 수 있다.
본 명세서에는 세균을 본 명세서에 개시된 화합물 또는 본 명세서에 개시된 방법에 의해 동정된 화합물과 접촉시키는 단계를 포함하는, 상기 세균을 사멸시키거나 억제하는 방법도 개시된다.
본 명세서에는 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 화합물을 동정하는 방법도 개시되어 있다. 예를 들어, 리보스위치를 활성화시키는 화합물은, 시험 화합물을 리보스위치와 접촉시키고 상기 리보스위치의 활성화를 평가함으로써 동정할 수 있다. 리보스위치가 활성화되는 경우, 시험 화합물은 상기 리보스위치를 활성화시키는 화합물로서 동정된다. 리보스위치의 활성화는 임의의 적절한 방식으로 평가될 수 있다. 예를 들어, 리보스위치는 레포터 RNA에 연결될 수 있고, 상기 레포터 RNA의 발현, 발현 수준 또는 발현 수준의 변화는 시험 화합물의 존재 및 부재 하에서 측정될 수 있다. 또 다른 예로서, 리보스위치는 구조-의존적 표지를 포함할 수 있고, 이 표지로부터의 신호는 상기 리보스위치의 활성화 상태에 따라 변한다. 이러한 리보스위치는 바람직하게는 천연 발생적 리보스위치의 앱타머 도메인 또는 천연 발생적 리보스위치로부터 유래된 앱타머 도메인을 사용한다. 알 수 있는 바와 같이, 리보스위치의 활성화 평가는 대조군 분석 또는 측정을 이용하거나 이용하지 않고 수행할 수 있다. 리보스위치를 불활성화시키는 화합물을 동정하는 방법도 유사한 방식으로 수행할 수 있다.
본 명세서에 개시된 방법들 이외에, 리보스위치를 차단하는 화합물의 동정은 임의의 적절한 방법으로 달성할 수 있다. 예를 들어, 리보스위치를 활성화시키거나 불활성화시키는 것으로 공지된 화합물의 존재 및 시험 화합물의 존재 하에서 리보스위치의 활성화 또는 불활성화를 평가하는 분석을 수행할 수 있다. 활성화 또는 불활성화가 시험 화합물의 부재 하에서 관찰되는 것처럼 관찰되지 않는 경우, 상기 시험 화합물은 리보스위치의 활성화 또는 불활성화를 차단하는 화합물로서 동정된다.
본 명세서에는 바이오센서 리보스위치를 사용하여 화합물을 검출하는 방법도 개시되어 있다. 상기 방법은 시험 화합물과 바이오센서 리보스위치를 접촉시키는 단계, 및 상기 바이오센서 리보스위치의 활성화를 평가하는 단계를 포함할 수 있다. 바이오센서 리보스위치의 활성화는 시험 샘플 중에 바이오센서 리보스위치에 대한 유발 분자가 존재함을 표시한다. 바이오센서 리보스위치는 그의 동족 유발 분자의 존재 하에서 검출가능한 신호를 발생시키는 개조된 리보스위치이다. 유용한 바이오센서 리보스위치는 유발 분자의 역치 수준 이상에서 유발될 수 있다. 바이오센서 리보스위치는 생체내에서 또는 시험관내에서 사용될 수 있도록 디자인될 수 있다. 예를 들어, 신호로서 기능하거나 신호를 발생시키는 데 관여하는 단백질을 코딩하는 레포터 RNA에 작동가능하게 연결된 사이클릭 다이-GMP 바이오센서 리보스위치는 상기 리보스위치/상기 레포터 RNA를 코딩하는 핵산 구축물을 보유하는 세포 또는 유기체를 개조함으로써 생체내에서 사용될 수 있다. 시험관내에서 사용되는 바이오센서 리보스위치의 일례는 구조-의존적 표지를 포함하는 사이클릭 다이-GMP 리보스위치이고, 상기 표지로부터의 신호는 상기 리보스위치의 활성화 상태에 따라 변한다. 이러한 바이오센서 리보스위치는 바람직하게는 천연 발생적 사이클릭 다이-GMP 리보스위치의 앱타머 도메인 또는 천연 발생적 TPP 리보스위치로부터 유도된 앱타머 도메인을 사용한다.
또한, 본 명세서에는 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 화합물을 동정하고 동정된 화합물을 제조함으로써 수득되는 화합물이 개시되어 있다. 이것은 예를 들어, 본 명세서에 개시된 화합물 동정 방법을 동정된 화합물의 제조 방법과 조합하여 달성할 수 있다. 예를 들어, 상기 화합물은 시험 화합물과 리보스위치를 접촉시키고, 상기 리보스위치의 활성화를 평가하고, 상기 리보스위치가 상기 시험 화합물에 의해 활성화되는 경우, 리보스위치를 활성화시키는 시험 화합물을 상기 화합물로서 제조함으로써 수득할 수 있다.
또한, 본 명세서에는 화합물에 의한 리보스위치의 활성화, 불활성화 또는 차단을 동정하고 동정된 화합물을 제조함으로써 수득되는 화합물이 개시되어 있다. 이것은 예를 들어, 본 명세서에 개시된 화합물 활성화, 불활성화 또는 차단 평가 방법을 확인된 화합물의 제조 방법과 조합하여 달성할 수 있다. 예를 들어, 화합물은 시험 화합물을 리보스위치와 접촉시키고, 상기 리보스위치의 활성화를 평가하고, 상기 리보스위치가 시험 화합물에 의해 활성화된 경우 리보스위치를 활성화시키는 시험 화합물을 상기 화합물로서 제조함으로써 수득할 수 있다. 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 능력에 대해 화합물을 조사하는 것은 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 것으로 이전에 공지되지 않은 화합물을 동정하는 것, 및 화합물이 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 것으로 이미 공지되어 있는 경우 상기 리보스위치를 활성화시키거나, 불활성화시키거나 또는 차단하는 화합물의 능력을 평가하는 것 둘다를 의미한다. 추가로, 본 명세서에는 샘플을 리보스위치와 접촉시키는 단계를 포함하는, 리보스위치를 활성화시키는 목적 화합물을 검출하는 방법이 개시되는데, 이때 상기 리보스위치는 샘플이 상기 목적 화합물을 함유하는 경우 상기 목적 화합물에 의해 활성화되었을 때 신호를 발생시킨다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 상기 리보스위치는 상기 목적 화합물에 의해 활성화되었을 때 구조 의존적 표지를 통해 신호를 발생시키는 구조적 변화를 겪을 수 있다. 또한, 상기 리보스위치는 상기 목적 화합물에 의해 활성화되었을 때 상기 리보스위치에 연결된 RNA의 발현 변화를 초래하는 구조적 변화를 겪을 수 있고, 이때 상기 발현 변화는 신호를 발생시킨다. 상기 신호는 상기 리보스위치에 연결된 RNA로부터 발현된 레포터 단백질에 의해 발생될 수 있다.
또한, 본 명세서에는 샘플을 리보스위치와 접촉시키는 단계를 포함하는, 상기 리보스위치를 활성화시키는 목적 화합물의 검출 방법도 개시되는데, 이때 상기 리보스위치는 샘플이 상기 목적 화합물을 함유하는 경우 상기 목적 화합물에 의해 활성화되었을 때 신호를 발생시키고, 상기 리보스위치는 리보스위치 또는 리보스위치의 유도체를 포함한다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 상기 리보스위치는 상기 목적 화합물에 의해 활성화되었을 때 구조 의존적 표지를 통해 신호를 발생시키는 구조적 변화를 겪을 수 있다. 또한, 상기 리보스위치는 상기 목적 화합물에 의해 활성화되었을 때 상기 리보스위치에 연결된 RNA의 발현 변화를 초래하는 구조적 변화를 겪을 수 있고, 이때 상기 발현 변화는 신호를 발생시킨다. 상기 신호는 상기 리보스위치에 연결된 RNA로부터 발현된 레포터 단백질에 의해 발생될 수 있다.
구체적으로, 본 명세서에는 사이클릭 다이-GMP-반응성 리보스위치를 샘플과 접촉시키는 단계; 및 사이클릭 다이-GMP와 사이클릭 다이-GMP-반응성 리보스위치 사이의 상호작용을 검출하는 단계를 포함하는, 상기 샘플에서 사이클릭 다이-GMP를 검출하는 방법이 개시되는데, 이때 사이클릭 다이-GMP와 사이클릭 다이-GMP-반응성 리보스위치 사이의 상호작용은 사이클릭 다이-GMP의 존재를 표시한다. 사이클릭 다이-GMP-반응성 리보스위치는 표지될 수 있다.
또한, 본 명세서에는 (a) 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현의 억제에 대해 화합물을 시험하는 단계로서, 이때 상기 억제가 상기 리보스위치를 통해 일어나고, 상기 리보스위치가 리보스위치 또는 리보스위치의 유도체를 포함하는, 단계; 및 (b) 단계 (a)에서 유전자 발현을 억제하는 화합물을 세포와 접촉시켜 유전자 발현을 억제하는 단계로서, 이때 상기 세포가 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물이 상기 리보스위치와의 결합을 통해 상기 유전자의 발현을 억제하는, 단계를 포함하는 방법도 개시된다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다.
또한, 본 명세서에는 (a) 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현의 탈억제에 대해 화합물을 시험하는 단계로서, 이때 상기 탈억제가 상기 리보스위치를 통해 일어나고, 상기 리보스위치가 리보스위치 또는 리보스위치의 유도체를 포함하는, 단계; 및 (b) 단계 (a)에서 유전자 발현을 탈억제하는 화합물을 세포와 접촉시켜 유전자 발현을 탈억제하는 단계로서, 이때 상기 세포가 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물이 상기 리보스위치와의 결합을 통해 상기 유전자의 발현을 탈억제하는, 단계를 포함하는 방법도 개시된다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다.
사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 사이클릭 다이-GMP-반응성 리보스위치를 활성화시킬 수 있는 사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG의 유도체일 수도 있다. SAH인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 SAH-반응성 리보스위치를 활성화시킬 수 있는 SAH의 유도체일 수도 있다. preO1인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 preO1-반응성 리보스위치를 활성화시킬 수 있는 preO1의 유도체일 수도 있다. Moco인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 Moco-반응성 리보스위치를 활성화시킬 수 있는 Moco의 유도체일 수도 있다. SAM인 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법도 개시된다. 상기 화합물은 SAM-반응성 리보스위치를 활성화시킬 수 있는 SAM의 유도체일 수도 있다. SAM-IV 리보스위치를 활성화시키는 화합물은 MeAzaAdoMet일 수도 있다.
SAH-반응성 리보스위치의 활성화의 경우, 화합물은 SAH일 수 있다. 상기 화합물은 SAH-반응성 리보스위치를 활성화시킬 수 있는 SAH의 유도체일 수도 있다. 예를 들어, 상기 화합물은 SAC일 수 있다. 도 12B는 SAH-반응성 리보스위치를 활성화시킬 수 있는 화합물에 중요한 구조 요소를 보여준다.
preQ1-반응성 리보스위치(및 preQ1-반응성 리보스위치로부터 유래된 리보스위치)의 활성화의 경우, 화합물은 위치 1에서 있는 N이 C, O 또는 S로 치환될 수 있고 위치 2에 있는 아미노 기가 수소결합 공여체로 치환될 수 있으며 위치 6에 있는 산소가 수소결합 수용체로 치환될 수 있고 위치 7에 있는 아미노 기가 수소결합 수용체로 치환될 수 있고 질소가 수소결합 공여체로 치환될 수 있거나 유도체화될 수 있는 preQ1의 유도체일 수 있다.
세포는 변화된 유전자 발현이 필요한 세포로서 동정될 수 있다. 상기 세포는 세균 세포일 수 있다. 화합물은 세균 세포를 사멸시킬 수 있거나 세균 세포의 생장을 억제할 수 있다. 화합물과 세포는 상기 화합물을 개체에게 투여함으로써 접촉할 수 있다. 상기 세포는 개체 내의 세균 세포일 수 있고, 이때 상기 화합물의 상기 세균 세포를 사멸하거나 상기 세균 세포의 생장을 억제한다. 상기 개체는 세균에 감염된 개체일 수 있다. 상기 세포는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치를 함유할 수 있다. 상기 화합물은 또 다른 항생제 화합물과 함께 투여될 수 있다. 상기 화합물은 생체막에서의 세균 생장을 억제할 수 있다. 또한, 본 명세서에는 사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG인 화합물을 세포와 접촉시키는 단계를 포함하는, 세포의 생리학적 상태를 변화시키는 방법도 개시된다. 상기 화합물은 사이클릭 다이-GMP-반응성 리보스위치를 활성화시킬 수 있는 사이클릭 다이-GMP, pGpG, GpG 또는 GpGpG의 유도체일 수도 있다.
본 명세서에는 유발 분자의 존재 및 부재 하에서 RNA 분자의 인-라인 천연 발생적 절단을 평가하는 단계를 포함하는 방법이 개시되는데, 이때 상기 RNA 분자는 상기 유발 분자에 의해 조절되는 유전자에 의해 코딩되고, 상기 RNA 분자의 인-라인 천연 발생적 절단 패턴의 변화는 상기 유발 분자에 반응하는 리보스위치를 표시한다. 상기 유발 분자는 사이클릭 다이-GMP, SAH, preQ1, Moco 또는 SAM일 수 있다.
본 명세서에는 (a) 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현의 억제에 대해 화합물을 시험하는 단계로서, 이때 상기 억제가 상기 리보스위치를 통해 일어나고, 상기 리보스위치가 사이클릭 다이-GMP-반응성 리보스위치 또는 사이클릭 다이-GMP-반응성 리보스위치의 유도체를 포함하는, 단계; 및 (b) 단계 (a)에서 유전자 발현을 억제하는 화합물을 세포와 접촉시켜 유전자 발현을 억제하는 단계로서, 이때 상기 세포가 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물이 상기 리보스위치와의 결합을 통해 상기 유전자의 발현을 억제하는, 단계를 포함하는 방법도 개시된다.
또한, 본 명세서에는 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현 억제에 대해 화합물을 시험하여 상기 유전자의 유전자 발현을 억제하는 화합물로서 동정된 화합물을 세포와 접촉시켜 상기 유전자의 유전자 발현을 억제하는 단계를 포함하는 방법이 개시되는데, 이때 상기 억제는 상기 리보스위치를 통해 일어나고, 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치 또는 사이클릭 다이-GMP-반응성 리보스위치의 유도체를 포함한다.
A. 항균 화합물의 동정
리보스위치는 작은 유기 분자와 결합하도록 진화된 새로운 클래스의 구조화된 RNA이다. 리보스위치의 천연 결합 포켓은 대사물질 유사체를 사용하거나 천연 대사물질의 형태-공간을 모방하는 화합물을 사용하여 표적화할 수 있다. 리보스위치의 소분자 리간드는 약물 후보물질을 생성하기 위한 유도체화에 유용한 부위를 제공한다. 일부 리보스위치의 분포는 미국 특허출원 공개 제2005-0053951호의 표 1에 기재되어 있다. 일단 한 클래스의 리보스위치, 예컨대, 사이클릭 다이-GMP 리보스위치가 동정되고 약물 표적으로서의 그의 잠재력이 평가되면, 후보 분자가 동정될 수 있다.
약물 내성 세균 균주의 출현은 새로운 클래스의 항생제의 동정이 필요함을 강조한다. 항-리보스위치 약물은 하기 이유로 상당히 흥미로운 항균 작용 모드를 대표한다. 리보스위치는 기초적인 대사 과정에 중추적인 유전자들의 발현을 조절한다. 따라서, 약물을 사용한 상기 유전자 조절 요소의 조작은 신규 항생제를 제공한다. 이 항생제는 세균 생장 저지 활성 또는 살균성을 나타내는 것으로 인정될 수 있다. 또한, 리보스위치는 대사물질에 선별적으로 결합하도록 진화된 RNA 구조를 보유하므로, 이 RNA 수용체는 단백질 효소 및 수용체와 마찬가지로 우수한 약물 표적이 될 수 있다.
화합물은 리보스위치 분석에서의 신호가 상기 화합물의 부재 하에서의 동일한 리보스위치 분석(즉, 대조군 분석)에 비해 상기 화합물의 존재 하에서 1배, 2배, 3배, 4배, 5배, 50%, 75%, 100%, 125%, 150%, 175%, 200%, 250%, 300%, 400% 또는 500% 이상 증가되는 경우 리보스위치를 활성화시키는 화합물로서 동정될 수 있거나 리보스위치 활성화 활성을 나타내는 화합물로서 동정될 수 있다. 리보스위치 분석은 임의의 적절한 리보스위치 구축물을 사용하여 수행할 수 있다. 리보스위치 활성화 분석에 특히 유용한 리보스위치 구축물은 본 명세서에 기재되어 있다. 리보스위치를 활성화시키는 화합물 또는 리보스위치 활성화 활성을 나타내는 화합물의 동정은 1종 이상의 특정 리보스위치, 리보스위치 구축물 또는 리보스위치 클래스의 관점에서 수행될 수 있다. 편의상, 한 클래스의 리보스위치를 활성화시키거나 한 클래스의 리보스위치에 대한 리보스위치 활성화 활성을 나타내는 화합물로서 동정된 화합물은 특정한 리보스위치, 예컨대, 특정한 종에서 발견되는 리보스위치 클래스에 대해서도 그와 같은 활성을 나타내는 화합물로서 동정될 수 있다. 예를 들어, 사이클릭 다이-GMP 리보스위치를 활성화시키거나 사이클릭 다이-GMP 리보스위치에 대한 리보스위치 활성화 활성을 나타내는 화합물로서 동정된 화합물은 특정한 사이클릭 다이-GMP 리보스위치, 예컨대, 비브리오 콜레라 또는 글루콘아세토박터 자일리누스(Gluconacetobacter xylinus)에서 발견되는 사이클릭 다이-GMP 리보스위치에 대해서도 그와 같은 활성을 나타내는 화합물로서 동정될 수 있다.
B. 항균 화합물의 사용 방법
본 명세서에는 생체내 및 시험관내 항균 방법이 개시되어 있다. "항균"은 세균 생장의 억제 또는 저해, 세균 사멸, 또는 세균 수의 감소를 의미한다. 따라서, 본 명세서에는 본 명세서에 개시된 1종 이상의 화합물 유효량과 세균을 접촉시키는 단계를 포함하는, 세균 생장의 억제 또는 저해 방법이 개시되어 있다. 개시된 화합물에 대한 추가 구조는 본 명세서에 기재되어 있다.
본 명세서에는 리보스위치에 결합하는 화합물과 세포를 접촉시키는 단계를 포함하는 세균 세포 생장의 억제 방법이 개시되어 있는데, 이때 상기 세포는 상기 화합물에 반응하는 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물은 리보스위치에 결합하여 유전자의 발현을 변화시킴으로써 세균 세포 생장을 억제한다. 상기 리보스위치는 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치일 수 있다. 이 방법은 상기 화합물과 접촉하지 않은 세포에 비해 세균 세포 생장을 10% 이상 감소시킬 수 있다. 상기 화합물과 상기 세포는 상기 화합물을 개체에게 투여함으로써 접촉할 수 있다. 상기 세포는 개체 내에 있는 세균 세포일 수 있고, 이때 상기 화합물은 세균 세포를 사멸시키거나 세균 세포의 생장을 억제한다. 상기 개체는 세균에 감염된 개체일 수 있다. 상기 화합물은 또 다른 항균 화합물과 함께 투여될 수 있다.
세균은 임의의 세균, 예컨대, 바실러스(Bacillus), 악시네토박터(Acinetobacter), 악티노바실러스(Actinobacillus), 버크콜데리아(Burkholderia), 캄필로박터(Campylobacter), 클로스트리디움(Clostridium), 데설피토박테리움(Desulfitobacterium), 엔테로코커스(Enterococcus), 에르위니아(Erwinia), 에스케리치아(Escherichia), 엑시구오박테리움(Exiguobacterium), 퓨소박테리움(Fusobacterium), 게오바실러스(Geobacillus), 게오박터(Geobacter), 글루콘아세토박터(Gluconacetobacter), 해모필러스(Haemophilus), 헬리오박터(Heliobacter), 클렙시엘라(Klebsiella), 아이디오마리나(Idiomarina), 락토바실러스(Lactobacillus), 락토코커스(Lactococcus), 류코노스톡(Leuconostoc), 리스테리아(Listeria), 모오렐라(Moorella), 마이코박테리움(Mycobacterium), 오셔노바실러스(Oceanobacillus), 오셔노코커스(Oenococcus), 파스테르엘라(Pasteurella), 페디오코커스(Pediococcus), 슈도모나스(Pseudomonas), 쉐와넬라(Shewanella), 쉬겔라(Shigella), 솔리박터(Solibacter), 스타필로코커스(Staphylococcus), 스트렙토코커스(Streptococcus), 써모아내로박터(Thermoanaerobacter), 써모토가(Thermotoga), 및 비브리오(Vibrio) 속으로부터 선택된 세균일 수 있다. 세균은 예를 들어, 악티노바실러스 플레우로뉴모니아(Actinobacillus pleuropneumoniae), 바실러스 안쓰라시스(Bacillus anthracis), 바실러스 세레우스(Bacillus cereus), 바실러스 클라우시이(Bacillus clausii), 바실러스 할로두란스(Bacillus halodurans), 바실러스 리체니포르미스(Bacillus licheniformis), 바실러스 서브틸리스, 바실러스 쑤링기엔시스(Bacillus thuringiensis), 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum), 클로스트리디움 디피실(Clostridium dificile), 클로스트리디움 퍼프링겐스(Clostridium perfringens), 클로스트리디움 테타니(Clostridium tetani), 클로스트리디움 써모셀룸(Clostridium thermocellum), 데설피토박테리움 하프니엔스(Desulfitobacterium hafniense), 엔테로코커스 패칼리스(Enterococcus faecalis), 에르위니아 카로토보라(Erwinia carotovora), 에스케리치아 콜라이, 엑시구오박테리움 종, 퓨소박테리움 뉴클레아툼(Fusobacterium nucleatum), 게오바실러스 카우스토필러스(Geobacillus kaustophilus), 게오박터 설퍼리덕센스, 글루콘아세토박터 자일리누스, 해모필러스 듀크레이이(Haemophilus ducreyi), 해모필러스 인플루엔자(Haemophilus influenzae), 해모필러스 솜너스(Haemophilus somnus), 아이디오마리나 로이히엔시스(Idiomarina loihiensis), 락토바실러스 애시도필러스(Lactobacillus acidophilus), 락토바실러스 카세이(Lactobacillus casei), 락토바실러스 델브루엑키이(Lactobacillus delbrueckii), 락토바실러스 가세리(Lactobacillus gasseri), 락토바실러스 존소니이(Lactobacillus johnsonii), 락토바실러스 플란타룸(Lactobacillus plantarum), 락토코커스 락티스(Lactococcus lactis), 류코스톡 메센테로이데스(Leuconostoc mesenteroides), 리스테리아 인노쿠아(Listeria innocua), 리스테리아 모노사이토게네스(Listeria monocytogenes), 모오렐라 써모아세티카(Moorella thermoacetica), 오셔노바실러스 아이헤이엔시스(Oceanobacillus iheyensis), 오셔노코커스 오에니(Oenococcus oeni), 파스테르엘라 뮬토시다(Pasteurella multocida), 페디오코커스 펜토사세우스(Pediococcus pentosaceus), 슈도모나스 애루기노사(Pseudomonas aeruginosa), 쉐와넬라 오네이덴시스(Shewanella oneidensis), 쉬겔라 플렉스네리(Shigella flexneri), 솔리박터 우시타투스(Solibacter usitatus), 스타필로코커스 아우레우스(Staphylococcus aureus), 스타필로코커스 에피데르미스(Staphylococcus epidermidis), 써모아내로박터 텡콘겐시스(Thermoanaerobacter tengcongensis), 서모토가 마리티마(Thermotoga maritima), 비브리오 콜레라, 비브리오 피쉐리(Vibrio fischeri), 비브리오 파라해몰리티커스(Vibrio parahaemolyticus) 또는 비브리오 불니피커스(Vibrio vulnificus)일 수 있다. 또한, 세균 생장은 세균이 발견되는 임의의 부분에서 억제될 수 있다. 예를 들어, 체액, 생체막 또는 표면에서의 세균 생장이 억제될 수 있다. 본 명세서에 개시된 화합물은 임의의 다른 화합물 또는 조성물과 함께 투여될 수 있거나 병용될 수 있다. 예를 들어, 본 명세서에 개시된 화합물은 또 다른 항균 화합물과 함께 투여될 수 있거나 병용될 수 있다.
"세균 생장의 억제"는 딸세포로 분열하는 단일 세균의 능력 감소, 또는 딸세포를 형성하는 세균 집단의 능력 감소로서 정의된다. 세균의 재생 능력은 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 100% 이상까지 감소될 수 있다.
또한, 본 명세서에는 본 명세서에 개시되고 기재된 1종 이상의 화합물과 세균을 접촉시키는 단계를 포함하는, 세균 또는 세균 집단 생장 억제 방법 및/또는 세균 또는 세균 집단의 사멸 방법이 개시되어 있다.
"세균의 사멸"은 단일 세균의 사멸 야기, 또는 복수의 세균, 예컨대, 콜로니 중의 세균의 수 감소로서 정의된다. 세균이 복수형으로 언급되는 경우, "세균들의 사멸"은 소정의 세균 집단의 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100% 이하의 세균이 사멸하는 속도로 상기 세균 집단의 세포가 사멸하는 것으로서 정의된다.
본 명세서에 개시된 화합물 및 조성물은 시험관내에서 또는 생체내에서 항균 활성을 나타내고, 살균 활성을 나타낼 수 있는 다른 화합물 또는 조성물과 병용병용.
본 명세서에 기재된 화합물의 "치료 유효량"이라는 용어는 독성을 나타내지 않되 1종 이상의 증상에서의 원하는 감소를 제공하기에 충분한 화합물 양을 의미한다. 이하에 기재되는 바와 같이, 화합물의 정확한 필요량은 개체의 종, 성별 및 일반적인 증상, 치료될 질환의 심각도, 사용되는 구체적인 화합물, 투여 방식 등에 따라 개체마다 다를 것이다. 따라서, 정확한 "유효량"을 특정할 수는 없다. 그러나, 적정한 유효량은 관용적인 실험만으로 당업자에 의해 결정될 수 있다.
본 명세서에 개시된 조성물 및 화합물은 약학적으로 허용가능한 담체와 함께 생체내로 투여될 수 있다. "약학적으로 허용가능한"은 생물학적 활성을 나타내지 않거나 바람직하지 않은 활성을 나타내지 않는 물질, 즉 임의의 바람직하지 않은 생물학적 효과를 일으키지 않거나 약학 조성물 중에 함유된 임의의 다른 성분들과 유해한 방식으로 상호작용하지 않으면서 개체에게 투여될 수 있는 물질을 의미한다. 당업자에게 잘 공지되어 있는 바와 같이, 상기 담체는 일반적으로 활성 성분의 임의의 분해를 최소화하고 개체 내에서 임의의 불리한 부작용을 최소화하도록 선택될 것이다.
본 명세서에 개시된 조성물 또는 화합물은 경구, 비경구(예를 들어, 정맥내), 근육내 주사, 복강내 주사, 경피, 체외, 국소(국소 비강내 투여 또는 흡입제에 의한 투여를 포함함) 경로 등을 통해 투여될 수 있다. 본 명세서에서 사용된 "국소 비강내 투여"는 콧구멍 중 하나 또는 둘다를 통해 코 또는 비강 경로 내로 조성물을 전달하는 것을 의미하고 분무 기작 또는 소적 기작을 통한 전달, 또는 핵산 또는 벡터의 에어로졸화를 통한 전달을 포함할 수 있다. 흡입제에 의한 조성물의 투여는 분무 또는 소적 기작에 의한 전달을 통한 코 또는 입을 통해 이루어질 수 있다. 전달은 삽관을 통해 호흡 시스템의 임의의 영역(예컨대, 폐)으로 직접적으로 이루어질 수도 있다. 필요한 조성물의 정확한 양은 개체의 종, 성별, 체중 및 일반적 증상, 치료될 알레르기성 장애의 심각도, 사용될 구체적인 핵산 또는 벡터, 투여 방식 등에 따라 개체마다 다를 것이다. 따라서, 조성물마다 정확한 양을 특정할 수는 없다. 그러나, 적정량은 본 명세서의 교시가 주어진 한 관용적인 실험만으로 당업자에 의해 결정될 수 있다.
조성물 또는 화합물의 비경구 투여는 이용되는 경우 일반적으로 주사를 특징으로 한다. 주사제는 액상 용액 또는 현탁액과 같은 보편적인 형태, 주사 전에 액체 중의 현탁액을 제조하기에 적합한 고체 형태, 또는 에멀젼으로서 제조될 수 있다. 비경구 투여에 대한 보다 최근의 개선된 방법은 일정한 투여량이 유지되도록 서방출 또는 지속 방출 시스템을 사용하는 것을 포함한다. 예를 들어, 본 명세서에 참고로 도입되는 미국 특허 제3,610,795호를 참조한다.
본 명세서에 개시된 조성물 및 화합물은 약학적으로 허용가능한 담체와 치료적으로 병용될 수 있다. 적절한 담체 및 이의 제제는 문헌(Remington: The Science and Practice of Pharmacy (19th ed.) ed. A.R. Gennaro, Mack Publishing Company, Easton, PA 1995)에 기재되어 있다. 전형적으로, 적정량의 약학적으로 허용가능한 염을 제제 중에 사용하여 상기 제제가 등장성을 나타내게 한다. 약학적으로 허용가능한 담체는 생리식염수, 링거액 및 덱스트로스 용액을 포함하나 이들로 한정되지 않는다. 상기 용액의 pH는 바람직하게는 약 5 내지 약 8이고, 더 바람직하게는 약 7 내지 약 7.5이다. 추가 담체는 지속 방출 제제, 예컨대, 항체를 함유하는 고체 소수성 중합체로 이루어져 있고 성형 제품, 예컨대, 막, 리포좀 또는 미세입자의 형태인 반투과성 매트릭스를 포함한다. 일부 담체가 예를 들어, 투여 경로 및 투여될 조성물의 농도에 따라 더 바람직할 수 있음은 당업자에게 자명할 것이다.
약학적으로 허용가능한 담체는 당업자에게 공지되어 있다. 이들 대다수는 전형적으로 약물을 인간에게 투여하는 데 있어서 표준 담체(멸균수, 생리식염수, 및 생리학적 pH로 완충된 용액과 같은 용액들을 포함함)일 것이다. 조성물은 근육내 또는 피하 경로로 투여될 수 있다. 다른 화합물은 당업자에 의해 이용되는 표준 절차에 따라 투여될 것이다.
약학 조성물은 선택된 분자 이외에 담체, 비후제, 희석제, 완충제, 보존제, 표면활성제 등을 포함할 수 있다. 약학 조성물은 항균제, 소염제, 마취제 등과 같은 1종 이상의 활성 성분을 포함할 수도 있다.
약학 조성물은 국소 치료가 필요한지 아니면 전신 치료가 필요한지, 및 치료될 영역에 따라 다수의 방식으로 투여될 수 있다. 투여는 국소(안내, 질내, 직장, 비강내를 포함함), 경구, 흡입 또는 비경구, 예컨대, 정맥내 드립, 피하, 복강내 또는 근육내 주사에 의해 이루어질 수 있다. 개시된 항체는 정맥내, 복강내, 근육내, 피하, 강내 또는 경피 경로로 투여될 수 있다.
비경구 투여를 위한 제제는 멸균 수용액 또는 비-수용액, 현탁액 및 에멀젼을 포함한다. 비-수성 용액의 예는 프로필렌 글리콜, 폴리에틸렌 글리콜, 식물성 오일, 예컨대, 올리브유, 및 주사가능한 유기 에스터, 예컨대, 에틸 올레에이트이다. 수성 담체는 물, 알코올성/수성 용액, 에멀젼 또는 현탁액(생리식염수 및 완충된 매질을 포함함)을 포함한다. 비경구 비히클은 염화나트륨 용액, 링거 덱스트로스, 덱스트로스 및 염화나트륨, 락테이트 링거 또는 고정된 오일을 포함한다. 정맥내 비히클은 유체 및 영양분 보충제, 전해질 보충제(예컨대, 링거 덱스트로스를 기초로 한 보충제) 등을 포함한다. 보존제 및 다른 첨가제, 예컨대, 항미생물제, 항산화제, 킬레이팅제, 및 불활성 기체 등도 존재할 수 있다.
국소 투여용 제제는 연고, 로션, 크림, 겔, 점적제, 좌제, 분무제, 액체 및 산제를 포함할 수 있다. 보편적인 약학적으로 허용가능한 담체, 수성, 분말 또는 유성 베이스, 비후제 등이 필요하거나 바람직할 수 있다.
경구 투여용 조성물은 산제 또는 과립제, 물 또는 비-수성 매질 중의 현탁액 또는 용액, 캡슐제, 샤세, 또는 정제를 포함한다. 비후제, 방향제, 희석제, 유화제, 분산 보조제 또는 결합제가 필요할 수 있다.
일부 조성물은 무기 산, 예컨대, 염산, 브롬화수소산, 과염소산, 질산, 티오시안산, 황산 및 인산, 및 유기 산, 예컨대, 포름산, 아세트산, 프로피온산, 글리콜산, 락트산, 피루브산, 옥살산, 말론산, 석신산, 말레산 및 푸마르산과의 반응에 의해 형성되거나, 또는 무기 염기, 예컨대, 수산화나트륨, 수산화암모늄, 수산화칼륨, 및 유기 염기, 예컨대, 모노알킬 아민, 다이알킬 아민, 트라이알킬 아민, 아릴 아민 및 치환된 에탄올아민과의 반응에 의해 형성된 약학적으로 허용가능한 산 부가 염 또는 염기 부가 염으로서 투여될 수 있다.
본 명세서에 개시된 치료 조성물은 화합물 분자에 커플링된 개별 담체로서의 단일클론 항체의 사용을 통해 전달될 수도 있다. 본 명세서에 개시된 치료 조성물은 표적화가능한 약물 담체로서의 가용성 중합체와 커플링될 수도 있다. 상기 중합체는 폴리비닐-피롤리돈, 피란 공중합체, 폴리하이드록시프로필메타크릴-아마이드페놀, 폴리하이드록시에틸아스파르트아마이드페놀, 또는 팔미토일 잔기로 치환된 폴리에틸렌옥사이드폴리라이신을 포함하지만 이들로 한정되지 않는다. 게다가, 본 명세서에 개시된 치료 조성물은 약물의 조절된 방출을 달성하는 데 유용한 생분해가능한 중합체 클래스, 예컨대, 폴리락트산, 폴리엡실론 카프로락톤, 폴리하이드록시 부티르산, 폴리오르쏘에스터, 폴리아세탈, 폴리다이하이드로-피란, 폴리시아노아크릴레이트, 및 가교-결합된 또는 양친매성 하이드로겔 블록 공중합체에 커플링될 수 있다.
바람직하게는 약 3% 이상, 더 바람직하게는 약 10%, 더 바람직하게는 약 20%, 더 바람직하게는 약 30%, 더 바람직하게는 약 50%, 더 바람직하게는 75%, 훨씬 더 바람직하게는 약 100%의 진균 감염이 화합물의 투여로 인해 감소될 수 있다. 감염의 감소는 감소된 백혈구 세포수, 낮아진 열, 완화된 염증, 감소된 세균 수 및 세균 감염에 있어서의 다른 증상의 감소와 같은 파라미터에 의해 결정된다. 세균 감염 감소의 비율을 증가시키기 위해, 투여량은 개체에 대해 무독성을 나타내는 가장 효과적인 수준까지 증가될 수 있다.
본 명세서 전체에서 사용된 "개체"는 단일체를 지칭한다. 바람직하게는, 개체는 비-인간 포유동물 또는 영장류, 더 바람직하게는 인간과 같은 포유동물이다. "개체"는 애완동물(예컨대, 고양이, 개 등), 가축(예를 들어, 소, 말, 돼지, 양, 염소 등), 실험용 동물(예컨대, 마우스, 토끼, 래트, 기니아 피그 등) 및 어류를 포함할 수 있다.
"세균 감염"은 개체 또는 샘플 중의 세균의 존재로서 정의된다. 상기 세균은 상기 개체 또는 샘플 중에서의 천연 발생적 세균의 생장일 수 있거나, 또는 외래 유기체의 침윤에 기인할 수 있다.
본 명세서에 개시된 화합물은 항생제와 동일한 방식으로 사용될 수 있다. 항생제의 사용은 당업계에 잘 확립되어 있다. 항생제의 사용의 일례는 동물의 치료이다. 필요한 경우, 본 명세서에 개시된 화합물은 통상적으로 수의사 또는 영양사의 전문적 지침에 따라 주사를 통해 또는 사료 또는 물을 통해 동물에게 투여될 수 있다. 본 명세서에 개시된 화합물은 질환 심각도 및 동물 종과 같은 환경에 따라 개별적으로 또는 군으로 나누어 동물에게 전달된다. 전체 동물 무리의 치료 및 보호는 모든 동물들이 유사한 면역 상태에 있고 모든 동물이 동일한 질환-유발 미생물에 노출된 경우 필요할 수 있다.
본 화합물의 사용의 또 다른 예는 미생물에 감염된 수생 동물을 선택하는 단계, 개시된 본 화합물, 킬레이팅제, 예컨대, EDTA 및 TRIENE을 포함하는 항균 용액을 제공하는 단계; pH 완충제를 상기 용액에 첨가하여 상기 용액의 pH를 약 7.0 내지 약 9.0의 값으로 조절하는 단계; 상기 수생 동물을 상기 용액에 침지시키고 상기 동물의 미생물 역가를 감소시키기에 효과적인 기간 동안 상기 수생 동물을 상기 용액 내에 방치하는 단계; 상기 수생 동물을 상기 용액으로부터 제거하는 단계; 및 상기 수생 동물을 상기 용액이 함유되지 않은 물로 돌려보내는 단계를 포함하는, 수생 동물의 미생물 감염을 감소시키는 것이다. EDTA, 개시된 본 화합물, TRIENE 및 pH 완충제를 함유하는 용액 중에 수생 동물을 침지시키는 단계는 상기 동물의 미생물 역가가 소멸할 때까지 반복할 수 있다(미국 특허 제6,518,252호 참조).
본 명세서에 개시된 화합물의 다른 용도는 치과 치료 및 물의 정제(이는 예를 들어, 수돗물, 오수 처리 시스템, 휴대용 및 비-휴대용 물 공급, 및 사육장을 포함할 수 있음)를 포함하나 이들로 한정되지 않는다.
C. 유발 분자의 제조 방법
본 명세서에는 유발 분자를 생성할 수 있는 돌연변이체 세균 세포를 배양하는 단계로서, 상기 돌연변이체 세균 세포가 상기 유발 분자에 반응하는 리보스위치 내에 돌연변이를 포함하고, 상기 돌연변이가 이 돌연변이를 갖지 않는 세포에 비해 돌연변이체 세균 세포에 의한 상기 유발 분자의 생성을 증가시키는, 단계; 및 세포 배양물로부터 상기 유발 분자를 단리하여 상기 유발 분자를 제조하는 단계를 포함하는, 유발 분자의 제조 방법이 개시된다. 상기 유발 분자는 사이클릭 다이-GMP, SAH, preQ1, Moco 또는 SAM일 수 있다.
돌연변이체 세균 세포는 넉아웃 돌연변이체일 수 있고, 이때 상기 세포는 유발 분자에 반응하는 리보스위치를 생성할 수 없다. 상기 세균 세포에는 리보스위치를 코딩하는 영역이 완전히 제거될 수 있다. 유발 분자의 생성은 10, 20, 30, 40, 50, 60, 70, 80 또는 90% 이상 증가될 수 있다. 이것은 온전한 리보스위치를 갖는 세포에 의해 생성된 유발 분자의 양과 비교된 유발 분자의 전체적인 양에 의해 측정될 수 있다.
또한, 본 명세서에는 유발 분자에 반응하는 리보스위치 내에 돌연변이를 포함하는 세균 세포가 개시되고, 이때 상기 돌연변이는 이 돌연변이를 갖지 않은 세포에 비해 상기 돌연변이를 갖는 세포에 의한 상기 유발 분자의 생성을 측정가능하게 증가시킨다. "측정가능하게 증가시킨다"는 유발 분자의 생성이 10, 20, 30, 40, 50, 60, 70, 80 또는 90% 이상 증가됨을 의미한다.
A.
CMfinder
비교 유전체학 파이프라인(
pipeline
)을 사용한, 세균 내의 22종의 구 조화된
RNA
후보물질의 동정
비교 유전체학을 기초로 한 자동화된 파이프라인을 세균에 적용하여 22종의 후보 RNA 모티프를 동정하였다. 이 중 6종의 후보 RNA 모티프는 특정한 대사물질과의 결합 시 유전자 발현을 조절하는 mRNA 요소인 리보스위치인 것으로 예측되었다. 별도의 연구에서, 상기 6종의 후보 RNA 모티프 중 2종의 후보 RNA 모티프는 신규 리보스위치임이 확인되었다. 다른 3종의 후보 리보스위치는 락토바실라레스(Lactobacillales) 목의 잠재적 수송자 유전자, 버크홀데리알레스(Burkholderiales) 목의 시트르산 주기 유전자, 또는 여러 문의 Moco 생합성 유전자의 업스트림에 위치한다. 나머지 후보 리보스위치인, 광범위하게 분포된 GEMM 모티프는 비브리오 콜레라의 선천적 컴피턴스(competence) 및 게노박터 설퍼리덕센스에서의 전자 수용체로서의 금속 이온의 사용에 있어서 중요한 유전자와 관련되어 있다. 나머지 모티프들 중에서 한 모티프는 이미 공개된 후보 리보스위치인 ykkC/yxkD와 유사한 유전적 분포를 갖지만 상이한 구조를 갖는다. 가능한 비-코딩 RNA 및 여러 종의 추가 시스-조절 RNA가 5종의 문(phylum)에서 동정되었는데, 상기 시스-조절 RNA 중 1종은 ε-프로테오박테리아(퓨린 생합성에 관여하는 purD의 업스트림)에서 동정되었고 다른 1종은 시아노박테리아(ATP 합성효소 오페론 내)에서 동정되었다. 이 후보 RNA들은 다수의 세포내 과정에 관여하는 RNA 모티프의 증가하는 목록에 추가되고 많은 다른 RNA가 미발견 상태임을 보여준다.
신규 구조화된 RNA의 최근 발견(He, 2006; Storz, 2005; Kima, 2006; Claverie, 2005)은 이러한 RNA가 세포에 공통적으로 존재함을 입증한다. 추가 구 조화된 RNA의 발견을 보조하기 위해, 세균 내의 보존된 RNA를 동정할 수 있는 자동화된 파이프라인이 개발되었다(Yao, 2007). 상기 파이프라인은 유사한 유전자들의 mRNA의 잠재적인 5' UTR(비-번역 영역)을 조립하고 CMfinder(Yao, 2006) 프로그램을 이용하여 UTR 세트 각각 내에서 보존된 RNA 구조 또는 "모티프"를 예측한다. 그 다음, 자동화된 유사성 검색이 상기 모티프의 추가 예를 찾는 데 사용되는데, 이때 CMfinder는 모티프 각각의 2차 구조 모델 및 서열 정렬을 개선하는 데 사용된다. 결과물은 예측된 RNA 2차 구조를 갖는 정렬 세트이고, 상기 정렬은 추후에 모델을 개선시키고 어떤 모티프가 추가 연구에 유리할지를 평가하기 위해 수동으로 분석된다.
RNA에 대한 다른 자동화된 검색이 수행되어 왔지만(Barrick, 2004; Corbino, 2005; Axmann, 2005; Seliverstov, 2005; McCutcheon, 2003; Coventry, 2004; Washietl, 2005; Pedersen, 2006; Torarinsson, 2006), 상기 파이프라인은 3종의 특징에 의해 상기 다른 자동화된 검색과 구별된다. 첫째, 상기 파이프라인은 일부 투입 서열이 모티프를 포함하지 않거나 관련 없는 서열 도메인을 갖는 모티프 대표물을 포함하는 경우조차도 모티프를 발견할 수 있는 CMfinder를 사용한다. 또한, CMfinder는 서열 보존도가 낮은 경우조차도 유용한 정렬을 발생시킬 수 있으나, 알고리즘은 어느 정도의 서열 유사성이 존재하는지를 이용할 것이다. 둘째, 상기 파이프라인은 유사성 검색을 도입하여 모티프 각각의 정렬 및 구조 모델을 자동적으로 다듬는다. 셋째, 상기 파이프라인은 유사 유전자들의 UTR들을 정렬하기 때문에 시스-조절 RNA를 찾기에 매우 적합하고 서열 보존성에 대한 그의 의존도가 더 감소 된다.
실제로, 퍼미큐트 문에 속하는 세균을 시험 케이스로서 사용하는 경우, 상기 파이프라인은 사실상 모두 공지되어 있는 시스-조절 RNA에 대한 유용한 예측을 수행함이 이미 입증되었다(Yao, 2007). 상기 파이프파인은 유사 유전자의 업스트림에 존재할 경우 트랜스-코딩된 또는 "비-코딩 RNA"(ncRNA)일 가능성이 높은 모티프도 발견한다.
상기 파이프라인은 게놈이 시퀀싱된 모든 세균들에서 구조화된 RNA를 발견하는 데 사용될 수 있다. 보존되고 구조화된 RNA일 가능성이 높은 22종의 모티프가 기재된다. 특정한 소분자를 직접적으로 감지하고 유전자 발현을 조절하는, mRNA에서 통상적으로 발견되는 구조화된 RNA의 일종인 리보스위치는 연구의 주된 대상이었다(Winkler, 2005; Batey, 2006). 후속 실험들은 이 모티프들 중 2종의 모티프가 신규 리보스위치임을 확인시켜주었다. 첫 번째 모티프는 SAH에 결합하고(도 1), 두 번째 모티프는 스트렙토마이세스 코엘리칼러(Streptomyces coelicolor) 및 관련 종의 SAM-결합 리보스위치이다. 또 다른 후보 리보스위치에서의 실험적 증거는 상기 또 다른 후보 리보스위치가 몰리브데늄 보조인자 또는 "Moco"를 감지함을 입증한다.
특히 흥미로운 후보물질은 리보스위치의 전형적인 성질을 나타내는 GEMM 모티프이다. 예를 들어, GEMM은 광범위하게 분포되어 있고 309종의 경우 중 297종의 경우에서 인접한 ORF의 5' UTR에 존재할 가능성이 높도록 배치된, 광범위하게 분포되고 고도로 보존된 유전적 요소이다. GEMM에 의해 조절되는 것으로 추정되는 유 전자들은 전형적으로 세포외 조건을 감지하여 반응하는 것과 관련되어 있는데, 이것은 GEMM이 신호 전달도입 또는 세포-세포 정보교환을 위해 생성된 대사물질을 감지할 수 있음을 암시한다.
1. 재료 및 방법
i. 후보 RNA 모티프의 동정
보존된 도메인 데이터베이스(Marchler-Bauer, 2005) 버전 2.08에서 분류된 유전자들의 잠재적 5' UTR을 자동화된 파이프라인(Yao, 2007)을 위한 투입물로서 사용하였다. 완성된 게놈 서열 및 유전자 위치는 RefSeq(Pruitt, 2005) 버전 14로부터 얻었지만, 유전자 내용이 다른 게놈과 매우 유사한 게놈은 제거되었다. UTR 추출 알고리즘(Neph, 2006)을 통해 UTR이 오페론 구조로 인해 항상 유전자의 바로 업스트림에 존재하지 않을 수 있다는 사실을 알 수 있다.
보존된 도메인 각각의 경우, 잠재적 UTR의 모아진 서열들을 투입물로서 CMfinder 버전 0.2에 제공하였는데, 이때 상기 CMfinder 버전 0.2는 UTR 세트 내의 구조적으로 보존된 모티프의 다수의 국소적 서열 정렬을 발생시켰다. 이어서, 상기 정렬을 사용하여 해석된 IGR 내에서 유사체(homolog)를 검색하였는데, 이때 잘못 해석된 ORF를 설명하기 위해 상기 IGR을 양 말단 상에서 50개 뉴클레오티드까지 연장하였다. 이 유사성 검색은 ML-발견적 필터(Weinberg, 2006)를 사용하는 RAVENNA 프로그램 버전 0.2f(Weinberg, 2004; Weinberg, 2004ii; Weinberg, 2006), 인퍼날(Infernal)(Eddy, 2005) 버전 0.7에 의해 실시되는 전반적인 모드의 공변산 모델(Eddy, 1994) 및 10의 E-값(Klein, 2003) 컷-오프를 사용하여 수행하였다. 공 지된 RNA는 Rfam 데이터베이스(Griffiths-Jones, 2005) 버전 7.0을 기초로 하여 검출하였다. 짧은 서열들의 계통발생적 보존성, 종의 다양성 및 구조적 기준을 기초로 하여 예측에 대한 점수를 매겼다. 상기 파이프라인 알고리즘은 다른 부분에서 더 상세히 기재되어 있다(Yao, 2007).
세균 게놈 서열 데이터를 군으로 나누고, UTR 추출을 수행하고, 모티프 예측 및 유사성 검색을 각 군에 대해 개별적으로 수행하였다. 이것의 수행 동기는 상이한 문에 속하는 UTR이 종종 동일한 모티프를 함유하지 않는다는 사실이었다. 그러나, 시퀀싱된 몇몇 구성원을 갖는 문을 분류학에 기초하여 합하여 모티프를 예측하기에 충분한 시퀀스 데이터를 모았다. 1종 또는 2개의 시퀀싱된 구성원만을 갖는 문(예를 들어, 클로로플렉시)은 무시하였다. 하기 8종의 문이 사용되었다: (1) 퍼미큐트, (2) 악티노박테리아, (3) α-프로테오박테리아, (4) β-프로테오박테리아, (5) γ-프로테오박테리아, (6) δ- 및 ε-프로테오박테리아, (7) 시아노박테리아 및 (8) 박테로이데트(Bacteroidetes), 클로로비(Chlorobi), 클라미디아(Chlamydiae), 베루코마이크로비아(Verrucomicrobia) 및 스피로샤에트(Spirochaetes).
ii
. 후보 모티프의 분석 및 유사성 검색 방법
가능성이 높은 모티프를 선택하고, 추가 유사성 검색을 수행하여 상기 모티프를 더 분석하고, RALEE(Griffiths-Jones, 2005)를 사용하여 상기 모티프의 정렬을 편집하였다. NCBI BLAST(Altschul, 1997), Mfold(Zuker, 2003) 및 Rnall(Wan, 2004)을 사용하여 rho-독립적 전사 종결요소를 동정하였고, CMfinder 및 RAVENNA를 사용하여 이 분석을 보조하였다. 모티프와 관련된 대사 경로에 대한 정보는 KEGG(Kanehisa, 2006)로부터 회수하였다. 추가 구조화된 요소를 동정하여 정렬을 확장하기 위해, 정렬을 그의 5' 말단 및 3' 말단 상에서 50 내지 100개 뉴클레오티드만큼 연장하고, 필요한 경우 CMfinder를 사용하거나 수동 조사를 수행하여 재정렬하였다.
유사체에 대한 추가 검색은 여러 방식으로 RAVENNA를 사용하였다. 전반적-모드 및 국소적-모드(Eddy, 2005) 공변산 모델 검색 둘다 상보적 결과를 제공하였다. 수동으로 수행된 검색에서 사용된 서열 데이터베이스는 RefSeq 버전 19(Pruitt, 2005)의 "미생물" 서브세트, 산성 광산 폐수로부터 유래된 환경적 유래 쇼트건(shotgun) 서열(Tyson, 2004)(진뱅크 등록번호 AADLO1000000) 및 조해(Sargasso Sea)로부터 유래된 쇼트건 서열(AACY01000000)이었다.
적절한 경우, 이 서열들의 4종의 서브세트를 검색하였다. 첫째, 환경 유래 서열 데이터는 항상 사용되지 않았다. 둘째, 모티프의 원출처인 세균 군 내의 게놈만이 검색되었다(예를 들어, β-프로테오박테리아). 셋째, (상기와 같이 50개 뉴클레오티드만큼 연장된) IGR만이 검색되었다. 넷째, BLAST 프로그램 tblastn을 이용하여 모티프와 관련된 유전자와 유사한 유전자를 검색하였다. 이어서, 일치된 서열의 2 Kb 업스트림(5' UTR을 포함하는 것으로 예측됨) 및 200개 뉴클레오티드 다운스트림에 대한 RAVENNA 검색을 수행하였다(겉보기 코딩 유사성은 진정한 ORF의 업스트림까지 연장되어 BLAST가 개시 코돈을 잘못 확인하게 할 수 있기 때문임). 모티프 세균 군을 BLAST 데이터베이스로서 사용함으로써 고도로 분기된 유사체를 용이하게 발견할 수 있었다. 예를 들어, ε-프로테오박테리아에서 purD 유전자의 업스트림 검색은 말단-절단된 줄기를 갖는 purD 모티프(하기 참조)의 유사체를 보여주었다. 추가로, 이러한 작은 데이터베이스에서 ML-발견적 필터는 RAVENNA에서와 동일하다. 전장 서열 세트를 BLAST 데이터베이스로서 사용한 경우, 이것은 다른 문에서 유사체를 찾는 데 도움이 될 수 있다.
iii
. 모티프의 배제
구조화된 RNA의 특징을 보이지 않는 모티프는 추가 연구로부터 배제되었다. 예측된 구조가 부정확한 모티프를 배제하기 위해, 예측된 구조에서 모든 염기쌍을 제거함으로써 서열 정보만을 이용하여 유사성 검색을 수행하였다. 구조를 보존하지 않는 서열-기재 일치는 예측된 구조가 부정확한 것임을 나타낸다. 그러나, 이러한 유사체는 구조가 보존되어 있다고 가정하는 공분산 모델에 의해 누락될 수 있다. 서열 유사체가, 제시된 구조가 사실상 잘 보존되어 있지 않음을 보여주는 경우 이 기법을 이용하여 여러 모티프를 배제하였다.
iv. 컨센서스 도표를 위한 보존도 및 공변이도의 확립
컨센서스 도표(예를 들어, 도 1에서와 같은 도표)에 반영되는 보존도를 확립하기 위해, 서열의 중량을 측정하여 고도로 유사한 유사체를 덜 강조하였다. 중량 측정은 인퍼날(Eddy, 2005)에 의해 실시되는 바와 같이 GSC 알고리즘(Gerstein, 1994)을 사용한 후, 중량이 측정된 뉴클레오티드 빈도를 다수의 서열 정렬에서 각 위치에서 계산하였다. 염기쌍을 공변이로서 분류하기 위해, 중량이 측정된 와슨-크릭 또는 G-U 쌍의 빈도를 계산하였다. 그러나, 뉴클레오티드 둘다가 누락되어 있는 정렬된 서열, 또는 뉴클레오티드 중 하나의 뉴클레오티드의 종류가 불확실한(예를 들어, 4종의 염기 중 임의의 염기를 표시하는 "N"인 경우) 정렬된 서열은 배제되었다. 공변이 위치로서의 분류는 두 서열이 모티프를 보유하는 서열 사이에 두 위치에서 상이한 와슨-크릭 또는 G-U 쌍을 갖는 경우 수행하였다. 한 위치만이 상이한 경우, 상용가능한 돌연변이로서 분류되었다. 그러나, 비-와슨-크릭 또는 G-U 쌍의 빈도가 5%보다 높은 경우, 이 위치들은 공변이 또는 상용가능한 돌연변이로서 해석되지 않았다.
2. 결과
i. 신규 RNA 모티프의 평가 및 분석
CMfinder 파이프라인에 의해 예측된 가능성이 높은 구조화된 RNA 모티프를 수동으로 조사하여 컨센서스 서열 및 구조 모델을 다듬고(재료 및 방법 단락 참조) 가능한 기능에 대한 정보를 수득하였다. 후보물질 각각에 대한 핵심적 발견은 표 1에 요약되어 있다. 동정된 22종의 모티프 중 7종의 모티프가 도 1에 도시되어 있다.
추가 연구를 위한 후보 RNA 모티프의 선별은 서열 및 구조 둘다의 보존성, 공변이 및 유전자 내용(예를 들어, 상기 모티프가 특정 유전자 패밀리의 업스트림에 일관되게 존재하는지)의 정량적 평가를 기초로 하였다. 보존된 서열은 구조화된 RNA가 3차 구조를 형성하거나 다른 구속 하에 존재하는 영역 내에 통상적으로 많은 보존된 뉴클레오티드를 갖기 때문에 중요하다. 구조화된 RNA는 종종 가변-길이 줄기 또는 "모듈 줄기"(모든 구조화된 RNA에 존재하는 것이 아니라 일부 구조화된 RNA에만 존재하는 줄기)를 갖는다. 줄기의 양 측면 중 어느 한 측면이 함께 나타나거나 어느 한 측면도 나타나지 않는다는 사실은 공변이와 유사하고 구조가 보존되어 있다는 증거이다.
시스-조절 RNA, 예컨대, 리보스위치는 mRNA 유전자를 조절하는 mRNA의 영역이다. 세균에서, 대다수의 시스-조절 RNA는 조절 하에 있는 mRNA의 5' UTR에서 발견된다. 전사 개시 부위를 확실히 예측할 수 없지만, 요소가 mRNA의 5' UTR에 존재할 수 있는 경우(전사 개시 부위가 요소에 대해 5' 방향으로 존재하는 경우) 대표적 모티프들은 상기 유전자에 대해 "5' 조절 배향"으로 배치되어 있다고 기재된다. 모티프의 대다수 또는 전부가 유전자에 대해 5' 조절 배향으로 배치되어 있는 경우, 이것은 상기 모티프가 시스-조절 기능을 가질 수 있다는 증거이다.
시스-조절 RNA는 종종 2종의 주목할만한 구조적 특징 중 하나, 즉 rho-독립적 전사 종결요소, 또는 SD 서열(세균 리보좀 결합 부위)과 중첩되는 줄기를 갖는다(Winkler, 2005). rho-독립적 전사 종결요소는 강한 헤어핀 및 이 헤어핀 다음에 위치한 4개 이상의 U 잔기로 구성된다(Henkin, 2002). 조절 RNA 도메인은 조건에 따라 종결요소 줄기를 형성함으로써 유전자 발현을 조절할 수 있다. 유사하게, 조건에 따라 형성되는 줄기는 SD 서열과 중첩되어 번역 수준에서 유전자를 조절할 수 있다(Winkler, 2005).
본 연구에서 동정된 일부 모티프들은 단일 또는 탠덤 헤어핀으로 구성된다. 이들 중 일부는 동종이량체 단백질이 반대 가닥 내의 소정의 DNA-기초 요소에 결합하는 단백질-결합 모티프일 가능성이 있다. 편의상, 이러한 모티프들도 이들이 구조화된 RNA를 형성하지 않거나 mRNA 수준에서 작용하지 않을지라도 5' 조절 배향을 갖는다고 기재된다.
ii. GEMM 모티프
GEMM은 세균에 광범위하게 분포되어 있고 잠재적 RNA에 실질적인 생화학적 구속을 부가하는 기능을 암시하는 고도로 보존된 서열 및 구조를 갖는 것으로 보인다. 322종의 GEMM 서열이 그람-양성 세균 및 그람-음성 세균 둘다에서 발견되었다. GEMM은 δ-프로테오박테리아, 특히 게오박터 및 관련된 속에서 공통적으로 발견된다. GEMM은 δ-프로테오박테리아 중에서 알테로모나달레스(Alteromonadales) 및 비브리오날레스(Vibrionales)에 편재되어 있다. GEMM은 퍼미큐트 및 플란토마이세트 문의 일부 목에서도 공통적으로 발견된다. GEMM을 갖는 저명한 병원체는 콜레라 및 탄저 병원체를 포함한다.
서열 데이터가 유전자 해석을 포함하는 309종의 GEMM 예 중에서 297종의 예서 GEMM은 유전자에 대해 5' 조절 배향으로 존재하는데, 이것은 시스-조절 역할을 암시한다. GEMM에 의해 조절되는 것으로 추정되는 유전자는 다양한 기능을 나타내지만, 대다수의 유전자는 세포외 환경 또는 막과 관련되어 있고 많은 유전자가 운동성과 관련된다.
GEMM은 P1 및 P2로서 명명된 2개의 인접한 헤어핀(페어링된 영역)을 포함한다(도 1 및 3 참조). P1은 서열 및 구조 면에서 고도로 보존되어 있고, 3-뉴클레오티드 내부 루프에 의해 분리되어 있고 말단 루프에 의해 캡핑되어 있는 2-염기쌍 줄기 및 6-염기쌍 줄기로 구성되어 있다. 상기 내부 루프는 고도로 보존되어 있고, 상기 말단 루프는 거의 항상 GNRA 테트라루프이다(Hendrix, 1997). P1 줄기는 여러 위치에서 공변이의 상당한 증거를 보이고, 광범위한 세균에 걸쳐 구조 면에서 고도로 보존되어 있다. 이 사실, 및 P2의 보다 낮은 공변이 및 가변-길이 줄기는 GEMM이 조직화된 RNA로서 작용함을 강력히 뒷받침하는 증거를 제공한다. 실시예 2는 GEMM 모티프가 리보스위치에서 작용함을 입증한다. P1과 P2를 연결하는 서열은 332종의 예에서 2개의 예만을 제외하고 사실상 항상 AAA이다.
P2 헤어핀은 P1보다 더 낮은 보존성을 보인다. P1 테트라루프가 GAAA인 경우, GNRA 테트라루프 수용체는 통상적으로 P2에서 발견된다. 상기 수용체는 종종 GAAA 루프가 선호할 것으로 예측되는 잘 공지된 11-뉴클레오티드 모티프이지만, 일부 서열은 신규 테트라루프 수용체일 수 있다. P1이 GYRA 테트라루프를 갖는 경우, 수용체-유사 서열은 거의 항상 존재하지 않지만, P2 염기에 더 가까운 융기부는 종종 발견된다(도 2).
대다수의 GEMM은 rho-독립적 전사 종결요소 헤어핀을 포함한다. 상기 종결요소의 5' 측면은 종종 P2 줄기의 3' 측면과 중첩된다(중첩되어 아마도 경쟁한다)(도 2B). GEMM이 리보스위치인 경우, 리간드 결합은 제안된 P1 및 P2 구조를 안정화시켜 경쟁하는 전사 종결요소가 형성되는 것을 방지할 수 있다. 이 모델에서, 보다 높은 리간드 농도는 유전자 발현을 증가시킨다. δ-프로테오박테리아 내의 GEMM의 1/3 및 다른 분류군 내의 일부 GEMM은 "탠덤(tandem)" 정렬로 존재하는데, 이때 한 GEMM은 동일한 UTR 내의 또 다른 GEMM에 인접하여 3' 방향으로 존재한다. 조절 RNA의 이러한 정렬은 단순한 조절 RNA 구조에 의해 허용되는 것보다 더 복잡한 유전자 발현 조절에 관여한다(Sudarsan, 2006; Welz, 2007; Mandal, 2006).
GEMM의 생물학적 역할의 이해는 GEMM이 조절하는 것으로 추측되는 매우 다양한 미생물 과정에 서광을 비출 수 있다. 사실상, GEMM은 이미 여러 연구의 목적인 2종의 시스템, 즉 비브리오 콜레라 및 게오박테리아 설퍼리덕센스 종과 관련되어 있다. 비브리오 콜레라는 인간에서 콜레라를 유발하지만 그의 수명의 대부분을 물에서 보내고, 비브리오 콜레라는 물에서 많은 갑각류의 키틴-함유 외골격에 부착될 수 있다. GlcNAc(N-아세틸글루코사민)의 중합체인 키틴은 많은 비브리오 콜레라 유전자의 발현에 영향을 미치는 것으로 밝혀졌다(Meibom, 2004). GEMM은 이 키틴-유도된 유전자들 중 2종의 유전자를 조절하는 듯하다. 첫 번째 키틴-유도된 유전자인 gbpA는 키틴 비드(Meibom, 2004) 및 인간 상피세포(Kirn, 2005)에의 부착에 중요할 뿐만 아니라 마우스의 감염(Kirn, 2005)에도 중요하다.
두 번째 키틴-유도된 유전자는 tfoX VC이다. 놀랍게도, 키틴은 비브리오 콜레라에서 천연 경쟁을 유도하고(Meibom, 2004), tfoX VC의 발현은 상기 경쟁에 필수적이다. 비브리오 콜레라는 분리된 2종의 tfoX 도메인들에 상응하는 CDD 모델 COG3070 및 pfamO4994와 일치하는 2종의 유전자를 갖는다. 상기 2종 도메인들은 10-25보다 더 우수한 RPSBLAST (Schaffer, 2001) E-값을 제공한다. 상기 도메인들 중 1종은 tfoX VC(좌위 VC1153)이다. GEMM은 tfoX GEMM(VC1722)으로 지칭되는 나머지 1종의 도메인을 조절하는 듯하다. 따라서, 비브리오 콜레라 및 관련된 세균에서 GEMM은 키틴-유도된 경쟁에 참여하거나, 또는 심지어 키틴 농도가 상승되어 있지 않은 환경 하에서 경쟁을 조절할 것이다.
게오박테리아 설퍼리덕센스 및 관련된 δ-프로테오박테리아는 전자 수용체로서 Fe(III)와 같은 금속 이온을 사용하여 유기 화합물을 산화시켜 ATP를 발생시킬 수 있다(Methe, 2003). GEMM은 게오박터 종에서 선모 조립 유전자와 관련되어 있다. 게오박터 설퍼리덕센스 내의 선모는 전기를 전도하는 것으로 밝혀져 있으므로(Reguera, 2005), 금속 이온을 환원하는 과정의 일부이다.
뿐만 아니라, GEMM은 게오박터 설퍼리덕센스 내의 7종의 사이토크롬 c 유전자를 조절하는 듯하다. 이 세균이 111종의 잠재적 사이토크롬 c 유전자를 갖지만, 7종의 GEMM-관련 유전자들 중 5종의 GEMM-관련 유전자가 이전 연구에서 동정되었고 특별한 역할을 수행할 것이다. OmcS(외막 사이토크롬 S)는 게오박터 설퍼리덕센스의 외막 상에 매우 풍부하게 존재하는 2종의 단백질 중 1종이고 불용성 Fe(III) 산화물을 환원시키는 데에는 요구되지만 가용성 Fe(III) 시트레이트를 산화시키는 데에는 요구되지 않는다(Mehta, 2005). OmcG 및 OmcH는 많은 조건 하에서 필수적인 사이토크롬 c인 OmcB의 생성에 필요하다(Kimm, 2006). OmcA 및 OmcT는 OmcG, OmcH 또는 OmcS와 관련되어 있다. 나머지 4종의 Omc, 즉 OmcB, OmcC, OmcE 및 OmcF만이 GEMM과 직접적으로 관련되지 않은 게오박터 설퍼리덕센스에서 남아있다.
공지된 리보스위치와 달리, GEMM은 매우 다양한 유전자 기능과 관련되어 있다(표 2). 이 결과는 GEMM 리보스위치가 대사 경로의 조절을 위한 전형적인 피드백(feedback) 센서로서 기능하지 않음을 의미한다. 오히려, GEMM은 신호 전달도입 또는 가능하게는 세포-세포 정보교환에 관여하는 제2 메신저 분자를 감지한다(Bassler, 2006). 실시예 2는 상기 제2 메신저인 GEMM 모티프의 유발 분자가 사이클릭 다이-GMP임을 입증한다. 이 방식으로, 다양한 세균이 GEMM 및 그의 신호전달 분자를 사용하여 다양한 과정을 조절한다. 많은 GEMM-관련 유전자가 신호 전달도입 도메인을 코딩한다는 사실은 신호 전달도입 단백질의 대다수가 한 기작에 의해 조절됨을 암시한다. 실시예 2는 GEMM RNA가 실제로 새로 발견된 리보스위치 클래스의 앱타머 구성요소로서 기능함을 입증한다.
iii. SAH 모티프
SAH 모티프는 모듈 및 가변-길이 줄기를 포함하는 예측된 줄기 영역 내에서 공변이를 보이면서 서열 및 구조 면에서 고도로 보존되어 있다(도 1). SAH 모티프는 주로 β-프로테오박테리아 및 일부 γ-프로테오박테리아, 및 특히 슈도모나스 속에서 SAH 대사와 관련되어 있는 유전자들에 대해 5' 조절 배향에서 발견된다. SAH는 SAM 대사 주기의 일부인데, 상기 대사 주기의 주요 구성요소들은 아미노산 메티오닌 및 이의 유도체인 호모시스테인을 포함한다. SAH는 메틸화 반응을 위해 보조인자로서 SAM을 사용하는 효소의 부산물이다. 전형적으로, SAH는 호모시스테인 및 아데노신으로 가수분해된다. 그 후, 호모시스테인은 메티오닌 및 궁극적으로 SAM을 합성하는 데 사용된다.
높은 농도의 SAH는 세포에게 유해한데, 이는 SAH가 많은 SAM-의존적 메틸트랜스퍼라제를 억제하기 때문이다(Ueland 1982). 따라서, 세포는 SAH의 농도가 독성을 나타내는 수준에 도달하기 전에 상응하는 SAH 농도 및 SAH의 처리를 감지할 필요가 있을 것이다. SAH 모티프와 관련된 유전자는 SAH 가수분해효소(ahcY), 코발라민(cobalamin)-의존적 메티오닌 합성효소(metH), 및 메티오닌 합성에서 사용되는 메틸 공여체를 합성하는 메틸렌테트라하이드로폴레이트 환원효소(metF)이다. SAH 모티프의 이러한 유전적 정렬 및 그의 높은 보존도는 SAH를 감지하고 SAH의 파괴에 필요한 생성물을 발현하는 유전자의 발현을 활성화시키는 SAH 모티프의 역할과 일치한다. 실제로, 생화학적 증거 및 유전학적 증거는 상기 모티프가 SAH-감지 리보스위치라는 가설을 뒷받침한다.
iv. COG4708 모티프
이 모티프는 스트렙토코커스의 몇몇 종 및 락토코커스 락티스에서 COG4708 유전자의 업스트림에서 발견되지만, 스트렙토코커스의 COG4708 유전자 패밀리의 일부는 이 모티프로서 추정되는 RNA 모티프를 갖지 않는다. COG4708 유전자는 막 단백질을 코딩하는 것으로 예측된다.
COG4708 모티프(preQ1-II 모티프로도 지칭될 수 있음)가 계통발생적으로 고도로 구속되어 있고 6종의 서열들만을 각각 1 카피씩 갖지만, 상기 모티프는 공변이, 모듈 줄기 및 가변-길이 줄기를 갖는다(도 1). 상기 모티프는 COG4708 유전자의 SD 서열과 중첩되는 슈도노트를 갖는데, 이것은 상기 모티프가 상기 유전자의 시스-조절자를 코딩함을 입증한다.
변경된 뉴클레오염기 preQ1을 감지하는 리보스위치는 최근에 특징규명되었다(Roth, 2007). 상기 리보스위치가 COG4708과 관련되어 있기 때문에, COG4708이 preQ1과 관련된 대사물질의 수송자라는 주장이 제기되었다. 따라서, COG4708 모티프 또한 preQ1-감지 리보스위치인 것으로 추측되었다. 실험은 이를 뒷받침한다. COG4708 모티프는 이전에 특징규명된 preQ1-감지 리보스위치와 서열 및 구조 면에서 유사성을 공유하지 않는다(Roth, 2007).
v.
sucA
모티프
sucA 모티프는 관련된 다운스트림 유전자 sucB/aceF 및 lpd와 동시에 전사될 가능성이 높은 sucA 유전자에 대해 5' 조절 배향으로만 발견된다. 상기 3종의 유전자의 생성물은 시트르산 주기에서 2-옥소글루타레이트로부터 석시닐-CoA를 합성한다. 모든 검출된 sucA 모티프는 버크홀더리알레스 목의 β-프로테오박테리아 내에 존재한다. sucA 모티프 내의 많은 뉴클레오티드가 엄격하게 보존되어 있지만, 보존되어 있지 않은 뉴클레오티드는 공변이를 보이지 않고 극소수의 비-정규 염기쌍을 보유한다(도 1). 상기 모티프는 잠재적 SD 서열과 중첩되는 줄기를 가짐으로써 시스-조절 RNA에 상응할 수 있다. sucA 모티프의 상대적으로 복잡한 구조는 상기 모티프가 리보스위치일 수 있음을 보여준다.
vi. 23S-메틸 모티프
이 모티프는 23S rRNA에 작용할 수 있는 rRNA 메틸트랜스퍼라제로서 해석된 유전자들의 업스트림에 일관되게 존재한다. 한 예외는 23S-메틸 RNA가 23S rRNA 메틸트랜스퍼라제 ORF로부터 약 3 Kb 정도 떨어져 위치하고 개재 서열의 반대 가닥에 다른 유전자가 존재할 때 발생한다. 23S-메틸 모티프는 퍼미큐트 목에 속하는 락토바실라레스에 국한된다.
23S-메틸 모티프는 2개의 큰 헤어핀으로 구성된다. 제2 헤어핀은 일련의 U로 종결되고 rho-독립적 전사 종결요소일 수 있다. 두 줄기는 상당한 공변이를 갖는데, 이것은 상기 두 줄기가 기능적 RNA의 일부임을 뒷받침하는 강력한 증거를 제공한다. 구조 모델은 많은 페어링된 위치들이 종종 비-정규 염기쌍을 가짐을 보여주지만, 각 모티프는 주로 에너지 면에서 유리한 쌍으로 구성된다. 잠재적 전사 종결요소의 존재는 23S-메틸 모티프가 시스-조절 RNA임을 보여준다. 23S rRNA 메틸트랜스퍼라제는 RNA 기질과 상호작용하기 때문에 리보좀 단백질 유전자의 자가조절과 유사한 방식으로 23S-메틸 모티프를 사용하여 그의 발현을 자가조절할 것이다(Zengel, 1994).
vii.
hemB
/항-
hemB
모티프
이 모티프는 다양한 β-프로테오박테리아, 특히 버크홀데리아에서 발견된다. 상기 모티프의 구조는 양 방향 모두에서 유사한 공변이 및 보존성을 나타내기 때문에 어떤 DNA 가닥이 전사될지는 명확하지 않다. 한 방향에서 상기 모티프는 hemB 유전자의 업스트림에 존재한다. 상기 모티프는 이 방향으로 시스-조절 RNA일 수 있으나, hemB 모티프의 바로 다운스트림에 위치하는, 서로 유사하지 않은 2종의 유전자가 있고, 이들은 시스-조절 RNA의 통상적인 방식으로 조절되기에 부적절한 가닥 상에 배치되어 있다. 다른 방향(항- hemB)에서, 상기 모티프는 전형적으로 유전자의 5' UTR에 존재하지 않는다. 항-hemB 모티프는 전사 종결요소 헤어핀에서 종결된다. 항-hemB의 다운스트림에 위치한 많은 유전자가 반대 가닥 상에 존재하므로 항-hemB가 비-코딩 RNA를 코딩할 수 있음을 알 수 있다.
viii. MAEB(버크홀데리아 내의 대사-관련 요소)
이 모티프는 여러 보존된 위치들을 갖는 단일 헤어핀으로 구성된다(도 1). 상기 모티프는 버크홀데리아에 속하는 β-프로테오박테리아 속에 광범위하게 분포되어 있다. 상기 모티프는 전형적으로 보존된 링커 서열과 함께 일렬로 중복적으로(2 내지 6 카피) 존재하지만 두 경우에서 12 카피만큼 많이 중복적으로 존재한다. 단일 또는 반복 MAEB 모티프가 발견된 141종의 예 중 132종의 예에서 상기 모티프가 한 유전자에 대해 5' 조절 배향으로 존재한다. 사실상, 이 유전자들 중 대다수는 1차 대사에 직접 관련되어 있고(예를 들어, 소분자의 생합성, 이화 또는 수송에 관련된 유전자들), DNA 복구, 복제, 신호전달 또는 운동성과 관련된 유전자가 아니다. 1종 이상의 예에서 MAEB의 다운스트림에 존재하는 46개의 보존된 도메인들(가상의 유전자를 제외함) 중에서 42개의 보존된 도메인들이 1차 대사에 참여하는 것으로서 해석된다. 1차 대사에 관여하지 않는 많은 세균 유전자들이 존재하기 때문에, 이 데이터는 대사 유전자 조절과의 기능적 관련성을 보여준다.
풍부한 글리신에 대한 세포 반응과 MAEB 사이에 관련성이 존재할 수 있다. MAEB는 글리신 절단 시스템의 일부인 gcvP 및 gcvT와 종종 관련되어 있는데, 이때 과량의 글리신이 시트르산 주기 내로 공급된다. MAEB는 여러 시트르산 주기 유전자들과도 관련되어 있다. 그러나, MAEB는 글리신 또는 시트르산 주기와의 보다 약한 관련성과 함께 일부 다른 유전자들과 관련되어 있다. 글리신 절단 시스템과의 관련성은 최대 수의 MAEB 반복부가 상기 시스템의 gcv 유전자와 관련되어 있기 때문에 존재할 수 있다. 뿐만 아니라, 글리신에 결합하는 한 클래스 이상의 리보스위치가 존재하지만, 상기 클래스는 MAEB와 함께 유기체 내에서 게놈 당 1 카피씩만 존재하므로, MAEB가 글리신 조절에 있어서 일정한 역할을 수행할 가능성이 있다.
MAEB 모티프는 염기-페어링을 보존하는 공변이를 보이지만, 나머지는 페어링을 파괴하는 돌연변이를 보유한다. 이 사실은 MAEB 모티프가 사실상 각 단백질 유니트가 반대 가닥에 결합하도록 단백질 이량체에 결합하는 DNA-서열일 수 있음을 보여준다. 대칭 위치들 중 1쌍의 대칭 위치에 있는 뉴클레오티드들은 줄기의 양쪽 측면에서 퓨린(A 또는 G)으로서 보존되어 있다. 퓨린들은 결코 와슨-크릭 쌍을 형성하지 않기 때문에, 이들은 반대 가닥 상에 동일한 뉴클레오티드를 가질 수 없다. DNA 결합 모티프의 예는 상이할 수 있다고 예측되지만, 대칭 퓨린은 상기 모티프 자체(단지 예가 아님)가 반대 가닥 상에서 구별가능한 패턴을 가짐을 암시한다.
ix. 미니-
ykkC
모티프
미니-ykkC 모티프는 상당한 공변이를 보이는 줄기, 및 특징적인 ACGR 모티프를 갖는 루프를 갖는 2개의 탠덤 헤어핀으로 구성된다(도 1). 미니-ykkC는 α-프로테오박테리아, β-프로테오박테리아 및 γ-프로테오박테리에 광범위하게 분포되어 있고 다른 분류군에서도 발견된다. 이 모티프는 이미 보고된 ykkC/yxkD 모티프(Bamck, 2004)(이하, "ykkC"로 지칭됨)와 유사한, 일군의 유전자의 시스-조절자인 것으로 보이므로 미니-ykkC로 명명되었다. ykkC 및 미니-ykkC에 공통된 8개의 보존된 도메인들은 이하에 기재되어 있다. ykkC의 구조와 미니-ykkC의 구조는 관련성이 없는 것으로 보인다.
ykkC 모티프는 고도로 구조화되고 광범위하게 보존된 모티프이다. 그러나, 미니-ykkC의 단순한 구조는 미니-ykkC의 광범위한 계통발생이 광범위한 보존에 영향을 미치는 기능을 암시할지라도 대다수의 다른 리보스위치의 특징이 되지 못한다. 미니-ykkC는 비교적 좁은 일군의 유전자 기능과 관련되어 있고 상기 유전자들의 코딩 서열에 인접하여 위치하기(90%가 SD 서열의 33개 뉴클레오티드 내에 위치함) 때문에 시스-조절 요소인 것으로 보인다. 미니-ykkC는 유전자 발현을 조절하는 데 사용된 기작이 상이할 수 있다 하더라도 ykkC 모티프와 동일한 기능을 수행할 수 있다. 1개의 헤어핀만을 갖는 미니-ykkC의 예가 존재할 수 있음을 인식해야 한다.
x.
purD
모티프
purD 모티프는 완전히 시퀀싱된 ε-프로테오박테리아(예를 들어, 캄필로박터 및 헬리코박터) 내의 모든 purD 유전자의 업스트림에서 발견된다. purD 유전자는 퓨린 생합성에 관여하는 GAR(포스포리보실글리신아마이드) 합성효소를 코딩한다. purD 모티프는 염기-페어링을 파괴하는 일부 돌연변이를 나타내지만 공변이 줄기 및 모듈 줄기를 보인다(도 1).
xi
. 6C 모티프
이 모티프는 악티노박테리아 사이에서 광범위하게 분포되어 있고 2개의 헤어핀으로 구성되어 있는데, 이때 각 헤어핀의 루프는 일련의 6개 이상의 C를 갖는다. 6C 모티프는 그의 줄기에서 상당한 공변이를 보인다. 통상적으로, 6C 모티프는 염색체 분할 및 선모 조립과 관련된 것으로 예측되는 유전자들과 어느 정도 인접하여(200 내지 300개 뉴클레오티드를 사이에 두고) 위치한다.
xii. 트랜스포존(transposon) 및 절개효소(excisionase)-관련 모티프
α-프로테오박테리아에서 1개의 트랜스포자제-관련 모티프가 발견되었고, 악티노박테리아에서 Xis 절개효소와 관련된 또 다른 모티프도 발견되었다. 상기 두 모티프는 10 내지 15개 염기쌍으로 구성된 줄기를 갖는 단일 헤어핀으로 주로 구성되어 있다. 상기 두 모티프는 많은 공변이도 보이는데, 이것은 이들이 구조화된 기능성 RNA를 형성함을 암시한다. 절개효소 모티프는 절개효소 유전자에 대해 5' 조절 배향으로 존재한다.
xiii
.
ATPC
모티프
ATPC 모티프는 일부 시아노박테리아 내의 ATP 합성효소 오페론 내에서 A 서브유니트를 코딩하는 유전자와 C 서브유니트를 코딩하는 유전자 사이에서 발견된다. ATPC 모티프의 예는 프로클로로코커스 마리누스(Prochlorococcus marinus)의 모든 시퀀싱된 균주 및 시네코코커스(Synechococcus)의 일부 종에서 발견된다. 상기 모티프는 주로 3개-줄기 접합부로 구성된다. 선행 연구는 시아노박테리아의 ATP 합성효소 오페론 내에 헤어핀-유사 구조체가 존재하나 이 헤어핀 구조체의 형태는 그다지 복잡하지 않고 ATPC 모티프와 상이한 위치에 존재함을 제시한 바 있다(Curtis 1988).
xiv. 시아노-30S 모티프
이 모티프는 일부 시아노박테리아에서 발견되고 30S 리보좀 단백질 S1을 코딩하는 유전자에 대해 5' 조절 배향으로 존재한다. 상기 모티프는 서로 유사하지 않은 2개의 헤어핀, 및 슈도노트로 구성되어 있는데, 이때 P1 루프 내의 5개 뉴클레오티드들은 P2의 3' 말단 바로 다음에 위치한 뉴클레오티드들과 염기-페어링을 형성한다. P1 및 P2 내의 염기-페어링을 파괴하는 수 개의 돌연변이가 존재할지라도 이 줄기들에는 많은 보상적 돌연변이들도 존재한다. 뿐만 아니라, 슈도노트 내의 염기-페어링은 공변이하고 모든 대표적 시아노-30S 모티프에 존재한다.
유전자 내용이 주어지면, 상기 모티프는 리보좀 단백질 유전자의 다운스트림에 위치한 리간드를 모방할 수 있고(Zengel, 1994), 이에 따라 상기 유전자의 생성물은 그 자신의 발현을 조절한다. 시아노-30S 모티프의 동정은 이러한 RNA가 매우 다양한 문에서 발견된다는 견해를 지지한다.
xv. 락토바실라레스 모티프
락토-1 및 락토-2는 락토바실라레스 목에 국한된다. 락토-1 모티프는 약간의 공변이를 보이지만 일부 돌연변이는 염기-페어링을 파괴한다. 일부 락토-1 모티프는 주 헤어핀과 SD 서열 사이에 위치한 S(MK)(또는 SAM-III)(Fuchs, 2006) 리보스위치의 가변 영역을 교차한다. 락토-2 모티프는 많은 내부 루프를 갖는 큰 헤어핀으로 구성되는데, 상기 내부 루프들 중 일부는 고도로 보존된 서열을 갖는다. 일부 돌연변이들은 염기-페어링을 파괴하지만, 상당한 수준의 공변이가 존재하고, 이것은 락토-2 모티프가 구조화된 RNA임을 암시한다.
xvi. TD(트레포네마 덴티콜라(
Treponema denticola
)) 모티프
2개의 예측된 모티프가 트레포네마 덴티콜라에서 발견되지만 임의의 다른 시퀀싱된 세균에서는 발견되지 않는다. 모티프 TD-1 및 TD-2는 각각 28종 및 36종의 예가 존재한다. 7종의 TD-1 모티프는 대표적인 TD-2 모티프의 역 상보체와 중첩되고 2개의 5'-헤어핀을 공유한다.
상기 두 모티프는 공변이 및 가변-길이 또는 모듈 줄기를 보인다. TD-1 모티프는 통상적으로 유전자에 대해 5' 조절 배향으로 존재한다. TD-2 모티프는 비-코딩 RNA에 상응할 수 있도록 5' 조절 배향을 공유하지 않는다.
3. 논의
CMfinder-기초 비교 유전체학 파이프라인을 이용하여 22종의 신규 잠재적 RNA 모티프를 발견하였다. 이들 중 2종의 RNA 모티프는 이미 리보스위치로서 실험적으로 확인되었다. 여러 다른 종의 RNA 모티프의 경우, 공변이 및 다른 특징들은 이들 RNA 모티프들이 구조화된 기능성 RNA임을 보이고, 상기 모티프의 대다수에 대한 가능한 기능이 제시된다. 따라서, 상기 파이프라인은 신규 RNA를 발견하는 데 유용한 듯하다.
이러한 발견은 CMfinder-기초 파이프라인이, 광범위하게 분포되어 있고 고도로 보존된 광범위한 2차 구조를 보유하며 약 60개 이상의 뉴클레오티드에 해당하는 길이를 갖고 유사한 유전자들과 관련되어 있는 RNA를 찾아낼 수 있음을 보여준다. 3종의 후보 리보스위치(GEMM, Moco 및 SAH)가 이 특징을 갖는다. 남은 3종의 후보물질, 즉 SAM-IV, COG4708 모티프 및 sucA 모티프는 이 모티프들 중 어느 것도 분류학적 수준에서 단일 목을 벗어나서 발견되지 않는다는 점에서 대다수의 공지된 리보스위치보다 더 좁게 분포되어 있다.
B. 실시예 2: 진정세균의 리보스위치 클래스는 제2 메신저인 사이클릭 다이-GMP를 감지한다.
사이클릭 다이-GMP는 다양한 세균 종에서 넓은 범위의 생리학적 변화를 유발하는 제2 메신저로서 작용하는 환형 RNA 다이뉴클레오티드이다. 조절되는 과정은 세포 분화, 운동 생활양식과 생체막 생활양식 사이의 전환, 및 독성 유전자 발현을 포함한다. 그러나, 유전자 발현을 조절하는 사이클릭 다이-GMP에 의해 사용되는 기작은 미지의 상태로 남아 있는데, 이것은 상기 화합물이 20 여년 전에 발견되었기 때문이다. 데이터는 많은 세균 종에서 사이클릭 다이-GMP가 다수의 기초적 세포 과정에 관여하는 유전자들의 발현을 조절하는 리보스위치 클래스에 의해 감지됨을 암시한다. 독성 유전자 발현과 관련된 몇몇 리보스위치, 섬모 형성과 관련된 몇몇 리보스위치 및 편모 세포소기관 생합성과 관련된 리보스위치를 비롯한 다양한 사이클릭 다이-GMP 레귤론(regulon)이 밝혀져 있다. 또한, 사이클릭 다이-GMP 리보스위치에 대한 컨센서스와 일치하는 서열이 박테리오파지의 게놈 내에 존재한다.
제2 메신저인 사이클릭 다이-GMP(도 3A)는 글루콘아세토박터 자일리누스로부터 셀룰로스 합성효소의 활성화자로서 발견되었다(Ross 1985; Ross 1987). 후속 연구는 사이클릭 다이-GMP가 세균에 거의 편재되어 세포 생리학적 특징에 광범위한 영향을 미침을 보여준다(Jenal, 2006; Ryan, 2006; Tamayo, 2007). 사이클릭 다이-GMP는 GGDEF 아미노산 도메인을 특징으로 하는 다이구아닐레이트 사이클라제(DGC) 효소에 의해 2개의 구아노신-5-트라이포스페이트 분자로부터 형성된 환형 RNA 다이뉴클레오티드이다. 상기 화합물은 일단 형성되면 EAL 또는 HD-GYP 아미노산 도메인을 함유하는 포스포다이에스터라제(PDE) 효소에 의해 선별적으로 분해된다(문헌(Jenal, 2006; Ryan, 2006; Tamayo, 2007; Simm, 2004) 및 이 문헌에서 인용된 문헌). 병원체 비브리오 콜레라를 포함하는 많은 세균 종이 수십종의 상이한 DGC 단백질 및 PDE 단백질을 갖는다(Galperin, 2001; Ulrich, 2005; Romling, 2005). 이 단백질들의 활성은 특정 자극에 의해 유발되어 세포내 사이클릭 다이-GMP 농도(Romling, 2005)를 조절하고, 비브리오 콜레라에서의 상기 제2 메신저의 농도 변화는 축엽(rugosity), 생체막 형성 및 독성을 조절하는 것으로 공지되어 있다(Lim, 2006c; Beyhan, 2007; Tischler, 2005; Waters, 2008).
세균에서 다양한 생리학적 변화를 일으키기 위해 사이클릭 다이-GMP가 이용하는 기작은 오랫동안 명확히 밝혀져 있지 않다. 이 제2 메신저는 사이클릭 다이-GMP-절단 PDE에 의해 표적화되는 것 이외에 일부 DGC 단백질에 결합되어 그 자신의 합성을 알로스테릭하게 억제할 수 있다(Chan, 2004; Wassman, 2007). 공지되어 있는 유일한 다른 단백질 표적들은 글루콘아세토박터 자일리누스의 셀룰로스 합성효소(Ross 1985; Ross 1987), 슈도모나스 애루기노사 PelD 단백질(Lee, 2007) 및 PilZ 도메인 단백질(Ryjenkov, 2006)이다. 그러나, 이 단백질들과 사이클릭 다이-GMP의 결합은 사이클릭 다이-GMP가 세포에 미치는 전반적인 효과를 충분히 설명하지 못한다(Tamayo, 2007; Wolfe, 2008). 따라서, 발견되어야 할 사이클릭 다이-GMP의 핵심 조절 표적이 존재한다.
사이클릭 다이-GMP에 대한 리보스위치
사이클릭 다이-GMP 리보스위치의 존재가, 이 제2 메신저가 어떻게 많은 유전자들의 전사 및 번역을 조절하는지를 설명할 수 있다는 가설이 제안된 바 있다(Tamayo, 2007). 일부 유기체에서 DGC 및 PDE 단백질에 대한 ORF의 바로 업스트림에 존재하는 GEMM으로 지칭되는 고도로 보존된 RNA 도메인의 동정이 최근에 보고되었다(Weinberg, 2007). 이 RNA 도메인 또한 사이클릭 다이-GMP에 의해 조절될 것으로 추측되는 유전자들과 종종 관련되어 있다. GEMM RNA의 고도 보존 및 게놈상의 분포는 표적 리간드의 농도 변화에 반응하여 유전자 발현을 조절하는 대사물질-감지 리보스위치의 특징이다(Winkler, 2005; Breaker, 2008 (Science)).
GEMM RNA는 1형 및 2형으로 지칭되는 2개의 유사한 구조체 중 하나와 일치한다(도 3B). 상기 1형 및 2형은 동정된 503종의 GEMM RNA에서 광범위한 공변이를 보이는 2개의 염기-페어링된 영역(P1 및 P2)을 보유한다(Weinberg, 2007). 1형 RNA(303종의 예)는 제2 위치에서 퓨린(R)을 가지면서 P1 상에서 GNRA 테트라루프(Heus, 1991)를 갖는다. GRRA 서열의 존재는 P2의 말단에 있는 테트라루프 수용체의 존재와 상호관련되어 있고, 상기 P2는 상기 테트라루프 타입으로 도킹되는 것으로 공지되어 있다(Costa, 1995). 대조적으로, 2형 RNA(171종의 예)는 테트라루프의 제2 위치에서 피리미딘(Y)을 갖고, 일부 경우 GYRA 테트라루프로의 도킹을 선호하는 P2 상의 구조체를 포함한다(Costa, 1995). 29종의 비-배정된 GEMM RNA가 추가로 존재하는데, 이들 중 24종은 비-페어링된 뉴클레오티드들에 의해 플랭킹된 GNRA 테트라루프를 보유하고, 5종은 테트라루프 서열을 갖지 않는다.
GNRA 테트라루프 및 이의 수용체는 조직화된 RNA에서 통상적으로 발견되고 리보스위치 앱타머에서 이미 관찰되었다(Regulski, 2008). 그러나, P1 및 P2 헤어핀의 정점에 있는 서열 및 구조의 가변성은 사이클릭 다이-GMP에 대한 임의의 결합 부위가 가장 잘 보존된 특징을 보유하는 중심 위치 또는 기저부 위치에 존재할 것임을 시사한다.
GEMM RNA는 사이클릭 다이-GMP에 선별적으로 결합한다.
병원체 비브리오 콜레라의 게놈은 별도의 염색체 상에 2개의 GEMM RNA 서열을 보유한다. 염색체 I 상에서, 1형 GEMM RNA(Vc1로 지칭됨)는 키틴 또는 이의 1차 단량체 유니트인 N-아세틸-D-글루코스아민에 결합하는 단백질 인자를 코딩하는 비브리오 콜레라 gbpA 유전자의 업스트림에 존재한다. gbpA는 인간에서 콜레라 감염에 관여한다(Kirn, 2005). 염색체 II 상에서, 또다른 1형 RNA(Vc2로 지칭됨)는 tfoX(Mandal, 2003; Meibom, 2005)와 유사한 유전자(VC1722)의 업스트림에 존재한다. tfoX 유전자(일부 유기체에서 sxy로 지칭됨; Cameron, 2008)는 비브리오 콜레라가 키틴에 노출된 경우 반응력을 증가시키는 유전자들을 조절하는 역할을 수행하는 인자를 코딩한다. 서열 면에서의 이러한 유사성이 존재하면, VC1722 단백질은 전사 인자로서도 작용할 것이다.
상기 2종의 GEMM RNA를 사용하여 생화학적 분석 및 유전학적 분석을 수행함으로써 상기 RNA들이 사이클릭 다이-GMP에 대한 앱타머로서 작용하는지를 확인하였다. 100 μM의 사이클릭 다이-GMP의 존재 또는 부재 하에서 110-뉴클레오티드 Vc2 RNA 구축물(110 Vc2; 도 3C)에 대한 인-라인 프로빙 분석(Soukup, 1999)을 수행하였다(도 3D). P1 줄기 및 P2 줄기의 기저부에서의 변화하는 천연 발생적 절단 패턴은 구조적 조절을 겪는 영역(1 내지 3으로 표지됨)에 인접한 보존된 뉴클레오티드들이 제2 메신저 결합에 중요함을 암시한다. 유사한 결과가 Vc1 RNA를 포함하는 구축물, 및 바실러스 세레우스 및 클로스트리디움 디피실로부터의 대표적 사이클릭 다이-GMP 앱타머의 경우에도 얻어졌다.
사이클릭 다이-GMP 농도를 변화시키면서 110 Vc2 RNA에 대해 인-라인 프로빙 분석을 수행함으로써 약 1 nM의 겉보기 KD를 확립하였다. 얻은 곡선(도 4A)은 RNA 앱타머와 이의 리간드 사이의 1 대 1 포화가능한 상호작용과 일치한다(Welz, 2007). 앱타머가 보고된 다양한 다량체 사이클릭 다이-GMP 복합체 중 하나에 결합할 수 있다 하더라도, 이 분자간 사이클릭 다이-GMP 복합체의 형성은 측정된 KD 값보다 훨씬 더 높은 농도에서 일어난다. 뿐만 아니라, KD의 변화는 K+ 및 Na+가 형성되는 사이클릭 다이-GMP 복합체의 타입에 영향을 미친다 하더라도 인-라인 프로빙 분석 반응에서 K+가 Na+로 대체되는 경우에는 관찰되지 않는다.
110 Vc2 앱타머와 사이클릭 다이-GMP 사이에 형성된 복합체는 이. 콜라이 PilZ 단백질 도메인에 의한 사이클릭 다이-GMP 결합에 대해 측정된 친화도보다 약 3차수만큼 더 높은 친화도로 결합되어 있다(KD = 840 nM; Ryjenkov, 2006). 게다가, 제2 메신저의 다양한 유사체는 Vc2 앱타머에 의해 확연히 구별된다(도 4B). 시험된 유사체로부터, 제2 메신저의 환형 구조 및 이의 구아닌 뉴클레오염기 둘다가 리간드 인식에 실질적으로 기여할 것으로 예측된다. 예를 들어, EAL 포스포다이에스터라제(PDE)에 의한 사이클릭 다이-GMP의 선형 분해 생성물(pGpG로 지칭됨)은 약 3차수만큼 낮은 친화도로 앱타머와 결합한다. 유사하게, HD-GYP PDE의 pG(5' GMP) 생성물은 사이클릭 다이-GMP에 대한 KD보다 5차수만큼 더 높은 친화도에서조차도 앱타머와 결합하지 못한다. 따라서, 이 앱타머에 대한 생물학적으로 관련된 리간드는 이 제2 메신저의 분해 생성물이 아니라 사이클릭 다이-GMP인 것으로 추측된다.
사이클릭 다이-GMP는 2개의 구조적으로 구속된 3',5'-포스포다이에스터 결합을 포함하는 RNA 다이뉴클레오티드이다(도 3A). 일부 경우, 구속된 기하학적 구조를 갖는 뉴클레오티드간 결합은 가속화된 RNA 가닥 절단을 보인다(Soukup, 1999). 사이클릭 다이-GMP가 인-라인 프로빙 분석 조건 하에서 안정한지를 평가하기 위해 천연발생적 분해에 대한 그의 속도 상수를 측정하였다. 인-라인 프로빙 분석 조건 하에서, 사이클릭 다이-GMP는 약 150일의 반감기에 상응하는 3.2 x 10-6 분-1의 속도 상수로 절단된다(도 4C). 이 속도 상수는 유사한 조건 하에서 항온처리된 경우 구속되지 않은 선형 폴리뉴클레오티드에 존재하는 RNA 결합에 대해 예측된 속도 상수와 유사하다(Li, 1999). 따라서, 상기 제2 메신저는 인-라인 프로빙 분석에서 안정한 것으로 추측되고 PDE 효소로 처리되지 않는다면 세포 내에서 훨씬 더 안정할 것이다.
사이클릭 다이-GMP 리보스위치에 의한 유전자 조절
세균 리보스위치는 전형적으로 보다 덜 보존된 발현 플랫폼의 바로 업스트림에 위치한 보존된 앱타머를 보유한다. 세균 내의 대다수의 발현 플랫폼은 전사 종결 또는 번역 개시를 조절하는 구조체를 형성한다(Barrick, 2007). 유사한 구조체가 많은 GEMM RNA와 관련되어 있는데, 이것은 사이클릭 다이-GMP 앱타머가 리보스위치의 구성요소일 가능성이 있음을 암시한다.
사이클릭 다이-GMP 앱타머가 생체내에서 리보스위치에 대한 감지 도메인으로서 작용하는지를 확인하기 위해 비브리오 콜레라, 바실러스 세레우스 및 클로스트리디움 디피실로부터 유래된 4종의 5' UTR을 선택하였다. Vc2의 경우, 예측된 천연 프로모터, 앱타머 또는 이의 변이체(도 5A) 및 인접하는 발현 플랫폼을 포함하는 DNA를 사용하여 이. 콜라이 lacZ 레포터 유전자와의 번역 융합체를 제조하였다. 앱타머-레포터 융합 구축물을 보유하는 형질전환 이. 콜라이 세포를 액체 배지 중에서 생장시키고 β-갈락토시다제 활성에 대해 분석하였다.
야생형(WT) Vc2 앱타머를 보유하는 레포터 구축물은 고도의 유전자 발현을 나타낸다(도 5B). 대조적으로, P1을 파괴하는 돌연변이 또는 P2 융기부 내의 엄격히 보존된 뉴클레오티드를 변경하는 돌연변이를 보유하는 구축물 M1 및 M3은 WT의 10% 미만으로 레포터 유전자를 발현한다. 나아가, P1의 구조를 복원하는 4종의 돌연변이를 보유하는 앱타머(M2)는 거의 WT 유전자 발현을 나타낸다. 이 결과는 Vc2 앱타머를 갖는 리보스위치가 인접하는 ORF의 번역을 활성화시킴으로써 "온(on)" 스위치로서 작용함을 의미한다. 유사하게, 바실러스 세레우스(Bc1 및 Bc2) 및 클로스트리디움 디피실(Cd1)로부터 유래된 사이클릭 다이-GMP 리보스위치에 대한 전사 융합체를 제조하였다. WT 및 M3 변이체에 대한 발현 패턴은 Bc1에 대한 "온" 스위치 기능 및 Bc2 및 Cd1에 대한 "오프(off)" 스위치 기능과 일치한다(도 5B).
사이클릭
다이
-
GMP
농도의 변화는
리보스위치
-매개 유전자 발현을 조절한다.
사이클릭 다이-GMP 리보스위치에 의한 유전자 발현의 조절은 제2 메신저의 세포내 농도를 변화시키면서 Cd1 RNA의 "오프" 스위치 작용을 조사함으로써 확립하였다. 사이클릭 다이-GMP 농도는 비브리오 콜레라 vieA 유전자 생성물을 발현시킴으로써 조절하였다. VieA는 제2 메신저가 그의 선형 pGpG 형태로 가수분해되는 것을 촉진함으로써 사이클릭 다이-GMP의 세포내 농도를 더 낮출 것으로 예측되는 EAL PDE이다(Li, 1999). 빈 벡터를 보유하는 세포 또는 PDE 활성을 상실하게 만드는 E170A 돌연변이를 갖는 VieA 단백질을 발현하는 세포(Tamayo, 2005)는 사이클릭 다이-GMP 농도를 생장 조건 하의 세포에 대해 정상인 수준으로 유지할 것으로 예측된다.
WT Cd1 리보스위치와 lacZ의 전사 융합체를 보유하고 X-gal이 함유된 아가 플레이트 상에서 생장된 형질전환 바실러스 서브틸리스 세포는 빈 플라스미드 벡터 또는 E170A VieA 돌연변이체를 코딩하는 벡터로 동시-형질감염된 경우 낮은 β-갈락토시다제 활성을 나타낸다. 대조적으로, 강한 β-갈락토시다제 활성이 레포터 구축물 및 VieA PDE를 코딩하는 벡터로 동시-형질감염된 세포에서 명확히 나타났다. 유사한 경향이, 상기 형질전환 세포들이 액체 배양물로부터 분석되었을 때 관찰된 반면, Cd1 앱타머 내에 M3 돌연변이를 보유하는 레포터 구축물은 vieA 발현에 의해 거의 영향을 받지 않은 상태로 남아있었다(도 6B). 이 결과는 Cd1 리보스위치에 의한 "오프" 스위치 기능과 일치하는데, 이때 PDE의 작용은 세포 내의 사이클릭 다이-GMP 농도를 낮춤으로써 억제를 완화시킨다.
다양한 세균에서의 사이클릭 다이-GMP 리보스위치의 역할
비브리오 콜레라는 2종의 사이클릭 다이-GMP 리보스위치만을 갖지만(도 7), 이 RNA들의 생리학적 역할은 상당하다. Vc1 리보스위치와 관련된 gbpA 유전자 생성물은 세균이 포유동물 장에서 콜로니를 형성하게 하여 콜레라 질환을 야기하는 핵심 성분인 것으로 보고된 당-결합 단백질이다(Kirn, 2005). 또한, 비브리오 콜레라는 포유동물 숙주 장에서 콜로니를 형성할 때 그의 사이클릭 다이-GMP 농도를 낮춘다는 사실이 밝혀져 있다(Tamayo, 2005). 변화하는 사이클릭 다이-GMP 농도에 대한 Cd1 리보스위치의 반응을 밝히기 위한 연구에서 사용된 비브리오 콜레라 vieA 유전자(도 6A)는 세균 감염에 필수적인 것으로 공지되어 있다. 따라서, VieA의 작용에 의해 야기된 사이클릭 다이-GMP 농도의 감소가 Vc1 리보스위치에 의해 감지되어 GbpA의 발현 및 비브리오 콜레라 감염을 촉진할 가능성이 있다.
Vc2 리보스위치와 관련된 VC1722 유전자는 반응력에 중요한 공지된 전사 인자와 유사한 단백질을 코딩한다(Meibom, 2005). 주름 표현형을 나타내는 비브리오 콜레라 돌연변이체가 상승된 사이클릭 다이-GMP 농도를 보이고 VC1722 mRNA의 보다 높은 발현을 나타낸다는 사실은 이미 밝혀져 있다(Lim, 2006c; Beyhan, 2007). 이것은 VC1722 mRNA와 관련된 Vc2 리보스위치가, 사이클릭 다이-GMP 농도가 상승되었을 때 보다 높은 유전자 발현을 일으키는 유전적 "온" 스위치임을 입증하는 데이터와 일치한다(도 5B).
일부 유기체들은 놀라울 정도로 많은 종류의 사이클릭 다이-GMP 리보스위치를 갖는다(도 7). 30종의 사이클릭 다이-GMP 리보스위치가 동정된 게오박터 우라니움리덕센스는 게놈이 시퀀싱된 세균 종 중에서 가장 많은 타입의 사이클릭 다이-GMP 앱타머 RNA를 갖는다. 상기 리보스위치는 25종의 다양한 전사 유니트의 업스트림에 분포되어 있고, 이들 중 6종의 RNA는 탠덤 사이클릭 다이-GMP 앱타머를 보유한다. 유사한 탠덤 정렬이 2개의 아미노산에 상호협동적으로 결합하는 몇몇 글리신 앱타머들의 경우에서 관찰된다(Mandal, 2004c). 그러나, 더욱 일반적인 탠덤 정렬은 동일한 리간드에 반응하는 완전한 리보스위치를 포함한다(Welz, 2007; Sudarsan, 2006). 상기 두 탠덤 구조적 정렬들은 리보스위치가 리간드 농도의 보다 작은 변화에 더욱 민감하게 반응하고(Welz, 2007) 더욱 우수한 디지털 유전적 스위치로서 작용하게 한다.
많은 사이클릭 다이-GMP 리보스위치와 관련된 유전자들의 기능이 공지되어 있지 않지만, 클로스트리디움 디피실에 존재하는 사이클릭 다이-GMP 리보스위치의 위치는 주목할 만하다(도 7). Cd1 리보스위치는 상기 종의 전체 편모 기관을 구축하는 데 필요한 단백질들을 코딩하는 큰 오페론의 5' UTR에 위치하는 유전적 "오프" 스위치(도 5 및 6)이다. 이 정렬은 일부 세균이 리보스위치를 사용하여 사이클릭 다이-GMP 농도의 변화를 감지하고 세포소기관 생합성을 조절하여 이동 대 고착 생활양식 변화를 조절함을 암시한다.
클로스트리디움 디피실의 게놈 내에 도입된 PhiCD119 박테리오파지 DNA 내에 존재하는 사이클릭 다이-GMP 리보스위치의 동정도 흥미롭다. 상기 박테리오파지 게놈의 용해 모듈 내에 위치한 리보스위치 서열은 박테리오파지 입자 내로 팩키징된 DNA에서도 분명하게 나타난다(Govind, 2006). 20종 이상의 대사물질-감지 리보스위치 클래스가 보고되어 있고 상기 클래스에 속하는 수천 종의 리보스위치가 동정되었지만, 사이클릭 다이-GMP RNA Cd2, Cd12, 및 파지로부터의 관련된 RNA는 박테리오파지-관련 리보스위치의 공지된 예일 뿐이다. 아마도 바이러스는 기초적 대사 생성물을 감지할 필요성은 거의 없지만 제2 메신저인 사이클릭 다이-GMP의 농도 변화에 의해 야기된 세균 세포의 생리학적 형질전환을 모니터링함으로써 진화적 이점을 얻을 것이다.
1. 재료 및 방법
i. 생물정보(Bioinformatics)
추가 유사성 검색을 수행하기 위해 이미 확립된 다중 서열 정렬(Weinberg, 2007)을 이용하여 공지된 사이클릭 다이-GMP 리보스위치 세트를 확장시켰다. 상기 검색은 RAVENNA(Weinberg, 2006)를 이용하여 RefSeq 버전 25(Pruitt, 2005)의 미생물 서열뿐만 아니라, 산성 광산 폐수(Tyson, 2004), 토양 및 고래 무덤(Tringe, 2005), 인간 장(Gill, 2006), 마우스 장(Turnbaugh, 2006), 장이 없는 바다 벌레(Woyke, 2006), 진흙 군락(Garcia Martin, 2006) 및 지구 해양 조사(Venter, 2004; Rusch, 2007)로부터 유래된 환경 유래 서열에 대해 수행하였다. 컨센서스 도표(도 3)에 반영된 보존도 통계는 이미 확립된 프로토콜(Weinberg, 2007)을 이용하여 계산하였다. 도 7은 RefSeq 및 DOE 조인트 게놈 인스티튜트(DOE Joint Genome Institute) 또는 지구 해양 조사로부터 얻은 유전자 해석을 이용하여 작도하였다. 유전자들은 보존된 도메인 데이터베이스(Marchler-Bauer, 2005) 버전 2.08을 기초로 하여 분류하였다.
ii. 올리고뉴클레오티드, 화합물, 플라스미드 및 세균 균주
DNA 올리고뉴클레오티드는 시그마-게노시스(Sigma-Genosys) 또는 예일 유니버시티의 더블유 엠 켁크 파운데이션 바이오테크놀로지 리소스 레이보레이토리(W. M. Keck Foundation Biotechnology Resource Laboratory)로부터 구입하였다. 사이클릭 다이-GMP, pGpG 및 3',5'-사이클릭 GMP는 바이오로그 라이프 사이언스 인스티튜트(BioLog Life Science Institute; 독일 소재)로부터 구입하였고, 3'-구아니신 모노포스페이트는 엠피 바이오메디칼스(MP Biomedicals)로부터 구입하였다. ApG, GpG, GpA, pGpA 및 GpGpG는 올리고스 이티씨(Oligos Etc.)로부터 구입하였다. 모든 다른 화합물은 시그마-알드리치로부터 구입하였다.
pDG1661 및 pDG148은 바실러스 제네틱 스톡 센터(Bacillus Genetic Stock Center(BGSC): 오하이오 주립 대학)로부터 입수하였다. pRS414는 알 시몬스 박사(UCLA)로부터 얻었다. 바실러스 서브틸리스 균주 1A1, 바실러스 세레우스 균주 6A5(ATCC 14579) 및 바실러스 세레우스 균주 6A15(ATCC 10987) 또한 BGSC로부터 입수하였다. ATCC 균주 9689의 클로스트리디움 디피실 게놈 DNA는 ATCC로부터 입수하였다. 컴피턴트(competent) DH5-알파 이. 콜라이는 뉴 잉글랜드 바이오랩스(New England Biolabs)로부터 구입하였다.
iii. 사이클릭 다이-GMP 분해의 동역학
500 μM 사이클릭 다이-GMP 용액을 인-라인 프로빙 분석 완충제(50 mM Tris-HCl[23℃에서 pH 8.3], 100 mM KCl, 20 mM MgCl2)의 존재 하에서 다양한 시간 동안 항온처리하였다. 반응은 사이클릭 다이-GMP의 첨가에 의해 개시되었고 아질런트 조박스 올리고(Agilent Zorbax Oligo) 컬럼(5 μM, 6.2 mm x 80 mm)이 장착된 아질런트 테크놀로지스 1200 시리즈 HPLC 상에 10 ㎕ 분취액이 주입되었을 때 켄칭되었다. 농도 구배가 95% 0.1 M NaHPO4[23℃에서 pH 6.0] 및 5% 아세토니트릴부터 100% 1 M NaCl까지 변하는 구배 이동상을 사용하여 화합물을 용출하였다. 흡광도를 254 nm에서 모니터링하였다. 사이클릭 다이-GMP에 대한 속도 상수는 시간에 대한 비-절단된 사이클릭 다이-GMP의 분율의 자연 대수를 작도함으로써 확립하였는데, 이때 얻은 선의 음의 기울기는 속도 상수를 반영한다.
iv. 사이클릭 다이-GMP 유사체의 순도 분석 및 완전성
용출된 화합물의 흡광도를 254 nm에서 모니터링하면서 아질런트 테크놀로지스 1200 시리즈 HPLC를 사용하여 사이클릭 다이-GMP의 다이뉴클레오티드 및 트라이뉴클레오티드 유사체의 순도를 조사하였다. 농도 구배가 95% 물, 5% 아세토니트릴 및 0.1% 트라이플루오로아세트산으로부터 100% 아세토니트릴 및 0.1% 트라이플루오로아세트산까지 변하는 구배 이동상을 사용하는 아질런트 익스텐드(Extend) C18 컬럼(3.5 μM, 4.6 mm x 150 mm)을 사용하여 화합물을 분리하였다. HPLC 추적 기록은 50% 내지 95%의 UV-흡수 물질이 원하는 유사체에 상응함을 보여주었다.
유사체의 정확한 질량을 확인하기 위해 유사체에 대한 고해상 질량 분광 분석을 각각 수행하였다. HRMS(ES) 이론치 및 (M-H)- 실측치 = C20H25N10O11P(GpA): 612.1442, 611.1375; C20H25N10O11P(ApG): 612.1442, 611.13723; C20H25N10O12P(GpG): 628.1391, 627.13207; C20H26N10O14P2(pGpA): 692.1105, 691.10410; C30H37N15O19P2(GpGpG): 973.1865, 972.1825, 및 (M-2H)-2 485.58597.
v. RNA의 제조
T7 RNA 중합효소(T7 RNAP)에 대한 프로모터 서열뿐만 아니라 RNA의 수율을 증가시키기 위해 전사 개시 부위에 2개의 구아닌 잔기를 부가하는 프라이머와 함께 WT 또는 돌연변이체 pRS414 플라스미드 DNA를 사용하여 PCR 증폭을 통해 DNA 주형을 제조하였다. RNA 분자는 20 mM Tris-HCl(23℃에서 pH 8.0), 20 mM NaCl, 14 mM MgCl2 및 100 μM EDTA 중에서 적절한 DNA 주형 및 T7 RNAP를 사용하는 시험관내 전사를 통해 제조하였다. RNA를 10% 변성(8 M 우레아) 폴리아크릴아마이드 겔 상에서 정제하고 10 mM Tris-HCl(23℃에서 pH 7.5), 200 mM NaCl 및 1 mM EDTA(pH 8.0) 중에서 상기 겔로부터 회수하였다. RNA를 에탄올로 침전시키고, 알칼리성 포스파타제(로스 다이아그노스틱스)를 사용하여 탈인산화시키고, 제조자의 프로토콜에 따라 [γ-32P] ATP 및 T4 폴리뉴클레오티드 키나제(뉴 잉글랜드 바이오랩스)를 사용하여 5'-방사성표지화를 수행하였다. 방사성표지된 RNA를 전술한 바와 같이 겔 정제하였다.
vi
. 인-라인 프로빙 분석
공지된 방법(Soukup, 1999)과 유사한 방법을 이용하여 인-라인 프로빙 분석을 수행하였다. 요약하건대, 5' 32P-표지된 RNA(사이클릭 다이-GMP KD 분석의 경우 약 50 pM, 다른 모든 분석의 경우 약 5 nM)를 기재된 화합물들과 함께 20 mM MgCl2, 100 mM KCl 및 50 mM Tris(23℃에서 pH 8.3) 중에서 23℃에서 약 40시간 동안 항온처리하였다. RNA 절단 생성물을 10% 변성 PAGE로 분리하고, 포스포르이미저(Phosphorimager)(몰레큘라 다이나믹스(Molecular Dynamics))를 이용하여 가시화하고 SAFA v1.1 소프트웨어(Das, 2005) 또는 이미지쿠아엔티(ImageQuaNT)(몰레큘라 다이나믹스)를 이용하여 분석하였다. SAFA 소프트웨어를 이용하여 각 레인에 적재된 RNA의 양의 차이를 보정하도록 표준화하고 각 밴드의 강도를 측정하였다. 유의한 강도 변화를 보이는 밴드는 구조적 조절을 겪은 것으로서 확인되었다.
사이클릭 다이-GMP에 대한 110 Vc2의 KD를 측정하기 위해, 사이클릭 다이-GMP의 농도를 변화시키면서 전술한 바와 같이 인-라인 프로빙 분석을 수행하였다. 예외적으로 낮은 농도의 방사성표지된 110 Vc2 RNA를 사용하였기 때문에, 적재된 샘플은 인-라인 프로빙 분석이 별도로 수행된 추가 비-표지된 RNA로 보충되었다. 이것은 겔 매트릭스에 비-특이적으로 결합된 방사선표지된 RNA의 양을 감소시키고 이미징 동안의 밴드 해상도를 증가시켰다. KD는 리간드의 부재 하에서 조절이 전혀 없고 시험된 최대 리간드 농도의 존재 하에서 완전한 조절이 있다는 가정 하에 구조적 조절 부위에서 개개의 밴드 강도를 비교하는 이미지쿠아엔티 소프트웨어(몰레큘라 다이나믹스)를 이용하여 산출하였다. KD는 표시된 조절 부위에서의 리간드 농도[L]의 대수에 대한 조절된 분율(F)을 작도하고 시그마플롯(SigmaPlot) 9(시스타트(Systat) 소프트웨어)를 이용하여 데이터를 방정식 F = [L]/([L]+ KD)에 피팅함으로써 계산하였다.
vii
. 플라스미드 및 세균 균주 준비
COG3070 (Tfox-유사 유전자)의 5' UTR인 Vc2를 비브리오 콜레라 게놈 DNA로부터 EcoRI-BamHI 단편으로서 증폭하여 번역 레포터 벡터 pRS414 내로 클로닝하고, 이. 콜라이 내에서의 Vc2의 유전자 조절 기능을 공지된 방법(Nahvi, 2002)과 유사한 방법을 이용하여 확립하였다. 구체적으로, ORF의 개시 부위를 기준으로 -348 뉴클레오티드부터 +21 뉴클레오티드까지 걸쳐 있는 영역을 lacZ 레포터 벡터 내에 번역 융합체로서 클로닝하였는데, 이때 COG3070 ORF의 7번째 코돈은 lacZ 레포터 유전자의 9번째 코돈과 인 프레임(in frame)으로 융합되었다. 조절 영역 내의 돌연변이는 제조자의 지시에 따라 퀵체인지(QuikChange) 부위-지정 돌연변이유발 키트(스트라타진(Stratagene))를 이용하여 상기 플라스미드로부터 발생시켰다.
바실러스 세레우스 및 클로스트리디움 디피실 내의 잠재적 ORF의 업스트림에 위치한 5' UTR 영역을 EcoRI-BamHI 단편으로서 PCR로 증폭하고 벡터 pDG1661 내로 클로닝하여 프로모터가 없는 lacZ 유전자와의 전사 융합체를 발생시켰다. 증폭된 단편은 UTR의 업스트림에 위치한 예측된 프로모터 요소, 및 상응하는 유전자의 업스트림에 위치한 리보스위치와 관련된 전사 종결요소를 포함하였다. 발생된 구축물을 공지된 바와 같이(Sudarsan, 2003) 바실러스 서브틸리스의 amyE 좌위 내로 도입하였다. 돌연변이체 구축물은 전술한 바와 같이 부위-지정 돌연변이유발을 이용하여 발생시켰다.
비브리오 콜레라로부터의 사이클릭 다이-GMP 특이적 포스포다이에스터라제 유전자(vieA)를 PCR로 게놈 DNA로부터 증폭하였다. vieA 유전자를, 공지된 라이게이션(ligation)-독립적 클로닝(Joseph, 2001)을 이용하여 변경된 pDG148 벡터 내의 Pspac 프로모터의 다운스트림에 위치한 stuI 부위 내로 클로닝하였다. vieA 유전자가 기본구성적(constitutive)으로 발현될 것이라고 예측되도록 상기 벡터 내의 lacI 유전자를 돌연변이시켰다. vieA 넉아웃 돌연변이체 E170A는 전술된 부위-지정 돌연변이유발을 이용하여 발생시켰다.
viii. β-갈락토시다제 분석
WT 및 돌연변이체 Vc2-pRS414 구축물을 컴피턴트 NEB 5-α(뉴 잉글랜드 바이오랩스) 이. 콜라이 세포 내로 형질전환시켰다. 50 ㎍/㎖ 카베니실린이 함유된 루리아-버타니(Luria-Bertani) 브로쓰 중에서 진탕시키면서 개개의 콜로니를 37℃에서 밤새 생장시켰다. 배양물을 OD600이 약 0.1이 될 때까지 희석하고 OD600이 약 0.6이 될 때까지 생장시킨 후, 표준 프로토콜(Miller, 1992)에 따라 β-갈락토시다제 분석을 수행하였다. Bc1, Bc2 및 Cd1을 함유하는 pDG1661로 형질전환된 바실러스 서브틸리스 균주의 밤샘 배양물을 OD600이 약 0.2가 될 때까지 하위-배양한 후, OD600이 약 1이 될 때까지 약 3시간 동안 생장시킨 다음, 전술한 바와 같이 β-갈락토시다제 분석을 수행하였다.
전술된 형질전환 바실러스 서브틸리스 세포를 함유하는 고체 아가 플레이트에 대한 유전자 발현 분석은 스트리킹된 세포를 37℃에서 16시간 이상의 시간 동안 생장시킴으로써 수행하였다. 아가(TBAB)는 400 ㎍/㎖의 X-gal 및 필요에 따라 5 ㎍/㎖의 클로람페니콜 및/또는 가나마이신을 함유하였다.
C. 실시예 3: SAH을 감지하고 보조효소 재활용에 관여하는 유전자를 활성화시키는 리보스위치
많은 그람-양성 세균 종 및 그람-음성 세균 종에서 SAM 재활용에 관여하는 유전자의 업스트림에서 발견되는 고도로 보존된 RNA 모티프가 동정되었다. 상기 모티프의 계통발생적 분포 및 보존된 구조적 특징은 상기 모티프가 리보스위치로서 작용함을 암시한다. 리보스위치는 전형적으로 세균 mRNA의 5' UTR에서 발견되는, 광범위하게 분포된 대사물질-감지 유전자 조절 요소이다. 단백질-부재 시험관내 분석에서 SAH를 특이적으로 인식하는 상기 RNA 모티프의 예가 동정되었고, 이 RNA가 SAM와 다른 밀접하게 관련된 유사체를 명확히 식별함이 확인되었다. 대표적인 SAH 모티프는 대사물질이 결합된 경우 생체내에서 다운스트림 유전자의 발현을 활성화시키는 것으로 밝혀졌다. 이 결과는 SAH 모티프 RNA가 SAH에 선별적으로 결합하여 증폭된 SAM 보조효소의 재활용에 필수적인 유전자를 조절하는 리보스위치 클래스에 대한 명백한 리간드-결합 앱타머임을 확인시켜준다.
RNA 앱타머는 특정한 리간드에 대한 선별적 결합 포켓을 형성하는 고도로 구조화된 폴리뉴클레오티드이다(Gold et al., 1995; Osborne and Ellington, 1997). 개조된 앱타머는 그의 표적에 대한 높은 친화성 및 선별성을 나타내도록 만들어질 수 있고, 기초 연구, 생물공학 및 치료 분야에서의 사용에 있어서 상당한 잠재력을 가질 수 있다(Breaker, 2004; Bunka and Stockley, 2006). RNA 앱타머는 많은 세균 메신저 RNA의 5' UTR에서 천연적으로 존재할 수도 있는데, 이때 상기 앱타머는 리보스위치로 지칭되는 유전자 조절 요소의 센서 도메인으로서 작용한다(Mandal and Breaker, 2004a; Soukup and Soukup, 2004; Winkler and Breaker, 2005). 천연 앱타머는, 그의 개조된 형태와 마찬가지로, 세포에 의해 사용되는 RNA 앱타머가 중요한 대사 유전자의 발현을 정확하게 조절하는 데 필요한 높은 친화성 및 특이성으로 그의 표적에 결합할 수 있다. 그러나, 천연 앱타머는 전형적으로 개조된 앱타머보다 훨씬 더 크므로(34개 내지 200개 뉴클레오티드) 단백질로 만들어진 유전자 조절 인자와 경쟁하는 데 필요한 고도의 성능을 나타낼 수 있다.
각 리보스위치는 통상적으로 그의 앱타머 도메인과 대사물질의 결합을 이용하여 인접하는 발현 플랫폼에서의 구조적 변화를 일으킨다. 이 구조적 변화는 ORF 또는 다운스트림에 위치한 다수의 ORF로부터의 단백질 생성 수준을 확립한다. 그러나, 폴딩 변화는 대사물질 결합에 의해 항상 일어나지는 않는다. 예를 들어, 한 리보스위치 클래스는 다운스트림 ORF의 발현을 억제하는 작용을 하는 자가-절단 라이보자임(ribozyme)에 대한 보조효소로서 표적 대사물질을 사용한다(Winkler et al., 2004; Cochrane et al., 2007). 사용되는 기작과 관계없이, 리보스위치는 대사물질 또는 대사물질의 전구체(이들의 세포내 농도는 앱타머 도메인에 의해 감지됨)의 합성, 분해 또는 수송에 관여하는 단백질을 생성하는 유전자를 종종 조절한다.
리보스위치 앱타머는 변경된 염기 또는 지지하는 단백질 인자가 관여하지 않는 경우 4종의 정규 뉴클레오티드들만을 사용하여 그의 표적 대사물질에 대한 정확한 결합 포켓을 형성해야 한다. 이것은 SAM(Corbino et al., 2005; Fuchs et al., 2006) 및 preQ1(Weinberg et al., 2007)과 같은 일부 리간드가 전체적으로 상이한 앱타머 구조를 갖는 다수의 리보스위치 클래스에 의해 검출된다 하더라도 진화 과정 동안 소정의 구조적 특징을 유지하도록 각 앱타머에 강한 선별적 압력을 인가한다. 심지어 관련성이 매우 낮은 유기체로부터 동정된 리보스위치 앱타머 클래스들은 서열 및 2차 구조 면에서 상당한 보존성을 나타낸다. 이 보존성은 앱타머에 결합되는 리간드의 종류와 함께 다양한 클래스로의 리보스위치의 분류에 대한 기준을 형성한다.
리보스위치 앱타머의 보존된 특징을 컴퓨터-보조 검색 알고리즘을 통해 활용하여 공지된 리보스위치 클래스에 속하는 리보스위치의 수를 증가시키고(예를 들어, 문헌(Rodionov et al., 2002; Rodionov et al., 2003a; Nahvi et al., 2004; Rodionov et al., 2004) 참조) 이전에 공지되지 않은 리보스위치 클래스를 발견하여 왔다(예를 들어, 문헌(Rodionov et al., 2003b; Barrick et al., 2004; Corbino et al., 2005; Weinberg et al., 2007) 참조). 대조적으로, 발현 플랫폼은 서열 및 구조 면에서 심지도 동일한 리보스위치 클래스 내에서도 매우 다양하다. 예를 들어, TPP 리보스위치는 컨센서스 앱타머를 다양한 발현 플랫폼 구조와 통합하여 세균 내에서의 전사 종결 및 번역 개시(Winkler et al., 2002; Mironov et al., 2002; Rentmeister et al., 2007), 및 진핵세포에서의 RNA 스플라이싱(Sudarsan et al., 2003a; Kubodera et al., 2003; Bocobza et al., 2007; Cheah et al., 2007; Wachter et al., 2007)을 조절한다.
전술한 바와 같이, 다양한 구조적 클래스로부터 선택된 앱타머를 갖는 리보스위치는 동일한 표적 대사물질을 인식할 수 있다. 보조효소 SAM(또는 AdoMet)을 특이적으로 인식하고 각각 SAM-I(Epshtein et al., 2003; McDaniel et al., 2003; Winkler et al., 2003), SAM-II(Corbino et al., 2005, Lim et al., 2006b), SAM-III 또는 SMK(Fuchs et al., 2006) 및 SAM-IV(Weinberg et al., 2007; 미공개된 ㄷ데이터)로 지칭되는 4종의 리보스위치 클래스가 발견되었다. 이 클래스들 중에서 SAM-I 리보스위치는 공지된 가장 광범위하게 분포된 계통발생적 분포를 나타내고, 이들의 예는 많은 세균 군에서 발견된다(Rodionov et al., 2004). SAM-II 리보스위치는 그람-음성 프로테오박테리아 및 박테로이데트에서 주로 발견되지만(Corbino et al., 2005), SAM-III 리보스위치는 그람-양성 락트산 세균에서만 발견되었다(Fuchs et al., 2006). 상기 모든 4종의 클래스에 속하는 앱타머들은 SAM-의존적 메틸 기 전달의 부산물인 SAH(AdoHcy)에 비해 SAM에 더 우선적으로 결합한다(Takusagawa et al., 1998). 예를 들어, SAM-I 및 SAM-II 앱타머는 SAH보다 SAM에 각각 약 80배 및 100배 이상 더 잘 결합한다(Lim et al., 2006b). 이 높은 식별력은 SAH와 SAM이 1개의 메틸 기에 의해서만 구별된다는 점을 고려할 때 놀라운 수준이다.
SAH를 L-메티오닌으로 전환시키는 역할을 담당하는 유전자의 업스트림에서 항상 발견되는 고도로 보존된 1차 서열 및 2차 구조를 갖는 세균 RNA 요소의 발견이 본 명세서에 기재된다. 상기 RNA 요소는 SAH에 선별적으로 결합하고 SAM보다 SAH에 1000배 이상 더 잘 결합하는(이는 상기 공지된 4종의 SAM 앱타머의 분자 인식 특징과 대조적임) 상이한 앱타머 클래스를 대표한다. 슈도모나스 시린가의 ahcY mRNA에서, SAH 앱타머에 결합하는 대사물질에 의해 야기된 구조적 변화는 생체내에서 다운스트림 유전자의 발현을 활성화시키는데, 이것은 상기 SAH 앱타머가 상이한 SAH-반응성 리보스위치 클래스의 센서 구성성분을 형성함을 입증한다.
1. 결과
i. SAH 재활용과 관련된 보존된 RNA 모티프의 동정
추가 리보스위치 클래스 및 다른 구조화된 조절 RNA 모티프를 동정하기 위해, 다수의 세균 클래스에 속하는 유전자 패밀리의 IGR의 체계적 검색을, CMfinder 비교 유전체학 파이프라인(Yao et al., 2007)을 이용하여 수행하였다(Weinberg et al., 2007). 상기 검색 기법을 이용하여 세균에서 다수의 RNA 모티프를 동정하고, 여러 모티프가 대사물질-감지 리보스위치로서 작용하는 RNA에 대해 예측된 특징을 나타내었다. 한 후보 리보스위치 클래스는 이 클래스에 속하는 RNA들과 가장 통상적으로 관련되어 있는 유전자들이 SAH 가수분해효소(ahcY, COG0499), 코발라민-의존적 메티오닌 합성효소(metH, COG1410) 및 메틸렌테트라하이드로폴레이트 리덕타제(metF, COG0685)이기 때문에 SAH 모티프로 지칭되었다(도 8). SAH 모티프들의 게놈 내용 및 이들의 높은 보존도는 SAH를 감지하는 데 있어서의 이들의 역할, 및 SAM을 재합성하기 위해 SAH를 재활용하는 데 필요한 생성물을 코딩하는 유전자의 발현을 활성화시키는 데 있어서의 이들의 역할과 일치한다. SAM-의존적 메틸화 반응의 SAH 부산물(Takusagawa et al., 1998)은 SAM과 비교할 때 유사한 또는 훨씬 더 우수한 친화도로 다수의 SAM-의존적 메틸트랜스퍼라제에 결합하여 상기 효소의 강력한 억제제로서 작용한다(Ueland, 1982). 메틸트랜스퍼라제 활성이 높은 시간 동안 세포는 화합물이 보다 약한 독성을 나타내는 생성물로 전환되지 않는다면 독성 수준의 SAH를 축적할 수 있다. 따라서, SAH의 신속한 감지, 및 SAM을 재합성하기 위한 SAH의 재활용에 필요한 유전자의 활성화는 중요하다.
SAH를 호모시스테인으로 전환시키는, SAH 이화를 위한 2종의 주요 경로가 진정세균에 존재한다(도 8). 많은 세균 종에서, SAH 뉴클레오시다제(EC 3.2.2.9)는 SAH의 N-글리코시드 결합의 절단을 촉진하여 아데닌 및 S-리보실호모시스테인을 생성한다(Delia Ragione et al., 1985). 그 후, S-리보실호모시스테인은 luxS의 유전자 생성물에 의해 가수분해되어 호모시스테인을 형성할 수 있다(Schauder et al., 2001). 대안적 경로는 SAH 모티프들과 일반적으로 관련되어 있는 ahcY 유전자를 이용한다. ahcY 유전자의 생성물인 SAH 가수분해효소는 SAH의 티오에터 결합의 분해를 촉진하여 아데노신 및 호모시스테인을 생성한다(Shimizu et al., 1984). 그 후, metH의 유전자 생성물은 metF의 유전자 생성물에 의해 5,10-메틸THF로부터 발생되는(Sheppard, 1999) 메틸 공여체로서 5-메틸테트라하이드로폴산(5-메틸THF)을 사용하여 호모시스테인을 L-메티오닌으로 메틸화시킨다(Old et al., 1988). metK 유전자에 의해 코딩되는 SAM 합성효소는 메티오닌 및 ATP로부터 SAM을 재생하여 주기를 완결시킨다(Tabor and Tabor, 1984). metK 유전자가 β-프로테오박테리아 및 γ-프로테오박테리아와 같은 일부 종에서 SAH RNA 모티프의 업스트림에 매우 인접하여 존재하고 동일한 오페론 내에 존재할 수 있다는 사실은 주목할 만하다. luxS 유전자 생성물(COG1854)의 유사체 중 어떠한 유사체도 보존된 RNA 요소가 발견되는 게놈 내에서 동정되지 않았으므로, 상기 유기체들에서 SAH의 이화는 SAH 가수분해효소를 이용하는 경로에 의해서만 진행될 수 있다.
요약하건대, 교정된 구조 모델에 일치하는 95종의 SAH RNA 모티프가 발견되었고, 이들 중 68종은 중복적으로 존재하지 않는다. 동정된 SAH RNA 모티프의 모든 예는 환경 유래 서열들로부터 동정된 것, 또는 상기 RNA 모티프에 인접한 유전자가 동정되지 않은 불완전하게 시퀀싱된 게놈으로부터 동정된 것들을 제외하고 SAH 재활용 유전자에 인접하여 위치한다. 대다수의 경우, SAH RNA들은 거의 예외 없이 SAH 가수분해효소(ahcY), 메틸렌테트라하이드로폴레이트 리덕타제(metF) 및 종종 메티오닌 합성효소(metH)를 코딩하는 오페론으로 보이는 것의 업스트림에 위치한다. 버크홀데리아, 데클로로모나스 및 랄스토니아와 같은 일부 종에서, 상기 오페론은 미공지된 기능을 갖는 예측된 막 단백질(COG1950)을 포함한다. SAH RNA-관련 오페론에서 거의 보이지 않는 다른 유전자들은 rRNA 메틸라제를 코딩하는 유전자(COG1189), 컴피턴스-특이적 유전자의 조절자를 코딩하는 유전자(tfoX, COG3070), 및 구아노신 폴리포스페이트 대사에 관여하는 효소를 코딩하는 유전자(spoT, COG0317)를 포함한다.
상기 RNA 모티프의 컨센서스 서열 및 구조 모델(도 9A)은 정렬에서 68종의 비-중복 서열들을 기초로 하여 구축하였다. 상기 컨센서스 RNA 모티프는 P1 및 P2로 지칭되는 염기-페어링된 영역에 의해 플랭킹된 고도로 보존된 뉴클레오티드로 구성된 중심 코어로 구성되고, 이때 P2는 가변-서열 루프(L2)로 캡핑되어 있다. 또한, 상기 RNA는 이 RNA의 3' 말단에 존재하는 고도로 보존된 뉴클레오티드와 중심 코어 사이에서 슈도노트(P4)를 형성한다. 헤어핀(P3 및 L3)은 일부 RNA 모티프들에서 P1 줄기와 P4 줄기 사이에서 발견된다. 2차 구조 요소들은 모두 공변이에 의해 지지된다.
β-프로테오박테리아 및 γ-프로테오박테리아 이외에, 상기 컨센서스 서열 및 구조와 일치하는 RNA의 예는 □-프로테오박테리아 종 및 일부 그람-양성 악티노박테리아에서도 발견되었다(도 9B). 악시도보락스 종(Acidovorax sp .), 데클로로모나스 아로마티카(Dechloromonas aromatica), 아조아르커스 종(Azoarcus sp .), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 종(Polaromonas sp.), 로도페락스 페리덕센스(Rhodoferax ferrireducens) 및 루브리비박스 겔라티노석스(Rubrivivax gelatinosus)를 제외한 대다수의 유기체들에서 상기 RNA 요소가 발견되었는데, 두 유기체에서 상기 RNA 요소는 게놈의 다양한 영역 내에 위치한 예측된 ahcY 코딩 서열 및 metH 코딩 서열 둘다의 앞에서 동정되었다.
ii. 68
metH
RNA에 의한 SAH의 선별적 결합
SAH RNA의 구조적 특징 및 게놈 정렬은 상기 RNA가 SAH를 감지하는 리보스위치에 대한 앱타머로서 작용함을 보여준다. 단백질-부재 시험관내 시스템에서 대사물질을 특이적으로 인식하여 유전자 조절 요소로서 작용할 수 있는(이 특징들은 리보스위치를 정의하는 2종의 특징임) RNA 모티프의 예를 찾았다. 데클로로모나스 아로마티카에서 metH 유전자의 업스트림에서 동정된 SAH RNA를 포함하는 68-뉴클레오티드 RNA(68 metH로 명명됨, 도 10A)를 선택하였다. 데클로로모나스 아로마티카 68 metH RNA는 이 모티프에 대한 컨센서스 서열 및 구조에 밀접하게 상응하는 거의 가장 짧은 서열이다. 이처럼 감소된 길이는 부분적으로는 임의적 구성요소인 P3 줄기의 부재에 기인한다(도 9A).
인-라인 프로빙 분석(Soukup and Breaker, 1999)을 이용하여 예측된 2차 구조(도 10A)를 확인하고 68 metH RNA가 SAH에 직접 결합한다는 사실을 확립하였다. 상기 분석은 RNA의 천연 발생적 절단이 구조화되지 않은 뉴클레오티드간 결합에서 보다 더 빨리 일어나므로 RNA의 구조적 특징뿐만 아니라 상기 RNA가 리간드에 결합하였을 때 일어나는 변화도 밝혀줄 수 있다는 사실을 이용한 것이다. 5' 32P-표지된 68 metH RNA는 점진적으로 높아지는 농도의 SAH를 함유하는 반응물 중에서 항온처리하고, 생성된 천연 발생적 절단 생성물은 PAGE로 분리하였다(도 10B). 임의의 리간드의 부재 하에서, L2를 형성하는 것으로 예측되는 상기 RNA의 영역, P1과 P2를 분리시키는 내부 루프, 및 상기 RNA의 3' 말단 부분에서 보다 높은 밴드 강도가 관찰되었다. 이 결과는 P1 및 P2가 형성되지만 RNA의 코어 및 3' 꼬리(P4 슈도노트의 뉴클레오티드들을 포함함)에서 고도로 보존된 뉴클레오티드들의 대다수가 리간드의 부재 하에서 덜 구조화됨을 암시한다.
증가하는 농도의 SAH의 존재 하에서 밴드 강도의 점진적인 변화는 상기 RNA 전체에 걸쳐 여러 위치에서 관찰되었는데, 이것은 상기 RNA가 이 대사물질에 대한 앱타머로서 작용하는 경우 예측되는 바와 같이 SAH가 RNA 폴딩의 변화를 초래함을 확인시켜준다. 뿐만 아니라, 구조적 변화는 많은 다른 리보스위치 앱타머의 경우에서 전형적으로 관찰되는 바와 같이 계통발생적으로 보존된 영역(도 9A, 도 10A)에서 주로 일어난다. SAH 결합에 반응한, 가장 주목할 만한 변화는 슈도노트 P4의 안정화, 및 상기 코어의 다른 보존된 뉴클레오티드들의 유연성의 감소이다. 이것은 상기 고도로 보존된 뉴클레오티드들이 SAH에 대한 결합 포켓을 형성하는 데 있어서 유용함을 보여준다.
SAH에 대한 68 metH RNA의 겉보기 해리 상수 KD는 일정한 SAH 농도 범위에 걸쳐 여러 뉴클레오티드 위치에서 일어나는 천연 발생적 절단 정도를 정량함으로써 약 20 nM인 것으로 추정되었다(도 10B 및 10C). 이 겉보기 KD 값은 KD가 약 200 μM(Winkler et al., 2004) 내지 약 200 pM(Welz and Breaker, 2007; Sudarsan et al., 2006)인 것으로 밝혀진 리보스위치 앱타머의 전형적인 겉보기 KD이다. 인-라인 프로빙 분석에 의해 확인된 유사한 SAH-매개 형태 변화는 슈도모나스 시린가의 ahcY 유전자로부터 유래된 122-뉴클레오티드 SAH 앱타머 구축물을 사용한 경우 수득되었다. 122 ahcY RNA는 임의적 구성요소인 P3 줄기를 보유하지만, 상기 RNA는 리간드 결합 시 앱타머의 코어의 핵심적인 구조적 변화를 겪고, 겉보기 KD 값은 68 metH RNA에 대해 측정된 값과 유사하다.
SAH 앱타머가 SAH-반응성 리보스위치에 대한 센서로서 작용하기 위해서는, 상기 SAH 앱타머가 SAH와 구조적으로 유사한 생물학적으로 관련된 화합물들을 식별할 수 있어야 한다. 아마도 가장 중요한 것은, 상기 앱타머가 1개의 메틸 기 및 황 중심에서의 결합된 양 전하에 의해서만 SAH와 구별되는 SAM으로부터 SAH를 식별해야 한다는 것이다. 인-라인 프로빙 분석 및 SAM의 상업적 공급원을 이용하여 68 metH RNA뿐만 아니라 다른 SAH 앱타머들도 SAH에 대해 확립된 겉보기 KD 값보다 10배 이하 더 높은 겉보기 KD 값을 나타냄을 발견하였다. 그러나, SAM은 천연 발생적으로 분해되어 상당한 수준의 SAH 오염물을 생성하고, 심지어 새로이 제조된 상업적 SAM 샘플은 약 10% SAH(시그마-알드리치 테크니칼 서비스)를 함유한다. 따라서, 68 metH RNA가 SAM에 대해 나타내는 높은 식별력은 SAM 샘플 중의 SAH의 존재에 의해 모호해질 수 있다.
SAM에 대한 SAH 앱타머의 식별력을 보다 정확하게 추정하기 위해, SAM-I 클래스 리보스위치 앱타머와 SAM의 결합 성질을 매우 유사하게 모방하는 것으로 이미 밝혀져 있는(Lim et al., 2006b) SAH의 설폰 유사체를 사용하여 인-라인 프로빙 분석을 수행하였다. 구체적으로, SAH의 설폰 유사체는 SAM에 존재하는 황 상에 메틸 기를 갖지 않되 황으로부터의 전자 밀도를 끌어당겨 이 원자의 상대적 양전하를 천연 보조효소의 전하와 유사한 정도로 증가시키는 2개의 음전하 산소 원자를 보유한다. 인-라인 프로빙 분석 결과(도 10C)는 상기 설폰 유사체가 SAH보다 약 3차수만큼 더 낮은 겉보기 KD로 68 metH RNA에 결함함을 보여준다.
SAM에 대한 68 metH 앱타머의 KD 값은 156 metA로 지칭되는 이미 공지된(Corbino et al., 2005) SAM-II 앱타머의 기능과 SAH 앱타머의 기능을 평형화 투석을 이용하여 비교함으로써 평가하였다. 68 metH RNA 또는 156 metA RNA(10 μM)를 평형화 투석 장치의 한 챔버에 첨가하고, 100 nM의 [3H]SAM(도 11A)을 다른 챔버에 첨가하였다. 상기 챔버들은 분자량 컷-오프가 5,000 달톤인 투과성 막으로 분리되어 있었다. [3H]SAM의 황 중심에 있는 메틸 기가 방사성표지되어 있기 때문에, 오염물질인 SAH는 방사성을 나타내지 않으므로 상기 두 챔버 사이의 방사성의 평형 분포에 영향을 미치지 않는다.
156 metA RNA는, 68 metH RNA가 동일한 분석 조건 하에서 존재하는 경우 [3H]SAM 분포를 전혀 변동시키지 않는다는 결과와 비교할 때, [3H]SAM 분포를 SAM-II 앱타머가 함유된 챔버 쪽으로 약 1.5배만큼 변동시킨다(도 11B). 156 metA RNA는 인-라인 프로빙 분석에 의해 측정된 경우 SAM에 대해 약 1 μM의 겉보기 KD를 나타낸다 (Corbino et al., 2005). 따라서, SAM에 대한 68 metH의 KD 값은 1 μM보다 더 높다. 나아가, 25 μM 68 metH RNA가 사용된 경우 SAM-II 리보스위치에 대해 관찰된 것과 동등한 방사성 변동의 부재는 SAM에 대한 68 metH RNA의 KD가 25 μM보다 더 높지 않을 것임을 시사한다. 이는 68 metH RNA가 SAM에 대한 친화도보다 1,000배 더 높을 것으로 예측되는 친화도으로 SAH를 인식함을 보여준다(도 11C). SAH와 SAM 사이의 이러한 식별은 상기 리보스위치들이 SAH와 동등한 또는 심지어 다소 과량의 SAM의 농도에 노출된 경우조차도 SAH 농도의 변화에 반응하여 SAH 재활용 유전자의 발현을 정확하게 조절하기에 충분해야 한다.
SAH 앱타머의 분자 인식 특징은 15종의 SAH 유사체에 대한 68 metH RNA의 겉보기 KD 값을 확립함으로써 보다 상세하게 평가하였다(도 12A). 아미노산의 카복실 기 및 아미노 기, 당 고리 및 뉴클레오베이스 상의 다양한 위치 및 티오에스터 결합이 변경되었다. SAC을 제외한 모든 유사체가 3배 이상의 차수의 친화도 감소를 나타낸다. 흥미로운 것은, SAC의 보다 짧은 아미노산 측쇄가 SAM-감지 리보스위치의 경우에서 관찰된 결과(Lim et al., 2006b)와 달리 단지 약간의 친화도 감소만을 초래하였다는 사실이다.
SAH의 설폰 유도체(화합물 3) 및 SAH의 아자 유도체(화합물 4)의 황 원자에서의 변화도 친화도를 3차수만큼 감소시키는데, 이것은 리간드 인식에 대한 상기 위치의 중요성을 암시한다. 화합물 4는 인-라인 프로빙 분석에 사용되는 조건 하에서 거의 변화되지 않는다(Lim et al., 2006b). 따라서, 화합물 4와 RNA의 보다 약한 상호작용은 메틸 기의 존재로 인한 입체 간섭으로부터 비롯될 것이다. 화합물 3의 황 원자에서의 보다 높은 양전하 밀도(Lim et al., 2006b)는 화합물 4에 비해 화합물 3의 다소 약한 결합에 기여할 것이다. 또한, SAH의 황 중심의 2개의 고립 전자쌍 세트는 상기 RNA의 리간드 인식에 있어서 핵심 역할을 수행할 것이다. SAH(및 SAC)의 황 원자는 전하 수송 또는 반데르발스 상호작용을 통해 앱타머와의 생산적 상호작용을 일으킬 수 있을 것으로 추측된다. 마지막으로, 아데노신은 SAH 앱타머와 약하게 상호작용하지만(KD = 약 100 μM) 호모시스테인 및 메티오닌 둘다 1 mM만큼 높은 농도에서 RNA 구조의 어떠한 조절도 일으키지 않는다.
이 결과는 68 metH RNA에 의한 SAH의 분자 인식 모델을 발생시키는 데 사용되었다(도 12B). 상기 모델은 여러 다른 리보스위치 앱타머 클래스(예를 들어, 문헌(Mandal et al., 2003; Sudarsan et al., 2003b; Mandal et al., 2004c; Lim et al., 2006a; Lim et al., 2006b) 참조)의 경우에 관찰된 것과 같이 리간드 상의 모든 작용기가 필수적으로 중요한 분자 인식 결정인자로서 작용함을 보여준다.
iii. SAH 결합은 레포터 유전자의 발현을 활성화시킨다.
슈도모나스 시린가로부터 유래된 ahcY mRNA의 개시 코돈과 SAH 요소 사이에 있는 서열은 P4 줄기의 3' 말단에 있는 2개의 뉴클레오티드가 리보좀 결합 부위 또는 SD 서열과 택일적으로 염기-페어링을 형성할 수 있는 과외의 줄기-루프 구조를 형성하는 것으로 예측된다(도 13A). 상기 염기-페어링에 의한 상호작용은 상기 과외의 줄기-루프 구조를 2개의 염기쌍만큼 연장시키므로 SD-격리 줄기로서 작용할 것이다. 따라서, 상기 RNA는 아마도 SD 서열을 노출시켜 라이보좀과 mRNA의 상호작용을 촉진함으로써 리간드 결합 시 유전자 발현을 활성화시키는 SAH-반응성 리보스위치로서 작용한다. 데클로로모나스 아로마티카로부터 유래된 SAH 앱타머에 대해 유사한 SAH-매개 재정렬이 예측되지만, 이 RNA에 결합하는 리간드는 전사 종결요소 줄기의 형성을 조절하는 듯하다.
생체내 유전자 조절 분석을 수행하였는데, 이때 슈도모나스 시린가의 ahcY 유전자의 5' UTR을 포함하는 IGR은 lacZ 코딩 서열의 바로 업스트림에 융합되어 있다. 이 구축물은 레포터 유전자 ORF와 인 프레임으로 융합되어 있는 ahcY 유전자의 개시 코돈을 보유하였다. 생성된 번역 융합 벡터를 슈도모나스 시린가 내로 형질전환시켜 WT 레포터 균주를 발생시켰다. 유사하게, 앱타머 기능을 파괴하거나 복원시키는 것으로 예측되는 일련의 돌연변이체 레포터 균주들을 구축하였다(도 13A). 그 후, 형질전환된 슈도모나스 시린가 균주를 킹스 배지 B(풍부 배지) 또는 보겔-본너 배지(최소 배지) 중에서 생장시키고, 상기 돌연변이체 구축물들의 레포터 발현 수준을 WT 레포터 구축물의 레포터 발현 수준과 비교하였다(도 13B).
풍부 배지에서, SAH 농도는 높은 것으로 예측되는데, 이는 세포가 보조인자로서 SAM의 사용을 필요로 하는 대사 경로를 이용해야 하기 때문이다. 예측된 바와 같이, WT 구축물에 대한 β-갈락토시다제 레포터 활성은 P1 줄기와 P2 줄기 또는 J1-2 사이의 접합부에 존재하는 2개의 보존된 뉴클레오티드를 파괴하는 돌연변이를 보유하는 구축물 M1(도 13B, 상부)에 비해 상승되어 있다(도 13A). 이 발견은 SAH 결합이 유전자 발현을 활성화시키고 리간드 결합을 파괴하는 돌연변이가 리보스위치로 하여금 오프 상태로 디폴트(default)하게 한다는 추측과 일치한다. 불운하게도, M2가 보유하는 돌연변이에 의한 P2 줄기의 불안정화가 리보스위치 기능을 파괴하는 것으로 예측됨에도 불구하고 M2 및 M3 둘다 WT-유사 유전자 발현을 나타낸다. 그러나, 인-라인 프로빙 분석(SAH가 존재하는 경우 및 존재하지 않는 경우)은 M2 구축물이 과도하게 미스폴딩(misfolding)되어 있고, 이것이 레포터 구축물로 하여금 높은 발현 수준으로 디폴트하게 할 수 있음을 보여준다. 과도하게 미스폴딩되어 있지 않은 구축물을 발생시키는 P2 내의 추가 돌연변이를 조사하였다. 예측된 바와 같이, 돌연변이 M4(P2 파괴) 및 M5(P2 복원)는 각각 유전자 발현의 상실 및 유전자 발현의 후속 복원을 보인다. 이 발견은 앱타머의 파괴가 리보스위치로 하여금 유전자 발현에 대해 오프 상태로 디폴트하게 함을 암시하고 M2 돌연변이가 실제로 그의 미스폴딩 및 유전자 발현 결과에 있어서 비정상적임을 보여준다.
유사하게, 구축물 M6, M7 및 M8이 보유하는 돌연변이의 효과는 SD 격리를 수반하는 유전자 조절 기작과 일치한다. 상기 구축물들은 P4의 안정성을 감소시키는 2종의 돌연변이를 각각 보유하고, 상기 구축물에 대한 SAH 결합 친화성의 상실이 인-라인 프로빙 분석의 이용에 의해 관찰되었다. 나아가, SAH 결합을 파괴하는 구축물 또한 낮은 β-갈락토시다제 레포터 활성을 나타낼 수 있다. 이 결과는 실제로 M6 및 M8의 경우에 관찰되지만, M7은 거의 WT 발현을 보인다(도 13A). M7 돌연변이가 P4 형성을 파괴한다 하더라도, 이 돌연변이는 SD 서열과 중첩되는 격리 줄기를 파괴할 수도 있다. 따라서, M7 리보스위치는 더 이상 오프 상태로 디폴팅할 수 없어야 하고, 리보스위치-레포터 융합 구축물의 유전자 발현은 관찰된 바와 같이 높을 수 있다. 일련의 유사한 레포터 유전자 분석을 최소 배지(보겔-본너 배지) 중에서 생장된 세포를 사용하여 수행하였다. 최소 배지 중에서 생장된 다양한 구축물을 사용한 경우 동일한 경향이 관찰되지만(도 13B, 하부), 레포터 발현에 대한 절대 값은 풍부 배지 중에서 더 높았다. 최소 배지 중에서의 총 레포터 발현의 이러한 감소는 일반적 대사 활성 및 단백질 합성에서의 감소에 기인할 수 있다.
인-라인 프로빙 분석을 이용하여 P4 줄기의 형성과 SD-격리 줄기의 형성 사이의 경쟁이 관찰될 수 있는지를 확인하였다. 도 13A에 도시된 바와 유사하게 151 ahcY RNA를 기초로 한 보다 긴 구축물을 사용한 인-라인 프로빙 분석은 SAH가 존재하는 WT 구축물에서 SD-격리 줄기가 실제로 파괴되어 있음을 보여준다. 대조적으로, 이 구축물의 M6 버전은 SAH의 존재 또는 부재와 관계없이 SD-격리 줄기를 형성하는 반면, M7 변이체는 상기 줄기를 형성할 수 없다. 따라서, 전장 P4 줄기 및 전장 SD-격리 줄기의 상호-배타적 형성은 슈도모나스 시린가의 ahcY 유전자로부터 유래된 SAH 리보스위치에 대한 발현 플랫폼의 핵심적인 구성요소일 수 있다.
SAH가 생체내에서 대사물질 이펙터(effector)로서 작용하는지를 더 확인하기 위해, 세포내 SAH 농도를 증가시키는 것으로 공지되어 있는 이펙터로 보충된 최소 배지 중에서 생장된 WT 균주에 대한 레포터 발현을 측정하였다(도 14). 아데노신-2',3'-다이알데하이드(SAH 가수분해효소의 억제제) 및 아데노신 + 호모시스테인 둘다 세포내 SAH 농도를 실질적으로 증가시킨다는 것은 이미 공지되어 있다(Hermes et al., 2004). SAH 가수분해효소 억제제 또는 아데노신/호모시스테인 혼합물로 보충된 배지는 WT 리보스위치-레포터 융합 구축물의 발현을 약 10 내지 20배 증가시키고(도 14A), 아데노신-2',3'-다이알데하이드 농도의 증가는 WT에서는 유전자 발현을 증가시키지만 결함 변이체인 M1 및 M7에서는 유전자 발현을 증가시키지 못한다(도 14B). 배지에의 메티오닌의 첨가는 리보스위치-매개 발현의 유사한 증가를 야기한다. 생장 배지 중의 과도한 메티오닌은 보다 높은 세포내 SAM 농도를 초래하고((Winkler et al., 2003), 세포내 SAH 농도 역시 증가될 수 있다.
대조적으로, 배지에의 250 μM SAH의 첨가는 레포터 유전자를 약간만 증가시킨다. SAH는 온전한 분자로서 세포막을 통과하지 못하는데(Ueland, 1982), 이것은 이 화합물의 첨가가 레포터 발현 수준에 거의 영향을 미치지 못하는 이유를 설명한다. 레포터 발현의 상향-조절은 리보스위치에 의존하는 듯한데, 이는 P4의 형성을 파괴하고 앱타머의 코어 컨센서스 서열을 변경시키는 돌연변이를 보유하는 M6 리보스위치-레포터 융합 구축물에서는 유전자 발현이 거의 전혀 관찰되지 않았기 때문이다(도 13A).
2. 논의
SAH는 SAM-의존적 메틸 전달 반응의 생성물로서 생체 시스템 내에 편재되어 있을 뿐만 아니라 높은 농도로 존재하는 경우 상기 반응의 억제제로도 작용한다(Ueland, 1982). 따라서, 많은 세포가 SAH를 선별적으로 감지하고 과량의 SAH를 처리할 필요가 있다. 일부 유기체에서, SAH는 황 대사에 관여하는 유전자를 조절하는 단백질 유전적 인자에 의해 감지된다(Rey et al., 2005). 이 발견은 RNA 분자들이 유사한 성능으로 SAH를 감지하고 그의 이화에 필요한 핵심 유전자들을 조절하는 데 기여할 수 있음을 암시한다.
SAH 요소의 동정은 SAH에 선별적으로 결합하는, 고도로 보존되어 있고 널리 분포되어 있는 세균 RNA의 첫 번째 예를 제공한다. 상기 RNA는 SAH 이화에 관여하는 단백질 생성물을 발현할 것으로 예측되는 ORF의 바로 업스트림에 항상 위치하는 리보스위치 클래스의 앱타머 도메인으로서 작용한다. 이것은 SAH 리보스위치의 대다수가 리간드 결합에 반응하여 유전자 발현을 "온" 상태로 전환시킬 것임을 보여준다. 실제로, RNA 요소의 직접적인 리간드 결합은 특정한 2차 구조 및 3차 구조를 안정화시키고, 이러한 안정화는 리보좀 결합 및 후속 번역이 가능하도록 인접하는 ORF에 대한 SD 서열에 접근할 수 있게 한다.
SAH 결합에 대해 명확히 식별하는, 공지된 SAM-감지 리보스위치의 여러 다양한 클래스가 존재하지만(Lim et al., 2006b; Fuchs, 2006), SAH 리보스위치는 상기 식별력을, SAH 결합에 유리하고 SAM을 거부하는 능력으로 전환시키는 RNA로서 동정된 첫 번째 클래스의 RNA이다. 다른 리보스위치 클래스에서와 마찬가지로, 리간드 결합의 높은 선별성은 다른 밀접하게 관련된 화합물들의 유전자 발현의 조절을 방해하는 데 필요할 수 있다. SAH 앱타머에 의한 강력한 분자 식별력은 SAM과 같은 다른 화합물들이, SAH가 높은 농도로 축적된 경우에만 필요한 SAH 이화 유전자 발현을 불필요하게 활성화시키는 것을 방지할 것이다. 이러한 SAH 앱타머의 식별력은 SAH의 대사 전구체인 SAM이 정상 조건 하에서 SAH보다 더 높은 세포내 농도로 존재하기 때문에 특히 중요하다(Ueland, 1982). SAH 리보스위치의 유전자 내용, 및 약 3차수의 크기로 SAM에 대해 식별하는 상기 리보스위치의 능력 둘다 SAH가 생체내에서 RNA 요소에 의해 감지되는 대사물질임을 입증한다. 따라서, SAH 리보스위치는 세포에 한 센서 클래스를 제공하고, SAH 농도가 적절한 유전자의 도움이 될 때에만 세포가 SAH 분해에 대한 자원을 소비하게 하는 유전자 조절 요소도 세포에게 제공한다.
천연 SAM 앱타머와 마찬가지로, 본 연구에서 최대한 상세히 조사된 SAH 앱타머는 분자 인식을 위해 리간드 상의 모든 작용기를 필수적으로 사용한다. 주목할 만한 한 예외는 SAH 앱타머가 친화성을 실질적으로 상실하지 않은 리간드의 아미노산 부분으로부터의 메틸렌 기의 제거를 용인한다는 결과이다. SAC(도 12A, 화합물 2)는 SAH에 존재하는 작용기의 동일한 어레이를 보유하지만, 이 작용기들 중 일부는 앱타머의 결합 포켓 내의 1 이상의 옹스트롬에 의해 치환되어 있다. 보다 짧은 SAC 유사체의 용인에 대한 가능한 설명은 RNA 앱타머가 2개의 분리된 결합 포켓을 형성할 것이고, 이때 각 결합 포켓이 리간드의 한 측면과 상호작용한다는 것이다. 이것은 결합 부위가 다양한 길이의 리간드를 인식할 수 있게 하는 일정 수준의 적응능(adaptability)을 허용할 수 있다. 이러한 타입의 리보스위치 앱타머 기능에 대한 예는 점진적으로 약해지는 겉보기 KD 값으로 점진적으로 짧아지는 티아민 모노포스페이트 및 티아민 화합물에 결합할 수 있는 TPP-결합 리보스위치의 경우 보고된 바 있다(Winkler et al., 2002). TPP 리보스위치 앱타머의 원자-해상 모델(Edwards and Ferre-D'Amare, 2006; Serganov et al., 2006; Thore et al., 2006)은 비교적 높은 친화도로 보다 짧은 티아민 모노포스페이트 리간드에 결합하도록 그의 위치를 조절할 수 있는 이성분(bipartite) 리간드-결합 포켓을 보여준다.
SAH 앱타머 내의 가장 고도로 보조된 뉴클레오티드들은 P4, 및 P1, P2 및 P4를 가교결합시키는 접합부에 주로 위치한다(도 9A). 상기 뉴클레오티드들은 인-라인 프로빙 분석에 의해 관찰된 이 잔기들의 구조의 실질적인 조절에 의해 분명히 드러난 바와 같이 SAH에 대한 결합 포켓을 형성하는 데 관여할 수 있다(도 10A 및 10B). 상기 뉴클레오티드들은 황 중심에서 전하를 갖지 않는 리간드에 결합하는 포켓을 형성하므로 SAM-I 앱타머와 상이한 방식으로 상기 원자 중심과 상호작용하는 구조를 형성한다. SAH 앱타머는 황 중심에의 변경을 보유하는, 본 연구에서 시험된 두 화합물 모두를 거부한다(도 12A, 화합물 3 및 4). 화합물 4에 대한 식별은 SAH의 황을 대신하는 질소 중심이 유사하게 전하를 갖지 않기 때문에 특히 주목할 만하다. 그러므로, SAH 리보스위치는 SAH의 황에 상응하는 원자 상에 추가 화학적 잔기를 보유하는 SAM, 화합물 3 및 화합물 4와 같은 화합물들의 입체적 배제에 의해 식별하는 듯하다.
리보스위치 클래스 목록을 확장하는 것 이외에, SAH 앱타머의 동정은 고도 선별적 SAH 센서로서의 용도를 이끌어 낸다. 예를 들어, SAH는 심혈관 질환에 대한 마커로서 사용될 수 있는 호모시스테인의 공급원이다(Nygard et al., 1999). SAH 요소의 컨센서스에 일치하는 시퀀싱된 세균 게놈에서 확인된 가장 짧은 예는 크기가 50개 뉴클레오티드보다 약간 더 길다(데클로로모나스 아로마티카에서 ORF Daro_0186의 업스트림에서 발견됨). SAH 요소는 SAH에 대한 nM 단위의 친화성 및 SAM과 같은 밀접하게 관련된 유사체들에 대한 여러 차수의 식별력 뿐만 아니라 용이하게 이용가능한 발현 플랫폼과 함께 시험관내 및 생체내 사용에 적합한 성질을 보유한다.
3. 실험 절차
i. 올리고뉴클레오티드, 화합물 및 세균
합성 DNA 올리고뉴클레오티드는 예일 유니버시티의 더블유 엠 켁크 파운데이션 바이오테크놀로지 리소스 레이보레이토리 또는 시그마-게노시스로부터 구입하였고 달리 명시하지 않은 한 추가 처리 없이 사용하였다. [3H]SAM 또는 S-(5'-아데노실)-L-메티오닌-(메틸-3H)은 시그마-알드리치로부터 구입하였고, [γ-32P]ATP는 아머샴 바이오사이언시스(Amersham Bioscience)로부터 구입하였다. 화합물 4는 더 유니버시티 오프 쉐프필드(The University of Sheffield)의 지 마이클 블랙번(G. Michael Blackburn) 교수로부터 제공받았다. 제조 방법이 공지되어 있는(Lim et al., 2006b) SAH 유사체 3, 5, 6 및 9 내지 16을 제외한 모든 다른 화합물은 시그마-알드리치로부터 구입하였다. 슈도모나스 시린가 피브이 토마토 균주 DC3000(Pseudomonas syringae pv . tomato str. DC3000)은 코넬 유니버시티의 그레고리 비 마틴(Gregory B. Martin) 교수로부터 제공받았다.
ii. RNA 제조
68 metH 및 122 ahcY RNA는 T7 RNA 중합효소 및 상응하는 DNA 주형을 사용하여 시험관내 전사를 통해 제조하였다. 68 metH에 대한 DNA 주형은 제조자의 지시에 따라 수퍼스크립트 II 역전사효소(인비트로겐)를 사용하여 합성 주형 DNA에 혼성화된 T7 프로모터 서열을 갖는 프라이머를 연장함으로써 생성하였다. 합성 주형 DNA는 연장 전에 변성(8 M 우레아) PAGE를 이용하여 정제하였다. WT 122 ahcY RNA 및 돌연변이체 122 ahcY RNA에 대한 DNA 주형은 이하에 기재된 적절한 플라스미드를 사용하여 PCR 증폭함으로써 생성하였다. RNA 전사체는 변성 PAGE로 정제하고 10 mM Tris-HCl(23℃에서 pH 7.5), 200 mM NaCl 및 1 mM EDTA가 함유된 용액을 사용하여 겔 단편으로부터 회수하였다. RNA를 에탄올로 침전시켜 농축시키고, 알칼리성 포스파타제(로슈 다이아그노스틱스)로 탈인산화시키고, 제조자의 지시에 따라 [γ-32P] ATP 및 T4 폴리뉴클레오티드 키나제(뉴 잉글랜드 바이오랩스)를 사용하여 5'-방사선표지화를 수행하였다. 방사선표지된 RNA를 변성 PAGE로 정제하고 전술한 바와 같이 단리하였다.
평형화 투석에 사용된 WT 68 metH RNA 및 돌연변이체 68 metH RNA를, 탈인산화 및 방사선표지화를 제외한 전술한 방법에 따라 제조하고 정제하였다. 평형화 투석에 사용된 156 metA RNA(Corbino et al., 2005)는 아그로박테리움 투메파시엔스 균주 GV2260의 전체-세포 PCR에 의해 생성된 DNA 주형을 사용하여 전술한 바와 같이 제조하였다.
iii
. 인-라인
프로빙
분석
인-라인 프로빙 분석은 본질적으로 전술한 바와 같이 수행하였다(Soukup, 1999). 5' 32P-표지된 RNA를 50 mM Tris-HCl(23℃에서 pH 8.3), 20 mM MgCl2, 100 mM KCl 및 표시된 농도의 시험 화합물이 함유된 10 ㎕ 용액 중에서 실온에서 약 40시간 동안 항온처리하였다. 천연 발생적 절단 생성물을 10% 변성 PAGE로 분리하고, 포스포르이미저(몰레큘라 다이나믹스)를 이용하여 가시화하고 SAFA v1.1 소프트웨어(Das et al., 2005)를 이용하여 정량하였다. 각 뉴클레오티드 위치에서 절단된 RNA의 양은 각 레인에 적재된 다양한 양을 보정하기 위해 천연 발생적 절단 수준이 일정한 기준 뉴클레오티드 위치를 자동적으로 결정하는 SAFA 분석으로부터 수득하였다. 리간드의 부재 하에서는 조절이 전혀 없고 최대 농도의 리간드의 존재 하에서는 최대 조절이 있다는 가정 하에 조절된 각 부위에서의 개개의 밴드 강도를 합하여 표준화함으로써 구조적으로 조절된 RNA의 분율 값을 수득하였다. 겉보기 KD 값은 모든 3개의 표시된 조절 부위에서 리간드 농도[L]에 대한 조절된 분율(F)의 곡선을 시그마플롯 9 소프트웨어(시스타트 소프트웨어 인코포레이티드)를 사용하여 방정식 F = [L]/([L] + KD) 에 피팅함으로써 측정하였다.
iv. 평형화 투석
평형화 투석은 20 ㎕의 샘플을 다이스포-평형화 생체투석기(Dispo-Equilibrium Biodialyzer)(더 네스트 그룹 인코포레이티드; 미국 매사츄세츠주 사우쓰보로 소재)의 각 면에 전달함으로써 수행하였는데, 이때 챔버 사이의 분리는 분자량 컷-오프가 5,000 달톤인 투석 막에 의해 유지된다. 한 챔버는 100 mM Tris-HCl(24℃에서 pH 8.3), 20 mM MgCl2, 100 mM KCl 및 100 nM [3H]SAM으로 구성된 완충제 용액을 함유하였다. 반대쪽 챔버는 표시된 농도의 156 metA 또는 68 metH RNA를 추가로 함유하는 동일한 완충제를 함유하였다. 25℃에서 11.5시간 동안 항온처리한 후, 5 ㎕의 분취액을 양쪽 챔버로부터 회수하고, 방사능을 액체 신틸레이션 카운터로 측정하였다.
v. 생체내 레포터 유전자 발현 분석
예측된 ahcY 번역 개시 부위(진뱅크 등록번호 NC_004578.1; 뉴클레오티드 5,771,072 내지 5,771,444)를 기준으로 뉴클레오티드 -367 내지 +6을, 슈도모나스 시린가 피브이 토마토 균주 DC3000의 전체-세포 PCR을 통해 BamHI-HindIII 단편으로서 증폭하였다. PCR 생성물을 lacZ 레포터 유전자의 바로 업스트림에서 번역 융합 벡터 pRA301(Akakura and Winans, 2002) 내로 클로닝하였다. 이 레포터 벡터는 슈도모나스 애루기노사 벡터 pVS1(Itoh et al., 1984)로부터 유래된 복제기점 rep 및 안정성 영역 sta를 보유하기 때문에 슈도모나스에서 안정하게 유지된다. 돌연변이체 M1 내지 M8은 생성된 플라스미드(주형으로서 사용됨), 적절한 돌연변이유발성 프라이머 및 퀵체인지 부위-지정 돌연변이유발 키트(스트라타진)를 제조자의 지시에 따라 사용하여 발생시켰다. 모든 재조합 플라스미드의 완전성은 시퀀싱으로 확인하였다. 슈도모나스 시린가 내로의 pRA301 변이체들의 형질전환은 표준 프로토콜(Ausubel et al., 1992)에 따른 전기천공을 통해 달성하였다. 확실한 형질전환체는 스펙티노마이신(75 ㎍/㎖) 및 리팜피신(50 ㎍/㎖) 내성에 대해 선별함으로써 확인하였다.
WT 슈도모나스 시린가 레포터 균주 및 돌연변이체 슈도모나스 시린가 레포터 균주에서의 lacZ 유전자의 발현 수준을 측정하기 위해, 세포를 킹스 배지 B(King et al., 1954)(20 g/ℓ 프로테오스 펩톤 제3번, 10 g/ℓ 글리세롤, 1.5 g/ℓ K2HPO4, 1.5 g/ℓ MgSO4·7H2O, pH 7.2), 50 ㎍/㎖ 리팜피신 및 75 ㎍/㎖ 스펙티노마이신 중에서, 또는 보겔-본너 최소 배지(0.2 g/ℓ MgSO4·7H2O, 2 g/ℓ 시트르산 일수화물, 10 g/ℓ K2HPO4, 3.5 g/ℓ NH4NaHPO·H2O, pH 7.0), 0.5 중량/부피% 글루코스, 50 ㎍/㎖ 리팜피신 및 75 ㎍/㎖ 스펙티노마이신 중에서 28℃에서 진탕하면서 밤새 생장시켰다. 밤새 생장시킨 배양물을 A600이 0.1 내지 0.2가 될 때까지 동일한 배지로 희석하고 표시된 추가 화합물로 보충하였다. 배양물을 4.5시간(킹스 배지 B) 또는 6시간(보겔-본너 배지) 동안 더 항온처리한 후 표준 프로토콜(Miller, 1992)에 따라 β-갈락토시다제 분석을 수행하였다. 기재된 밀러 유니트는 3회 반복 실험의 평균이었다.
D. 실시예 4: 스트렙토코카세아(
Streptococcaceae
) 세균 내의 제2 천연 preQ
1
앱타머 클래스의 동정
진정세균 게놈의 생물정보 검색을 통해 많은 리보스위치 후보물질들이 확인되었지만, 이때 리간드의 종류는 관련된 유전자들의 조사 시 즉시 명확하지는 않았다. 이 모티프들 중 하나는 스트렙토코카세아 패밀리에서 COG4708 또는 DUF988로서 분류된 잠재적 막 단백질을 코딩하는 유전자들의 5' UTR 내에서만 발견되었다. 쿠에우오신 생합성 중간체인 preQ1에 결합하는 리보스위치는 스트렙토코카세아 패밀리에 속하지 않는 세균인 많은 퍼미큐트 종에서 유사 유전자들의 5' UTR에서 동정되었다. 본원은 스트렙토코커스 뉴모니아 R6으로부터 유래된 COG4708 RNA 모티프도 preQ1에 결합함을 발견하였다. 나아가, 상기 RNA 모티프는 이미 공지되어 있는 preQ1 리보스위치 클래스와 상이한 구조적 및 분자 인식 특징을 갖는다. preQ1은 2종 이상의 상이한 천연 앱타머 클래스에 의해 인식되는 대사물질의 두 번째 예인데, 이것은 동일한 대사물질에 결합하기 위해 상이한 구조를 이용하는 천연 앱타머가 흔할 수 있음을 암시한다. 또한, COG4708로서 분류된 단백질을 코딩하는 대다수의 유전자와 preQ1 결합 RNA의 관련성은 상기 단백질이 preQ1 또는 또 다른 쿠에우오신 생합성 중간체에 대한 수송자로서 작용함을 보여준다.
리보스위치는 소분자에 결합하여 유전자 발현을 조절하는 구조화된 RNA이다(Mandal and Breaker 2004a; Soukup and Soukup 2004; Tucker and Breaker 2005; Winkler and Breaker 2005). 상기 리보스위치는 전형적으로 리간드-결합 앱타머, 및 리간드 결합을 유전적 조절로 전환시키는 발현 플랫폼으로 구성된다. 각 리보스위치 클래스의 앱타머는 통상적으로 리간드 결합 부위에 의해 부가된 구속으로 인해 잘 보존되어 있다. 앱타머 서열 및 구조의 이러한 보존은 게놈 서열의 생물정보 분석이 신규 리보스위치 후보물질의 동정에 효과적인 수단이 되게 한다(예를 들어, 문헌(Rodionov et al., 2002; Rodionov et al., 2003; Barrick et al., 2004; Abreu-Goodger and Merino 2005; Corbino et al., 2005; Weinberg et al., 2007) 참조). 대조적으로, 발현 플랫폼은 상당히 다양할 수 있고 다양한 유전적 조절 기작, 예컨대, 전사 종결 및 번역 개시를 이용할 수 있다(Mandal and Breaker 2004a). 발현 플랫폼이 통상적으로 개개의 리보스위치의 서열을 조사함으로써 식별될 수 있을 지라도, 발현 플랫폼은 서열 및 구조 보존성을 상대적으로 결여하고 있기 때문에 신규 리보스위치 클래스의 생물정보 검색에 대한 표적으로서 유용하지 못하다.
생물정보 검색은 다수의 리보스위치 및 리보스위치 후보물질의 발견에 사용되어 왔다(예를 들어, 문헌(Barrick et al., 2004; Corbino et al., 2005) 참조). 가장 최근에는, 수백 종의 세균 게놈을 검색하는 데 적용된 CMfinder 파이프라인(Yao et al., 2006)을 사용한 22종의 RNA 모티프의 발견이 이용되었다. 상기 22종의 모티프 중 6종의 모티프는 시스-조절 RNA, 예컨대, 리보스위치의 공통된 특징을 나타낸다. 예를 들어, 상기 모티프는 한 유전자 또는 상이한 유전자 세트의 바로 업스트림에 일관되게 위치하고 있다. 또한, 상기 모티프는 2종의 특징 중 하나, 즉 바로 다운스트림에 위치한 유전자의 리보좀 결합 부위 또는 SD 서열과 중첩되는 줄기 또는 rho-독립적 전사 종결요소를 갖는다. 기재된 모티프 중 여러 종의 모티프의 경우, 리간드 종류는 RNA의 게놈 내용으로부터 추측되었다(Weinberg et al., 2007; Wang et al., 2008; Regulski et al., 제출됨). 다른 모티프들의 경우, 게놈 내용은 리간드 종류에 대한 정보를 거의 또는 전혀 제공하지 못하였다. 이러한 RNA 모티프 중 하나는 COG4708 또는 DUF988로서 분류된, 퍼미큐트에서 발견되는 보존된 잠재적 막 단백질에 대한 유전자와만 관련되어 있는 것으로 밝혀졌다.
쿠에우오신 생합성 전구체 preQ1에 반응하는 리보스위치가 공지되어 있다(Roth et al., 2007). Q는 대다수의 세균에서 tRNA의 GUN 안티코돈의 와블(wobble) 위치에서 Tyr, Asn, Asp 및 His 대신에 발견되는 과다-변경된 염기이다(Harada and Nishimura 1972). Q 변경은 번역 신뢰도에 중요한 것으로 공지되어 있다(Meier et al., 1985; Bienz and Kubli 1981; Urbonavicius et al., 2001). Q 생합성은 GTP로 개시되어 일련의 효소적 단계에서 중간체 preQ0(7-시아노-7-데아자구아닌) 및 preQ1(7-아미노메틸-7-데아자구아닌)을 거쳐 진행된다(Kuchino et al., 1976; Okada et al., 1978; Iwata-Reuyl 2003; Gaur and Varshney 2005; Van Lanen et al., 2005). preQ1은 특정한 구아닌 tRNA와 우선적으로 교환되고, 남은 생합성 단계는 원위치에서 일어난다(Okada et al., 1979; Slany et al., 1993). 따라서, preQ1은 tRNA 내로 삽입되기 전에 자유 형태로 존재하는 마지막 Q 전구체이다.
공지된 preQ1 리보스위치 클래스에 속하는 preQ1 리보스위치(Roth et al., 2007)는 종종 Q 생합성 오페론의 업스트림에 위치하지만(Reader et al., 2004), 일부는 Q와 관련되지 않은 단백질을 코딩하는 다른 유전자들의 업스트림에서 동정되기도 하고, 이러한 타입의 유전자들 중 하나는 COG4708로서 분류된다. 따라서, COG4708 단백질이 Q 생합성 전구체의 수송에 관여할 수 있다는 결론이 도출된다.
본 연구에서, COG4708 단백질을 코딩하는 유전자와 관련된 RNA가 preQ1과 강하게 선별적으로 결합할 뿐만 아니라 유전적 "오프" 스위치와 일치하는 특징을 나타냄이 확인되었다. 따라서, 이러한 RNA 모티프는 이하에서 preQ1-II로 지칭되는 preQ1 리보스위치의 제2 부류를 구성한다는 사실이 제시되었다. preQ1-II 리보스위치 앱타머는 이하에서 preQ1-I로 재명명된 이미 공지된 preQ1 리보스위치(Roth et al., 2007)와 실질적으로 상이한 구조 및 분자 인식 프로파일을 갖는다. 따라서, preQ1은 천연 RNA 앱타머의 2종 이상의 클래스에 의해 인식되는 제2 대사물질로서 SAM(Corbino et al., 2005)에 결합한다. 뿐만 아니라, 신규 리보스위치 클래스의 발견은 공지된 리보스위치에 의해 조절되는 유사체를 갖는 mRNA의 비-코딩 영역에서의 검색을 수행함으로써 용이해질 수 있다.
1. 결과 및 논의
i. COG4708 RNA 모티프의 생물정보
COG4708 RNA 모티프에 대한 최초 설명은 스트렙토코카세아 패밀리로부터 유래된 22종의 서열을 포함하고, 상기 서열들 중 6종의 서열은 중복적으로 존재하지 않았다(Weinberg et al., 2007). COG4708 RNA 모티프의 추가 예를 동정하기 위해, 업데이트된 서열 데이터베이스 방출(RefSeq25)을 이용하여 유사성 검색을 수행하였다. 상기 모티프에 일치하는 추가 18종의 서열이 동정되어, 서열은 총 40종이 되었고 중복적으로 존재하지 않는 서열은 13종이 되었다(도 15).
대다수의 신규 서열들이 스트렙토코커스 뉴모니아, 스트렙토코커스 피오게네스 또는 락토코커스 락티스와 같은 유기체 내에서 동정되었는데, 대표적 균주들은 이미 시퀀싱되었다. 따라서, 추가 COG4708 RNA들 중 일부는 이미 공지된 것들과 매우 유사하거나 동일하다. 스트렙토코커스 수이스, 스트렙토코커스 상구이니스 및 락토바실러스 카세이에서 상기 모티프에 일치하는 서열도 동정되었다. 상기 모티프는 COG4708 또는 DUF988로서 명명된 단백질을 코딩하는 유전자의 5' UTR에서 발견되었다. 슈도노트, 루프 서열 및 앱타머 내의 SD 서열을 비롯한 이미 공지된(Weinberg et al., 2007) 상기 모티프의 보존된 특징은 모든 신규 서열에도 존재한다(도 16A). 이 클래스의 구조화된 RNA는 이미 동정된 것보다 더 넓은 범위의 세균 종에 걸쳐 보존되어 있다. 또한, RNA에 대한 컨센서스 서열 패턴 및 2차 구조 모델 둘다 preQ1 앱타머 클래스에서 관찰된 것보다 실질적으로 더 복잡하다(Roth et al., 2007).
ii
.
COG4708
RNA
모티프는
preQ
1
-감지
리보스위치로서
작용할 것이다.
COG4708 단백질을 코딩하는 유전자와 공지되어 있는 preQ1-I 리보스위치(Roth et al., 2007)의 관련성을 기초로 하여, COG4708을 코딩하는 유전자와 관련된 제2 보존된 RNA 모티프도 preQ1을 감지한다는 가설을 확립하였다. COG4708 RNA가 preQ1 결합에 반응하여 구조적 변화를 겪을지를 확인하기 위해, preQ1의 존재 및 부재 하에서 상기 모티프에 대해 인-라인 프로빙 분석(Soukup and Breaker, 1999; Winkler et al., 2002)을 수행하였다. 인-라인 프로빙 분석은 내부 포스포에스터 전달로 인해 상이한 천연 발생적 RNA 절단 속도를 이용한다. RNA 쇄의 비-구속된 영역은 대사물질 결합에 대한 RNA 구조 변화가 일반적으로 RNA 단편화 패턴의 변화를 일으키도록 구속된 영역보다 더 빠른 절단 속도를 나타낸다(Soukup and Breaker, 1999; Li and Breaker, 1999).
스트렙토코커스 뉴모니아 R6으로부터 유래된 COG4708 RNA 모티프를 포함하는 103-뉴클레오티드 구축물(이하, 1-103 RNA로 지칭됨)에 상응하는 5' 32P-표지된 RNA는 preQ1의 농도를 달리하면서 항온처리하였고, 천연 발생적 절단 생성물을 변성 PAGE로 분리하였다. 1-103 RNA의 단편화 패턴은 농도-의존적 변화를 나타내므로 preQ1-의존적 RNA 구조 변화가 일어남을 알 수 있다(도 16B). 이 발견 또한 COG4708 RNA가 본 발명자들에 의해 preQ1-II로 명명된 상이한 클래스의 preQ1 앱타머임을 확인시켜준다. 전장 1-103 RNA 구축물의 절단 패턴은 계통발생적 분석을 기초로 하여 예측한 2차 구조와 일치한다(Weinberg et al., 2007). 루프 및 연결 영역은 절단 증거를 보이지만, 예측된 염기-페어링된 영역은 절단으로부터 거의 보호된다(도 16C). 감소된 절단 속도를 보이는 대다수의 뉴클레오티드들은 가장 고도로 보존되어 있는 뉴클레오티드들에 상응한다(도 16C). P3을 포함하는 SD 서열 및 항-SD는 preQ1의 부재 하에서 약간의 절단을 보인다. 이 절단은 리간드 결합 시 감소되는데, 이것은 SD와 항-SD의 상호작용이 preQ1의 존재 하에서 안정화됨을 입증하고, 이러한 안정화는 SD를 격리시켜 번역 개시를 방해할 것으로 예측된다. 대조적으로, 16번 뉴클레오티드 또는 이보다 낮은 번호의 뉴클레오티드에서 일어나는 천연 발생적 절단의 높은 수준은 1-103 RNA 구축물의 5' 영역이 거의 비-구조화된 상태로 남아있음을 암시한다. preQ1-II 앱타머들 사이에서 보존된 뉴클레오티드가 비교적 흩어져 분포한다는 사실과 함께, 상기 결과는 상기 영역이 앱타머 구조의 핵심 부분을 형성하는 데 관여하지 않음을 입증한다.
생물정보 및 구조적 프로빙 데이터를 기초로 할 때, 스트렙토코커스 뉴모니아로부터 유래된 preQ1-II RNA 모티프가 유전적 오프-스위치로서 작용하고, 이때 리간드 결합이 P3 2차 구조를 안정화시켜 SD 서열을 격리시키고 유전자 발현을 방해함이 밝혀졌다. 이러한 유전자 조절 기작은 다른 여러 리보스위치들의 경우에도 이미 관찰되었다(Rodionov et al., 2002; Mandal and Breaker 2004a; Fuchs et al., 2006; Wang et al., 2008). 유사하게, preQ1-I 리보스위치는 preQ1에 반응하여 유사한 COG4708 유전자들의 발현을 하향-조절할 것으로 예측된다(Roth et al., 2007).
iii. 최소 preQ
1
-II 2차 구조는 생물정보에 의해 정확히 예측된다.
말단-절단된 구축물이 preQ1 결합 활성을 보유하는지를 확인하기 위해 인-라인 프로빙 분석에서 사용되는 일련의 5' 말단-절단된 RNA 및 3' 말단-절단된 RNA를 구축하였다. 페어링 요소 P1 내지 P4(뉴클레오티드 17-90)를 포함하는 RNA는 preQ1에 대해 약 100 nM의 겉보기 KD를 나타낸다(도 17A 및 17B). 이 친화도는 다른 리보스위치 앱타머의 경우에 관찰된 범위 내에 있으므로, 인-라인 프로빙 분석 동안에 비교적 구조화되지 않은 상태로 남아있는 대다수의 5' 뉴클레오티드들은 고-친화성 대사물질 결합에 필요하지 않음을 입증한다(도 16C). P1이 결여되어 있는 훨씬 더 짧은 RNA 구축물(뉴클레오티드 33-90)은 17-90 RNA 구축물과 거의 동일한 KD를 나타내는데, 이것은 여러 위치에서 관찰되는 공변이에도 불구하고 보존된 P1 요소가 preQ1 리간드의 분자 인식에 관여하지 않을 것임을 암시한다(Weinberg et al., 2007). 아마도 P1은 본 발명자들의 시험관내 인-라인 프로빙 분석에 의해 확인되지 않은 생체내 RNA 폴딩 또는 기능 동안에 일정한 역할을 수행할 것이다.
제안된 2차 구조 모델을 더 조사하기 위해, 17-90 RNA의 각 페어링 요소에서 파괴적 및 보상적 돌연변이를 보유하는 구축물을 생성하였고(도 17C), 이 구축물에 대한 리간드-결합 활성을 인-라인 프로빙 분석으로 평가하였다(도 17D). 예측된 바와 같이, P2에서의 파괴적 돌연변이(M1)는 리간드 결합 친화성도를 약 100배만큼 감소시키고(KD = 약 10 μM), 보상적 돌연변이(M2)는 리간드 결합 친화도를 부분적으로 회복시킨다(KD = 약 250 nM). 천연 발생적 절단 생성물의 패턴은 P2가 M1에서는 페어링되어 있지 않고 M2에서는 페어링되어 있는 구조와 일치한다.
P3에 위치한 파괴적 돌연변이 M3, 및 P4에 위치한 파괴적 돌연변이 M5 둘다 preQ1 결합을 소멸시킨다(도 17D). (P4에 위치한) 보상적 돌연변이 M6은 예측된 바와 같이 리간드 결합을 완전히 회복시키는 반면, P3 염기-페어링을 복원시키는 보상적 변이를 보유하는 M4 돌연변이는 preQ1 결합을 회복시키지 못한다. 이 보상적 돌연변이의 실패는 여러 원인에 기인할 수 있다. M3 및 M4 둘다 리간드의 부재 하에서 인-라인 프로빙 분석 과정 동안 WT RNA와 상이한 천연 발생적 절단 패턴을 보이는데, 이것은 상기 돌연변이들이 상당한 미스폴딩을 야기함을 입증한다. 또한, 돌연변이된 P3 뉴클레오티드들은 SD 서열 및 항-SD 서열의 존재로 인해 엄격히 보존되어 있고, 이 영역은 리간드 결합을 조절한다(도 16B 및 16C). 이 특징들은 P3에 위차하는 염기 종류의 변경이 광범위한 미스폴딩을 야기하고 preQ1 결합에 (직접적으로 또는 간접적으로) 중요한 분자 접촉 부위가 M4 구축물에 결여되어 있을 수 있음을 암시한다.
iv. 평형화 투석은 preQ
1
결합을 확인시켜준다.
상이한 방법을 이용하여 리간드 결합 및 분자 인식의 특이성을 확인하기 위해 3H-preQ1 및 17-90 RNA 구축물을 사용하여 평형화 투석 실험을 수행하였다. 평형화 투석을 위해, 3H-preQ1을 평형화 투석 장치의 챔버 a에 첨가하고, 과량의 RNA를 챔버 b에 첨가하였다. 상기 두 챔버는 분자량 컷-오프가 5,000 달톤인 투석 막에 의해 분리되었다(도 18A). 용액을 평형화시킨 후, 각 챔버 내의 3H의 분획을 액체 신틸레이션 카운팅으로 측정하였다. 상기 두 챔버에 대한 방사성 신호의 비(b/a)가 약 1.75가 되도록 3H-preQ1을 17-90 RNA로 평형화시켰을 때 RNA로 향한 3H의 변동이 관찰되었는데(도 18B), 이것은 RNA가 3H-preQ1에 결합하여 3H-preQ1을 챔버 b로 격리시킴을 의미한다. 3H-preQ1(1 μM)이 RNA 없이 평형화된 경우 또는 P3 줄기를 형성하는 능력을 갖지 않는 RNA(1-81 RNA)로 평형화된 경우, 3H 표지는 고루 분포되어 있다(b/a = 약 1). 17-90 RNA가 3H-preQ1로 평형되어 방사성의 비대칭 분포를 확립한 경우, 챔버 a에의 과량의 비-표지된 preQ1의 첨가는 3H 표지가 재분포되게 한다. 그러나, 과량의 비-표지된 구아닌의 첨가는 3H의 분포에 전혀 영향을 미치지 않는데, 이것은 시험된 농도에서 구아닌이 17-90 RNA 내의 리간드 결합 부위에 대해 3H-preQ1과 경쟁할 수 없음을 의미한다.
평형화 투석 과정 동안에 관찰된 경향이 인-라인 프로빙 분석에 의해 관찰된 preQ1-II 앱타머의 결합 기능과 일치하지만, 3H 표지의 변동 정도는 예측된 것만큼 크지 않다. 사용된 RNA의 농도는 3H-preQ1에 과도한 결합 부위를 제공했어야 하지만, 그의 리간드에 대한 앱타머의 측정된 KD가 주어진 한, 모든 preQ1 분자를 RNA로 포화시키기에 충분했어야 한다. 그러므로, b/a 비는 평형화가 비-표지된 preQ1 경쟁자의 부재 하에서 일어난 경우 더 높았어야 한다.
이 차이점을 더 조사하기 위해, 17-90 RNA를 사용한 평형화 후 남아있는 비-변동된 3H-표지된 물질을 함유하는 챔버의 내용물을 새로 제조된 17-90 RNA 샘플의 반대편에 위치한 새로운 장치의 챔버 a로 옮기고 상기 두 챔버를 다시 평형화시키는 실험을 수행하였다(도 18C). 예측된 바와 같이, 3H-표지된 물질은 상기 두 챔버 사이에 고루 분포되었는데(도 18D), 이것은 3H의 비-변동된 부분의 분자 공급원이 RNA와 결합하지 않고 preQ1이 아닐 가능성이 높음을 암시한다. 이 분석으로부터 3H-표지된 물질의 약 25%만이 preQ1인 것으로 추정되었다. 이 결론과 일치하는 결과는 평형화 투석에서 사용된 3H-표지된 preQ1 샘플의 순도 분석 결과이다. 3H-표지의 약 82%는 용매로부터 유래되었고, 다른 UV-흡수 화합물은 혼합물에 존재하지 않는다. 요약하건대, 평형화 투석 실험 또한 COG4708 RNA 모티프의 코어를 보유하는 RNA 구축물이 preQ1에 대한 선별적 앱타머로서 작용함을 보여준다.
v. 17-90
RNA
에 의한
preQ
1
의 선별적 인식
스트렙토코커스 뉴모니아로부터 유래된 preQ1-II 앱타머의 분자 인식 결정인자는 일련의 preQ1 유사체들에 대한 17-90 RNA의 결합 친화성을 측정함으로써 확립하였다. 아미노메틸 기의 인식을 평가하기 위해, 본 발명자들은 preQ0(7-시아노-7-데아자구아닌), 7-(N,N'-다이메틸아미노메틸)-7-데아자구아닌 및 7-카복스아마이드-7-데아자구아닌을 시험하였다. 상기 2종의 다이메틸아미노메틸 유사체 및 preQ0은 약 500 nM의 KD 값을 나타내었는데, 이것은 알킬아미노 기의 말단에서 실질적인 입체 장애가 전혀 일어나지 않고 상기 기가 수소결합 공여체로서 작용하지 않을 것임을 암시한다(도 19A). 오히려, 아미노에틸 기와의 생산적 상호작용은 아미노 기를 수소결합 수용체로서 사용할 것이다. 드물기는 하지만 아미노기의 질소 원자는 몇몇 다른 핵산 구조에서 수소결합 수용체로서 작용한다(Luisi et al., 1998).
평형화 투석의 이용에 의해 관찰된 바와 같이(도 18B), 17-90 RNA는 구아닌에 대해 강하게 식별한다(KD = 약 10 μM). 구아닌 유사체 7-데아자구아닌은 단지 약간의 우수한 친화도로 결합하는데, 이것은 preQ1에 대한 매우 낮은 선별성이 위치 7에 있는 질소 원자의 부재로 인한 것임을 입증한다. 1 mM만큼 높은 농도에서 7-메틸구아닌 결합이 부재하는 것은 위치 7에서의 분자 인식 접촉의 임의의 파괴에 기인한 것이기 보다는 위치 9에서의 수소결합 공여체의 부재에 기인한 것일 가능성이 있다.
시험된 잔존 퓨린 화합물들로부터 위치 2에 있는 아민이 리간드 결합에 매우 중요하다는 것은 분명하다(도 19A). 2,6-다이아미노퓨린(DAP)은, 구아닌-유사 와슨-크릭 염기-페어링 우세를 보이지는 않지만 시험된 농도에서 RNA에 측정가능하게 결합하는 능력을 보유하는 유일한 화합물이다. 흥미롭게도, 퓨린 고리의 위치 6에서 케토 산소(구아닌) 또는 아민(DAP)을 보유하는 화합물은 거의 동일한 KD 값을 보인다. 그러나, 위치 6에 엑소사이클릭 작용기가 존재하지 않는다는 점에서 구아닌 및 DAP와 구별되는 2-아미노퓨린에 대해서는 결합이 전혀 검출되지 않았다. 따라서, 위치 6에 존재하는 구아닌의 케토 기 및 DAP의 아미노 기는 분자 인식에 동등하게 기여할 것이다. 보다 복잡한 가능성이 존재하지만, 상기 결과에 대한 가장 단순한 설명은 preQ1의 케토 기 및 DAP 아민의 질소 원자 둘다가 위치 6에서 수소결합 수용체로서 작용한다는 것이다.
17-90 RNA 및 이의 preQ1 리간드에 의해 만들어지는 잠재적 분자 인식 접촉 부분의 개요(도 19B)는 preQ1-I 앱타머(Roth et al., 2007)에 대해 확인된 분자 인식 접촉 부분과 비교할 때의 차이점을 보여준다. 위치 7에 있는 아미노메틸 기의 인식은 실질적으로 상이한데, 이는 7-다이메틸아미노메틸 및 7-카복시메틸 유사체의 상대적 특이성이 상기 2종의 앱타머 클래스에 대해 역전되어 있기 때문이다. 또한, preQ1-I 리보스위치는 구아닌과의 훨씬 더 강한 상호작용을 형성하므로, preQ1에 대한 특이성이 구아닌에 비해 훨씬 더 낮아진다. preQ1-I 리보스위치와 유사하게, 위치 2에 있는 아민은 17-90 RNA에 대한 리간드 결합에 매우 중요할 것이다. 그러나, 유사체 결합 데이터는 preQ1-II 앱타머가 퓨린 고리의 N1 위치와 접촉하지 못함을 보여준다. 이것은 리간드와 preQ1-I 앱타머 사이에서 형성되는 것으로 제안된 와슨-크릭 염기쌍(Roth et al., 2007)과 상이하다. 기존 데이터로부터, preQ1-II 앱타머의 구별가능한 서열들 및 구조 요소들이 preQ1-I 앱타머에 의해 형성된 결합 포켓과 상이한 결합 포켓을 형성하도록 폴딩됨은 분명하다.
vi. 와슨-크릭 염기-페어링은 리간드 인식을 설명하지 못할 것이다.
구아닌 및 아데닌에 결합하는 리보스위치가 선별적 리간드 결합을 위해 정규 와슨-크릭 염기쌍을 사용한다는 것은 밝혀져 있다(Gilbert et al., 2006; Mandal and Breaker 2004b; Batey et al., 2004; Serganov et al., 2004; Noeske et al., 2005). 퓨린 리보스위치 앱타머의 단일 점 돌연변이는 구아닌과 아데닌 사이에서 앱타머 특이성을 전환시키기에 충분하다(Mandal and Breaker 2004b). 유사하게, 2'-데옥시구아노신에 결합하는 리보스위치의 특이성은 비교가능한 돌연변이에 의해 변경될 수 있다(Kim et al., 2007). 유사한 기작이 preQ1-I 리보스위치 앱타머에서 사용될 수 있는데, 이때 보존된 사이티딘이 유리딘으로 돌연변이되면 리간드 결합 특이성이 preQ1로부터 DAP로 변경된다(Roth et al., 2007).
17-90 RNA가 리간드 특이성을 촉진하기 위해 유사한 기작을 이용하는지를 확인하기 위해, 유일하게 공통적으로 보존된 비-페어링된 사이티딘(C33)을 유리딘으로 돌연변이시켰다(도 15 및 16A). preQ1-II 앱타머에 존재하는 엄격하게 보존된 사이티딘 잔기(C32 및 C51)가 추가로 존재하지만, 이들은 예측된 염기-페어링된 요소 내에 존재하므로 리간드와의 정규 염기쌍을 형성하지 못할 것이다. 그러나, 위치 33에서 U를 보유하는 돌연변이체 RNA가 WT RNA와 매우 유사하게 거동하고 preQ1에 대해 약 250 nM의 KD를 나타낸다는 것이 관찰되었다. 따라서, 상기 잔기는 리간드와 정규 염기쌍을 형성하지 못할 것이다. 이 결과는 상기 RNA 영역이 리간드 결합을 조절하지 못하고(도 16B 및 16C) P1이 리간드 결합에 필요하지 않다는 점을 고려할 때 놀라운 발견은 아니다.
뉴클레오티드 C41도 preQ1과의 염기쌍 형성을 위한 후보물질로서 관찰되었다. 상기 뉴클레오티드는 앱타머의 보존된 코어에 인접하여 위치하고 리간드 결합을 조절한다(도 16). 40종의 공지된 COG4708 RNA들 중에서 C41이 U 잔기로 돌연변이된 것으로 밝혀진 COG4708 RNA는 하나뿐이다(도 15). 상기 위치에서 C가 U로 변경되어 있는 17-90 RNA 구축물은 preQ1에 대한 친화도가 약 2차수만큼 감소되었는데(도 20A), 이것은 상기 잔기가 실제로 리간드 결합에 중요함을 의미한다. 그러나, 돌연변이체 구축물은 아데닌 염기-페어링 면을 갖는 유사체에 유리한 특이성 변화를 겪지 않는다. 이 결과는 C41 또한 리간드와 정규 염기쌍을 형성할 수 없음을 보여준다.
U41 돌연변이체가 WT 17-90 RNA보다 더 약하게 preQ1에 결합하지만, 상기 돌연변이체는 WT 17-90 RNA와 본질적으로 동일한 친화도로 DAP에 결합한다(도 20B). 대조적으로, 구아닌 결합은 U41 돌연변이체에서 더 이상 검출될 수 없다. 이 결과는 위치 41에 있는 뉴클레오티드가 preQ1-II 앱타머에 대한 분자 인식 모델과 일치하는 방식으로 리간드와 접촉함을 보여준다(도 19B). C41의 엑소사이클릭 아미노 기는 preQ1의 케토 기에 수소를 공여할 수 있지만, U42에서 상기 아민 대신에 존재하는 케토 기는 등가의 수소결합을 형성할 수 없다(도 20C). 따라서, 관찰된 바와 같이, 돌연변이체 RNA는 WT RNA보다 더 약하게 preQ1에 결합해야 한다(도 20A). 대조적으로, C41의 엑소사이클릭 아미노 기는 DAP의 위치 6에서 엑소사이클릭 아민의 질소 원자에 수소를 공여하여 수소 결합을 형성할 수 있다. 마찬가지로, U41의 상응하는 케토 기는 수소결합 수용체로서 작용할 수 있고 DAP의 위치 6에서 동일한 엑소사이클릭 아민과 함께 등가의 수소결합을 형성할 수 있다(도 20C). 이 정렬은 C41 RNA와 DAP의 결합에 대한 KD 값과 U41 RNA와 DAP의 결합에 대한 KD 값이 왜 거의 동일한 수준으로 관찰되는지를 설명할 수 있다.
2. 결론
preQ1은 2종 이상의 천연 앱타머 클래스에 의해 인식되는 대사물질의 두 번째 예이다. 현재까지, SAM(또는 AdoMet)을 인식하는 4종의 다양한 앱타머 클래스가 동정되었다. SAM-I 또는 S-box(Epshtein et al., 2003; McDaniel et al., 2003; Winkler et al., 2003), SAM-II(Corbino et al., 2006), SAM-III 또는 SMK-box(Fuchs et al., 2006) 및 SAM-IV(Weinberg et al., 2007)는 종종 다양한 유기체에서 동일한 유전자를 조절한다(예를 들어, SAM 합성효소, 호모세린 O-석시닐트랜스퍼라제). 제2 천연 preQ1 앱타머 클래스의 발견은 SAM이 특별한 경우가 아니고 추가 대사물질들이 다양한 유기체 내에서 다수의 구별가능한 RNA 구조체와 결합하여 유사한 유전자 세트를 조절할 수 있음을 보여준다.
COG4708 또는 DUF988로 분류된 막 단백질과 2종의 preQ1-결합 RNA의 관련성은 상기 단백질이 쿠에우오신 생합성 중간체에 대한 수송자임을 보여준다. 그 후, TPP 리보스위치와 관련되어 있는 유전자에 의해 코딩되는, 미공지된 기능을 갖는 막 단백질은 TPP 및 티아민 수송자와 관련되어 있는 것으로 밝혀졌는데(Rodionov et al., 2002; Winkler et al., 2002; Schyns et al., 2005), 이것은 RNA 유전적 조절 요소의 특징이 단백질 기능을 어떻게 설명할 수 있는지를 보여준다. 마찬가지로, 소정의 mRNA에 의해 코딩된 소정의 단백질의 기능에 관한 지식은 관련된 리보스위치의 리간드 종류를 확인하는 데 도움이 될 수 있다.
흥미롭게도, 많은 세균에서 preQ1 생합성 또는 수송과 관련된 유전자와 유사한 다수의 유전자들이 존재하지만, 상기 유전자들은 확립된 조절 기작을 전혀 갖지 않는다. 따라서, 이러한 유전자들에 대한 mRNA는 다른 preQ1 리보스위치 클래스를 보유할 수 있을 것으로 추측되었다. 신규 preQ1 앱타머의 발견 가능성을 평가하기 위해, preQ1-I 및 preQ1-II 앱타머를 갖지 않고 그의 게놈이 시퀀싱되어 있는 유기체에서 여러 COG4708 유전자들의 업스트림에 위치한 IGR을 관찰하였다.
COG4708 유전자는 세균에 좁게 분포되어 있고, 상기 유전자의 모든 3종의 예는 바실러스 및 클로스트리디움에서 발견된다(도 21). γ-프로테오박테리아(루브로박터 자일라노필러스(Rubrobacter xylanophilus))에서 COG4708의 일례가 존재하고, 고세균(써모필룸 펜덴스(Thermophilum pendens) 및 스타필로써머스 마리누스(Staphylothermus marinus))에서 2종의 예가 발견된다. COG4708 단백질에 상응하는 유전자들은 46종의 예 중 30종의 예에서 preQ1 앱타머와 관련되어 있다(도 21). 알칼리필러스 메탈리레디겐스(Alkaliphilus metalliredigens)에서 상기 유전자의 2 카피 모두 preQ1-I 리보스위치 다음에 위치하지만, 여러 유기체가 상기 유전자를 2 카피씩 함유하고, 리보스위치는 전형적으로 이 카피들 중 하나와만 관련되어 있다. COG4708에 대한 유전자가 공지된 preQ1-감지 RNA와 관련되어 있지 않은 많은 유기체에서, ORF의 바로 업스트림에 위치한 IGR은 50개 염기쌍보다 더 크다. 이것은 RNA 앱타머가 mRNA의 5' UTR에 위치하기에 충분한 공간이다. 그러나, 상기 영역은 전형적으로 임의의 다른 서열에 대한 검출가능한 유사성을 거의 또는 전혀 보이지 않는데, 이것은 상기 영역이 구조화된 RNA를 결여하고 있거나 많은 다른 세균에서 유사체를 갖는 앱타머를 보유하지 않음을 입증한다.
인-라인 프로빙 분석을 이용하여, 모오렐라 써모아세티카, 클로스트리디움 디피실, 오셔노코커스 오에니 및 게오바실러스 카우스토필러스에서 COG4708 단백질을 코딩하는 ORF의 업스트림에 위치한 IGR, 및 스트렙토코커스 써모필러스에서 두 COG4708 카피의 업스트림에 위치한 IGR을 조사하였다. 시험된 RNA들 중 어느 것도 preQ1의 존재 하에서 구조적 조절을 보이지 않는데, 이것은 상기 RNA들이 preQ1-결합 리보스위치를 보유하지 않음을 암시한다. 그러나, 외래 5' 또는 3' 서열로부터의 간섭으로 인한 RNA 미스폴딩뿐만 아니라 생체내 조건과 시험관내 조건 사이의 차이점을 포함하는 여러 다양한 인자들이 인-라인 프로빙 분석에서 뒤얽힐 수 있다.
대다수의 다른 동정된 리보스위치와 대조적으로, preQ1-II 앱타머는 매우 좁게 분포되어 있는데, 주로 스트렙토코카세아 패밀리에 속하는 세균에서 발견된다. 이 좁은 분포의 선례가 있는데, SAM-III도 동일한 군의 세균에만 국한되어 있는 듯하기 때문이다(Fuchs et al., 2006).
3. 재료 및 방법
i. 화합물 및 DNA 올리고뉴클레오티드
preQ1, preQ0, 7-(N,N'-다이메틸아미노메틸)-7-데아자구아닌, 7-카복스아마이드-7-데아자구아닌 및 7-아미노메틸-7-데아자아데닌의 화학적 합성은 이미 공지되어 있다(Roth et al., 2007). 남은 퓨린 화합물 및 다른 화합물은 달리 명시하지 않은 시그마-알드리치로부터 구입하였다. 3H-preQ1은 공지된 바와 같이 수득하였다(Hurt et al., 2007). 합성 DNA는 시그마-제노시스에 의해 제조되었다.
ii. RNA의 제조
preQ1-II(Cog4708 RNA) 모티프에 상응하는 COG4708을 코딩하는 유전자의 5' UTR 부분을, 하기 프라이머를 사용하여 스트렙토코커스 뉴모니아 R6으로부터 PCR로 증폭하였다: 5'-GGAATTCAACAAGTCTAACAGAAAAGTAGAAAGGCGGGC-3'(서열번호 1), 5'-TTTTGTCATTTTTTCTCCTTTAACGTCTGGATAACTCTCAAAAGC-3'(서열번호 2). 그 다음, 생성된 이중-가닥 DNA를 TOPO TA 클로닝 키트(인비트로겐)를 사용하여 pCR2.1 내로 클로닝하였다. 플라스미드 삽입물을 시퀀싱하고(예일 유니버시티의 더 더블유 케크 파운데이션 바이오테크놀로지 리소스 센터) 주형으로서 사용하여, T7 프로모터 다음에 위치한 원하는 RNA를 코딩하고 전사 효율을 개선시키기 위해 2개의 구아노신 잔기를 포함하는 DNA 단편을 PCR로 증폭하였다. 파괴적 돌연변이 및 보상적 돌연변이를, PCR용 돌연변이체 프라이머를 사용하여 PCR 생성물 내로 도입하였다. T7 RNA 중합효소를 사용하여 PCR 생성물을 시험관내에서 전사하고, 생성된 RNA를 공지된 방법(Seetharaman et al., 2001)과 유사한 방법을 이용하여 6% 변성 PAGE로 정제하였다.
기재된 구축물(Dillon and Rosen, 1990)에 상응하는 DNA 단편을, 게놈 서열을 기초로 한 합성 올리고뉴클레오티드 세트를 사용하여 PCR로 스트렙토코커스 써모필러스로부터 구축하였다. 모오렐라 써모아세티카, 오셔노코커스 오에니(PSU -1), 클로스트리디움 디피실 및 게오바실러스 카우스토필러스로부터 유래된, COG4708 단백질을 코딩하는 유전자들의 업스트림에 위치한 IGR에 상응하는 DNA 단편을 각각의 게놈 DNA, 및 적절한 위치에서 T7 프로모터 서열을 함유하는 프라이머를 사용하여 PCR로 증폭하였다. 오셔노코커스 오에니 및 클로스트리디움 디피실 게놈 DNA 샘플은 ATCC로부터 입수하였다. RNA 분자는 전술한 바와 같이 시험관내 전사를 통해 제조하였다.
iii. 인-라인 프로빙 분석
시험관내 전사에 의해 제조된 RNA 분자를 알칼리성 포스파타제(로슈 다이아그노스틱스)로 탈인산화시키고, [γ-32P] ATP(지이 바이오사이언시스) 및 T4 폴리뉴클레오티드 키나제(뉴 잉글랜드 바이오랩스)를 사용하여 제조자의 지시에 따라 방사선표지화를 수행하였다. 5' 32P-표지된 RNA를 전술한 바와 같이 PAGE로 정제하였다. 약 1 nM의 5' 32P-표지된 RNA를 함유하는 인-라인 프로빙 분석 반응물을 기재된 바와 같이(Soukup and Breaker, 1999) 리간드와 합하거나 리간드와 합하지 않았다. 50 mM Tris-HCl(23℃에서 pH 8.3), 20 mM MgCl2 및 100 mM KCl을 함유하는 반응 혼합물을 25℃에서 약 40시간 동안 항온처리하였다. 모오렐라 써모아세티카 및 게오바실러스 카우스토필러스로부터 유래된 RNA의 경우, 항온처리는 58℃에서 30분 동안 및 60℃에서 15분 동안 수행되었다. 샘플을 10% 변성 PAGE로 분리하고, 몰레큘라 다이나믹스 포스포르이미저 및 이미지쿠아엔티 소프트웨어를 이용하여 이미징 및 정량화를 수행하였다.
KD 값은 일련의 리간드 농도를 이용하여 인-라인 프로빙 분석을 수행함으로써 측정하였다. 각 분석에 대해 표시된 부위에서 절단된 RNA의 표준화된 분율을 각 리간드 농도에서 계산하고, 표준 결합 곡선을 점에 피팅하였다. preQ1, 구아닌, 7-카복스아마이드-7-데아자구아닌 및 7-아미노메틸-7-데아자아데닌을 제외한 조사된 대다수의 화합물의 농도는 1 nM 내지 1 mM이었고, 이때 시험된 최대 농도는 각각 100 μM, 100 μM, 10 μM 및 30 μM이었다.
iv. 평형화 투석
50 mM Tris-HCl(23℃에서 pH 8.3), 20 mM MgCl2, 100 mM KCl 및 1 μM의 3H-표지된 preQ1을 함유하는 30 ㎕ 혼합물을 다이스포-평형화 투석기(ED-1, 하버드 바이오사이언스)의 한 챔버 내에 배치하고, 동일한 성분들을 함유하되 3H-표지된 preQ1을 함유하지 않는 동일한 부피의 혼합물을 반대편 챔버에 첨가하였다. 상기 후자 용액은 5 μM 17-90 RNA 또는 5 μM 1-81 RNA도 함유하였다. 14시간 동안 평형화시킨 후, 상기 두 챔버 내의 3H-표지의 분포를 액체 신틸레이션 카운팅으로 확인하기 위해 상기 투석기의 챔버 각각으로부터 5 ㎕의 분취액을 따라 내었다. 경쟁적 결합 실험을 위해, 1 mM 비-표지된 화합물을 함유하는 상기 완충제 혼합물 3 ㎕를 RNA가 없는 챔버에 첨가하고, 동일한 부피의 완충제를 RNA가 함유된 챔버에 첨가하였다. 챔버들을 8시간 동안 더 평형화시킨 후, 3H-표지의 분포를 전술한 바와 같이 재평가하였다.
3H-표지된 preQ1의 HPLC는 preQ1과 일치하는 단일 UV-활성 피크를 보였다. preQ1 내로 도입되지 않은 3H-표지가 어디로부터 유래된 것인지를 확인하기 위해, 3H-preQ1 용액(약 2 mM)의 40 ㎕ 분취액을 8 mg의 탈색화 탄소 및 200 ㎕의 물과 혼합하였다. 이어서, 슬러리를 원심분리로 분리하고 상청액을 따라 내어 여과하였다(0.22 마이크론). 상청액의 HPLC 분석은 preQ1이 수층에 전혀 존재하지 않음을 보여주는데, 이는 상기 탄소가 헤테로환을 완전히 흡착하였기 때문이다. 상청액 부분에 존재하는 3H, 및 탄소 잔기는 액체 신틸레이션 카운팅으로 측정하였다.
v. 생물정보
RefSeq25(Pruitt et al., 2007)에 대한 유사성 검색을 수행하고, COG4708 RNA 모티프 컨센서스 서열을 공지된 바와 같이 확인하였다(Weinberg et al., 2007). COG4708(DUF988) 유전자의 예는 PFAM 데이터베이스(release 22.0)(Finn et al., 2006)를 통해 동정되었다. NCBI 게놈 데이터베이스에 대해 여러 유기체들로부터 유래된 COG4708 단백질 서열의 BLAST 검색은 어떠한 추가 서열도 동정하지 못하였다. 예는 완전히 시퀀싱된 게놈으로 한정되었고, preQ1-I 또는 preQ1-II 리보스위치가 COG4708 단백질을 코딩하는 ORF의 업스트림에 위치한 IGR에 존재하는지를 확인하였다. 중복성을 피하기 위해 동일한 종의 매우 유사한 균주 또는 단리물을 목록으로부터 제거하였다.
E.
실시예
5:
Moco
및 텅스텐 보조인자(Tuco) 대사에 관여하는 세균 유전자를 조절하는 광범위하게 분포된
리보스위치
후보물질
몰리브데이트 수송자, Moco 생합성 효소, 및 보조효소로서 Moco를 사용하는 단백질을 코딩하는 유전자들의 업스트림에 위치한 고도로 보존된 RNA 모티프를 동정하였다. 생물정보 검색은 γ-프로테오박테리아, δ-프로테오박테리아, 클로스트리디움, 악티노박테리아, 데이노코커스-써모스 종, 및 환경적 샘플로부터 유래된 DNA에서 176종의 상기 RNA 모티프를 동정하였다. 유전적 분석을 이용하여, 이. 콜라이에서 Moco 생합성 오페론과 관련된 Moco RNA는 Moco 생성에 반응하여 유전자 발현을 조절함을 입증하였다. 또한, 상기 보존된 RNA가 Moco의 밀접하게 관련된 유사체들로부터 Moco를 식별함을 입증하는 증거가 제공되었다. 이 결과는, 광범위한 계통발생적 보존성 및 일부 예에 인접한 전형적인 유전자 조절 구조와 함께, 상기 구조화된 RNA가 Moco를 감지하는 리보스위치의 신규 클래스를 대표함을 암시한다. 뿐만 아니라, 관련된 Tuco(금속 성분으로서 몰리브데늄 대신에 텅스텐을 보유함)에 의해 유발되는 것으로 보이는 상기 RNA의 변이체들도 동정되었다.
리보스위치는 대사물질 또는 금속 이온에 선별적으로 결합하고 유전자 조절 요소로서 작용하는 구조화된 RNA 도메인이다(Mandal and Breaker, 2004; Soukup and Soukup, 2004; Winkler and Breaker, 2005; Winkler, 2005). 리보스위치는 통상적으로 진정세균 mRNA의 UTR 영역에서 발견되고, 통상적으로 번역 연장 또는 번역 개시를 조절함으로써 유전자 발현에 대한 조절 기능을 발휘한다(Breaker and Barrick, 2007). 몇몇 예외가 있지만(Winkler et al., 2004; Barick et al., 2004), 리보스위치는 2개의 모듈 영역, 앱타머 도메인 및 발현 플랫폼으로 구성되어 있다. 상기 앱타머는 표적 대사물질에 대한 선별적 결합 포켓을 형성하고, 이 결합 이벤트는 인접하는 발현 플랫폼의 폴딩을 알로스테릭하게 조절하여 유전자 발현을 조절한다. 각 리보스위치 클래스의 대사물질-결합 포켓은 관련성이 낮은 유기체들로부터 동정된 리보스위치 클래스들 사이에서조차도 서열 및 구조 면에서 고도로 보존되어 있다(Breaker and Barrick, 2007).
리보스위치는 생물정보 검색을 이용하여 발견하기에 매우 적합한 표적이 된다. 예를 들어, CMfinder 비교 유전체학 파이프라인(Yao et al., 2007; Weinberg et al., 2007)은 신규 기능성 RNA 요소들을 동정하는 데 이용되는 생물정보 검색 기법을 대표한다. 상기 CMfinder 비교 유전체학 파이프라인은 유사한 유전자들의 잠재적 5' UTR을 동정한 후, 다양한 유기체들로부터 유래된 UTR들 사이에서 서열 및 2차 구조 보존성을 확인하기 위해 상기 영역을 조사한다. 서열 및 구조 보존성의 패턴을 이용하여 추가 유사체를 동정하여 초기 예측된 모티프를 정련한다. CMfinder 파이프라인은 최근에 검증되거나(Wang et al., 2008) 검증을 기다리는 다수의 유망한 리보스위치 후보물질을 동정하였다. 보고된 한 신규 모티프는 Moco 대사에 관여하는 단백질을 코딩하는 ORF의 업스트림에서 통상적으로 발견되는 크고 복잡한 RNA 도메인이다(Weinberg et al., 2007).
Moco는 원소주기율표에서 크롬 및 텅스텐과 같은 종행에 있는 전이금속인 몰리브데늄 원자(Mo)를 배위결합시키는 트라이사이클릭 피라노프테린이다(Schwartz, 2005; Baugh et al., 1998). Moco는 생합성된 후, 탄소, 질소 및 황 대사 주기에서 핵심 반응을 촉진하기 위해 Mo의 산화환원 활성을 이용하는 Mo-의존적 효소의 활성 부위 내로 삽입된다(Baugh et al., 1998). 이 모티프의 176종의 예가 γ-프로테오박테리아, δ-프로테오박테리아, 클로스트리디움, 악티노박테리아 및 데이노코커스-써머스를 포함하는 매우 다양한 진정세균 및 환경 유래 서열에서 동정되었다(Weinberg et al., 2007). 이 모티프는 광범위한 서열 보존성, 예측된 염기-페어링된 요소 내의 뉴클레오티드 공변이 증거, 및 보존된 비-페어링된 뉴클레오티드와 상호혼합된 염기-페어링된 요소의 정교한 조립을 포함하는, 대사물질-감지 리보스위치의 전형적인 특징을 나타낸다.
본원은 이. 콜라이의 대표적인 Moco RNA가 Moco를 선별적으로 감지하고 이 보조효소의 농도 변화에 반응하여 인접하는 유전자들의 발현을 조절한다는 증거를 제공한다. 나아가, 본원은 Moco RNA가 Moco와 밀접하게 관련된 유사체인 Tuco 사이의 조절 식별에 관여함을 밝힘으로써, Moco가 Moco RNA에 의해 형성된 앱타머에 의해 특이적으로 인식된다는 추가 증거를 제공한다. 이 실험적 발견은, 일부 RNA 변이체와 보조효소 대사 특징 사이의 상관관계와 함께, 상기 클래스의 구조화된 RNA가 구별가능한 Moco-감지 리보스위치와 Tuco-감지 리보스위치를 포함함을 보여준다.
1. 결과 및 논의
I. Moco 모티프는 광범위하게 분포하고 고도로 보존되어 있다.
비교 유전체학 파이프라인(Yao et al., 2007)을 이용하여 γ-프로테오박테리아에서 Moco 생합성 단백질 A를 코딩하는 유전자의 UTR을 조사하였을 때, 공변이 및 구조화된 RNA의 다른 특징을 나타내는 모티프가 동정되었다 (Weinberg et al., 2007). 이 검색을 통해 γ-프로테오박테리아, δ-프로테오박테리아, 클로스트리디움, 악티노박테리아 및 데이노코커스-써머스 및 환경적 DNA 서열에서 상기 모티프("Moco RNA"로 지칭됨)의 176종의 예가 동정되었다. 이 서열들은 잠재적 컨센서스 구조에 따라 RALEE(Griffiths-Jones, 2005)를 사용한 수동 정렬에 의해 비교되었다. 상기 정렬은 75 내지 100%의 서열 보존성을 나타내는 뉴클레오티드들의 대다수를 보유하는, 상기 모티프의 중심 다중-줄기 접합부 근처에서 서열 보존도가 최대임을 보여준다(도 22).
5종의 염기-페어링된 요소들(P1 내지 P5로 명명됨)이 Moco RNA의 2차 구조를 형성한다. 이 보존된 2차 구조 내에는 P4의 말단에서 발견되는 GNRA 테트라루프(Heus and Pardi, 1991), 및 P2의 융기부에 집중되어 있는 테트라루프 수용체(Costa and Michel, 1995)가 존재한다. 5종의 Moco RNA 내의 테트라루프 서열은 모두 GAAA이다. 그러나, GCAA 테트라루프를 보유하는 4종의 Moco RNA는 모두 상기 수용체를 갖지 않는 반면, GAAA 테트라루프를 보유하는 Moco RNA 중 2종만이 상기 수용체를 갖지 않는다. GEMM 모티프로 지칭되는 또 다른 새로 발견된 RNA 모티프의 대표물들의 경우 유사한 상관관계가 이미 관찰되었다(Weinberg et al., 2007).
Moco 모티프는 P3 줄기의 존재 또는 부재를 기초로 2개의 군으로 분류될 수 있다. 모든 공지된 Moco 모티프의 정렬은 고도로 보존된 분명한 앱타머 영역이 존재하고, 상기 영역 다음에 공지된 대사물질-감지 리보스위치의 전형적인 특징인 다양한 타입의 발현 플랫폼을 형성할 것으로 추측되는 서열이 존재함을 보여준다. 예를 들어, moaABCDE 오페론(도 23a)의 업스트림에 존재하는 이. 콜라이 Moco RNA의 가능한 발현 플랫폼은 P1 줄기를 형성하는 뉴클레오티드들 내에 다운스트림 ORF에 대한 리보좀 결합 부위를 포함하는 것으로 추측된다. 이 정렬은 앱타머 도메인과 리간드의 결합이 유전자 발현을 억제함을 보여줄 수 있다. 잠재적 앱타머 도메인이 세균 고유 전사 종결요소의 예측된 서열 및 구조와 일치하는 줄기-루프 구조의 업스트림에서 발견되는 예도 존재한다(Gusarov and Nudler, 1999; Yarnell and Roberts, 1999). 뿐만 아니라, 일부 유기체들은 2종 이상의 Moco RNA를 보유하고, 동일한 유기체 내에서 2종 이상의 발현 플랫폼이 발견된다.
대다수의 유기체들이 게놈 당 1개의 Moco RNA를 보유하지만, 게놈이 완전히 시퀀싱되어 있는 일부 유기체들은 4 또는 5종의 Moco RNA를 갖는다. 데설피토박테리움 하프니엔스는 8종의 Moco RNA를 보유하고, 신트로포모나스 울페이(Syntrophomonas wolfei)는 15종 이상의 Moco RNA를 보유한다. 흥미롭게도, Moco RNA 모티프의 탠덤 정렬이 신트로포모나스 울페이 및 게오박터 메탈리리덕센스에서 존재한다. 드물지만 탠덤-정렬된 리보스위치 또는 이의 서브도메인이 다른 대사물질-감지 리보스위치 클래스에서도 동정되었다(Mandal and Breaker, 2004; Famulok, 2004; Sudarsan et al., 2006; Stoddard and Batey, 2006). 리보스위치는 이 보다 복잡한 구조를 이용하여 복잡한 기능, 예컨대, 다수의 신호 투입에 반응하는 능력을 달성하거나(Sudarsan et al., 2006) 리간드 농도의 보다 적은 변화에 더 잘 반응한다(Mandal and Breaker, 2004; Welz and Breaker, 2007). 신트로포모나스 울페이 내의 한 오페론은 3종의 Moco RNA를 일렬로 보유한다.
ii. Moco 모티프는 Moco 생합성 유전자와 관련되어 있다.
대다수의 공지된 리보스위치는 그들의 동족 리간드의 결합에 반응하여 인접한 위치에 존재하는 유전자들의 조절을 조절하도록 시스-조절 기작으로 작용한다. 리보스위치 앱타머에 의해 감지되는 리간드는 전형적으로 조절 하에 놓인 mRNA에 의해 코딩되는 효소 또는 효소들에 의해 촉진되는 경로의 최종 생성물이다. 별법으로, 소분자 리간드는 종종 발현이 상기 리보스위치에 의해 조절되는 유전자 생성물에 대한 보조인자 또는 기질로서 요구된다. 리보스위치는 통상적으로 시스-조절 기작을 이용하기 때문에, 상기 리보스위치의 다운스트림에 위치한 유전자들에 의해 코딩되는 단백질들의 기능은 리간드의 종류에 대한 많은 정보를 제공할 수 있다.
Moco RNA의 기능을 확립하기 위한 노력으로, 상기 보존된 Moco RNA를 보유하는 인접하는 게놈 위치 내의 유전자들의 기능을 고려하였다. 이. 콜라이를 포함하는 γ-프로테오박테리아에서, Moco RNA 모티프는 몰리브도프테린(MPT) 생합성(Schwarz, 2005)을 담당하는 단백질들을 코딩하는 moaABCDE 오페론(도 23a)의 업스트림에서 발견된다. 일부 세균에서, 상기 모티프는 고-친화성 몰리브데이트 수송자 복합체를 코딩하는 modABC의 업스트림에도 존재한다(Grunden and Shanmugam, 1997). Moco 모티프가 MPT 생합성 오페론 및 MPT 산화환원효소를 코딩할 것으로 예측되는 유전자 둘다의 업스트림에 위치하는 3종의 γ-프로테오박테리아(해모필러스 솜너스, 해모필러스 듀크레이이 및 악티노바실러스 플레우로뉴모니아 세로바 1)도 존재한다. Moco 모티프는 Moco 생합성 효소에 대한 유전자, 고-친화성 몰리브데이트 수송자에 대한 유전자 및 Moco를 사용하여 반응을 촉진하는 효소에 대한 유전자의 다양한 정렬의 업스트림에서도 발견된다. 일반적으로, 이러한 게놈 내용은 Moco 또는 이 보조인자의 생합성 중간체가 상기 리보스위치 후보물질에 대한 잠재적 리간드임을 암시한다. 공지된 리보스위치 클래스들 중 여러 리보스위치 클래스들이 다른 공통된 보조효소를 감지하고 반응하므로, Moco는 상기 리보스위치 후보물질에 대한 가장 가능성 있는 리간드로서 간주된다.
Moco 생합성은 진정세균으로부터 인간에까지 보존되어 있는 복잡하고 오래된 경로이다. 몰리브데늄 또는 Moco를 필요로 하지 않는 유기체만이 몰리브데늄 또는 Moco 대신에 텅스텐 및 유사 보조효소 Tuco를 사용한다(Schwarz, 2005). 이. 콜라이에서, 총 15종의 단백질을 코딩하는, Moco 대사에 관여하는 5종의 공지된 오페론, 즉 moa, mob, mod, moe 및 mog(Shanmugam et al., 1999)가 존재한다. Moco 생합성의 처음 2개 단계는 moa 오페론에 의해 코딩된 유전자들에 의해 촉진된다(도 23b). 구체적으로, 구아노신-5'-트라이포스페이트(GTP)는 SAM-의존적 효소인 MoaA 및 특징규명되지 않은 동종육량체 MoaC에 의해 촉진되는 반응에서 사이클릭 피라노프테린 모노포스페이트(cPMP)로 전환된다(Wuebbens and Rajagopalan, 1995). 반감기가 1시간 이내인 cPMP는 가장 안정한 Moco 생합성 중간체이다(Santamaria-Araugo et al., 2004). 그 후, MoaD 및 MoaE에 의해 형성된 이종사량체 MPT 합성효소는 2개의 황 원자가 cPMP에 전달되는 반응을 촉진하여 MPT 다이티올레이트를 발생시킨다(Pitterle et al., 1993).
그 후, Moco는 MPT의 아데닐화, 및 Moco를 형성하기 위한 Mo의 삽입을 수반하는 일련의 독립적인 단계들을 통해 mogA 및 moeA의 생성물에 의해 MPT로부터 합성된다(Nichols and Rajagopalan, 2002). 이. 콜라이에서, Moco는 MobA에 의해 바이스-몰리브도프테린 구아닌 다이뉴클레오티드 보조인자(바이스-MGD)로 더 변경된다(Lake et al., 2000). 이어서, 상기 바이스-MGD는 몰리브데늄-함유 효소 내로 삽입된다. 다른 진정세균에서, Moco는 보조효소로도 사용되는 다른 유도체를 생성하도록 변경될 수 있다(Schwarz, 2005). 전술한 Moco 생합성 유전자뿐만 아니라 Moco 또는 이의 유도체를 보조효소로 사용하는 효소를 코딩하는 여러 유전자들 모두가 적어도 일부 세균에서 Moco RNA 모티프와 관련되어 있다(도 23b).
iii. Moco RNA의 구조적 특징의 생화학적 분석
Moco 및 이의 생합성 중간체는 화학적으로 불안정하기 때문에, 이 화합물들을 시험관내에서 직접적인 결합 상호작용에 대해 실제로 시험하지는 못하였다. 따라서, 이. 콜라이의 Moco RNA가 리보스위치 기능과 일치하는 특징을 갖는지를 확인하기 위한 일련의 생화학적 및 유전학적 실험을 수행하였다. Moco RNA에 대한 제안된 구조 모델을 평가하기 위해, 염기-페어링된 P1 요소의 5' 말단의 업스트림에 위치하는 9개 뉴클레오티드부터 P1의 3' 말단의 다운스트림에 위치하는 10개 뉴클레오티드까지 걸쳐 있는 Moco 모티프를 함유하는 138-뉴클레오티드 RNA 구축물(138 moaA로 지칭됨, 도 24a)을 구축하였다. 138 moaA는 (일부 Moco RNA에서 존재하지 않는) P3 줄기, 예측된 리보좀 결합 부위 및 moaA ORF의 AUG 개시 출발 코돈을 포함한다. 상기 RNA는 시험관내 전사에 의한 생성을 촉진하기 위해 5' 말단에서 2개의 추가 G 잔기도 보유한다. RNA 구조의 차이에 의해 야기된 다양한 뉴클레오티드간 결합의 천연 발생적 절단 빈도의 차이를 이용하여 구조적으로 강하고 유연한 영역을 동정하는 인-라인 프로빙 분석(Soukup and Breaker, 1999)을 미량의 5' 32P-표지된 moaA RNA에 대하여 수행하였다.
PAGE에 의해 분리된 경우, 인-라인 프로빙 분석 동안에 발생된 RNA 절단 생성물의 발생 패턴(도 24b)은 비교 서열 분석의 기초를 형성할 것으로 예측되는 주요 2차 구조 특징들 중 대다수와 일치한다(도 22). 구체적으로, 고도의 천연 발생적 포스포에스터 전달을 보이는 대다수의 부위는 P3 줄기 및 P5 줄기의 루프에 위치하고 예측된 염기-페어링된 줄기들 사이에 가교를 형성하는 접합부에도 밀집되어 있다. 그러나, 천연 발생적 절단 패턴은 P2 줄기의 대다수에 대해 제시된 2차 구조와 일치하지 않는다. 이 줄기가 구조적 유연성을 나타낼 수 있는 2개의 내부 융기부를 가질 수 있다 하더라도, 관찰된 일부 RNA 단편은 염기-페어링될 수 있는 뉴클레오티들에서의 절단 결과이다.
인-라인 프로빙 분석 결과는 고도로 보존된 뉴클레오티드들 중 여러 뉴클레오티드들을 보유하는 P2 줄기 및 접합부가 구조적으로 변경되어 리간드 결합 포켓을 형성할 수 있음을 암시한다. 이것은 다른 공지된 리보스위치 앱타머의 거동과 일치하는데, 상기 리보스위치 앱타머 중 일부는 표적 대사물질의 부가 시 실질적인 구조 변경을 겪음이 인-라인 프로빙 분석에 의해 관찰되었다(Nahvi et al., 2002; Winkler et al , 2002; Mandal et al , 2003).
iv. Moco RNA는 유전자 조절 요소로서 작용한다.
이. 콜라이에서, moa 오페론의 전사를 조절하는 것으로 공지되어 있는 2개의 프로모터 부위 및 이에 동반된 단백질 보조 결합 부위가 존재한다(도 23a). S2 프로모터 부위는 협기성 단백질 전사 인자인 Fnr에 의존한다(Anderson et al., 2000; Spiro and Guest, 1990). 협기성 조건에 반응한 오페론의 이러한 전사 상향-조절은 협기성 호흡에 관여하는 일부 단백질들이 보조효소로서 필요로 하는 Moco의 생합성을 증가시킨다. moa 오페론의 S1 프로모터 부위는 세포 내에서 몰리브데이트에 결합하여 modABCD 오페론(Gruden et al., 1999)의 전사를 상향-조절하는 전사 인자인 몰리브데이트-결합된 ModE(Anderson et al., 2000)에 의해 활성화된다. 이것은 Moco를 합성하기 위해 세포 내에서 이용가능한 충분한 몰리브데이트가 존재하는 것을 보장한다. 또한, 구리-반응성 인자 CueR(Yamamoto and Ishihama, 2005)에 대한 예측된 결합 부위가 Moco 요소의 다운스트림에서 발견되더라도 moa 오페론 내의 일부 유전자들이 CueR에 의해 조절됨을 보여주는 증거가 존재한다.
이 다중층 전사 조절 네트워크 이외에, S1 프로모터와 moaA 개시 코돈 사이에 존재하는 131-뉴클레오티드 스트레치가 제3 조절 시스템에 기여한다는 것이 공지되어 있다(Anderson et al., 2000). 구체적으로, 상기 영역의 존재는 Moco가 세포 내에 존재할 때 moa 오페론을 억제시킨다(Anderson et al., 2000; Baker and Boxer, 1991). 이. 콜라이에서 moa 오페론 발현에 대한 Fnr 및 ModE 전사 인자의 영향은 5' UTR의 이 부분이 결실된 경우에만 관찰될 수 있다. 흥미롭게도, 상기 131-뉴클레오티드 영역은 Moco RNA 모티프를 정확하게 포함한다. 나아가, DNA의 이 부분 또는 상응하는 RNA 전사체에 작용하는 단백질 조절 인자가 전혀 동정되어 있지 않아, mRNA의 상기 부분이 Moco에 대한 직접적 센서로서 작용할 가능성이 여전히 남아 있다.
Moco RNA의 구조적 특징은, 이. 콜라이 moa 오페론의 공지된 유전자 조절 특징과 함께, Moco RNA가 대사물질-감지 리보스위치임을 보여준다. Moco RNA가 유전적 조절 요소로서 작용함을 확인하기 위해, PCR을 이용하여 WT moaA 5' UTR에 상응하는 이. 콜라이 게놈의 일부를 증폭하였다. 이 게놈 분절은 P1의 5' 말단의 업스트림에 위치하는 9개 뉴클레오티드들로 시작되어 P1의 3' 말단의 다운스트림에 위치하는 21개 뉴클레오티드들까지 연장되어 moaA 코딩 영역 내로 들어가 있는 149-뉴클레오티드 RNA(149 moaA로 지칭됨)를 코딩한다. 또한, P3 줄기 내에의 염기-페어링을 파괴하고(M1) 추후에 복원시키는(M2) 돌연변이를 갖는 149 moaA RNA를 발현하는 2종의 변이체 DNA도 발생되었다(도 25a).
상기 서열들을 번역 융합 플라스미드 내의 β-갈락토시다제 레포터 유전자의 업스트림 또는 상기 β-갈락토시다제 레포터 유전자와 인 프레임으로 클로닝하였다. 융합은 moaA 오페론의 발현을 천연적으로 제한하는 업스트림 협기-의존적 및 몰리브데이트-의존적 프로모터 조절의 효과를 없애기 위해 기본구성적 활성 lacUV5 프로모터의 조절 하에 두었다. 이 일련의 플라스미드들을 moaA 유전자가 결실되어 있는 이. 콜라이 균주 내에 두었다. 발생된 형질전환체를 아라비노스-유도성 및 글루코스-억제성 프로모터의 조절 하에 moaABCDE 오페론을 함유하는 플라스미드로 형질전환시켰다(Guzman et al., 1995). 본 발명자들은 이중으로 형질전환된 상기 균주를 통해 Moco 농도가 높거나 낮은 경우 레포터 유전자 발현에 대한 149 moaA RNA의 역할을 확인할 수 있었다.
WT 149 moaA 구축물을 보유하는 세포는 아라비노스의 존재 하에 생장된 경우(Moco 농도가 증가될 것으로 예측됨) 낮은 β-갈락토시다제 유전자 발현을 나타내었다(도 25b). 대조적으로, WT 구축물을 보유하는 세포는 글루코스의 존재 하에 생장된 경우(Moco 농도가 감소될 것으로 예측됨) 레포터 유전자 발현에 있어서 3배 초과의 증가를 나타낸다. 이 결과는 Moco RNA 요소가 아마도 Moco 생합성 경로의 소분자 생성물에 반응함으로써 유전자 발현을 억제함을 보여준다. 유전적 "오프" 스위치로서의 상기 Moco RNA의 기능은 생물정보에 의해 예측된 기작과 일치한다.
P3 줄기 내로의 돌연변이의 도입(M1)에 의한 Moco RNA의 보존된 2차 구조의 파괴는 유전자 발현의 탈억제를 야기한다. 대조적으로, 염기-페어링을 복원시키는 추가 돌연변이(M2)를 사용한 P3 서열의 변경도 Moco 생합성의 아라비노스-유도에 대한 유전자 억제를 복원시킨다. 이 변이체들에 의해 나타나는 유전자 조절의 파괴 및 WT 레포터 유전자 발현 수준으로의 복귀는 Moco RNA가 활성을 위해 그의 보존된 2차 구조를 필요로 하는 유전자 조절 요소임을 암시한다.
v. 몰리브데늄 수송은 Moco RNA 유전자 조절 기능에 영향을 미친다.
몰리브데이트는 mod 오페론에 의해 코딩되는 고-친화성 단백질-의존적 ABC 수송자를 통해 이. 콜라이 세포 내로 전달된다(Grunden and Shanmugam, 1997; Maupin-Furlow et al., 1995). 몰리브데이트로 보충되지 않은 배지에서, WT 이. 콜라이의 추정된 세포내 몰리브네이트 농도는 1.0 μM임에 반해, 몰리브데이트-수송자 결핍 균주 내의 세포내 몰리브데이트 농도는 0.2 μM로 추정된다(Scott and Amy, 1989). 그러나, 이 몰리브데이트 결핍 및 이것이 미치는 불리한 효과는 소듐 몰리브데이트를 생장 배지에 첨가함에 의해 극복될 수 있다. 높은 세포외 소듐 몰리브데이트 농도 하에서, 설페이트 수송 시스템은 몰리브데이트를 이입하여 WT 균주 및 몰리브데이트-수송자 결핍 균주의 세포내 몰리브데이트 농도가 약 5 μM이 되게 할 수 있다(Scott and Amy, 1989; Rosentel et al., 1995).
몰리브데이트가 149 moaA RNA에 의한 유전자 조절에 중요한지를 확인하기 위해, 고-친화성 몰리브데이트 수송자 기능이 제거되도록 이. 콜라이 균주의 modC 넉아웃을 수행하였다. 이어서, 상기 균주를 moaABCDE 유도성 발현 플라스미드 및 WT 및 돌연변이체 149 moaA 레포터 융합 플라스미드로 형질전환시켰다. 미량의 몰리브데이트를 함유하는 루리아-버타니(LB) 배지(Sambrook and Russell, 2001) 중에서 생장된 경우, modC 결실은 WT 149 moaA 레포터 융합체가 고도의 유전자 발현을 나타내게 하였다(도 25c). 대조적으로, 동일한 균주가 10 mM 소듐 몰리브데이트로 보충된 LB 중에서 생장된 경우, 발현은 기능성 ModC를 보유하는 형질전환체의 발현 수준과 유사한 수준까지 억제되었다. 이것은 Moco RNA를 통한 유전자 발현을 유발하는 데 필요한 분자가, 적정량의 몰리브데이타가 세포 내에서 이용가능하지 않은 경우 충분한 농도로 존재하지 않음을 암시한다.
흥미롭게도, 세포가 10 mM 소듐 텅스테이트로 보충된 LB 중에서 생장된 경우, modC가 결실되어 있는 형질전환체 내의 WT 149 moaA 레포터 융합 구축물은 탈억제된다. 전술한 바와 같이, 텅스텐은 세포 내로 들어가 보조인자의 금속 이온 성분으로서 몰리브데늄 대신에 사용될 수 있다. 그러나, 149 moaA RNA가 대사물질-감지 리보스위치(예를 들어, Moco)로서 작용하는 경우, 149 moaA RNA는 몰리브데늄과 배위결합된 화합물과 텅스텐과 배위결합된 유사 화합물을 식별하는 능력을 갖는다. 모든 경우, 파괴적 돌연변이(M1) 및 보상적 돌연변이(M2)를 보유하는 레포터 융합 구축물은 예측된 발현 프로파일을 나타낸다.
vi. 생합성 유전자 내의 돌연변이는 Moco가 조절 리간드임을 암시한다.
상기 결과를 고려할 때, Moco가 Moco RNA에 의해 직접적으로 감지될 수 있는 조절 인자라고 추정할 수 있다. Moco 생합성 경로의 특정 화합물이 유전자 발현 조절을 담당함을 뒷받침하는 추가 증거를 제공하기 위해, 상기 경로에 관여하는 다양한 유전자들에 대한 넉아웃 돌연변이를 만들었다. 먼저 조사된 moaA 넉아웃 이외에(도 25b), mogA, modC 또는 moeA가 넉아웃되어 있는(Δ) 균주를 만들고 moaABCDE 유도성 발현 플라스미드 및 WT 149 moaA 레포터 융합 플라스미드로 형질전환시켰다. ΔmogA, ΔmodC 및 ΔmoeA 넉아웃 균주는 moaABCDE 발현 플라스미드의 유도와 관계없이 탈억제를 보인다(도 26). 이 결과는 상기 3종의 단백질들이 소분자 신호의 생성을 위해 필수적으로 요구되고 moa 오페론의 유도가 상기 단백질들의 상실을 보상할 수 없음을 보여준다.
ΔmodC 균주의 유전자 발현 특징은 이전에 관찰된 바와 유사한데(도 25c), 이것은 몰리브데이트 수송자가 신호전달 화합물을 형성하는 데 필요함을 입증한다. 그러나, ΔmoeA 균주의 특징은 몰리브데이트만이 신호전달 화합물일 가능성이 거의 없음을 보여준다. moeA는 몰리브도프테린 내로의 몰리브데늄의 삽입을 촉진하고(Moco 생합성 경로의 마지막 단계), 이 활성은 149 moaA RNA에 의한 유전자 발현의 조절에 필요하다.
많은 리보스위치 클래스의 경우, 리보스위치 앱타머에 의해 감지되는 리간드는 조절되는 생합성 경로의 최종 보조효소 또는 대사 생성물이다(Winkler and Breaker, 2005). Moco는 생명체의 모든 도메인 내에 널리 분포되어 있는 화합물이지만, 일부 세균은 Mo-의존적 효소의 활성 부위 내로 삽입되는 Moco의 유도체를 생성한다. Moco는 이 리보스위치 클래스에 대한 가장 이상적인 리간드이다.
이. 콜라이에서, Moco가 단백질 내로 삽입될 수 있기 전에, Moco는 MobA에 의해 더 변형되어야 한다(Iobbi-Nivol et al., 1995; Johnson et al., 1991). 그 후, Moco의 생성된 바이스-MGD 형태(도 23b)는 몰리브도프테린 내로 삽입될 수 있다. Moco의 유도체가 리보스위치 리간드인지를 확인하기 위해, ΔmobA 균주를 구축하고 레포터 유전자 발현에 대한 그의 효과를 전술한 바와 같이 평가하였다. 글루코스를 함유하는 LB 중에서 생장된 경우, 모든 다른 형질전환체에서와 동일한 탈억제가 관찰되었다(도 26). 그러나, 레포터 융합 구축물의 억제는 세포가 아라비노스로 보충된 LB에서 생장된 경우 복원된다. MobA가 없는 경우조차도, 세포는 moaA 149 RNA에 의해 조절되는 유전자 발현을 억제하는 데 필요한 소분자를 생성할 수 있다. 이 결과는 Moco가 Moco RNA-의존적 유전자 조절을 담당하는 소분자라는 사실과 일치한다.
vii. Moco RNA가 Moco치와 Tuco를 식별할 수 있음을 뒷받침하는 증거
리보스위치는 하나의 생합성 경로 내의 밀접하게 관련되어 있는 중간체들을 식별하는 능력을 갖는다고 공지되어 있다. 클로스트리디움 종 및 여러 써모필러스 고세균 종은 몰리브데늄보다는 텅스텐을 몰리브도프테린 내로 도입하여 밀접하게 관련되어 있는 화합물 Tuco를 형성한다(Johnson et al., 1993). Mo의 원자 반경 및 이온 반경과 W의 원자 반경 및 이온 반경은 그들의 전자 친화성과 마찬가지로 사실상 동일하다(Kletzin and Adams, 1996). 본 연구에서 중요한 것은, 이. 콜라이가 W를 최종 W-바이스-MGD 보조인자 내로 도입한 후 상기 보조인자를 기능성 트라이메틸아민 N-옥사이드 환원효소 내로 삽입할 수 있음이 밝혀져 있다는 것이다(Buc et al., 1999).
선행 연구(Anderson et al., 2000)에서, 131-뉴클레오티드 업스트림 영역에 의한 moaABCDE 오페론의 명백한 억제는 Moco의 존재 하에서 일어나지만, Tuco의 존재 하에서는 탈억제된다. 이 선행 결과는 Moco RNA-레포터 융합 구축물을 보유하는 세포가 배지 내로의 텅스테이트의 첨가에 의해 영향을 받지 않음을 입증하는 데이터(도 25c)와 일치한다. 따라서, Moco RNA는 거의 동일한 상기 두 보조인자를 구별할 수 있다.
Moco RNA의 계통발생적 분포 및 서열 정렬을 조사하였을 때, Moco RNA 모티프의 2종의 주요 클래스가 존재한다는 것은 분명해졌다. 176종의 Moco RNA 모티프 중에서 58종의 Moco RNA 모티프가 P3 줄기를 갖지 않는다. 그러나, 계통발생적 분리에 따라 엄격히 분류되지는 않는데, 이것은 동일한 리간드를 인식하는 리보스위치 앱타머의 구조 변이체들의 증가와 일치한다.
흥미롭게도, 두 구조적 타입의 Moco RNA는 세균에서의 Moco 및 Tuco의 사용과 거의 완전한 일치를 보이는데(표 3), 이것은 상기 두 타입의 RNA가 Moco 또는 Tuco의 선별적 인식을 허용함을 입증한다. Moco 또는 Tuco를 사용하는 유기체는 이 보조인자들과 관련된 화합물들을 사용하거나 수송하는 것으로 예측되는 단백질들을 코딩하는 유전자들의 존재에 의해 잠정적으로 동정될 수 있다. P3 줄기를 포함하는 Moco RNA는 몰리브도프테린 또는 Moco를 합성하는 단백질을 코딩하는 유전자와만 관련되어 있거나 Moco를 보조효소로서 사용하는 것으로 공지되어 있거나 예측되는 효소를 코딩하는 유전자와만 관련되어 있다. 대조적으로, P3 줄기를 갖지 않는 Moco RNA를 보유하는 19종의 유기체들 중 17종은 Tuco 대사를 지시하는 유전자도 보유한다. 나아가, P3을 갖지 않은 RNA는 몰리브도프테린 생합성(몰리브도프테린은 Tuco 및 Moco 둘다의 생합성에 있어서 전구체로 사용됨)과 관련된 효소를 코딩하는 유전자, 또는 Tuco를 보조효소로서 사용하는 것으로 공지되어 있거나 예측되는 효소를 코딩하는 유전자와 거의 배타적으로 관련되어 있다.
Moco 및 Tuco 대사를 이용하여 Moco RNA의 타입을 분류하는 것에 대한 분명한 예외는 예측된 몰리브데이트 수송자와 관련된 P3-결여 RNA를 갖는 펠로박터 카비놀리커스(Pelobacter carbinolicus)이다(표 3, 주석 a). 그러나, 이 수송자 클래스의 구성원은 텅스턴을 식별할 수 없으므로, 상기 유기체에서 상기 수송자는 Tuco 생합성에 있어서 사실상 중요할 수 있다. Moco RNA의 두 구조적 변이체를 보유하는 유기체에서조차도, P3-포함 RNA와 P3-결여 RNA가 각각 Moco 및 Tuco 대사 과정으로 분류되는 것은 거의 유지된다.
상기 2종의 Moco RNA의 놀라운 분류는 각각 Moco 또는 Tuco를 선별적으로 감지하는, P3 줄기의 존재 또는 부재에 의해 구분되는 2종의 Moco RNA의 존재에 의해 설명될 수 있다. 그러나, P3 줄기는 이. 콜라이 Moco RNA로부터 결실되어 있지만, 이 변이는 시험된 모든 생장 조건 하에서 유전자 조절을 완전히 파괴하였다. 추정컨대, 상기 결실만으로 Moco RNA의 특이성을 Moco로부터 Tuco로 전환시키기에는 역부족이다.
전술한 바와 같이, RNA 요소의 삼중 정렬은 신트로포모나스 울페이의 7-유전자 오페론 내에 존재한다. 상기 오페론 내의 유전자들은 몰리브도프테린 합성, 몰리브데이트 또는 텅스테이트 수송, 및 미공지된 기능을 갖는 다른 유전자에 관여하는 단백질을 코딩할 것으로 예측된다. 일렬로 정렬된 3개의 RNA는 P3 줄기를 갖지 않는다. 또한, 상기 오페론 내에서 처음 2개의 RNA 모티프 다음에 잠재적 고유 전사 종결요소가 관찰되고 세 번째 모티프와 첫 번째 ORF 사이에 긴 갭이 관찰된다. 리보스위치 각각이 사실상 별도의 발현 플랫폼을 통해 작용하고 P3 줄기의 부재가 Tuco 결합을 표시하는 경우, 삼중 정렬은 세포가 이미 공지되어 있는(Welz and Breaker, 2007) 탠덤 리보스위치에 비해 더 강한 "디지탈" 유전자 조절 특성을 나타내면서 Tuco 농도의 작은 변화에도 예외적으로 반응할 수 있게 한다.
2. 결론
이. 콜라이에서, moaABCDE 오페론의 전사는 ModE 및 FNR에 의해 상향-조절된다. 그러나, Moco RNA 및 Moco가 존재하는 경우 상기 오페론의 번역은 억제된다. ModE 및 FNR 조절은 Moco 생성을 필요로 하는 조건(FNR에 의해 감지되는 협기 생장 조건) 및 Moco 생성을 가능하게 하는 조건(ModE에 의해 감지되는 몰리브데이트의 충분한 수준)이 세포 내에 존재하는 경우 moaABCDE 전사체만이 생성되게 한다. Moco RNA가 사실상 리보스위치인 경우, Moco RNA는 추가 조절 기작을 제공한다. Moco-감지 리보스위치는 moaABCDE 전사체에 결합하는 자유 Moco에 의해 표시되는 충분한 수준의 Moco가 이미 존재하는 경우, Moco 생합성 단백질이 생성되지 않게 할 것이다. 이 시스템은 세포 내에서 Moco에 대한 변화하는 요구에 대한 신속하고 충분한 반응을 가능하게 한다.
본원에 제시된 실험적 데이터 및 생물정보 데이터는 Moco RNA 모티프에 해당하는 RNA가 Moco-감지 또는 Tuco-감지 리보스위치 앱타머로서 작용할 수 있음을 보여준다. 상기 RNA는 리보스위치 기능과 일치하는 게놈 분포를 가지며, 149 moaA RNA는 그의 2차 구조에 의존하는 유전자 조절 기능을 나타낸다. 그러나, 본 발명자들은 Moco 및 이의 대사 중간체의 불안정성 때문에 이 보조효소와 상기 RNA의 직접적인 결합을 통상적으로 이용되는 기법, 예컨대, 인-라인 프로빙 분석, 평형화 투석 또는 형광도-기초 분석을 이용하여 입증하지 못하였다. 상기 기법들은 전형적으로 리간드 결합이 단백질 인자의 완전한 부재 하에서 일어남을 입증하는 데 이용된다.
여러 증거는 단백질 인자가 대사물질 감지에 관여하지 않고 상기 RNA가 직접적인 센서로서 작용함을 입증한다. 선행 연구에서, 이. 콜라이에서 Moco 생합성 유전자들을 조절하는, 산소 및 몰리브데이트에 반응하는 단백질 인자들을 동정하였다(Anderson et al., 2000; Spiro and Guest, 1990; Gruden et al., 1999). 그러나, 상기 유기체에서 moaA 유전자의 바로 업스트림에 위치하는 조절 영역에 대한 인자는 동정되지 않았다. 뿐만 아니라, Moco RNA는 2종의 상이한 구조체로 분류될 수 있고(P3을 갖는 구조체 및 P3을 갖지 않은 구조체), 이러한 타입의 모티프들의 분포는 유기체에 의한 Moco, Tuco 또는 이들 둘다의 사용과 상관관계를 갖는다(표 3). 구조적으로 상이한 Moco RNA의 이러한 분류는 상기 RNA가 Moco 및 Tuco의 직접적인 센서로서 작용하는 RNA인 경우 예측된다.
또한, Moco RNA는 다른 리보스위치와 여러 중요한 특징을 공유한다. 예를 들어, 보조효소 B12(Nahvi et al., 2004), 티아민 피로포스페이트(Winkler et al., 2002a), 플라빈 모노뉴클레오티드(Winkler et al., 2002b) 및 라이신(Sudarsan et al., 2003)에 반응하는, 이. 콜라이에 존재하는 것으로 공지된 4종의 다른 리보스위치 앱타머 클래스가 존재한다. Moco RNA에서와 마찬가지로(Weinberg et al., 2007), 이 리보스위치들은 RNA로 구성된 비-리보스위치 유전자 조절 요소에 비해 모두 크고(도 27), 모두 고도의 뉴클레오티드 서열 및 구조 보존성을 나타낸다(Barrick and Breaker, 2007). 이. 콜라이로부터 유래된 Moco RNA 및 공지된 리보스위치 앱타머는 그 크기가 100개 초과의 뉴클레오티드에 상응하며, 관련성이 낮은 유기체로부터 유래된 Moco RNA에서조차도 염기-페어링을 유지하는 뉴클레오티드 공변이의 증거를 보이는 4 내지 6개의 줄기를 보유한다.
RNA, 예컨대, CspA(Phadtare and Inouye, 1999), BglG(Houman et al., 1990) 및 기타 다른 것들(Liu et al., 1997; Torres-Larios et al., 2002; Vecerek et al., 2005; Richardson and Richardson, 1996; Tang and Guest, 1999)에 결합하는, 이. 콜라이의 공지된 대사 조절 단백질들은 훨씬 더 작은 RNA 스트레치를 인식한다. 이 단백질-결합 서열들 내에 임의의 2차 구조가 존재하는 경우, 상기 2차 구조는 일반적으로 단일 헤어핀으로 구성된다. 이 경향에 대한 한 예외는 일반적으로 큰 구조화된 tRNA에 결합하는 아미노아실-tRNA 합성효소에 의한 결합에 유리하도록 구조를 진화시킨 ThrRS RNA 요소이다(Torres-Larios et al., 2002). 대다수의 단백질-결합 RNA 모티프와 대조적으로, 이. 콜라이 moaA RNA로부터 유래된 Moco RNA는 138개의 뉴클레오티드에 걸쳐 연장되어 있고 5개 이상의 보존된 줄기-루프 요소들을 형성한다. 따라서, Moco RNA의 광범위하게 보존된 큰 구조는 단백질 인자와 결합하는 대다수의 RNA 유전자 조절 요소들보다 이. 콜라이의 공지된 리보스위치 RNA의 특징들을 더 많이 나타낸다. 이 특징들은 Moco RNA가 새로 발견된 대사물질-감지 리보스위치 클래스의 구성원임을 보여준다.
3. 실험 절차
i. 올리고뉴클레오티드 및 화합물
합성 DNA는 예일 유니버시티의 하워드 휴즈 메디칼 인스티튜트 켁크 파운데이션 바이오테크놀로지 리소스 센터에 의해 합성되었다. 카베니실린, 클로람페니콜, 가나마이신, L-아라비노스, D-글루코스, 글리세롤, 소듐 몰리브데이트 및 소듐 텅스테이트는 시그마-알드리치로부터 구입하였다.
ii. 세균 균주 및 배지
이. 콜라이 균주 DJ480(MG1655 ΔlacX74)(Cabrera and Jin, 2001)은 진(Jin) 박사(미국 국립보건원)로부터 입수하였고, NEB5α 세포는 뉴 잉글랜드 바이오랩스로부터 입수하였다. 완너(Wanner) 유전자 파괴 세트(pKD46, pKD13 및 pCP20)(Datsenko and Wanner, 2000)에 상응하는 플라스미드는 예일 유니버시티의 이. 콜라이 유전자 저장 센터로부터 입수하였다. 배지 보충물은 각 실험에 대해 기재된 바와 같이 첨가하였다: 카베니실린 50 ㎍/㎖; 클로람페니콜 5 ㎍/㎖; 가나마이신 50 ㎍/㎖; L-아라비노스 0.2 중량/부피%; D-글루코스 0.2 중량/부피%. 글리세롤 0.2 중량/부피%는 아라비노스가 배지에 보충된 경우 상기 배지에 첨가된다(Guzman et ai, 1995).
iii. Moco RNA의 제조
인-라인 프로빙 분석에 사용된 138 moaA RNA 구축물은 연속적 PCR 증폭 반응에 의해 발생된 주형을 사용하여 시험관내 전사를 통해 제조하였다. moaA의 업스트림에 위치하는 IGR은 프라이머 5'-GAATTCCCTGGAGTCAGATTATCCGC(서열번호 4) 및 5'-CTGGATCCAGTTGTGAAGCCATGTACAC(서열번호 5)를 사용하여 이. 콜라이 K12 게놈 DNA로부터 PCR을 통해 증폭하였다. EcoRI 및 BamHI을 사용한 분해 후, PCR 생성물을 pRS414 내로 클로닝하고, 생성된 플라스미드의 완전성을 DNA 시퀀싱으로 확인하였다. 이 플라스미드는 138 moaA 구축물(RNA 전사체의 5' 말단에 상응하는 GG 부가를 포함함)을 코딩하는 DNA 구축물의 PCR 증폭을 위한 주형으로서 사용되었고, 이때 비-주형 가닥에 대한 프라이머는 T7 RNA 중합효소에 대한 프로모터 서열을 포함하였다. RNA 분자는 T7 RNA 중합효소를 사용한 시험관내 전사를 통해 제조하고 공지되어 있는 바와 같이 변성 PAGE로 정제하였다(Roth et al., 2006).
iv. 138
moaA
RNA의 인-라인 프로빙 분석
시험관내 전사에 의해 제조된 RNA 40 pM을 알칼리성 포스파타제(로슈 다이아그노스틱스)로 탈인산화시키고, 제조자에 의해 공급된 프로토콜에 따라 T4 폴리뉴클레오티드 키나제(뉴 잉글랜드 바이오랩스)를 사용하여 상기 탈인산화된 RNA 20 pM을 γ-32P[ATP]로 표지하였다. PAGE에 의해 정제된 방사선표지된 RNA를 사용하는 인-라인 프로빙 분석 반응물은 공지되어 있는 바와 같이 형성하고(Mandal et al., 2003), 50 mM Tris-HCl(23℃에서 pH 8.3), 100 mM KCl, 20 mM MgCl2 및 약 5 nM의 전구체 RNA를 함유하는 10 ㎕ 용액 중에서 25℃에서 40시간 동안 항온처리하였다. 생성된 RNA 단편을 10% 변성 PAGE로 정제하고 몰레큘라 다이나믹스 포스포르이미저를 이용하여 가시화하고 이미지쿠아엔티 소프트웨어를 이용하여 정량하였다.
v.
moaA
,
mogA
,
modC
,
moeA
및
mobA
넉아웃의
발생
특정 유전자가 결실되어 있는 이. 콜라이 DJ480 균주를 λ-레드 재조합 기법 및 적절한 PCR 생성물을 공지되어 있는 바와 같이(Datsenko and Wanner, 2000) 이용하여 발생시켰다. 요약하건대, 돌연변이체는 플라스미드 pKD13 및 하기 프라이머를 사용하여 PCR로 증폭함으로써 제조하였다:
FLP 인식 표적 부위에 의해 플랭킹된 가나마이신 내성 카세트, 및 인접하는 염색체 서열과 동일한 50개-뉴클레오티드 서열을 갖는 약 1.4 kb의 긴 PCR 생성물을 정제하여 DpnI로 절단하였다. 유사 재조합(homologous recombination)을 촉진하는, 파지 λ로부터 유래된 레드 재조합효소(Red recombinase)를 코딩하는 레드 헬퍼 플라스미드 pKD46을 사용하여 DJ480 세포를 형질전환시켰다. 앰피실린 내성에 대하여 형질전환체를 선별하였다. L-아라비노스의 존재 하에서 생장된 DJ480/pKD46 세포를 상기 유전자-특이적/pKD13 PCR 생성물로 형질전환시켰다. DJ480의 염색체 내로의 PCR 생성물의 재조합은 가나마이신-내성 형질전환체의 선별을 통해 확인하였다. 발생된 모든 결실 돌연변이체를 가나마이신 카세트에 특이적인 2개의 내부 프라이머(k1 5'-CAGTCATAGCCGAATAGCCT(서열번호 16) 및 k2 5'-CGGTGCCCTGAATGAACTGC(서열번호 17)) 및 플랭킹 유전자-특이적 프라이머(moaA 5''-CGCTAGTATCGGCATAACCAC(서열번호 18) 및 5'-GAATCGCGCAGATAGTGACCG(서열번호 19); mogA 5'-GCTACCTCTTCTGAAGCCTGTCTGT(서열번호 20) 및 5'-ATGGGTGAAGTACTGAACGAGCAGT(서열번호 21); moeA 5'-GATGGATATGGCATGTAAAGGCAGG(서열번호 22) 및 5'-AGCACGCGAGAATCTTTCAGCGCCT(서열번호 23); modC 5'-GAGCGGCGAGACTGTGCATTA(서열번호 24) 및 5'-GCAACGCCGATGACGCGGTA(서열번호 25); 및 mobA 5 '-CTTCATTCAGACGTTTACATTTCATAG(서열번호 26) 및 5'-CATCCATATCATGGTGCGTATGCTTA(서열번호 27))를 사용하여 PCR로 검증하였다.
그 후, FLP 플라스미드 pCP20을 사용함으로써 부위-특이적 재조합을 통해 상기 가나마이신 카세트를 제거하였다. 발생된 가나마이신 감수성 형질전환체는 예비-FLP 검증에 사용된 프라이머와 동일한 프라이머를 사용하여 PCR로 검증하였다.
vi. β-갈락토시다제 번역 융합체 및 돌연변이체의 구축
작동자(operator) 결합 부위가 결여되어 있는 기본구성적 활성 lacUV5 프로모터에 의해 발현되는 Moco RNA-레포터 융합 구축물의 제조는 다음과 같이 달성하였다. 이. 콜라이 moaABCDE 오페론(도 23a)에 대한 S1 전사 개시 부위를 기준으로 위치 1부터 위치 145에 걸쳐 있는 뉴클레오티드 서열을, 56-뉴클레오티드 lacUV5 프로모터 서열(밑줄로 표시됨)(Dickson et al., 1975)을 포함하는 프라이머 5'-GAATTCCTCATTAGGCACCCCAGGCTTTACACTTTATGCTTCCGGCTCGTATAATGTGTGGAACCACTAAACACTCTAGCCTC(서열번호 28) 및 프라이머 5'-CTGGATCCAGTTGTGAAGCCATGTACAC(서열번호 29)를 사용하여 이. 콜라이 균주 K12로부터 PCR로 증폭하였다. EcoRI 및 BamHI을 사용한 절단 후, 증폭 생성물을, 프로모터가 없는 lacZ 카피를 포함하는 pRS414 플라스미드(Simons et al., 1987) 내로 클로닝하여, lacZ의 9번째 코돈과 moaA의 15번째 코돈 사이에서 인 프레임 융합체를 발생시켰다. NEB-5α 세포를 상기 생성된 플라스미드로 형질전환시켰다. 형질전환체를 앰피실린 내성에 대해 선별하고, lacUV5-Moco 모티프-lacZ 번역 융합체의 완전성을 DNA 시퀀싱으로 확인하였다. 모든 부위-지정 돌연변이를 퀵체인지 부위-지정 돌연변이유발 키트(스트라타진) 및 적절한 돌연변이유발 DNA 프라이머를 사용하여 Moco 리보스위치 내로 도입하였다. 모든 돌연변이를 DNA 시퀀싱으로 확인하였다.
vii. MoaABCDE pBAD33 과다발현 플라스미드의 구축
세포 내의 Moco 농도의 아라비노스-유도성 조절을 가능하게 하기 위해 moaABCDE 오페론을 pBAD33 플라스미드(Guzman et al., 1995) 내로 클로닝하였다. 2.7 kb KpnI-HindIII moaABCDE 단편을 프라이머 5'-CTAGGTACCTCTGGAAAGGTGTACATGGCTTCACAAC(서열번호 30) 및 5'-TAGAAGCTTAACTACCAGCGTTTTGCCGCCTGCTG(서열번호 31)를 사용하여 이. 콜라이 K12로부터 PCR로 증폭하였다. PCR 생성물을 아가로스 겔 전기영동으로 정제하고 pBAD33과 마찬가지로 KpnI 및 HindIII으로 절단하였다. 그 다음, 절단된 단편을 아라비노스-유도성 프로모터의 다운스트림에서 pBAD33과 라이게이션시키고 NEB-5α 세포 내로 형질전환시켰다. 형질전환체를 클로람페니콜 내성에 대해 선별하고 융합체를 DNA 시퀀싱으로 확인하였다.
viii. 돌연변이체 균주의 발생
moaA, mogA, modC, moeA 및 mobA 넉아웃 DJ480 균주를, WT 또는 돌연변이체 149 moaA-레포터 융합체가 포함된 lacUV5-Moco 모티프-lacZ 융합체 pRS414 플라스미드 및 moaABCDE pBAD33 과다발현 플라스미드 둘다로 동시에 형질전환시켰다. 형질전환체를 앰피실린 내성 및 클로람페니콜 내성 둘다에 대해 선별하였다.
ix. 이. 콜라이의 149
moaA
RNA에 의한 유전자 조절의 생체내 분석
이. 콜라이의 WT 레포터 균주 및 돌연변이 레포터 균주에서 lacZ의 유전자 발현을 측정하기 위해, 상기 세포를 기재된 바와 같이 보충된 LB 3 ㎖ 중에서 37℃에서 밤새 진탕하면서 14 ㎖ 배양 바이얼 내에서 생장시켰다. 이어서, 상기 세포를 96-웰 플레이트 내의 LB 150 ㎕ 중의 OD600이 0.05가 될 때까지 희석하고 37℃에서 진탕하면서 A600이 0.5 내지 0.7이 될 때까지 생장시킨 후, 유전자 발현 실험을 위해 수거하고, β-갈락토시다제 활성을 공지되어 있는 96-웰 마이크로플레이트 프로토콜(Blount et al., 2007)을 이용하여 분석하였다.
x. Moco 및 Tuco 대사의 생물정보 분석
Moco 및 Tuco 대사를 다양한 유기체로 배정하는 것 및 Moco RNA 모티프 타입을 3종의 과정(몰리브도프테린 생합성, Moco 생합성 또는 사용 및 Tuco 생합성 또는 사용; 표 3)에 관여하는 유전자로 배정하는 것은 서열 유사성 분석을 통해 달성하였다. Tuco를 사용하되 이것이 실험적으로 입증되지 않은 유기체를 동정하기 위해, BLAST를 이용하여 tupA 및 tupB와 유사한 유전자를 검색하였다. 상기 유전자들은 진정세균 악시다미노필룸(Eubacterium acidaminophilum)에서 텅스테이트에 특이적인 수송자를 코딩하는 것으로 밝혀졌다(Makdessi et al., 2001). 펠로박터 카비놀리커스 및 데설포탈레아 사이크로필리아에서의 Tuco 대사는 텅스테이트의 또 다른 선별적 수송자인 것으로 밝혀진 wtpA 유사체의 존재를 기준으로 배정하였다(Bevers et al., 2006). Moco RNA 모티프를 상기 3종의 과정으로 배정하는 것은 인접하는 유전자들의 단백질 생성물들의 해석된 기능을 조사하거나 해석이 이용될 수 없는 경우 서열 유사성을 사용하여 기능을 배정함으로써 달성하였다.
표 3은 P3의 존재 또는 부재와 Moco-관련 또는 Tuco-관련 유전자의 존재 사이의 상관관계를 보여준다. Moco 관련 유전자를 보유하는 유기체는 공지되어 있는 Moco-의존적 단백질 및 몰리브데이트 수송에 관여하는 단백질과 유사한 유전자에 대해 각 유기체의 게놈을 검색함으로써 동정하였다. Tuco-관련 유전자를 보유하는 유기체는 Moco에 대해 기재된 바와 같이 그리고 공개된 바와 같이 (Bevers et al., 2006; Iyer et al., 2006) 동정하였다. 몰리브도프테린(몰리)의 생합성에 중요한 유전자들은 Moco 또는 Tuco 생성에 관여할 수 있기 때문에, 상기 유전자들의 존재는 별도의 종행에 표시하였다. 별모양(*)의 부재는 유기체가 표시된 화합물과 관련된 유전자를 갖지 않음을 의미하는 것이 아니라 문헌 또는 게놈 데이터베이스 검색에서 상기 유전자들의 존재에 대한 증거를 발견하지 못하였음을 의미한다. 유전자들에 대한 게놈 검색은 NCBI 엔트레즈 게놈 프로젝트(NCBI Entrez Genome Project) 데이터베이스(http://www.ncbi.nlm.nih.gov/genomes/lproks.cgi)로부터 입수가능한 해석된 게놈에 의존한다.
주석: 음영으로 표시된 박스 a 내지 c는 RNA 타입과 Moco 또는 Tuco 유전자 조절 사이의 상관관계에 위반되는 것으로 보이는 경우만을 확인시켜준다. 그러나, a는 P3-결여 RNA가 modA와 관련되어 있는 경우를 표시하는데, modA의 단백질 생성물은 몰리브데이트와 텅스테이트를 구별할 수 없는 수송자이다(Chan et al., 1995). b의 경우, P3-결여 RNA는 (텅스텐-의존적 알데하이드 퍼리독신 환원효소를 코딩하는) Tuco-관련 유전자 COG2414(Harborne et al., 1992) 및 (니트레이트 환원효소를 코딩하고 통상적으로 Moco를 필요로 하는) nirB(Clarke et al., 2000)를 보유하는 2-유전자 오페론과 관련되어 있다. c에서, P3-결여 RNA는 잠재적 Moco-사용 설파이트 산화효소를 코딩하는 2종의 유전자와 관련되어 있지만, c에서의 결과(데이터 참조)를 설명하기 위해 다른 가능성이 제거될 필요가 있을 것이다. 또한, 신트로포모나스 울페이에서, 1개의 P3-포함 RNA는 금속 수송 착물의 성분을 코딩하는 것으로 예측되는 troA와 관련되어 있다. 유사한 정렬이 데설피토박테리움 하프니엔스 DCB-2에 존재한다. 그러나, TroA의 구조적 구성과 니트로게나제 MoFe 단백질(Moco-보유 단백질)의 구조적 구성은 유사하다(Chan et ai, 1995). 따라서, P3-포함 RNA는 MoFe 니트로게나제에 대한 유전자와 관련되어 있는 것으로 추측된다.
F.
실시예
6:
SAM
-
IV 리보스위치의
앱타머
코어는
SAM
-I
리보스위치의
리간드
-결합 부위를 모방한다.
"SAM-IV"로 지칭되는 신규 리보스위치 패밀리는 SAM(또는 AdoMet)의 직접적인 감지를 통해 유전자 발현을 조절한다고 보고되어 있는 별개의 제4 mRNA 요소 세트이다. SAM-IV 리보스위치는 뉴클레오티드의 종류가 패밀리-특이적인 뉴클레오티드의 위치 및 재정렬된 구조에도 불구하고 공지되어 있는 SAM-I 리보스위치와 보존된 뉴클레오티드 위치를 공유한다. 서열 분석 및 분자 인식 실험은 SAM-I 및 SAM-IV 리보스위치가 유사한 리간드 결합 부위를 고유하지만 상이한 스카폴드를 가짐을 암시한다. 이 발견은 RNA가 상당한 구조적 다양성을 가지며 리보스위치가 이러한 능력을 이용하여 유전자 조절에 있어서 RNA의 범위를 확장시킴을 입증한다.
리보스위치는 특정 대사물질에 특이적으로 결합하고 대사물질의 농도 변화에 반응하여 유전자 발현을 조절하는 mRNA 요소이다(Mandal and Breaker 2004; Winkler and Breaker 2005; Batey 2006; Coppins et al., 2007). 많은 메틸라제 효소에 대한 보조인자인 SAM은 공지된 3종의 리보스위치 클래스, 즉 SAM-I(Winkler et al., 2003; McDaniel et al., 2003; Epshtein et al., 2003), SAM-II(Corbino et al., 2005) 및 SAM-III(또는 SMK)(Fuchs et al., 2006) 리보스위치에 의해 인식된다. 상기 3종의 리보스위치 패밀리 모두가 SAM을 특이적으로 인식하지만, 이들은 서열 또는 구조 면에서 명백한 유사성을 보이지 않는다.
다수의 상이한 SAM-결합 리보스위치의 발견, 예를 들어, 다수의 자가-절단 리보스위치의 발견은 RNA가 동일한 생화학적 과제를 다양한 방법으로 해결하기에 충분할 정도로 구조적으로 정교하다는 견해를 뒷받침한다. 나아가, 2종의 큰 리보자임 클래스, 군 I 인트론 및 RNase P RNA의 구조 연구 및 서열 분석은 이 RNA들 내의 상이한 스카폴드가 촉매 활성 코어에서의 뉴클레오티드의 동일한 위치선정(positioning)을 지지함을 보여준다(Michel and Westhof 1990; Krasilnikov et al., 2004; Torres-Larios et al., 2006; Vicens and Cech 2006).
생물정보를 이용하여 세균에서 신규 리보스위치를 검색하는 동안(Yao et al., 2007; Weinberg et al., 2007), SAM-결합 리보스위치의 신규 세트로서 분류된 보존된 구조화된 RNA 모티프가 동정되었다. 이 "SAM-IV" 리보스위치는 악티노마이세탈레스, 예를 들어, 마이코박테리움 튜버큘로시스(Mycobacterium tuberculosis)(결핵 병원체)에서 주로 발견된다. SAM-IV 리보스위치는 SAM-I 리보스위치의 리간드-결합 코어와 유사하지만, 구조 및 뉴클레오티드 종류 면에서 다수의 차이점을 나타낸다. 따라서, SAM-I 리보스위치 및 SAM-IV 리보스위치는 상이한 스카폴드를 가질 수 있지만 고도로 유사한 리간드-결합 코어를 가질 수 있다. SAM-IV 리보스위치에서의 발견은 구조적 모방이 큰 리보자임으로 한정되지 않음을 입증하는데, 이것은 상기 구조적 모방이 다양한 타입의 구조화된 RNA 사이에 광범위하게 분포되어 있음을 암시한다.
1. 결과 및 논의
i. SAM-IV 모티프의 동정
SAM-IV 모티프는 CMfinder 비교 유전체학 파이프라인(Weinberg et al., 2007; Yao et al., 2007)을 이용하여 발견하였다. 대다수의 SAM-IV 모티프는 황 대사에 관여하는 유전자의 업스트림, 추정컨대, 상기 유전자의 5' UTR에 위치하는데, 이것은 SAM-IV가 SAM-결합 리보스위치에 상응함을 입증한다. 모든 공지된 SAM-IV RNA들은 악티노마이세탈레스 목에서 발견된다.
ii. SAM-IV 모티프 코어는 SAM-I의 코어와 유사하다.
SAM-IV의 고도로 보존된 영역과 SAM-I, SAM-II 및 SAM-III 리보스위치의 고도로 보존된 영역을 비교하였다. SAM-IV는 SAM-I 결합 코어의 핵심적인 서열 및 구조적 특징을 공유하지만, 뉴클레오티드 종류 면에서의 상당한 차이가 모든 위치에서 발견되며, 전체적인 구조 면에서 상당한 차이가 있다(도 28). 리간드 원자의 5 Å 내에서 원자를 갖는 SAM-I 3-D 구조(Montange and Batey 2006)에서 코어의 모든 뉴클레오티드를 확인하고(도 28, 진하게 표시된 문자), 보존된 구조적 특징의 명백한 유사점을 기초로 하여 SAM-I 위치를 유사한 SAM-IV 위치로 맵핑하였다. 주위에 존재하는 보존된 뉴클레오티드 종류 또는 다른 특징이 뉴클레오티드 종류가 우연히 동일하지 않음을 보여주는 경우, 뉴클레오티드 종류를 상기 두 모티프의 공통점으로서 분류하였다(도 28, 음영).
상기 두 모티프는 다중-줄기 접합부를 가지며 P3 줄기의 뉴클레오티드 종류 면에서 광범위한 유사성을 나타낸다(도 28). P1과 P2 사이의 접합부도 유사성을 공유하고, 상기 두 모티프는 P2의 말단 루프와 P3에 대해 3' 방향으로 존재하는 접합부 사이의 슈도노트를 형성하는 듯하다. 상기 슈도노트를 수용하기 위해, SAM-I의 P2는 원추형 킨크-턴(kink-turn)을 갖는다(Lescoute et al., 2005; Montange and Batey 2006). 흥미로운 사실은 SAM-IV의 P2 내의 내부 루프가 상기 킨크-턴과 유사하게 작용하여 SAM-IV 및 SAM-I RNA들이 슈도노트 구조를 채택하게 할 수 있다는 점이다.
그러나, 상기 SAM-IV 및 SAM-I 모티프는 상이한 구조적 요소를 가지며 많은 부위에서 상이한 뉴클레오티드 보존 패턴을 나타낸다(도 28, 밝은 음영). SAM-I 코어의 P4 헤어핀은 SAM-IV에 존재하지 않지만 상이한 P4 헤어핀이 SAM-IV의 P1의 외부에서 발견된다. 상기 P4 헤어핀은 유사하지 않은 보존된 뉴클레오티드 종류를 보인다. SAM-IV는 코어 외부에 부가되어 있는 P4 이외에 SAM-I이 갖지 않는 추가 슈도노트를 형성할 수 있다. 또한, SAM-IV는 루프 및 줄기 길이가 SAM-I과 상이하다는 점에서 SAM-I과 상당히 상이한 P2를 갖고, 서열 면에서 거의 유사성이 없는 듯하다. 사실상, P2 내의 킨크-턴은 SAM-I 리보스위치에서 고도로 보존되어 있지만(Barrick and Breaker 2007), SAM-IV 리보스위치 서열은 이 구조적 모티프를 갖지 않는다. SAM-I과 SAM-IV 사이의 보존된 뉴클레오티드 종류 면에서의 다른 차이점은 P3의 정점, P1의 기저부, 및 P3에 대해 3' 방향으로 존재하는 접합부에 존재한다.
이러한 차이점들 때문에, SAM-IV 리보스위치는 3종 이상의 선행 연구에서 SAM-I을 기초로 한 유사성 검색에 의한 검출에서 검출되지 않는다. 제1 연구에서, PAT 프로그램을 이용하여 SAM-I 앱타머를 포함하는 조절 RNA에 대해 악티노박테리아 게놈을 검색하였다(Seliverstov et al., 2005). 제2 연구에서, RNA-PATTERN 프로그램을 이용하여 황 대사에 있어서 SAM-I 앱타머 및 다른 유전자 조절 요소에 대해 그람-양성 세균을 검색하였다(Rodionov et al., 2004). 제3 연구에서, 모든 세균에서 공지된 리보스위치들의 유사체들에 대한 검색은 통계학적 프로파일 기법을 이용하여 보존된 서열 및 2차 구조를 확률적으로 모델링하는 SequenceSniffer 및RAVENNA(Weinberg and Ruzzo 2006)를 사용하였다. 많은 악티노마이세트가 상이한 게놈 좌위에서 SAM-I 리보스위치 및 SAM-IV 리보스위치 둘다를 보유하지만 모든 노력에도 불구하고 SAM-IV 리보스위치를 검출하지 못하였다.
SAM-I과 SAM-IV 사이의 유사성은 주로 이들의 코어로 한정되므로, SAM-I 리보스위치와 SAM-IV 리보스위치는 유사한 결합 부위 및 분자 인식 특징을 공유할 수 있다. 이것은 6개의 뉴클레오티드들이 리간드와 직접적으로 상호작용한다고 제안하는 SAM-I 원자-해상 모델(Montange and Batey 2006)에 의해 뒷받침된다(도 28). 상기 6개의 위치들에서의 뉴클레오티드 종류는 1종의 SAM-I만을 제외한 모든 SAM-I에서 엄격히 보존되어 있다. 리간드-접촉 위치에 상응하는 것으로 제안된 SAM-IV 내의 상기 6개의 위치 중 5개의 위치가 SAM-I 리보스위치와 동일한 종류의 뉴클레오티드를 갖는 모든 공지된 SAM-IV에서 보존되어 있다. 6번째 위치인 U88은 SAM-IV에서 전형적으로는 시토신이지만 4종의 모든 뉴클레오염기가 이 위치에서 발견된다.
iii. SAM-IV RNA의 분자 인식 특징
SAM-IV RNA의 분자 인식을 평가하기 위해, 인-라인 프로빙 분석(Soukup and Breaker 1999)을, 스트렙토마이세스 코엘리칼러에서 발견되는 SAM-IV를 포함하는 132-뉴클레오티드 RNA(132 Sc RNA로 지칭됨)에 적용하였다. 이 분석에서, 132 Sc RNA는 SAM에 대해서는 약 150 nM의 겉보기 KD로 결합하지만 SAH에 대해서는 20 μM의 겉보기 KD로 결합한다. 아데노신 및 메티오닌은 1 mM보다 더 낮은 KD 값을 나타낸다(도 29). 이 값들은 132 Sc RNA 앱타머가 다른 클래스의 SAM 리보스위치 앱타머와 유사한 친화도 및 특이성으로 SAM에 결합함을 입증한다.
SAM-IV 리보스위치는 SAM-I에서 U88에 상응하는 뉴클레오티드를 보존하지 못한다(도 28). SAM-I 리보스위치 내의 상기 위치에 존재하는 O2 카보닐 산소가 SAM 리간드 내의 황 원자의 양 전하를 감지할 것으로 예측되기 때문에(Montange and Batey 2006), 황 원자의 위치에서 구별되는 화합물(SAM, SAH, SAH 설폰(Borchardt and Wu 1974), 및 2종의 아자 유도체, 즉 AzaAdoMet 및 MeAzaAdoMet(Thompson et al., 1999))에 대한 SAM-I 리보스위치 및 SAM-IV 리보스위치의 친화성을 비교하였다. 132 Sc RNA는 U88과 유사한 위치에서 뉴클레오염기로서 유라실 대신에 시토신을 갖는다. 시토신이 O2 카보닐을 보존할지라도, 와슨-크릭 G-C 쌍에 의해 형성된 추가 수소결합은 리간드의 양 전하와의 상호작용을 방해할 것인데, 이것이 SAM-I 리보스위치에서의 U88의 완벽한 보존을 설명할 수 있다.
132 Sc RNA의 분자 인식을 124 yitJ로 지칭되는 공지된 SAM-I 리보스위치(Winkler et al., 2003)의 분자 인식과 비교하였다. 리간드의 변형에 대한 리보스위치의 식별력을 측정하기 위해, 변경된 리간드에 대한 KD를 SAM에 대한 KD로 나누어 KD 비를 산출하였다. SAM-I 리보스위치 및 SAM-IV 리보스위치는 유사한 KD 비로 SAM 및 SAM 유사체에 결합한다(표 4). 이 데이터는 SAM-IV에서의 U88의 낮은 보존도에도 불구하고 SAM-IV 분자 인식이 SAM-I의 분자 인식과 유사함을 입증한다.
iv. SAM-IV는 유전적 조절 요소이다.
SAM-IV가 생체내에서 유전자 발현을 조절하는지를 확인하기 위해, 스트렙토마이세스 코엘리칼러 좌위 SCO2146의 업스트림에 위치한 SAM-IV-함유 IGR을 xylE 레포터 유전자와의 번역 융합체로서 클로닝하였다. 프로모터는 SAM-IV-함유 IGR에서 용이하게 확인될 수 없었기 때문에, 상기 영역을 글리세롤-유도성 프로모터의 조절 하에 두었다(Kieser et al., 2000).
대다수의 공지된 SAM 리보스위치들은 SAM과 결합하였을 때 유전자 발현을 감소시킴으로써 SAM 농도가 높은 경우 필요한 단백질 생성물을 코딩하는 유전자의 발현을 감소시킨다. SAM-IV가 유전자 조절 요소인지를 확인하기 위해, SAM-IV 리보스위치의 기능을 파괴하거나 복원시킬 것으로 예측되는 돌연변이를 도입하였다. 제1 돌연변이(M1)로 변경된 위치들은 이 뉴클레오티드들이 SAM-I 앱타머의 뉴클레오티드들과 유사하다고 가정하였을 때 SAM과 직접적으로 접촉할 것으로 예측된다. 제2 돌연변이(M2)는 보존된 2차 구조에서 염기-페어링을 파괴한다. 제3 돌연변이(M3)는 WT 활성을 회복시킬 수 있는 보상적 돌연변이를 통해 M2에서의 염기-페어링 상실을 복원시킨다.
XylE 활성은 복합 배지 중에서 생장된 4종의 리보스위치-레포터 융합체 각각을 보유하는 스트렙토마이세스 코엘리칼러 세포에서 측정하였는데, 이때 SAM의 세포내 농도는 충분한 것으로 예측되었다. 예측된 바와 같이, M1 리보스위치 및 M2 리보스위치를 갖는 균주는 WT 리보스위치 또는 M3 리보스위치를 갖는 균주보다 더 높은 레포터 유전자 발현을 보였다(도 30). 이 결과는 스트렙토마이세스 코엘리칼러 세포의 SAM-IV RNA가 유전적 조절 요소이고, 분자 인식 실험에서 상기 RNA가 SAM에 반응해야 함을 입증한다. 레포터 유전자 발현은 세포내 SAM이 모두 소모된 조건 하에서 측정하였지만, 이 결과는 레포터 유전자 발현의 수준이 사용된 구축물에 비해 지나치게 낮아 포함시키지 않았다.
황 대사의 유전자 조절은 SAM 농도가 스트렙토마이세스에서 항생제 생성 및 포자형성에 영향을 미치기 때문에 스트렙토마이세스에서 특히 흥미롭다(Kim et al., 2003; Okamoto et al., 2003). SAM-IV에 의해 분명히 조절되는 일부 유전자들(예를 들어, SCO2146)은 셀레노시스테인 리아제로서 예측된다. 이들은 예를 들어, 황 대사에서 일정 역할을 수행할 수 있다.
v. SAM-IV의 진화 역사
이 단락에는 발산적 진화를 설명할 수 있는 모델이 제시된다. 이 모델에서, SAM-I 유사 조상은 그의 P4 줄기를 갖지 않고, P4의 상실에 의해 추후에 야기되는 임의의 부정적 효과는 상이한 P4 줄기를 P1 줄기에 대해 3' 방향으로 부가하여 결과적으로 SAM-IV 유사 RNA를 생성함으로써 보상되었다. 3가지 사실이 상기 모델과 일치한다. 첫째, SAM-IV가 악티노마이세탈레스에 거의 한정되어 있지만, SAM-I은 이 분류군 및 많은 다른 군에서 발견되는데, 이것은 SAM-IV와 SAM-I가 조상을 공유한다면 상기 조성은 아마도 SAM-I과 유사할 것임을 암시한다. 둘째, P4는 보다 용이하게 대체될 수 있도록 스카폴딩에만 관여한다는 것이 밝혀졌다(Montange and Batey 2006). 셋째, 몇몇 SAM-I 리보스위치들은 P4 상실이 허용될 수 있도록 P4 줄기 및 루프 전체를 갖지 않는다.
vi
.
SAM
-IV
리보스위치의
분류 및 의미
단백질들은 다양한 기준에 의해 패밀리 및 수퍼패밀리로 분류된다(Orengo and Thornton 2005). 원 기준은 서열 유사성만을 기초로 하였다(Dayhoff et al., 1976). 다른 군들은 이 선례를 유지하였지만(예를 들어, 문헌(Barker et al., 1996) 참조), 일부 군들은 구조적 또는 기능적 유사성도 고려한다(Murzin et al., 1995). 일반적으로, 패밀리로 분류된 단백질들은 명백한 유사성을 보이지만, 수퍼패밀리로 분류된 단백질들은 관련성이 보다 낮은 듯하며, 유사성은 "가능성"만으로 간주된다(Murzin et al., 1995; Dayhoff et al., 1976). SAM-I 리보스위치와 SAM-IV 리보스위치 사이에 부적합한 보존 패턴 및 재정렬된 구조가 존재한다면, SAM-I 리보스위치와 SAM-IV 리보스위치의 유사성은 현재의 서열 분석 방법으로 확인되지 않기 때문에, 본 발명자들은 상기 리보스위치들이 상이한 패밀리를 포함한다고 제안한다. 그러나, SAM-I 리보스위치의 코어와 SAM-IV 리보스위치의 코어 사이의 유사성은 상기 리보스위치들을 단일 수퍼패밀로서 분류하기에 충분하다. SAM-IV 리보스위치에 대한 3-D 구조 연구는 상기 리보스위치들의 분류를 정련하는 데 기여한다. 리보스위치는 "클래스" 및 "타입"으로 분류된다. 클래스는 구조적 성질 및 기능성 성질을 공유하는 리보스위치 세트를 정의하고, 타입은 동일한 클래스에 속하지만 상이한 하위-구조를 보유하는 RNA를 분류하는 데 사용된다. 유사한 단백질들을 분류하는 데 사용되는 용어와 상기 용어들의 관계에 있어서, "클래스"는 "패밀리"에 상응하고, "타입"은 "수퍼패밀리"에 상응한다.
추가 리보스위치 패밀리는 SAM-I 리보스위치와 SAM-IV 리보스위치 사이의 관계와는 상이한 성질을 나타낼 수 있지만 구조적 다양성을 보인다. 예를 들어, preQ1-I 리보스위치는 루프 서열을 기초로 하여 서브패밀리로 분류될 수 있다(Roth et al., 2007). 또한, 이미 보고된 아데노실코발라민-결합 리보스위치(Nahvi et al., 2004)는 통상적으로 보존된 도메인을 갖지 않지만, 그의 3' 플랭킹 서열은 리간드 인식에 필요하다. 이 변이체는 전형적인 아데노실코발라민 리보스위치보다 퓨리닐코발라민에 대해 더 우수한 친화성을 나타내므로, 상기 변이체의 결합 코어는 변경될 수 있다.
이 결과는 리보스위치 RNA가 다양한 구조를 이용하여 핵심 뉴클레오티드들을 동일한 결합 부위 내로 배치함을 입증한다. I 군 인트론과 RNase P RNA 사이의 유사한 발견을 고려할 때, 상기 현상은 매우 다양한 RNA에 의해 나타난다는 결론이 도출된다. RNA의 구조적 레퍼토리(repertoire)의 이러한 강력한 천연 사용은 RNA가 분자 감지 및 유전적 조절에 있어서 강력하고 다재다능한 중합체라는 결론을 뒷받침한다.
2. 재료 및 방법
i. 생물정보
SAM-IV 모티프는 CMfinder 비교 유전체학 파이프라인을 이용하여 동정하였고, 이의 정렬은 이미 확립된 기법을 이용하여 추정하였으나(Weinberg et al., 2007; Yao et al., 2007), RefSeq(Pruitt et al., 2005)의 버전 21이 사용되었다. SAM-I 정렬 데이터는 이미 공개되어 있다(Barrick and Breaker 2007). 도 28에 제시된 보존도 통계는 이미 보고된 바와 같이 계산되었다(Weinberg et al., 2007).
ii. 미생물 유전학 및 플라스미드
유전자 발현의 리보스위치 조절을 시험하기 위해, 본 발명자들은 카테콜 2,3-다이옥시게나제를 코딩하는 xylE 레포터 유전자(Kieser et al., 2000)의 업스트림 내로 스트렙토마이세스 코엘리칼러의 SAM-IV-함유 IGR을 클로닝하였다. 상기 효소는 카테콜을 2-하이드록시뮤코네이트 세미알데하이드로 전환시키고, 2-하이드록시뮤코네이트 세미알데하이드의 375 nm에서의 흡광도는 비색 분석을 가능하게 한다. 본 발명자들은 이. 콜라이에서 복제되며 글리세롤-유도성 프로모터의 다운스트림에서 아프라마이신 내성 유전자 및 xylE 레포터 유전자를 포함하는 완전한 스트렙토마이세스 플라스미드인 pMT3226(Kieser et al., 2000)을 사용하였다. xylE 유전자와의 번역 융합체를 구축하기 위해, 프라이머 5'-GAAGAGGTGACGTCATGGATCCGAACAAAGGTGTAATGC(서열번호 32) 및 이의 역방향 상보체를 사용하여 퀵체인지(스트라타진)로 제2 BamHI 부위를 pMT3226에 부가하였다. SAM-IV를 함유하는 스트렙토마이세스 코엘리칼러 IGR은 프라이머 5'-CTAGGATCCGCCACGCGTAGCGGCCCTGGTGTGT(서열번호 33) 및 5'-GTAGGATCCACAGCGGTGGGTACGGACATGGCG(BamHI 부위는 밑줄로 표시됨, 서열번호 34)를 사용하여 PCR로 게놈 DNA로부터 증폭하였다. G+C 함량이 높은 DNA 생성물의 증폭을 보조하기 위해, PCR 반응물은 1.3 M의 베타인(시그마-알드리치) 및 5% DMSO(Frackman et al., 1998)를 함유하였다. "pEZ35"를 조립하기 위해, pMT3226 및 상기 PCR 생성물을 BamHI로 절단하고, pMT3226으로부터 유래된 작은 조각을 아가로스 겔 정제를 통해 제거하고, DNA 분자를 라이게이션하고, 시퀀싱을 통해 정확한 서열 및 방향을 검증하였다. 돌연변이체 리보스위치(M1, M2, M3)를 함유하는 벡터를 퀵제인지로 제조하였다. 플라스미드를 접합을 통해 스트렙토마이세스 코엘리칼러 내로 도입하였다(Kieser et al., 2000). 28℃의 MS 아가 상에서 생장시킨 세포(Kieser et al., 2000)로부터 접합전달체(exconjugant)의 포자 원액을 모아 -20℃의 15% 글리세롤 중에서 저장하였다. 아프라마이신 설페이트(시그마-알드리치)는 이. 콜라이의 경우 100 ㎍/㎖의 농도로 사용되었고 스트렙토마이세스 코엘리칼러의 경우에는 50 ㎍/㎖의 농도로 사용되었다.
유전적 실험을 개시하기 위해, 포자 원액을 얼음 상에서 해동시키고 1 ㎖의 트리톤 X-100 완충제(Hodgson 1982)로 세척하고 1 ㎖의 dH2O 중에 재현탁시켰다. 이 혼합물을, H2O을 기준으로 측정된 A450이 약 0.03이 될 때까지 25 ㎖ 배양액에 접종하였다(Hodgson 1982). 배지는 오염 위험을 감소시키기 위해 덱스트로스(벡톤 딕킨슨), 4% 글리세롤, 20 ㎍/㎖의 아프라마이신 설페이트(벡터를 갖지 않는 세포는 제외됨) 및 12.5 ㎍/㎖의 소듐 날리딕세이트(시그마-알드리치)를 함유하지 않는 24 g/ℓ의 트립틱 대두 브로쓰(TSB)이었다. 배양물을 28℃에서 진탕하면서 250 ㎖ 플라스크 내에서 50.5시간 동안 생장시켰다. 이어서, 세포-무함유 추출물의 XylE 활성을 측정하였다(Kieser et al., 2000). 미정제 추출물에 잔류하는 세포 데브리스(debris)는 XylE 효소 곡선에 무의미한 신호를 부가하기 때문에, 원심분리를 2회 수행하여 상청액을 추출한 후, 0.2 ㎛-공극 막(와트만)을 통해 여과시킨 다음, 20분 동안 원심분리하였다. 반응물은 1 ㎖ 카테콜-무함유 분석 완충제, 100 ㎕ 세포-무함유 추출물 및 10 ㎕ 20 mM 카테콜을 포함하였고, 375 nm에서의 흡광도는 바리안 50 바이오 분광계 상에서 20분 동안 6초마다 측정하였다. 여과에도 불구하고, 375 nm를 포함하는 모든 가시광선 파장에서 흡수하는 데브리스가 종종 남는다. 480 nm(XylE 반응 생성물에 의해 인지가능하게 흡수되지 않는 파장)에서의 변화가 20분에 걸쳐 0.0004보다 크고 375 nm에서의 변화와 크기 면에서 유사한 경우, 본 발명자들은 해당 결과를 버리고 새로운 반응을 준비하였다. 이미 보고된 바와 같이(Kieser et al., 2000) 선형 범위의 사용보다 더 재현가능할 수 있는, 총 20분에 걸친 A375에서의 변화를 이용하여 XylE 활성을 추정하였다.
iii
. 인-라인
프로빙
분석
pEZ35 플라스미드(상기 참조) 내의 앱타머에 상응하는 DNA를, 프라이머 5'-TAATACGACTCACTATAGGTTTTTCGACAGGTCATGAGTGACAGTC(T7 RNA 중합효소 프로모터 서열은 밑줄로 표시됨, 서열번호 35) 및 5'-AGGGGTCCGCGCTTGCCGTGGACCTTGCTG(서열번호 36)를 사용하여 PCR로 증폭하였다. 이미 공지되어 있는 프로토콜(Roth et al., 2007)을 이용한 시험관내 전사, 탈인산화 및 [γ-32P]ATP로의 방사선표지화를 통해 PCR 생성물로부터 5' 32P-표지된 RNA 분자를 제조하였다. 인-라인 프로빙 분석 반응물을 준비하고 5' 32P-표지된 단편을 변형 PAGE로 해상하고 공지되어 있는 바와 같이(Roth et al., 2007) 가시화하였다.
개시된 방법 및 조성물은 변경될 수 있으므로 본 명세서에 기재된 구체적인 방법, 프로토콜 및 시약으로 한정되지 않음을 이해해야 한다. 또한, 본 명세서에서 사용된 용어는 특정 실시양태를 설명하기 위한 것일 뿐, 첨부된 청구의 범위에 의해서만 제한될 본 발명의 범위를 한정하기 위한 것이 아님을 이해해야 한다.
본 명세서 및 첨부된 청구의 범위에서 사용된 바와 같이, 문맥상 달리 명시하지 않은 한 단수형은 복수형의 언급을 포함함을 인식해야 한다. 따라서, 예를 들어, "리보스위치"라 함은 복수의 리보스위치를 포함하고, "리보스위치"에 대한 언급은 1종 이상의 리보스위치 및 당업자에게 공지된 리보스위치의 등가물 등에 대한 언급이다.
"임의적" 또는 "임의적으로"는 후속적으로 기재되는 사건, 조건 또는 물질이 일어나거나 존재할 수 있거나 일어나지 않거나 존재하지 않을 수 있음을 의미하고, 이러한 기재는 상기 사건, 조건 또는 물질이 존재하는 경우, 및 상기 사건, 조건 또는 물질이 일어나지 않거나 존재하지 않는 경우를 포함한다.
본 명세서에서 범위는 "약"으로 시작되는 하나의 구체적인 값 내지 "약"으로 시작되는 또 다른 구체적인 값으로서 표시될 수 있다. 이러한 범위가 표시되는 경우, 문맥상 달리 명시하지 않은 한, 상기 하나의 구체적인 값, 나머지 다른 구체적인 값, 및/또는 상기 하나의 구체적인 값 내지 나머지 다른 구체적인 값이 구체적으로 고려되고 개시된 것으로 간주된다. 유사하게, 값이 근사치로서 표시된 경우, "약"의 사용은 문맥상 달리 명시하지 않은 한 특정 값이 개시된 것으로 간주되어야 하는 또 다른 구체적으로 고려되는 실시양태를 형성함을 이해할 것이다. 또한, 문맥상 달리 구체적으로 기재하지 않은 한, 각 범위의 한계 값은 다른 한계 값과 관련하여 유의할 뿐만 아니라 다른 한계 값과 무관하게 유의함을 이해할 것이다. 마지막으로, 문맥상 달리 구체적으로 기재하지 않은 한, 개개의 값 및 명시된 범위 내에 포함되는 값들의 하위-범위 전부도 구체적으로 고려되고 개시된 것으로 간주되어야 함을 이해해야 한다. 상술한 것은 일부 경우 실시양태들의 일부 또는 전부가 명시적으로 개시되어 있는지와 관계없이 적용된다.
달리 정의되지 않은 한, 본 명세서에서 사용된 모든 기술 용어 및 학술 용어는 본 명세서에 개시된 방법 및 조성물이 속하는 분야에서 숙련된 기술을 갖는 자에 의해 통상적으로 이해되는 의미와 동일한 의미를 갖는다. 본 명세서에 기재된 방법 및 물질과 유사하거나 동등한 임의의 방법 및 물질이 본 방법 및 조성물의 실시 또는 시험에서 사용될 수 있지만, 특히 유용한 방법, 장치 및 물질이 기재되어 있다. 본 명세서에서 인용된 공개문헌 및 이 공개문헌에서 인용된 참조문헌은 본원에 참고로 구체적으로 도입되어 있다. 이러한 문헌의 인용은 본 발명이 선행 발명에 의해 상기 개시내용을 예상할 자격이 없음을 인정하는 것으로 해석되어서는 안 된다. 임의의 인용문헌이 선행 기술을 구성함을 인정하는 것도 아니다. 인용문헌의 논의는 상기 문헌의 저자가 주장하는 것을 설명하는 것이고, 출원인은 인용된 문헌의 정확성 및 타당성을 조사할 권리를 유보한다. 다수의 공개문헌이 본 명세서에서 언급되어 있지만, 이러한 언급은 상기 문헌들 중 임의의 문헌이 당업계의 통상의 일반적인 지식의 일부를 형성함을 인정하는 것은 아니다.
본 명세서의 상세한 설명 및 청구의 범위 전체에 걸쳐, "포함한다" 및 이의 어미변화, 예컨대, "포함하는" 및 "포함하고"는 "포함하지만 이로 한정되지 않는"을 의미하고 예를 들어, 다른 첨가제, 성분, 정수 또는 단계를 배제하기 위한 것이 아니다.
당업자라면 본 명세서에 개시된 방법 및 조성물의 특정 실시양태들의 많은 등가물을 인식할 것이고 상기 등가물을 과도한 실험 없이 확인할 수 있을 것이다. 이러한 등가물은 하기 청구의 범위에 포함된다.
참고문헌
SEQUENCE LISTING
<110> Yale University
<120> Riboswitches and Methods and Compositions for Use of and with
Riboswitches
<130> 24519.1.4101
<140> PCT/US08/65179
<141> 2008-05-29
<150> US 60/932,112
<151> 2007-05-29
<160> 102
<170> PatentIn version 3.5
<210> 1
<211> 39
<212> DNA
<213> Streptococcus pneumoniae
<220>
<221> 5'UTR
<222> (1)..(39)
<400> 1
ggaattcaac aagtctaaca gaaaagtaga aaggcgggc 39
<210> 2
<211> 45
<212> DNA
<213> Streptococcus pneumoniae
<220>
<221> 5'UTR
<222> (1)..(45)
<400> 2
ttttgtcatt ttttctcctt taacgtctgg ataactctca aaagc 45
<210> 3
<211> 39
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> Unsure
<222> (1)..(39)
<220>
<221> 5'UTR
<222> (1)..(39)
<220>
<221> misc_feature
<222> (2)..(2)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (9)..(11)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(20)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (27)..(27)
<223> n is a, c, g, or u
<400> 3
rnyaaacynn nygnrarnnn gggrcgnaaa gcyyrggyc 39
<210> 4
<211> 26
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(26)
<400> 4
gaattccctg gagtcagatt atccgc 26
<210> 5
<211> 28
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(28)
<400> 5
ctggatccag ttgtgaagcc atgtacac 28
<210> 6
<211> 67
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(67)
<400> 6
aggaagaaat gacttcgcct cccgtatctg gaaaggtgta catggctatt ccggggatcc 60
gtcgacc 67
<210> 7
<211> 70
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(70)
<400> 7
acctgactca tctgatctct ccttttgacg ttttagccgc caatgtacga tgtaggctgg 60
agctgcttcg 70
<210> 8
<211> 70
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(70)
<400> 8
tgtatcattc tgtttaacga gactgtttaa acggaaaaat cttgatgaat attccgggga 60
tccgtcgacc 70
<210> 9
<211> 70
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(70)
<400> 9
ttgagatccc cccgctcggg gggatttttt tattcgctaa cgtcgcgtct tgtaggctgg 60
agctgcttcg 70
<210> 10
<211> 70
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(70)
<400> 10
gacataatag gcaaattcga ttttgcctcc gcaggagtgt tttcatggaa attccgggga 60
tccgtcgacc 70
<210> 11
<211> 70
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(70)
<400> 11
cagcatctcc tgatcgctga gttccgccat tacaggcctc cgaacaacgc tgtaggctgg 60
agctgcttcg 70
<210> 12
<211> 70
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(70)
<400> 12
gaatggctgg ccagaatcag ccgtgaacgg gcggggcgct aatcatgctg attccgggga 60
tccgtcgacc 70
<210> 13
<211> 69
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(69)
<400> 13
ttgcccagtt catttatagc cacctgatta atcaggcggt tatcgacact gtaggctgga 60
gctgcttcg 69
<210> 14
<211> 70
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(70)
<400> 14
gacacgttag cagggtcaat cccacaataa aagaggcgat atcggtgaat attccgggga 60
tccgtcgacc 70
<210> 15
<211> 70
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(70)
<400> 15
actccacgcg gcaaaggcga gtaacggtat catcgttttt cctgccatcg tgtaggctgg 60
agctgcttcg 70
<210> 16
<211> 20
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(20)
<400> 16
cagtcatagc cgaatagcct 20
<210> 17
<211> 20
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(20)
<400> 17
cggtgccctg aatgaactgc 20
<210> 18
<211> 21
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(21)
<400> 18
cgctagtatc ggcataacca c 21
<210> 19
<211> 21
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(21)
<400> 19
gaatcgcgca gatagtgacc g 21
<210> 20
<211> 25
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(25)
<400> 20
gctacctctt ctgaagcctg tctgt 25
<210> 21
<211> 25
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(25)
<400> 21
atgggtgaag tactgaacga gcagt 25
<210> 22
<211> 25
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(25)
<400> 22
gatggatatg gcatgtaaag gcagg 25
<210> 23
<211> 25
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(25)
<400> 23
agcacgcgag aatctttcag cgcct 25
<210> 24
<211> 21
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(21)
<400> 24
gagcggcgag actgtgcatt a 21
<210> 25
<211> 20
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(20)
<400> 25
gcaacgccga tgacgcggta 20
<210> 26
<211> 27
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(27)
<400> 26
cttcattcag acgtttacat ttcatag 27
<210> 27
<211> 26
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(26)
<400> 27
catccatatc atggtgcgta tgctta 26
<210> 28
<211> 83
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(83)
<400> 28
gaattcctca ttaggcaccc caggctttac actttatgct tccggctcgt ataatgtgtg 60
gaaccactaa acactctagc ctc 83
<210> 29
<211> 28
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(28)
<400> 29
ctggatccag ttgtgaagcc atgtacac 28
<210> 30
<211> 37
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(37)
<400> 30
ctaggtacct ctggaaaggt gtacatggct tcacaac 37
<210> 31
<211> 35
<212> DNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(35)
<400> 31
tagaagctta actaccagcg ttttgccgcc tgctg 35
<210> 32
<211> 39
<212> DNA
<213> Streptomyces coelicolor
<220>
<221> Unsure
<222> (1)..(39)
<400> 32
gaagaggtga cgtcatggat ccgaacaaag gtgtaatgc 39
<210> 33
<211> 34
<212> DNA
<213> Streptomyces coelicolor
<220>
<221> Unsure
<222> (1)..(34)
<400> 33
ctaggatccg ccacgcgtag cggccctggt gtgt 34
<210> 34
<211> 33
<212> DNA
<213> Streptomyces coelicolor
<220>
<221> Unsure
<222> (1)..(33)
<400> 34
gtaggatcca cagcggtggg tacggacatg gcg 33
<210> 35
<211> 46
<212> DNA
<213> Streptomyces coelicolor
<220>
<221> Unsure
<222> (1)..(46)
<400> 35
taatacgact cactataggt ttttcgacag gtcatgagtg acagtc 46
<210> 36
<211> 30
<212> DNA
<213> Streptomyces coelicolor
<220>
<221> Unsure
<222> (1)..(30)
<400> 36
aggggtccgc gcttgccgtg gaccttgctg 30
<210> 37
<211> 16
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> Unsure
<222> (1)..(16)
<220>
<221> 5'UTR
<222> (1)..(16)
<400> 37
grycyrggyu gccrrr 16
<210> 38
<211> 20
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> stem_loop
<222> (1)..(20)
<220>
<221> misc_feature
<222> (1)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (16)..(20)
<223> n is a, c, g, or u
<400> 38
nnnnnrggac gaccynnnnn 20
<210> 39
<211> 14
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> stem_loop
<222> (1)..(14)
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (13)..(14)
<223> n is a, c, g, or u
<400> 39
nngggacgrc ccnn 14
<210> 40
<211> 32
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(32)
<220>
<221> misc_feature
<222> (6)..(7)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (10)..(11)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (26)..(26)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (28)..(29)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (31)..(32)
<223> n is a, c, g, or u
<400> 40
yygccnncyn nycgaggrgc gcugcnannr nn 32
<210> 41
<211> 23
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(23)
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (4)..(6)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (16)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (20)..(20)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (22)..(23)
<223> n is a, c, g, or u
<400> 41
nnynnncagg cucgrnnggn rnn 23
<210> 42
<211> 15
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(15)
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or u
<400> 42
nnyncaacgg cgcyc 15
<210> 43
<211> 53
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> stem_loop
<222> (1)..(53)
<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (10)..(11)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (16)..(18)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (36)..(36)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (41)..(44)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (50)..(50)
<223> n is a, c, g, or u
<400> 43
guangruyyn nugugnnngu gnynuuuuar ruugcnrccu nnnnrrryyn ucu 53
<210> 44
<211> 18
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> stem_loop
<222> (1)..(18)
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (11)..(11)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, or u
<400> 44
nuggcuuuuu nrrgyyan 18
<210> 45
<211> 18
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(18)
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or u
<400> 45
cggcyayuug ggyuynyr 18
<210> 46
<211> 43
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> stem_loop
<222> (1)..(43)
<220>
<221> misc_feature
<222> (11)..(11)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (36)..(36)
<223> n is a, c, g, or u
<400> 46
gcaugggryc nrrgyrrgcg cyraagcgcy racyyngryc gac 43
<210> 47
<211> 40
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(40)
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or u
<400> 47
yygcnauccg cyaancgguy nrgccguguc gcggaagguu 40
<210> 48
<211> 18
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(18)
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (10)..(12)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (16)..(18)
<223> n is a, c, g, or u
<400> 48
aaccnryurn nnyuynnn 18
<210> 49
<211> 18
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(18)
<220>
<221> misc_feature
<222> (1)..(3)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (7)..(7)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, or u
<400> 49
nnnrrrnrnn ggunagcg 18
<210> 50
<211> 23
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(23)
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, or u
<400> 50
urugyuauac unrruaangu ugy 23
<210> 51
<211> 19
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(19)
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (15)..(16)
<223> n is a, c, g, or u
<400> 51
ncgyyaaagg gaaannaug 19
<210> 52
<211> 47
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> 5'UTR
<222> (1)..(47)
<220>
<221> misc_feature
<222> (47)..(47)
<223> n is a, c, g, or u
<400> 52
rcaacccuug rugcuuaruu cccuuucayc aagayauuau acrrcgn 47
<210> 53
<211> 72
<212> RNA
<213> Desulfotomaculum reducens
<220>
<221> stem_loop
<222> (1)..(72)
<400> 53
ggcaaacuuu ccgaaaggaa aggacgcaaa gccacgggcc uaaggacauu gucuaugguc 60
cgggccgccu ua 72
<210> 54
<211> 103
<212> RNA
<213> Geobacter sulfurreducens
<220>
<221> stem_loop
<222> (1)..(103)
<400> 54
acuaaaccau ccgcgaggau ggggcggaaa gcccacaggg ucucacgaag acccggguug 60
ccgaacuauc acaccacgau agggcggcgg cccggcuuuu uuu 103
<210> 55
<211> 47
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> stem_loop
<222> (1)..(47)
<220>
<221> misc_feature
<222> (2)..(3)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (12)..(14)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (21)..(23)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (46)..(47)
<223> n is a, c, g, or u
<400> 55
annggcaaay ynnnygaaar nnnrrgrcgc aaagcyryng gycuann 47
<210> 56
<211> 19
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> stem_loop
<222> (1)..(19)
<220>
<221> misc_feature
<222> (3)..(3)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (8)..(9)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(19)
<223> n is a, c, g, or u
<400> 56
yangrycnnr gyugccrnn 19
<210> 57
<211> 42
<212> RNA
<213> Unknown
<220>
<223> Concenses sequence
<220>
<221> stem_loop
<222> (1)..(42)
<220>
<221> misc_feature
<222> (3)..(3)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (5)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (12)..(15)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (20)..(23)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (37)..(37)
<223> n is a, c, g, or u
<400> 57
aanrnyaaac cnnnngyran nnngggrcgn aaagccnygg gu 42
<210> 58
<211> 16
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(16)
<400> 58
gayccgggyu gccgaa 16
<210> 59
<211> 107
<212> RNA
<213> Vibrio cholerae
<220>
<221> 5'UTR
<222> (1)..(107)
<400> 59
ggaaaaaugu cacgcacagg gcaaaccauu cgaaagagug ggacgcaaag ccccggccua 60
aaccagaaga caugguaggu cgggguuacc gauggcaaaa ugcauac 107
<210> 60
<211> 25
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(25)
<220>
<221> misc_feature
<222> (1)..(4)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (23)..(25)
<223> n is a, c, g, or u
<400> 60
nnnnycgagg rgcgyugcrr crnnn 25
<210> 61
<211> 19
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(19)
<220>
<221> misc_feature
<222> (1)..(3)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (16)..(19)
<223> n is a, c, g, or u
<400> 61
nnnygycagg cucgrnnnn 19
<210> 62
<211> 21
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(21)
<220>
<221> misc_feature
<222> (1)..(7)
<223> n is a, c, g, or u
<400> 62
nnnnnnncaa cggcgcycry y 21
<210> 63
<211> 50
<212> RNA
<213> Dechloromonas aromatica
<220>
<221> 5'UTR
<222> (1)..(50)
<400> 63
ggucugccga ggagcgcugc gacccuuuaa uucgggggcc aggcucggca 50
<210> 64
<211> 18
<212> RNA
<213> Dechloromonas aromatica
<220>
<221> 5'UTR
<222> (1)..(18)
<400> 64
augaucaacg gcgcucgc 18
<210> 65
<211> 61
<212> RNA
<213> Pseudoalteromonas syringae
<220>
<221> 5'UTR
<222> (1)..(61)
<400> 65
ccguucccgc caccuguccg aggggcgcug cagcagguuu acccugucag gcucggaugg 60
g 61
<210> 66
<211> 86
<212> RNA
<213> Pseudoalteromonas syringae
<220>
<221> 5'UTR
<222> (1)..(86)
<400> 66
gcguuguuug ucgguugauc acagccggca agccuuaaac gcacaacggc gcccauucca 60
uuuuuaugga auggagacuc ucaaug 86
<210> 67
<211> 22
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> 5'UTR
<222> (1)..(22)
<220>
<221> misc_feature
<222> (2)..(3)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (5)..(6)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (8)..(8)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (10)..(10)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (17)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (19)..(19)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, or u
<400> 67
unngnnanan urrnaangnu gn 22
<210> 68
<211> 97
<212> RNA
<213> Streptococcus mutans
<220>
<221> Unsure
<222> (1)..(97)
<220>
<221> misc_feature
<222> (23)..(25)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (73)..(77)
<223> n is a, c, g, or u
<400> 68
uaugcuauac uggauaaguu gunnnacaac ccuuggugcu uauuucccuu ucaccaagca 60
uauuacaaac ggnnnnnccg uuaaaggaga aacaaug 97
<210> 69
<211> 97
<212> RNA
<213> Streptococcus pneumoniae R6
<220>
<221> Unsure
<222> (1)..(97)
<220>
<221> misc_feature
<222> (23)..(27)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (74)..(77)
<223> n is a, c, g, or u
<400> 69
ugugcuauac uaguaagguu gannnnnuca acccuuggug cuuagcuucu uucaccaagc 60
auauuacacg cggnnnnccg ccaaaggaga aaagaug 97
<210> 70
<211> 97
<212> RNA
<213> Streptococcus pneumoniae SP18-BS74
<220>
<221> Unsure
<222> (1)..(97)
<220>
<221> misc_feature
<222> (23)..(27)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (74)..(77)
<223> n is a, c, g, or u
<400> 70
ugugcuauac uaguaagguu gannnnnuca acccuuggug cuuagcuucu uucaccaagc 60
auauuacacg cggnnnnccg ccaaaggaga aaagaug 97
<210> 71
<211> 97
<212> RNA
<213> Streptococcus pneumoniae SP19-BS75
<220>
<221> Unsure
<222> (1)..(97)
<220>
<221> misc_feature
<222> (23)..(27)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (74)..(77)
<223> n is a, c, g, or u
<400> 71
ugugcuauac uaguaggguu gannnnngca acccuuggug cuuagcuucu uucaccaagc 60
auauuacacg cggnnnnccg ccaaaggaga aaagaug 97
<210> 72
<211> 97
<212> RNA
<213> Streptococcus pneumoniae SP6-BS73
<220>
<221> Unsure
<222> (1)..(97)
<220>
<221> misc_feature
<222> (23)..(27)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (74)..(77)
<223> n is a, c, g, or u
<400> 72
ugugcuauac uaguaggguu gannnnngca acccuuggug uuuagcuucu uucaccaagc 60
auauuacacg cggnnnnccg ccaaaggaga aaagaug 97
<210> 73
<211> 116
<212> RNA
<213> Streptococcus pyogenes
<220>
<221> Unsure
<222> (1)..(116)
<220>
<221> misc_feature
<222> (23)..(25)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (78)..(89)
<223> n is a, c, g, or u
<400> 73
uaugguacaa uguaaccguu gcnnngcaac ccuuggugcu uaguucccuu ucaccaagca 60
uauuagaaac guagauannn nnnnnnnnnu auccagacgu uaaaggagaa aaaaug 116
<210> 74
<211> 114
<212> RNA
<213> Streptococcus agalactiae 2630V/R
<220>
<221> Unsure
<222> (1)..(114)
<220>
<221> misc_feature
<222> (23)..(27)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (79)..(89)
<223> n is a, c, g, or u
<400> 74
ugugauauac uuaguaaguu gunnnnnaca acccuugaug cuuaguuccc uuucaucaag 60
cauauuacaa acguuagann nnnnnnnnnu cuaaacguua aaggagaaau uaug 114
<210> 75
<211> 114
<212> RNA
<213> Streptococcus agalactiae
<220>
<221> Unsure
<222> (1)..(114)
<220>
<221> misc_feature
<222> (23)..(27)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (79)..(89)
<223> n is a, c, g, or u
<400> 75
ugugauauac uuaguaaguu gunnnnnaca acccuugaug cuuaguuccc uuucaucaag 60
cauauuacaa acguuagann nnnnnnnnnu cuaaacguua aaggagaaau uaug 114
<210> 76
<211> 107
<212> RNA
<213> Streptococcus sanguis
<220>
<221> Unsure
<222> (1)..(107)
<220>
<221> misc_feature
<222> (25)..(34)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (83)..(87)
<223> n is a, c, g, or u
<400> 76
ugggggaauc aacuaaugau gcucnnnnnn nnnnaugcaa cccuuggcgc uuagcuucuu 60
ucgccaagca uauuacacgc ggnnnnnccg cuaaaggaga aaacaug 107
<210> 77
<211> 103
<212> RNA
<213> Streptococcus suis
<220>
<221> Unsure
<222> (1)..(103)
<220>
<221> misc_feature
<222> (26)..(32)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (79)..(84)
<223> n is a, c, g, or u
<400> 77
uaugcuauac uaaucaacgu uguugnnnnn nncaaugacc cuuggggcuu gcucacuuua 60
cccaagcaua uuuuaagcnn nnnngcuaaa ggagaauuuu aug 103
<210> 78
<211> 107
<212> RNA
<213> Lactococcus lactis subsp. lactis
<220>
<221> Unsure
<222> (1)..(107)
<220>
<221> misc_feature
<222> (25)..(31)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (81)..(86)
<223> n is a, c, g, or u
<400> 78
ucugcuaaaa uaaaaacguu gcucnnnnnn ngaguuaacc cuugagccuu caucccuuug 60
cucaagcaua uuauaggcga nnnnnnucgc caaaggagaa ccuuuug 107
<210> 79
<211> 108
<212> RNA
<213> Lactococcus lactis subsp. cremoris SK11
<220>
<221> Unsure
<222> (1)..(108)
<220>
<221> misc_feature
<222> (25)..(31)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (82)..(87)
<223> n is a, c, g, or u
<400> 79
ucuguuaaaa uaaaaacguu gcucnnnnnn ngagucaacc cuugagccuu cuucccuuug 60
cucaagcaua uuaaacgcga cnnnnnnucg ccaaaggaga guauuuug 108
<210> 80
<211> 99
<212> RNA
<213> Lactobacillus casei
<220>
<221> Unsure
<222> (1)..(99)
<220>
<221> misc_feature
<222> (24)..(27)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (75)..(77)
<223> n is a, c, g, or u
<400> 80
acaccaaaac ugaaaacgga aggnnnnccu uccacgacga uacuuacuuu ccuuugaucg 60
ucguuacuac uggcnnngcc acaaaggaga acaaacaug 99
<210> 81
<211> 24
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(24)
<220>
<221> misc_feature
<222> (4)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (7)..(8)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (10)..(10)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (19)..(19)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, or u
<400> 81
ggunngnnan anurrnaang nugn 24
<210> 82
<211> 46
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(46)
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (26)..(27)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (42)..(44)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (46)..(46)
<223> n is a, c, g, or u
<400> 82
nyracccuug rnrcuurnuy ycuuunnyca agcauauuay annngn 46
<210> 83
<211> 19
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(19)
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (3)..(4)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (14)..(16)
<223> n is a, c, g, or u
<400> 83
ncnnyaaagg gaannnaug 19
<210> 84
<211> 104
<212> RNA
<213> Streptococcus pneumoniae
<220>
<221> Unsure
<222> (1)..(104)
<400> 84
ggugugcuau acuaguaagg uugaaugaau caacccuugg ugcuuagcuu cuuucaccaa 60
gcauauuaca cgcggauaac cgccaaagga gaaaagaugu uuuu 104
<210> 85
<211> 74
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> Unsure
<222> (1)..(74)
<400> 85
gguugaauga aucaacccuu ggugcuuagc uucuuucacc aagcauauua cacgcggaua 60
accgccaaag gaga 74
<210> 86
<211> 10
<212> RNA
<213> Unknown
<220>
<223> Consensus sequences
<220>
<221> stem_loop
<222> (1)..(10)
<400> 86
ucguuugagy 10
<210> 87
<211> 13
<212> RNA
<213> Pseudoalteromonas syringae
<220>
<221> 5'UTR
<222> (1)..(13)
<400> 87
gucccauuug gac 13
<210> 88
<211> 18
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(18)
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (10)..(10)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, or u
<400> 88
nrgcrgayun aucygcyn 18
<210> 89
<211> 29
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> Unsure
<222> (1)..(27)
<220>
<221> Unsure
<222> (1)..(29)
<220>
<221> misc_feature
<222> (1)..(3)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (13)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (25)..(29)
<223> n is a, c, g, or u
<400> 89
nnncuccgag cynnnnnryc uanrnnnnn 29
<210> 90
<211> 25
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> Unsure
<222> (1)..(25)
<220>
<221> misc_feature
<222> (1)..(5)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (11)..(14)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (21)..(25)
<223> n is a, c, g, or u
<400> 90
nnnnnyaygg nnnnynrgcc nnnnn 25
<210> 91
<211> 54
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> Unsure
<222> (1)..(54)
<220>
<221> misc_feature
<222> (1)..(7)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (12)..(17)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (25)..(29)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (37)..(41)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (50)..(50)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (52)..(54)
<223> n is a, c, g, or u
<400> 91
nnnnnnnggg unnnnnnrga aayynnnnng ccucccnnnn nuggaaaggn gnnn 54
<210> 92
<211> 140
<212> RNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(140)
<400> 92
ggaaccacua aacaccuagc cucugcaccu gggucaacug auacggugcu uuggccguga 60
caaugcucgu aaagauugcc accagggcga aggaagaaau gaacuucgcc ucccguaucu 120
ggaaaggugu acauggcuuc 140
<210> 93
<211> 26
<212> RNA
<213> Escherichia coli
<220>
<221> Unsure
<222> (1)..(26)
<400> 93
gugacaaugc ucguaaagau ugccac 26
<210> 94
<211> 47
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(47)
<220>
<221> misc_feature
<222> (7)..(7)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (30)..(30)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (35)..(35)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, or u
<400> 94
cuuaucnaga gnggyngagg gaynggcccn ryganrccnc rgcaacc 47
<210> 95
<211> 15
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(15)
<220>
<221> misc_feature
<222> (9)..(9)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, or u
<400> 95
ggugcyaanu ccnrc 15
<210> 96
<211> 10
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(10)
<400> 96
grragaurag 10
<210> 97
<211> 84
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(84)
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (31)..(31)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (50)..(51)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (59)..(59)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (75)..(75)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (80)..(80)
<223> n is a, c, g, or u
<400> 97
ggucaygagy rycagcrnya agccccggcu ngcugrycgg caacccuccn nycgcggyng 60
ggugccccgg gugangaccn ggyy 84
<210> 98
<211> 14
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> stem_loop
<222> (1)..(14)
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or u
<400> 98
ggcaagygcg rnyy 14
<210> 99
<211> 132
<212> RNA
<213> Streptomyces coelicolor
<220>
<221> Unsure
<222> (1)..(132)
<400> 99
gguuuuucga caggucauga gugacaguca ugaggccccg gccgacuguc cggcaacccu 60
ccguccgugg cggggugccc cgggugaaga ccaggucgug gacagcaagg uccacggcaa 120
gcgcggaccc cu 132
<210> 100
<211> 132
<212> RNA
<213> Unknown
<220>
<223> Consesus sequence
<220>
<221> Unsure
<222> (1)..(132)
<400> 100
gguuuuucga caggucauga gugacaguca ugaggccccg gccgacuguc cggcaacccu 60
ccguccgugg cggggugccc cgggugaaga ccaggucgug gacagcaagg uccacggcaa 120
gcgcggaccc cu 132
<210> 101
<211> 49
<212> RNA
<213> Unknown
<220>
<223> Concensus sequence
<220>
<221> Unsure
<222> (1)..(49)
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (7)..(7)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (20)..(21)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (29)..(30)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (45)..(47)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (49)..(49)
<223> n is a, c, g, or u
<400> 101
nnyracnccu ugrnrcuurn nuyycuuunn ycaagcauau uayannngn 49
<210> 102
<211> 20
<212> RNA
<213> Unknown
<220>
<223> Consensus sequence
<220>
<221> Unsure
<222> (1)..(20)
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (3)..(4)
<223> n is a, c, g, or u
<220>
<221> misc_feature
<222> (15)..(17)
<223> n is a, c, g, or u
<400> 102
ncnnyaaagg agaannnaug 20
Claims (28)
- 코딩 영역에 작동가능하게 연결된 리보스위치(riboswitch)를 포함하는 RNA를 코딩하는 핵산 분자를 포함하는 조절가능한 유전자 발현 구축물(construct)로서, 상기 리보스위치 및 상기 코딩 영역이 이종 영역이고, 이때 상기 리보스위치가 사이클릭 다이-구아노신 모노포스페이트(GMP)-반응성 리보스위치, S-아데노실호모시스테인(SAH)-반응성 리보스위치, 프리-쿠에오오신1(pre-queuosine1; preQ1)-반응성 리보스위치, 몰리브데늄 보조인자(Moco)-반응성 리보스위치 또는 S-아데노실메티오닌(SAM)-반응성 리보스위치인, 조절가능한 유전자 발현 구축물.
- 제1항에 있어서,리보스위치가 앱타머(aptamer) 도메인 및 발현 플랫폼(platform) 도메인을 포함하고, 이때 상기 앱타머 도메인 및 상기 발현 플랫폼 도메인이 이종 도메인인, 조절가능한 유전자 발현 구축물.
- 제1항에 있어서,리보스위치가 2개 이상의 앱타머 도메인 및 발현 플랫폼 도메인을 포함하고, 이때 상기 앱타머 도메인 중 1개 이상의 앱타머 도메인 및 상기 발현 플랫폼 도메인이 이종 도메인인, 조절가능한 유전자 발현 구축물.
- 제3항에 있어서,앱타머 도메인 중 2개 이상의 앱타머 도메인이 상호협동적(cooperative) 결합을 나타내는, 조절가능한 유전자 발현 구축물.
- 천연 발생적 리보스위치의 비-천연 유도체이며 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치인 리보스위치.
- 제5항에 있어서,앱타머 도메인 및 발현 플랫폼 도메인을 포함하고, 이때 상기 앱타머 도메인 및 상기 발현 플랫폼 도메인이 이종 도메인인, 리보스위치.
- 제6항에 있어서,환경, 막 및 운동성에 대한 유전자(GEMM) 모티프(motif), SAH 모티프, preQ1-II 모티프, Moco 모티프 또는 SAM-IV 모티프를 포함하는 리보스위치.
- 제5항에 있어서,유발 분자에 의해 활성화되고, 상기 유발 분자에 의해 활성화되었을 때 신호를 발 생시키는 리보스위치.
- 제1항에 있어서,리보스위치가 도 1의 컨센서스(consensus) 구조 또는 도 3의 컨센서스 구조를 갖는, 조절가능한 유전자 발현 구축물.
- 제1항에 있어서,리보스위치가 앱타머 도메인 및 발현 플랫폼 도메인을 포함하고, 이때 상기 앱타머 도메인이 천연 발생적 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치로부터 유래된 것인, 조절가능한 유전자 발현 구축물.
- 제10항에 있어서,앱타머 도메인이 천연 발생적 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치의 앱타머 도메인인, 조절가능한 유전자 발현 구축물.
- 제10항에 있어서,앱타머 도메인이 천연 발생적 리보스위치의 앱타머 도메인의 컨센서스 구조를 갖 는, 조절가능한 유전자 발현 구축물.
- 제10항에 있어서,앱타머 도메인이 천연 발생적 리보스위치의 염기쌍 보존적 변이만으로 구성되는, 조절가능한 유전자 발현 구축물.
- 샘플을 리보스위치와 접촉시키는 단계를 포함하는, 상기 리보스위치를 활성화시키는 목적 화합물을 검출하는 방법으로서, 이때 상기 리보스위치가, 상기 샘플이 상기 목적 화합물을 함유하는 경우 상기 목적 화합물에 의해 활성화되었을 때 신호를 발생시키고, 상기 리보스위치가 사이클릭 다이-GMP-반응성 리보스위치 또는 이의 유도체, SAH-반응성 리보스위치 또는 이의 유도체, preQ1-반응성 리보스위치 또는 이의 유도체, Moco-반응성 리보스위치 또는 이의 유도체, 또는 SAM-반응성 리보스위치 또는 이의 유도체인, 방법.
- 제14항에 있어서,리보스위치가 목적 화합물에 의해 활성화되었을 때 구조를 변화시키고, 이때 구조의 변화가 구조 의존적 표지(label)를 통해 신호를 발생시키는, 방법.
- 제14항에 있어서,리보스위치가 목적 화합물에 의해 활성화되었을 때 구조를 변화시키고, 이때 구조의 변화가 리보스위치에 연결된 RNA의 발현 변화를 야기하고, 상기 RNA의 발현 변화가 신호를 발생시키는, 방법.
- 제16항에 있어서,신호가 리보스위치에 연결된 RNA로부터 발현된 레포터(reporter) 단백질에 의해 발생되는, 방법.
- (a) 리보스위치를 포함하는 RNA를 코딩하는 유전자의 유전자 발현의 변화에 대해 화합물을 시험하는 단계로서, 이때 상기 변화가 상기 리보스위치를 통해 일어나고, 상기 리보스위치가 사이클릭 다이-GMP-반응성 리보스위치 또는 이의 유도체, SAH-반응성 리보스위치 또는 이의 유도체, preQ1-반응성 리보스위치 또는 이의 유도체, Moco-반응성 리보스위치 또는 이의 유도체, 또는 SAM-반응성 리보스위치 또는 이의 유도체인, 단계; 및(b) 단계 (a)에서 유전자 발현을 변화시키는 화합물을 세포와 접촉시켜 유전자 발현을 변화시키는 단계로서, 이때 상기 세포가 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물이 상기 리보스위치와의 결합을 통해 상기 유전자의 발현을 억제하는, 단계를 포함하는 방법.
- RNA 분자의 인-라인(in-line) 천연 발생적 절단을, 상기 RNA 분자를 코딩하는 유전자를 조절하는 화합물의 존재 및 부재 하에서 평가하는 단계를 포함하는 리보스위치의 동정 방법으로서, 이때 상기 RNA 분자의 인-라인 천연 발생적 절단 패턴의 변화가 리보스위치를 표시하고, 이때 (a) 상기 RNA 분자가 사이클릭 다이-GMP-반응성 리보스위치 또는 이의 유도체를 포함하고, 상기 화합물이 사이클릭 다이-GMP이거나, (b) 상기 RNA 분자가 SAH-반응성 리보스위치 또는 이의 유도체를 포함하고, 상기 화합물이 SAH이거나, (c) 상기 RNA 분자가 preQ1-반응성 리보스위치 또는 이의 유도체를 포함하고, 상기 화합물이 preQ1이거나, 또는 (d) 상기 RNA 분자가 Moco-반응성 리보스위치 또는 이의 유도체, 또는 SAM-반응성 리보스위치 또는 이의 유도체를 포함하는, 동정 방법.
- 화합물을 세포와 접촉시키는 단계를 포함하는, 유전자 발현을 변화시키는 방법으로서, 이때 상기 세포가 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치를 포함하는 RNA를 코딩하는 유전자를 포함하고, 상기 화합물이 사이클릭 다이-GMP-반응성 리보스위치, SAH-반응성 리보스위치, preQ1-반응성 리보스위치, Moco-반응성 리보스위치 또는 SAM-반응성 리보스위치와의 결합을 통해 상기 유전자의 발현을 변화시키는, 방법.
- 제20항에 있어서,세포가 변화된 유전자 발현이 필요한 세포로서 동정된 세포인, 방법.
- 제20항에 있어서,세포가 세균 세포인, 방법.
- 제22항에 있어서,화합물이 세균 세포를 사멸시키거나 세균 세포의 생장을 억제하는, 방법.
- 제20항에 있어서,화합물과 세포를, 상기 화합물을 개체(subject)에게 투여함으로써 접촉시키는, 방법.
- 제24항에 있어서,세포가 개체 내의 세균 세포이고, 화합물이 상기 세균 세포를 사멸시키거나 상기 세균 세포의 생장을 억제하는, 방법.
- 제25항에 있어서,개체가 세균에 감염된 개체인, 방법.
- 제20항에 있어서,화합물을 또 다른 항생제 화합물과 함께 투여하는, 방법.
- 제20항에 있어서,화합물이 생체막(biofilm)에서의 세균 생장을 억제하는, 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US93211207P | 2007-05-29 | 2007-05-29 | |
US60/932,112 | 2007-05-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20100017905A true KR20100017905A (ko) | 2010-02-16 |
Family
ID=40156887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097026872A Withdrawn KR20100017905A (ko) | 2007-05-29 | 2008-05-29 | 리보스위치, 리보스위치의 사용 방법 및 리보스위치를 함유하는 조성물 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20100286082A1 (ko) |
EP (3) | EP2164996A4 (ko) |
JP (1) | JP2010528617A (ko) |
KR (1) | KR20100017905A (ko) |
CN (1) | CN101849020A (ko) |
AU (1) | AU2008266684A1 (ko) |
CA (1) | CA2688575A1 (ko) |
MX (1) | MX2009012773A (ko) |
SG (2) | SG174104A1 (ko) |
WO (1) | WO2008156987A2 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013191473A1 (ko) * | 2012-06-20 | 2013-12-27 | 포항공과대학교 산학협력단 | 리보스위치를 이용한 l-트립토판 고생산균 스크리닝 방법 |
US9493767B2 (en) | 2012-06-20 | 2016-11-15 | Postech Academy-Industry Foundation | Method for screening for high L-tryptophan producing microorganisms using riboswitch |
WO2020159182A1 (ko) * | 2019-01-29 | 2020-08-06 | 포항공과대학교 산학협력단 | 리보스위치를 이용한 카프로락탐 고생산균 스크리닝 방법 |
KR102309424B1 (ko) * | 2020-09-28 | 2021-10-07 | 한국생명공학연구원 | 나노포어를 이용한 리보스위치-표적 물질의 스크리닝 방법 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100017893A (ko) * | 2007-05-29 | 2010-02-16 | 예일 유니버시티 | 택일적 스플라이싱 및 rna 프로세싱을 조절하는 리보스위치와 관련된 방법 및 조성물 |
US20120107331A1 (en) * | 2009-05-15 | 2012-05-03 | Yale University | Gemm riboswitches, structure-based compound design with gemm riboswitches, and methods and compositions for use of and with gemm riboswitches |
WO2010141085A1 (en) * | 2009-06-02 | 2010-12-09 | Biorelix Pharmaceuticals, Inc. | Methods for screening and identifying compounds |
WO2011088076A2 (en) * | 2010-01-12 | 2011-07-21 | Yale University | Structured rna motifs and compounds and methods for their use |
US20130143955A1 (en) * | 2010-08-09 | 2013-06-06 | Yale University | Cyclic di-GMP-II Riboswitches, Motifs, and Compounds, and Methods for Their Use |
WO2012032522A1 (en) * | 2010-09-07 | 2012-03-15 | Yeda Research And Development Co. Ltd. | Thiamine pyrophosphate (tpp) riboswitch mutants producing vitamin b1 enriched food and feed crops |
US9303057B2 (en) * | 2011-04-29 | 2016-04-05 | Cornell University | Methods and reagents for analyzing riboswitches using FRET |
US10392622B2 (en) | 2014-08-01 | 2019-08-27 | The Trustees Of The University Of Pennsylvania | Compositions and methods for self-regulated inducible gene expression |
WO2016115473A1 (en) * | 2015-01-15 | 2016-07-21 | Mayo Foundation For Medical Education And Research | Methods of treating neurological inflammatory disorders |
WO2017074955A1 (en) * | 2015-10-27 | 2017-05-04 | The Regents Of The University Of California | Fluorescent biosensor for methyltransferase assay |
US10988759B2 (en) | 2016-01-15 | 2021-04-27 | University Of Washington | High throughput protein-protein interaction screening in yeast liquid culture |
US11325948B2 (en) | 2016-03-19 | 2022-05-10 | Exuma Biotech Corp. | Methods and compositions for genetically modifying lymphocytes to express polypeptides comprising the intracellular domain of MPL |
BR112018069075A2 (pt) * | 2016-03-19 | 2019-01-29 | F1 Oncology Inc | métodos e composições para transduzir linfócitos e expansão regulada dos mesmos |
US11111505B2 (en) | 2016-03-19 | 2021-09-07 | Exuma Biotech, Corp. | Methods and compositions for transducing lymphocytes and regulating the activity thereof |
WO2018071732A1 (en) * | 2016-10-12 | 2018-04-19 | Verrix, Llc | Systems and methods for sterility assurance |
MY205553A (en) * | 2016-12-12 | 2024-10-25 | Univ Colorado Regents | Use of biological rna scaffolds with in vitro selection to generate robust small molecule binding aptamers for genetically encodable biosensors |
SG11201908043UA (en) * | 2017-03-02 | 2019-09-27 | Meiragtx Uk Ii Limited | Regulation of gene expression by aptamer-modulated rnase p cleavage |
EP4389894A3 (en) | 2017-03-10 | 2024-08-28 | The Medical College of Wisconsin, Inc. | Riboswitch modulated gene therapy for retinal diseases |
WO2018226666A1 (en) * | 2017-06-05 | 2018-12-13 | Maumita Mandal | Methods, compositions, and devices involving pseudoknot formation |
CA3072614A1 (en) | 2017-09-18 | 2019-03-21 | Futuragene Israel Ltd. | Tissue-specific expression control of della polypeptides |
GB201901166D0 (en) * | 2019-01-28 | 2019-03-20 | Univ Nottingham | Genetic construct and uses thereof |
CN110184326B (zh) * | 2019-05-13 | 2022-07-01 | 华侨大学 | 一种tpp核糖开关序列引物和肠道菌群分类方法 |
WO2021102153A1 (en) * | 2019-11-19 | 2021-05-27 | The Regents Of The University Of California | Structure-based design of therapeutics targeting rna hairpin loops |
CA3180716A1 (en) * | 2020-06-01 | 2021-12-09 | David Younger | Methods for characterizing and engineering protein-protein interactions |
CN114085834A (zh) * | 2021-11-16 | 2022-02-25 | 珠海中科先进技术研究院有限公司 | 一种癌细胞导向电路组及应用 |
US11820983B2 (en) | 2021-12-13 | 2023-11-21 | Labsimply, Inc. | Tuning cascade assay kinetics via molecular design |
CN114627557B (zh) * | 2022-03-22 | 2024-05-31 | 厦门大学 | 基于时空流形轨迹建图的3d骨架动作识别方法 |
US11965205B1 (en) * | 2022-10-14 | 2024-04-23 | Vedabio, Inc. | Detection of nucleic acid and non-nucleic acid target molecules |
US12060602B2 (en) | 2023-01-10 | 2024-08-13 | Vedabio, Inc. | Sample splitting for multiplexed detection of nucleic acids without amplification |
Family Cites Families (120)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US360257A (en) * | 1887-03-29 | Malt-drier | ||
US20040A (en) * | 1858-04-27 | Ebog fob bailboad-cbossibrgs | ||
US320308A (en) * | 1885-06-16 | Process of separating and cooling a sealing or lubricating liquid in apparatus | ||
GB981458A (en) | 1961-12-04 | 1965-01-27 | Wellcome Found | Pyrrolo[2,3-d]pyrimidines |
FR1601438A (ko) | 1968-10-17 | 1970-08-24 | ||
US3687808A (en) * | 1969-08-14 | 1972-08-29 | Univ Leland Stanford Junior | Synthetic polynucleotides |
US4469863A (en) | 1980-11-12 | 1984-09-04 | Ts O Paul O P | Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof |
CA1190838A (en) | 1981-07-17 | 1985-07-23 | Cavit Akin | Homogeneous nucleic acid hybridization diagnostics by non-radiative energy transfer |
US5023243A (en) | 1981-10-23 | 1991-06-11 | Molecular Biosystems, Inc. | Oligonucleotide therapeutic agent and method of making same |
US4476301A (en) * | 1982-04-29 | 1984-10-09 | Centre National De La Recherche Scientifique | Oligonucleotides, a process for preparing the same and their application as mediators of the action of interferon |
US5118800A (en) * | 1983-12-20 | 1992-06-02 | California Institute Of Technology | Oligonucleotides possessing a primary amino group in the terminal nucleotide |
US5550111A (en) * | 1984-07-11 | 1996-08-27 | Temple University-Of The Commonwealth System Of Higher Education | Dual action 2',5'-oligoadenylate antiviral derivatives and uses thereof |
FR2567892B1 (fr) | 1984-07-19 | 1989-02-17 | Centre Nat Rech Scient | Nouveaux oligonucleotides, leur procede de preparation et leurs applications comme mediateurs dans le developpement des effets des interferons |
US5367066A (en) | 1984-10-16 | 1994-11-22 | Chiron Corporation | Oligonucleotides with selectably cleavable and/or abasic sites |
FR2575751B1 (fr) | 1985-01-08 | 1987-04-03 | Pasteur Institut | Nouveaux nucleosides de derives de l'adenosine, leur preparation et leurs applications biologiques |
US5185444A (en) | 1985-03-15 | 1993-02-09 | Anti-Gene Deveopment Group | Uncharged morpolino-based polymers having phosphorous containing chiral intersubunit linkages |
US5166315A (en) | 1989-12-20 | 1992-11-24 | Anti-Gene Development Group | Sequence-specific binding polymers for duplex nucleic acids |
US5034506A (en) | 1985-03-15 | 1991-07-23 | Anti-Gene Development Group | Uncharged morpholino-based polymers having achiral intersubunit linkages |
US5235033A (en) | 1985-03-15 | 1993-08-10 | Anti-Gene Development Group | Alpha-morpholino ribonucleoside derivatives and polymers thereof |
US5405938A (en) * | 1989-12-20 | 1995-04-11 | Anti-Gene Development Group | Sequence-specific binding polymers for duplex nucleic acids |
US4683202A (en) * | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4683195A (en) * | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
DE3681787D1 (de) * | 1985-07-05 | 1991-11-07 | Whitehead Biomedical Inst | Expression von fremdem genetischem material in epithelzellen. |
US4980286A (en) | 1985-07-05 | 1990-12-25 | Whitehead Institute For Biomedical Research | In vivo introduction and expression of foreign genetic material in epithelial cells |
US4800159A (en) * | 1986-02-07 | 1989-01-24 | Cetus Corporation | Process for amplifying, detecting, and/or cloning nucleic acid sequences |
US4987071A (en) * | 1986-12-03 | 1991-01-22 | University Patents, Inc. | RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods |
US5276019A (en) | 1987-03-25 | 1994-01-04 | The United States Of America As Represented By The Department Of Health And Human Services | Inhibitors for replication of retroviruses and for the expression of oncogene products |
US5264423A (en) | 1987-03-25 | 1993-11-23 | The United States Of America As Represented By The Department Of Health And Human Services | Inhibitors for replication of retroviruses and for the expression of oncogene products |
DE3851889T2 (de) | 1987-06-24 | 1995-04-13 | Florey Howard Inst | Nukleosid-derivate. |
US5188897A (en) | 1987-10-22 | 1993-02-23 | Temple University Of The Commonwealth System Of Higher Education | Encapsulated 2',5'-phosphorothioate oligoadenylates |
US4924624A (en) * | 1987-10-22 | 1990-05-15 | Temple University-Of The Commonwealth System Of Higher Education | 2,',5'-phosphorothioate oligoadenylates and plant antiviral uses thereof |
ATE152169T1 (de) | 1988-02-05 | 1997-05-15 | Whitehead Biomedical Inst | Modifizierte hepatozyten und deren anwendung |
EP0406309A4 (en) | 1988-03-25 | 1992-08-19 | The University Of Virginia Alumni Patents Foundation | Oligonucleotide n-alkylphosphoramidates |
US5278302A (en) | 1988-05-26 | 1994-01-11 | University Patents, Inc. | Polynucleotide phosphorodithioates |
US5216141A (en) | 1988-06-06 | 1993-06-01 | Benner Steven A | Oligonucleotide analogs containing sulfur linkages |
US5175273A (en) | 1988-07-01 | 1992-12-29 | Genentech, Inc. | Nucleic acid intercalating agents |
JP3082204B2 (ja) | 1988-09-01 | 2000-08-28 | ホワイトヘッド・インスティチュート・フォー・バイオメディカル・リサーチ | 両栄養性および環境栄養性宿主域を持つ組換え体レトロウイルス |
US5134066A (en) | 1989-08-29 | 1992-07-28 | Monsanto Company | Improved probes using nucleosides containing 3-dezauracil analogs |
US5591722A (en) | 1989-09-15 | 1997-01-07 | Southern Research Institute | 2'-deoxy-4'-thioribonucleosides and their antiviral activity |
US5399676A (en) | 1989-10-23 | 1995-03-21 | Gilead Sciences | Oligonucleotides with inverted polarity |
US5264562A (en) | 1989-10-24 | 1993-11-23 | Gilead Sciences, Inc. | Oligonucleotide analogs with novel linkages |
US5264564A (en) | 1989-10-24 | 1993-11-23 | Gilead Sciences | Oligonucleotide analogs with novel linkages |
DE69033495T2 (de) | 1989-10-24 | 2000-07-20 | Isis Pharmaceuticals, Inc. | 2'-modifizierte nukleotide |
US5177198A (en) | 1989-11-30 | 1993-01-05 | University Of N.C. At Chapel Hill | Process for preparing oligoribonucleoside and oligodeoxyribonucleoside boranophosphates |
US5130302A (en) | 1989-12-20 | 1992-07-14 | Boron Bilogicals, Inc. | Boronated nucleoside, nucleotide and oligonucleotide compounds, compositions and methods for using same |
US5646265A (en) * | 1990-01-11 | 1997-07-08 | Isis Pharmceuticals, Inc. | Process for the preparation of 2'-O-alkyl purine phosphoramidites |
US5681941A (en) | 1990-01-11 | 1997-10-28 | Isis Pharmaceuticals, Inc. | Substituted purines and oligonucleotide cross-linking |
US5587361A (en) | 1991-10-15 | 1996-12-24 | Isis Pharmaceuticals, Inc. | Oligonucleotides having phosphorothioate linkages of high chiral purity |
US5670633A (en) * | 1990-01-11 | 1997-09-23 | Isis Pharmaceuticals, Inc. | Sugar modified oligonucleotides that detect and modulate gene expression |
US5459255A (en) | 1990-01-11 | 1995-10-17 | Isis Pharmaceuticals, Inc. | N-2 substituted purines |
US5321131A (en) | 1990-03-08 | 1994-06-14 | Hybridon, Inc. | Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling |
US5470967A (en) | 1990-04-10 | 1995-11-28 | The Dupont Merck Pharmaceutical Company | Oligonucleotide analogs with sulfamate linkages |
GB9009980D0 (en) | 1990-05-03 | 1990-06-27 | Amersham Int Plc | Phosphoramidite derivatives,their preparation and the use thereof in the incorporation of reporter groups on synthetic oligonucleotides |
ES2116977T3 (es) * | 1990-05-11 | 1998-08-01 | Microprobe Corp | Soportes solidos para ensayos de hibridacion de acidos nucleicos y metodos para inmovilizar oligonucleotidos de modo covalente. |
US5602240A (en) * | 1990-07-27 | 1997-02-11 | Ciba Geigy Ag. | Backbone modified oligonucleotide analogs |
US5608046A (en) * | 1990-07-27 | 1997-03-04 | Isis Pharmaceuticals, Inc. | Conjugated 4'-desmethyl nucleoside analog compounds |
US5489677A (en) | 1990-07-27 | 1996-02-06 | Isis Pharmaceuticals, Inc. | Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms |
US5610289A (en) | 1990-07-27 | 1997-03-11 | Isis Pharmaceuticals, Inc. | Backbone modified oligonucleotide analogues |
US5541307A (en) * | 1990-07-27 | 1996-07-30 | Isis Pharmaceuticals, Inc. | Backbone modified oligonucleotide analogs and solid phase synthesis thereof |
US5677437A (en) | 1990-07-27 | 1997-10-14 | Isis Pharmaceuticals, Inc. | Heteroatomic oligonucleoside linkages |
US5618704A (en) | 1990-07-27 | 1997-04-08 | Isis Pharmacueticals, Inc. | Backbone-modified oligonucleotide analogs and preparation thereof through radical coupling |
US5614617A (en) | 1990-07-27 | 1997-03-25 | Isis Pharmaceuticals, Inc. | Nuclease resistant, pyrimidine modified oligonucleotides that detect and modulate gene expression |
US5623070A (en) | 1990-07-27 | 1997-04-22 | Isis Pharmaceuticals, Inc. | Heteroatomic oligonucleoside linkages |
DE69115702T2 (de) | 1990-08-03 | 1996-06-13 | Sterling Winthrop Inc | Verbindungen und verfahren zur unterdrückung der genexpression |
US5177196A (en) | 1990-08-16 | 1993-01-05 | Microprobe Corporation | Oligo (α-arabinofuranosyl nucleotides) and α-arabinofuranosyl precursors thereof |
US5214134A (en) | 1990-09-12 | 1993-05-25 | Sterling Winthrop Inc. | Process of linking nucleosides with a siloxane bridge |
US5561225A (en) | 1990-09-19 | 1996-10-01 | Southern Research Institute | Polynucleotide analogs containing sulfonate and sulfonamide internucleoside linkages |
WO1992005186A1 (en) * | 1990-09-20 | 1992-04-02 | Gilead Sciences | Modified internucleoside linkages |
US5432272A (en) | 1990-10-09 | 1995-07-11 | Benner; Steven A. | Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases |
US5455166A (en) * | 1991-01-31 | 1995-10-03 | Becton, Dickinson And Company | Strand displacement amplification |
US5539082A (en) | 1993-04-26 | 1996-07-23 | Nielsen; Peter E. | Peptide nucleic acids |
US5719262A (en) | 1993-11-22 | 1998-02-17 | Buchardt, Deceased; Ole | Peptide nucleic acids having amino acid side chains |
US5714331A (en) | 1991-05-24 | 1998-02-03 | Buchardt, Deceased; Ole | Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility |
DE4216134A1 (de) * | 1991-06-20 | 1992-12-24 | Europ Lab Molekularbiolog | Synthetische katalytische oligonukleotidstrukturen |
US5571799A (en) | 1991-08-12 | 1996-11-05 | Basco, Ltd. | (2'-5') oligoadenylate analogues useful as inhibitors of host-v5.-graft response |
EP0538194B1 (de) | 1991-10-17 | 1997-06-04 | Novartis AG | Bicyclische Nukleoside, Oligonukleotide, Verfahren zu deren Herstellung und Zwischenprodukte |
US5594121A (en) * | 1991-11-07 | 1997-01-14 | Gilead Sciences, Inc. | Enhanced triple-helix and double-helix formation with oligomers containing modified purines |
US5484908A (en) | 1991-11-26 | 1996-01-16 | Gilead Sciences, Inc. | Oligonucleotides containing 5-propynyl pyrimidines |
US5359044A (en) | 1991-12-13 | 1994-10-25 | Isis Pharmaceuticals | Cyclobutyl oligonucleotide surrogates |
FR2687679B1 (fr) | 1992-02-05 | 1994-10-28 | Centre Nat Rech Scient | Oligothionucleotides. |
US5633360A (en) | 1992-04-14 | 1997-05-27 | Gilead Sciences, Inc. | Oligonucleotide analogs capable of passive cell membrane permeation |
US5434257A (en) | 1992-06-01 | 1995-07-18 | Gilead Sciences, Inc. | Binding compentent oligomers containing unsaturated 3',5' and 2',5' linkages |
EP0577558A2 (de) | 1992-07-01 | 1994-01-05 | Ciba-Geigy Ag | Carbocyclische Nukleoside mit bicyclischen Ringen, Oligonukleotide daraus, Verfahren zu deren Herstellung, deren Verwendung und Zwischenproduckte |
US5297721A (en) * | 1992-11-19 | 1994-03-29 | Fry's Metals, Inc. | No-clean soldering flux and method using the same |
US5476925A (en) | 1993-02-01 | 1995-12-19 | Northwestern University | Oligodeoxyribonucleotides including 3'-aminonucleoside-phosphoramidate linkages and terminal 3'-amino groups |
GB9304618D0 (en) | 1993-03-06 | 1993-04-21 | Ciba Geigy Ag | Chemical compounds |
EP0691968B1 (en) | 1993-03-30 | 1997-07-16 | Sanofi | Acyclic nucleoside analogs and oligonucleotide sequences containing them |
HU9501974D0 (en) | 1993-03-31 | 1995-09-28 | Sterling Winthrop Inc | Oligonucleotides with amide linkages replacing phosphodiester linkages |
DE4311944A1 (de) * | 1993-04-10 | 1994-10-13 | Degussa | Umhüllte Natriumpercarbonatpartikel, Verfahren zu deren Herstellung und sie enthaltende Wasch-, Reinigungs- und Bleichmittelzusammensetzungen |
US5502177A (en) | 1993-09-17 | 1996-03-26 | Gilead Sciences, Inc. | Pyrimidine derivatives for labeled binding partners |
US5624803A (en) * | 1993-10-14 | 1997-04-29 | The Regents Of The University Of California | In vivo oligonucleotide generator, and methods of testing the binding affinity of triplex forming oligonucleotides derived therefrom |
US5861288A (en) * | 1993-10-18 | 1999-01-19 | Ribozyme Pharmaceuticals, Inc. | Catalytic DNA |
US5457187A (en) | 1993-12-08 | 1995-10-10 | Board Of Regents University Of Nebraska | Oligonucleotides containing 5-fluorouracil |
US5446137B1 (en) * | 1993-12-09 | 1998-10-06 | Behringwerke Ag | Oligonucleotides containing 4'-substituted nucleotides |
US5519134A (en) | 1994-01-11 | 1996-05-21 | Isis Pharmaceuticals, Inc. | Pyrrolidine-containing monomers and oligomers |
US5631359A (en) * | 1994-10-11 | 1997-05-20 | Ribozyme Pharmaceuticals, Inc. | Hairpin ribozymes |
US5596091A (en) | 1994-03-18 | 1997-01-21 | The Regents Of The University Of California | Antisense oligonucleotides comprising 5-aminoalkyl pyrimidine nucleotides |
US5627053A (en) | 1994-03-29 | 1997-05-06 | Ribozyme Pharmaceuticals, Inc. | 2'deoxy-2'-alkylnucleotide containing nucleic acid |
US5625050A (en) | 1994-03-31 | 1997-04-29 | Amgen Inc. | Modified oligonucleotides and intermediates useful in nucleic acid therapeutics |
US5648211A (en) * | 1994-04-18 | 1997-07-15 | Becton, Dickinson And Company | Strand displacement amplification using thermophilic enzymes |
EP0684316B1 (en) | 1994-04-29 | 2004-10-20 | Johnson & Johnson Clinical Diagnostics, Inc. | Homogeneous method for assay of double-stranded nucleic acids using fluorescent dyes and kit useful therein |
US5525711A (en) | 1994-05-18 | 1996-06-11 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Pteridine nucleotide analogs as fluorescent DNA probes |
US5597909A (en) | 1994-08-25 | 1997-01-28 | Chiron Corporation | Polynucleotide reagents containing modified deoxyribose moieties, and associated methods of synthesis and use |
US5807718A (en) * | 1994-12-02 | 1998-09-15 | The Scripps Research Institute | Enzymatic DNA molecules |
US5658735A (en) | 1995-11-09 | 1997-08-19 | Biometric Imaging, Inc. | Cyclized fluorescent nucleic acid intercalating cyanine dyes and nucleic acid detection methods |
US5734058A (en) | 1995-11-09 | 1998-03-31 | Biometric Imaging, Inc. | Fluorescent DNA-Intercalating cyanine dyes including a positively charged benzothiazole substituent |
US20020102694A1 (en) * | 2000-03-31 | 2002-08-01 | Ronald Breaker | Nucleozymes with endonuclease activity |
US6518252B2 (en) | 2000-09-20 | 2003-02-11 | University Of Georgia Research Foundation, Inc. | Method of treating aquatic animals with an antimicrobial agent and chelating agent |
US20020123077A1 (en) * | 2000-09-29 | 2002-09-05 | O'toole George A. | Novel compounds capable of modulating biofilms |
US20030108949A1 (en) * | 2001-07-03 | 2003-06-12 | Gang Bao | Filtration-based microarray chip |
US20030020377A1 (en) * | 2001-07-30 | 2003-01-30 | Ngk Insulators, Ltd. | Piezoelectric/electrostrictive element and piezoelectric/electrostrictive device and production method thereof |
JP2006500030A (ja) * | 2002-09-20 | 2006-01-05 | イェール ユニバーシティ | リボスイッチ、その使用方法、ならびにリボスイッチとともに用いるための組成物 |
WO2004113495A2 (en) * | 2003-05-23 | 2004-12-29 | The President And Fellows Of Harvard College | Rna-based transcriptional regulators |
WO2005054478A1 (en) * | 2003-12-03 | 2005-06-16 | Muehlbauer Stefan | Controlling gene expression in plastids |
US20080004230A1 (en) * | 2006-02-17 | 2008-01-03 | Batey Robert T | SAM Riboswitch and Uses Thereof |
US20080033866A1 (en) * | 2006-05-25 | 2008-02-07 | Lease This, Llc | System and a method for facilitating a lease on a domain name through an online competitive bidding process |
GB2442118B (en) * | 2006-09-19 | 2011-08-17 | Chisso Corp | Process for production of recombinant proteins as a soluble form |
US7560692B2 (en) * | 2006-12-28 | 2009-07-14 | International Business Machines Corporation | Method of TEM sample preparation for electron holography for semiconductor devices |
WO2008116220A2 (en) * | 2007-03-22 | 2008-09-25 | Yale University | Methods and compositions related to riboswitches that control alternative splicing |
US8161366B2 (en) * | 2007-12-03 | 2012-04-17 | International Business Machines Corporation | Finite state machine error recovery |
-
2008
- 2008-05-29 EP EP08825955A patent/EP2164996A4/en not_active Withdrawn
- 2008-05-29 EP EP11006816A patent/EP2426219A1/en not_active Withdrawn
- 2008-05-29 AU AU2008266684A patent/AU2008266684A1/en not_active Abandoned
- 2008-05-29 SG SG2011061744A patent/SG174104A1/en unknown
- 2008-05-29 CN CN200880100930A patent/CN101849020A/zh active Pending
- 2008-05-29 SG SG2011061736A patent/SG174103A1/en unknown
- 2008-05-29 WO PCT/US2008/065179 patent/WO2008156987A2/en active Application Filing
- 2008-05-29 CA CA002688575A patent/CA2688575A1/en not_active Abandoned
- 2008-05-29 EP EP11006811A patent/EP2426218A1/en not_active Withdrawn
- 2008-05-29 JP JP2010510498A patent/JP2010528617A/ja not_active Withdrawn
- 2008-05-29 KR KR1020097026872A patent/KR20100017905A/ko not_active Withdrawn
- 2008-05-29 MX MX2009012773A patent/MX2009012773A/es not_active Application Discontinuation
- 2008-05-29 US US12/602,338 patent/US20100286082A1/en not_active Abandoned
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013191473A1 (ko) * | 2012-06-20 | 2013-12-27 | 포항공과대학교 산학협력단 | 리보스위치를 이용한 l-트립토판 고생산균 스크리닝 방법 |
US9493767B2 (en) | 2012-06-20 | 2016-11-15 | Postech Academy-Industry Foundation | Method for screening for high L-tryptophan producing microorganisms using riboswitch |
WO2020159182A1 (ko) * | 2019-01-29 | 2020-08-06 | 포항공과대학교 산학협력단 | 리보스위치를 이용한 카프로락탐 고생산균 스크리닝 방법 |
KR102309424B1 (ko) * | 2020-09-28 | 2021-10-07 | 한국생명공학연구원 | 나노포어를 이용한 리보스위치-표적 물질의 스크리닝 방법 |
WO2022065941A1 (ko) * | 2020-09-28 | 2022-03-31 | 한국생명공학연구원 | 나노포어를 이용한 rna 표적의 고효율 약물 스크리닝 방법 |
Also Published As
Publication number | Publication date |
---|---|
WO2008156987A3 (en) | 2009-05-07 |
US20100286082A1 (en) | 2010-11-11 |
CN101849020A (zh) | 2010-09-29 |
MX2009012773A (es) | 2009-12-16 |
EP2426219A1 (en) | 2012-03-07 |
WO2008156987A2 (en) | 2008-12-24 |
SG174103A1 (en) | 2011-09-29 |
SG174104A1 (en) | 2011-09-29 |
WO2008156987A9 (en) | 2009-03-26 |
AU2008266684A2 (en) | 2010-01-07 |
EP2426218A1 (en) | 2012-03-07 |
EP2164996A2 (en) | 2010-03-24 |
JP2010528617A (ja) | 2010-08-26 |
EP2164996A4 (en) | 2010-07-14 |
AU2008266684A1 (en) | 2008-12-24 |
CA2688575A1 (en) | 2008-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20100017905A (ko) | 리보스위치, 리보스위치의 사용 방법 및 리보스위치를 함유하는 조성물 | |
EP1828953B1 (en) | Crystalline xpt guanine riboswitch from Bacillus subtilis and structure-based compound identification employing said riboswitch | |
US8440810B2 (en) | Riboswitches, methods for their use, and compositions for use with riboswitches | |
US20130143955A1 (en) | Cyclic di-GMP-II Riboswitches, Motifs, and Compounds, and Methods for Their Use | |
US20130012527A1 (en) | Preq1 riboswitches and methods and compositions for use of and with preq1 riboswitches | |
WO2011088076A2 (en) | Structured rna motifs and compounds and methods for their use | |
US20090117545A1 (en) | Glycine riboswitches, methods for their use, and compositions for use with glycine riboswitches Cross-Reference to Related Applications | |
KR20090073131A (ko) | Glms 라이보스위치, glms 라이보스위치를 사용한 구조-기초 화합물 디자인, 및 glms 라이보스위치를 사용하는 방법 및 조성물 | |
Class et al. | Patent application title: RIBOSWITCHES AND METHODS AND COMPOSITIONS FOR USE OF AND WITH RIBOSWITCHES Inventors: Ronald R. Breaker (Guilford, CT, US) Zasha Weinberg (New Haven, CT, US) Narasimhan Sudarsan (New Haven, CT, US) Narasimhan Sudarsan (New Haven, CT, US) Joy Xin Wang (New Haven, CT, US) Michelle M. Meyer (Hamden, CT, US) Adam Roth (Guilford, CT, US) Elizabeth E. Regulski (Novi, MI, US) Assignees: YALE UNIVERSITY | |
HK1148319A (en) | Riboswitches and methods and compositions for use of and with riboswitches | |
HK1154867A (en) | Riboswitches, methods for their use, and compositions for use with riboswitches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20091223 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
PC1203 | Withdrawal of no request for examination | ||
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |