발명의 요약
본 발명은 일부 유전적 마커들이 심장성 부정맥, 특히, 심방세동과 심방조동, 및 뇌졸중과 연관된 것으로 확인되었다는 발견에 관한 것이다. 이 발견은 감수성의 진단 및/또는 결정을 위한 방법 및 절차, 연관된 변이의 유전형 분석 방법, 치료제에 대한 반응을 예측하는 방법, 예후를 예측하는 방법, 치료의 진행을 모니터링하는 방법, 및 그와 같은 방법에서 이용되는 시스템 및 키트에 관한, 본 명세서에 기재된 바와 같은 다양한 방법, 절차, 장치, 매체 및 키트에서 이용될 수 있다.
본 발명의 일 양태는 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립형질의 존재 또는 부재를 결정하는 단계를 포함하는, 개인에서 심장성 부정맥 또는 뇌졸중에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 표 5에 표시된 마커들 및 이들과 연관 불균형(linkage disequilibrium)인 마커들로부터 선택되고, 상기 하나 이상의 대립형질의 존재 또는 부재의 결정이 상기 개인의 심장성 부정맥 또는 뇌졸중에 대한 감수성을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 본 명세서에서 서열번호 50으로 표시된 LD 블럭 C04 내에 위치한다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 9에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택된다. 일 구체예에서, 상기 하나 이상의 다형성 마커는 마커 rs2220427 (서열번호 1)과 마커 rs10033464 (서열번호 41), 및 이들과 연관 불균형인 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 19에 표시된 마커들로부터 선택된다. 일 구체예에서, 상기 방법은 상기 개인에서 두개 이상의 다형성 마커를 포함하는 하나 이상의 일배체형을 평가하는 단계를 더 포함한다.
또 다른 양태에서, 본 발명은 개인으로부터 유래된 유전형 데이터세트에 하나 이상의 다형성 마커의 하나 이상의 위험 대립형질(at-risk allele)이 존재하는지 여부를 결정하는 단계를 포함하는, 개인에서 심장성 부정맥 또는 뇌졸중에 대한 감수성을 결정하는 방법으로서, 상기 하나 이상의 다형성 마커는 표 5에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 위험 대립형질의 존재의 결정은 상기 개인에서 심장성 부정맥 또는 뇌졸중에 대한 증가된 감수성을 표시하는 것인 단계를 포함하는 방법.
상기 유전형 데이터세트는 일 구체예에서, 마커 동일성(marker identity), 및 상기 하나 이상의 다형성 마커에 대한 상기 개인의 대립형질 상태(allelic status)에 대한 정보, 즉, 상기 마커에 대해 개인이 가진 두 개의 대립형질의 동일성에 대한 정보 및/또는 개인이 상기 하나 이상의 다형성 마커에 대한 특정한 위험 대립형질의 보인자(carrier)인지 여부에 대한 정보를 포함한다. 유전형 데이터세트는 두개 이상의 마커, 세개 이상의 마커, 다섯개 이상의 마커, 백개 이상의 마커 등을 포함한, 하나 이상의 마커에 대한 대립형질 정보(allelic informaton)을 포함할 수 있다. 일부 구체예에서, 유전형 데이터세트는 수십만개의 마커, 또는 심지어 백만개 이상의 마커를 포함하는 개인의 전체-게놈(whole-genome) 평가로부터의 유전형 정보를 포함한다.
또 다른 양태에서, 본 발명은 서열번호 50에 표시된 서열을 갖는 게놈 서열과 연관된 하나 이상의 다형성 마커의 하나 이상의 대립형질 또는 일배체형의 존재 또는 부재를 결정하기 위해 개인으로부터의 핵산을 분석하는 단계 및 상기 하나 이상의 마커 또는 일배체형의 존재 또는 부재로부터 상기 개인의 심장성 부정맥 또는 뇌졸중의 유전적 지표(genetic indicator)의 상태를 결정하는 단계를 포함하는 절차(procedure)에 관한 것이다. 따라서, 상기 개인의 유전형 및/또는 일배체형 상태는 상기 개인에서 심방세동 및 심방조동을 포함한 심장성 부정맥, 및 뇌졸중의 지표로서 이용된다.
본 발명은 또한, 인간 집단에서 심장성 부정맥 또는 뇌졸중의 증가된 발생과 상관 관계를 갖는, 서열번호 50 내의 하나 이상의 다형성 마커 또는 일배체형에 대해, 개인으로부터의 핵산을 스크리닝하는 단계를 포함하는, 개인에서 심장성 부정맥 또는 뇌졸중에 대한 감수성을 평가하는 방법으로서, 상기 핵산에서 상기 하나 이상의 다형성의 위험 마커 대립형질 또는 위험 일배체형의 존재의 결정은 상기 개인이 심장성 부정맥 및/또는 뇌졸중에 대한 증가된 감수성을 갖는다는 것을 확인하고, 및 상기 핵산에서 상기 하나 이상의 위험 대립형질 또는 위험 일배체형의 부재는 상기 개인이 상기 증가된 감수성을 갖지 않는다는 것을 확인하는 것인 방법에 관한 것이다.
일 구체예에서, 본 발명의 절차 또는 방법은 서열번호 50에 표시된 LD 블럭 C04의 연속적인 핵산 단편, 또는 그의 상보체를 포함하는 하나 이상의 다형성 마커 또는 일배체형을 수반하고, 상기 단편은 500개의 뉴클레오티드 미만으로 구성된 크기이고 LD 블럭 C04의 상보성 단편에 특이적으로 혼성화된다. 일 구체예에서, 상기 단편은 크기가 15개 초과, 400개 미만의 뉴클레오티드로 구성되고, 상기 단편은 서열번호 50에 표시된 LD 블럭 C04의 상보성 단편에 특이적으로 혼성화된다.
대안적인 구체예에서, 상기 다형성 마커 또는 일배체형에 의해 부여된 감수성은 감소된 감수성이고, 즉, 본 발명의 마커 및 일배체형은 개인이 심방세동 및 심방조동을 포함한 심장성 부정맥, 및/또는 뇌졸중을 발병할 감소된 위험도를 부여한다. 하나의 그와 같은 구체예에서, 상기 감소된 감수성은 0.8 미만의 오즈비(odds ratio, OR) 또는 상대적 위험도(relative risk, RR)를 특징으로 한다. 또 다른 구체예에서, 상기 감소된 감수성은 0.7 미만의 오즈비(OR) 또는 상대적 위험도(RR)를 특징으로 한다. 또 다른 구체예에서, 상기 감소된 감수성은 0.6 미만의 오즈비(OR) 또는 상대적 위험도(RR)를 특징으로 한다. 또 다른 구체예에서, 상기 감소된 감수성은 0.5 미만의 오즈비(OR) 또는 상대적 위험도(RR)를 특징으로 한다. 다른 구체예는 0.9, 0.85, 0.75, 0.65, 0.55, 등의 값을 포함한, OR 또는 RR에 대한 다른 값에 관한 것이다.
본 발명의 또 다른 양태는 개인에서 심장성 부정맥 및/또는 뇌졸중에 대한 감수성을 평가하기 위해 이용되는 마커를 확인하는 방법으로서, 상기 방법은 서열번호 50 내의 하나 이상의 다형성 마커, 또는 서열번호 50 내의 하나 이상의 다형성 마커와 연관 불균형인 하나 이상의 다형성 마커를 확인하는 단계, 심장성 부정맥 및/또는 뇌졸중으로 진단된 개인의 시료의 유전형 상태(genotype status) 및 대조군 개인의 시료의 유전형 상태를 결정하는 단계를 포함하고, 상기 대조군 시료에서의 하나 이상의 대립형질의 빈도와 비교하여, 심장성 부정맥 및/또는 뇌졸중으로 진단된 개인에서 상기 하나 이상의 다형성의 하나 이상의 대립형질의 빈도의 유의성 있는 차이는 상기 하나 이상의 다형성이 심장성 부정맥 및/또는 뇌졸중에 대한 감수성을 평가하기 위해 유용하다는 것을 나타내는 것인 방법에 관한 것이다. 일 구체예에서, 상기 대조군 시료에서의 상기 하나 이상의 대립형질의 빈도와 비교하여, 심장성 부정맥 및/또는 뇌졸중으로 진단된 개인에서 상기 하나 이상의 다형성의 상기 하나 이상의 대립형질의 빈도의 증가는 상기 하나 이상의 다형성이 심장성 부정맥에 대한 증가된 감수성을 평가하기 위해 유용하다는 것을 나타낸다. 또 다른 구체예에서, 상기 대조군 시료에서의 상기 하나 이상의 대립형질의 빈도와 비교하여, 심장성 부정맥 및/또는 뇌졸중으로 진단된 개인에서 상기 하나 이상의 다형성의 상기 하나 이상의 대립형질의 빈도의 감소는 상기 하나 이상의 다형성이 심장성 부정맥 및/또는 뇌졸중에 대한 감소된 감수성 또는 그에 대한 보호를 평가하기 위해 유용하다는 것을 나타낸다. 바람직한 구체예에서, 상기 빈도의 유의성 있는 차이는 통계적 척도(statistical measure)에 의해 표현된다. 일 구체예에서, 상기 통계적 척도는 P-값이다. 특정한 구체예에서, 유의성 있는 P-값은 0.05 미만, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 또는 0.00000001 미만이다. 다른 구체예에서, 상기 유의성 있는 차이는 특정한 신뢰 구간(confidence interval, CE) 값과 함께 오즈비(OR) 또는 상대적 위험도(RR)에 의해 표현된다.
또 다른 양태에서, 본 발명은 개인으로부터 수득된 핵산 시료에서 심장성 부정맥 및/또는 뇌졸중의 증가된 위험도를 예측하는 하나 이상의 다형성 마커의 하나 이상의 대립형질의 존재 또는 부재를 결정하는 단계를 포함하는, 개인으로부터 수득된 핵산 시료의 유전형을 분석하는 방법으로서, 상기 하나 이상의 마커는 표 5에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 다형성 마커의 하나 이상의 대립형질의 존재 또는 부재의 결정은 상기 개인에서 심장성 부정맥 및/또는 뇌졸중의 증가된 위험도를 예측하는 것인 방법에 관한 것이다. 일 구체예에서, 유전형 분석(genotyping)은 대립형질-특이적 프로브 혼성화, 대립형질-특이적 프라이머 연장(primer extension), 대립형질-특이적 증폭, 핵산 서열결정(nucleic acid sequencing), 5'-엑소뉴클레아제 처리(exonuclease digestion), 분자 표지 분석법(molecular beacon assay), 올리고뉴클레오티드 라이게이션 분석법(oligonucleotide ligation assay), 크기 분석, 및 단일 가닥 구조 분석(single-stranded conformation analysis)으로부터 선택된 방법을 이용하여 수행된다. 바람직한 구체예에서, 상기 방법은 대립형질-특이적 프로브 혼성화를 포함한다. 상기 유전형분석 방법은 바람직하게는 상기 하나 이상의 다형성 마커를 플랭킹하는 뉴클레오티드 프라이머 쌍을 이용한 중합효소 연쇄 반응(PCR)에 의해, 상기 하나 이상의 다형성 마커를 포함하는 핵산의 세그먼트를 증폭하는 단계를 포함한다. 유전형 분석의 바람직한 방법에서, 하기의 단계들이 수행된다:
1. 상기 핵산의 카피를 검출 올리고뉴클레오티드 프로브 및 인핸서 올리고뉴클레오티드 프로브와 상기 올리고뉴클레오티드와 상기 핵산 간의 특이적 혼성화(specific hybridization) 조건 하에 접촉시키는 단계로서,
a) 상기 검출 올리고뉴클레오티드 프로브는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 하나 이상의 다형성 부위를 포함하는 서열번호 50에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 제1 세그먼트에 특이적으로 결합하고,
b) 상기 검출 올리고뉴클레오티드 프로브는 3' 말단의 검출가능한 표지 및 5' 말단의 퀀칭 모이어티(quenching moiety)를 포함하며,
c) 상기 인핸서 올리고뉴클레오티드는 길이가 5 내지 100개의 뉴클레오티드로 구성되고 상기 올리고뉴클레오티드 프로브의 5'에 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두 개의 올리고뉴클레오티드가 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3' 에 위치하며, 및
d) 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭(single base gap)이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하는 것인 단계,
2. 상기 검출 프로브가 상기 핵산에 혼성화되는 경우, 상기 검출 프로브의 3' 말단으로부터 상기 검출가능한 표지를 절단하여 유리된 검출가능한 표지를 방출시키는 엔도뉴클레아제로 상기 핵산을 처리하는 단계, 및
유리된 검출가능한 표지를 측정하는 단계로서, 상기 유리된 검출가능한 표지의 존재는 상기 검출 프로브가 상기 핵산의 제1 세그먼트에 특이적으로 혼성화된다는 것을 표시하고, 상기 다형성 부위의 서열이 상기 검출 프로브의 상보체(complement)라는 것을 표시하는 것인 단계.
본 발명의 또 다른 양태는 개인에서 심장성 부정맥 또는 뇌졸중에 대한 감수성을 결정하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립형질의 정체(identity)를 결정하는 단계를 포함하고, 상기 하나 이상의 마커는 PITX2 유전자와 연관된 마커들의 군으로부터 선택되며, 상기 하나 이상의 대립형질의 존재는 상기 개인에서 심장성 부정맥 또는 뇌졸중에 대한 감수성을 나타내는 것인 방법에 관한 것이다.
본 발명의 일부 구체예는 심방세동, 심방조동 또는 뇌졸중에 대한 하나 이상의 추가적인 바이오마커를 평가하는 추가적인 단계로서, 상기 마커로부터의 유전적 정보를 통합하는 것은 심방세동, 심방조동 또는 뇌졸중에 대한 위험도 평가를 제공하는 것인 단계에 관한 것이다. 이와 같은 일부 구체예에서, 상기 바이오마커는 유전적 마커 또는 일배체형이고, 즉, 심방세동, 심방조동 또는 뇌졸중의 증가된 위험도 또는 감소된 위험도와 관련된 것으로 입증되거나, 또는, 그와 같이 고려되는 유전적 위험 인자이다. 다른 구체예에서, 상기 바이오마커는 단백질 바이오마커이다. 일부 구체예에서, 상기 단백질 바이오마커는 피브린 D-이량체, 프로트롬빈 활성화 단편(prothrombin activation fragment) 1.2 (F1.2), 트롬빈-항트롬빈 III 복합체(thrombin-antithrombin III complex, TAT), 피브리노펩티드 A(fibrinopeptide A, FPA), 지질단백질-연관 포스포리파아제 A2(lipoprotein-associated phospholipase A2, lp-PLA2), 베타-트롬보글로불린, 혈소판 인자(platelet factor) 4, P-셀렉틴, 폰 빌리브란트 인자(von Willebrand Factor), 프로-나이트리우레틱 펩티드(pro-natriuretic peptide, BNP), 매트릭스 메탈로프로테이나아제-9(matrix metalloproteinase-9, MMP-9), PARK7, 뉴클레오시드 디포스페이트 키나아제(nucleoside diphosphate kinase, NDKA), tau, 신경세포-특이적 에놀라아제(neuron-specific enolase), B-타입 신경영양성 성장 인자(B-type neurotrophic growth factor), 성상 아교세포성 단백질 S-100b(astroglial protein S-100b), 신경교섬유 산성 단백질(glial fibrillary acidic protein), C-반응성 단백질(C-reactive protein), 혈청 아밀로이드 A(seum amyloid A), 매트릭스 메탈로프로테이나아제-9(marix metalloproteinase-9), 혈관 및 세포내 세포 부착 분자(vascular and intracellular cell adhesion molecule), 종양 괴사 인자 알파(tumor necrosis factor alpha), 및 인터루킨-1, 인터루킨-6, 및 인터루킨-8을 포함한 인터루킨으로부터 선택된다. 일 구체예에서, 상기 하나 이상의 바이오마커는 전구 세포(progenitor cell)를 포함한다. 특정한 구체예에서, 하나 이상의 바이오마커가 결정된다. 바람직한 구체예에서, 상기 바이오마커는 상기 개인으로부터의 혈장에서 측정된다. 다른 구체예는 또한 상기 개인에서 심방세동, 심방조동 또는 뇌졸중의 위험도 평가, 진단, 또는 예후를 판단하기 위해 비-유전적 정보를 통합하는 것에 관한 것이다. 상기 비-유전적 정보는 연령, 질병의 발병 연령, 성별, 민족, 과거 질병 진단, 예를 들면, 심장성 부정맥(예를 들면, 심방세동) 및 뇌졸중의 진단, 상기 개인의 병력(medical history), 질병의 가족력, 생화학적 측정값, 및 임상적 측정값(예를 들면, 혈압, 혈청 지질 수준)을 포함할 수 있다. 다양한 유전적 마커들, 또는 유전적 마커들과 비-유전적 마커들로부터의 그와 같은 통합된 정보의 분석이 본 발명이 속하는 기술 분야의 당업자에게 공지된 방법에 의해 가능하다. 일 구체예에서, 분석은 로지스틱 회귀분석(logistic regression)에 의해 전체 위험도를 계산하는 것에 의해 수행된다.
본 발명은 개인에서 뇌졸중의 증가된 감수성을 진단하는 방법으로서, (a) 상기 개인이 심방세동, 심방조동 또는 일과성 허혈 발작(Transient Ischemic Attack)과 연관된 증상을 경험하는지를 결정하는 단계; (b) 상기 개인으로부터의 핵산 시료가 표 5에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택된 하나 이상의 다형성 마커의 위험 대립형질의 하나 이상의 카피를 포함하는지 여부를 결정하는 단계를 포함하고, 심방세동, 심방조동 및/또는 일과성 허혈 발작과 연관된 증상의 존재 및 상기 위험 대립형질의 하나 이상의 카피의 존재는 뇌졸중의 증가된 감수성을 나타내는 것인 방법에 관한 것이다.
또 다른 양태에서 본 발명은 심장성 부정맥 및/또는 뇌졸중과 연관된 증상을 예방 및/또는 개선시키기 위한 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법으로서, 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립형질의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 9에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 마커의 하나 이상의 대립형질의 존재는 심장성 부정맥 및/또는 뇌졸중용 치료제에 대한 양성 반응의 확률을 나타내는 것인 방법에 관한 것이다.
일 구체예에서, 상기 치료제는 항응고제, 항부정맥제, 심박동수 조절제(heart rate control agent), 심박동 회복제(cardioversion agent), 또는 심장 리듬 조절제(heart rhythm control agent)이다. 또 다른 구체예에서, 상기 치료제는 와파린(warfarin), 헤파린, 저분자량 헤파린, 인자 Xa 저해제, 트롬빈 저해제, 나트륨 채널 차단제, 베타 차단제, 칼륨 채널 차단제, 및 칼슘 채널 차단제로부터 선택된다.
또 다른 구체예에서, 상기 치료제는 와파린, 지멜라가트란(ximelagatran), 헤파린, 에녹사파린, 달테파린(dalteparin), 틴자파린(tinzaparin), 아르데파린(ardeparin), 나드로파린(nadroparin), 레비파린(reviparin), 폰다파리눅스(fondaparinux), 이드라파리눅스(idraparinux), 레피루딘(lepirudin), 비발리루딘(bivalirudin), 아르가트로반(argatroban), 다나파로이드(danaparoid), 디소피라미드(disopyramide), 모리시진(moricizine), 프로카인아미드(procainamide), 퀴니딘(quinidine), 리도카인(lidocaine), 멕실레틴(mexiletine), 토카이니드(tocainide), 페니토인(phenytoin), 엔카이니드(encainide), 플레카이니드(flecainide), 프로파페논(propafenone), 아즈말린(ajmaline), 시벤졸린(cibenzoline), 데타즈미움(detajmium), 에스몰롤(esmolol), 프로프라놀롤(propranolol), 메토프롤롤(metoprolol), 알프레놀롤(alprenolol), 아테놀롤(atenolol), 카르베딜롤(carbedilol), 비소프롤롤(bisoprolol), 아세부톨롤(acebutolol), 나돌롤(nadolol), 핀돌롤롤(pindololol), 라베탈롤(labetalol), 옥스프레노톨(oxprenotol), 펜부톨롤(penbutolol), 티몰롤(timolol), 베탁솔롤(betaxolol), 카르텔롤(cartelol), 소탈롤(sotalol), 레보부놀롤(levobunolol), 아미오다론(amiodarone), 아지밀리드(azimilide), 브레틸리움(bretylium), 도페틸리드(dofetilide), 테디사밀(tedisamil), 이부틸리드(ibutilide), 세마틸리드(sematilide), N-아세틸 프로카인아미드(N-acetyl procainamide), 니페칼란트 히드로클로라이드(nifekalant hydrochloride), 베르나칼란트(vernakalant), 암바실리드(ambasilide), 베르파밀(verpamil), 미베프라딜(mibefradil), 딜티아젬(diltiazem), 디곡신(digoxin), 아데노신(adenosine), 이부틸리드(ibutilide), 아미오다론(amiodarone), 프로카인아미드(procainamide), 프로파페논(profafenone) 및 플레카이니드(flecainide)로부터 선택된다.
본 발명의 또 다른 양태는 심장성 부정맥 및/또는 뇌졸중으로 진단된 개인의 예후(prognosis)를 예측하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립형질의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 9에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되며, 상기 하나 이상의 대립형질의 존재의 결정은 상기 개인에서 심장성 부정맥 및/또는 뇌졸중의 악화된 예후를 나타내는 것인 방법에 관한 것이다.
심장성 부정맥 및/또는 뇌졸중의 치료를 받는 개인의 치료의 진행을 모니터링하는 방법도 본 발명의 범위 내에 속하며, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립형질의 존재 또는 부재를 결정하는 단계로서, 상기 하나 이상의 다형성 마커는 표 9에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택되고, 상기 하나 이상의 대립형질의 존재의 결정은 상기 개인의 치료 결과를 나타내는 것인 단계를 포함한다.
본 발명의 특정한 구체예에서, 예를 들면, 본 발명의 다양한 방법, 용도, 절차, 장치, 및 키트에서, 상기 심장성 부정맥 표현형은 심방세동 또는 심방조동인 것을 더 특징으로 한다. 본 발명자들은 본 명세서에 기재된 AF 위험 변이에 의해 부여된 위험도가 늦은 발병 연령의 개인보다 이른 발병 연령의 개인에 대해 더 크다고 결정했다. 따라서, 일 구체예에서, 상기 심방세동 또는 심방조동은 상기 개인에서 80세 미만의 발병 연령을 추가적인 특징으로 한다. 또 다른 구체예에서, 상기 심방세동 또는 심방조동은 상기 개인에서 70세 미만의 발병 연령을 추가적인 특징으로 한다. 또 다른 구체예에서, 상기 심방세동 또는 심방조동은 상기 개인에서 60세 미만의 발병 연령을 추가적인 특징으로 한다. 본 발명의 대안적인 구체예에서, 다른 연령 컷오프(cutoff)가 가능하고, 75세 미만, 65세 미만, 및 55세 미만을 포함하나, 이에 한정되지 않는 다른 연령 컷오프도 고려된다. 또한, 55세, 60세, 65세, 70세, 75세 또는 80세 이상의 발병 연령 또는 진단 연령도 고려되고 본 발명의 범위 내에 속하며, 50-80세, 55-75세, 60-80세, 65-75세 등을 포함하나, 이에 한정되지 않는 상기 질병의 진단 또는 증상 또는 발병이 일어나는 연령 범위도 고려되고, 본 발명의 범위 내에 속한다.
본 발명의 일부 구체예에서, 뇌졸중은 허혈성 뇌졸중을 추가적으로 특징으로 한다. 다른 구체예에서, 상기 뇌졸중 표현형은 허혈성 뇌졸중의 하부-표현형(sub-phenotype) 주동맥 죽상경화증(large artery atherosclerosis, LAA), 심장색전성 뇌졸중(cardioembolic stroke, CES) 및 소혈관 질환(small vessel disease, SVD) 중 하나 이상을 추가적으로 특징으로 한다.
본 발명의 특정한 구체예에서, 연관 불균형(linkage disequilibrim, LD)은 특정한 정량적 컷오프에 의해 정의된다. 본 명세서에서 상세하게 설명되는 바와 같이, 연관 불균형은 r2 및 |D'|와 같은 척도에 의해 정량적으로 결정될 수 있다. 결과로서, 본 발명의 일부 구체예는 r2 및/또는 |D'|의 특정한 값에 의해 특정된 일정한 범위 내의 척도에 의한 연관 불균형인 마커에 관한 것이다. 하나의 그와 같은 구체예에서, LD는 0.1보다 큰 r2의 수치값을 특징으로 한다. 또 다른 구체예에서, LD는 0.1보다 큰 r2의 수치값을 특징으로 한다. 또 다른 구체예에서, LD는 0.5보다 큰 r2의 수치값을 특징으로 한다. 또 다른 구체예에서, LD는 0.8보다 큰 r2의 수치값을 특징으로 한다. 본 명세서에서 보다 상세하게 기재되는 바와 같이, r2에 대한 다른 컷오프 값들도 고려된다. 일부 구체예에서, LD는 r2 및/또는 |D'|에 대한 특정한 컷오프 값을 특징으로 한다. 하나의 그와 같은 구체예에서, LD는 각각 0.2 및 0.8보다 큰 r2 및/또는 |D'|의 값을 특징으로 한다. LD의 상기 척도들 또는 다른 척도들의 조합 및 변경(permutation)이 본 발명을 실시하기 위해 가능하고, 또한 고려되며, 본 발명의 범위 내에 속한다.
일부 구체예에서, 본 발명의 절차, 용도, 또는 방법은 심장성 부정맥 또는 뇌졸중을 발병할 증가된 위험에 있는 것으로 결정된 개인에게, 심장성 부정맥 또는 뇌졸중을 치료 또는 예방하거나, 또는 심장성 부정맥 또는 뇌졸중과 연관된 증상을 예방하기 위해 효과적인 하나 이상의 치료제를 포함하는 조성물을 투여하는 단계를 더 포함한다. 따라서, 본 발명은 개인이 특정한 치료 방식에 대해 적합한지 여부를 결정하기 위해 이용될 수 있다.
본 명세서에 기재된 다양한 방법 및 절차에서 이용되는 키트도 본 발명의 범위 내에 속한다. 따라서, 일 양태에서, 본 발명은 개인에서 심장성 부정맥 및/또는 뇌졸중에 대한 감수성을 평가하기 위한 키트로서, 상기 키트는 상기 개인의 게놈에서 하나 이상의 다형성 마커의 하나 이상의 대립형질을 선택적으로 검출하는 시약을 포함하고, 상기 다형성 마커는 서열번호 50에 표시된 서열의 핵산 세그먼트 내의 다형성 마커들, 및 이들과 연관 불균형인 마커들로 구성된 군으로부터 선택되고, 상기 하나 이상의 대립형질의 존재는 심장성 부정맥 및/또는 뇌졸중에 대한 감수성을 나타내는 것인 키트에 관한 것이다.
일 구체예에서, 상기 하나 이상의 다형성 마커는 표 5에 표시된 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 9에 표시된 마커들, 및 이들과 연관 불균형인 마커들의 군으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 마커 rs2220427 (서열번호 1)과 rs10033464 (서열번호 41), 및 이들과 연관 불균형이 마커들로부터 선택된다. 하나의 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 표 19에 표시된 마커들로부터 선택된다. 또 다른 바람직한 구체예에서, 상기 하나 이상의 다형성 마커는 D4S406 (서열번호 45), rs2634073 (서열번호 33), rs2200733 (서열번호 28), rs2220427 (서열번호 1), rs10033464 (서열번호 41), 및 rs13143308 (서열번호 51)로부터 선택된다. 일 구체예에서, 상기 시약은 상기 하나 이상의 다형성 마커를 포함하는, 상기 개인의 게놈의 단편에 혼성화하는 하나 이상의 연속된(contiguous) 올리고뉴클레오티드, 완충액 및 검출가능한 표지(detectable label)를 포함한다.
또 다른 구체예에서, 상기 시약은 상기 개체로부터 수득된 게놈 핵산 세그먼트의 반대쪽 가닥(opposite strand)에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나의 다형성 마커를 포함하는 상기 개인의 게놈의 단편을 선택적으로 증폭시키도록 설계되고, 상기 단편은 크기가 30 bp 이상이다. 바람직한 구체예에서, 상기 하나 이상의 올리고뉴클레오티드는 상기 개인의 게놈에 완전히 상보적이다. 일 구체예에서, 상기 올리고뉴클레오티드는 약 18개 내지 약 50개의 뉴클레오티드로 구성된 길이이다. 또 다른 구체예에서, 상기 올리고뉴클레오티드는 20 내지 30개의 뉴클레오티드로 구성된 길이이다. 하나의 바람직한 구체예에서, 상기 키트는:
a. 길이가 5 내지 100 개의 뉴클레오티드로 구성된 검출 올리고뉴클레오티드 프로브;
b. 길이가 5 내지 100개의 뉴클레오티드로 구성된 인핸서 올리고뉴클레오티드 프로브; 및
c. 엔도뉴클레아제 효소;를 포함하고,
상기 검출 올리고뉴클레오티드 프로브는 하나 이상의 다형성 부위를 포함하는 서열번호 2로 표시된 뉴클레오티드 서열의 핵산의 제1 세그먼트에 특이적으로 혼성화되고; 상기 검출 올리고뉴클레오티드 프로브는 3' 말단에 검출가능한 표지를 포함하고 5' 말단에 퀀칭 모이어티를 포함하며; 상기 인핸서 올리고뉴클레오티드는 길이가 5개 내지 100개의 뉴클레오티드로 구성되고, 상기 올리고뉴클레오티드 프로브의 5'에 대해 배열된 상기 뉴클레오티드 서열의 제2 세그먼트에 상보적이어서, 상기 인핸서 올리고뉴클레오티드는 상기 두개의 올리고뉴클레오티드가 상기 핵산에 혼성화되는 경우 상기 검출 올리고뉴클레오티드에 대해 3'에 위치하며; 및 상기 제1 세그먼트와 상기 제2 세그먼트 간에 단일 염기 갭이 존재하여, 상기 올리고뉴클레오티드 프로브와 상기 인핸서 올리고뉴클레오티드 프로브가 모두 상기 핵산에 혼성화되는 경우, 상기 올리고뉴클레오티드 간에 단일 염기 갭이 존재하며; 및 상기 핵산을 상기 엔도뉴클레아제에 의해 처리하는 단계는 상기 검출 프로브가 상기 핵산에 혼성화된 경우, 상기 검출 프로브의 3'말단으로부터 검출가능한 표지를 절단하여 유리 상태의 검출가능한 표지를 방출시킨다.
본 명세서에서 심장성 부정맥(예를 들면, AF 및 심방조동) 및 뇌졸중의 위험도를 예측하는 것으로 기재된 다형성 마커는 진단 마커로서 유용하다. 따라서, 일 양태에서, 본 발명은 개인에서 심장성 부정맥 및/또는 뇌졸중에 대한 감수성을 진단 및/또는 평가하기 위한 진단 시약의 제조에서 올리고뉴클레오티드 프로브의 용도로서, 상기 프로브는 하나 이상의 다형성 부위를 포함하는 서열번호 50에 의해 주어진 뉴클레오티드 서열을 갖는 핵산의 세그먼트에 혼성화되고, 상기 단편은 길이가 15 내지 500개의 뉴클레오티드로 구성되는 것인 용도에 관한 것이다.
하나의 그와 같은 구체예에서, 상기 다형성 부위는 표 5에 표시된 다형성 마커들, 및 이들과 연관 불균형인 다형성으로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 D4S406 (서열번호 45), rs2634073 (서열번호 33), rs2200733 (서열번호 28), rs2220427 (서열번호 1), rs10033464 (서열번호 41), 및 rs13143308 (서열번호 51)로부터 선택된다.
본 명세서에 기재된 바와 같은 질병-연관 마커에 대한 정보를 저장하기 위한 컴퓨터-판독가능한 매체(computer-readable medium)도 본 발명의 범위 내에 속한다. 하나의 그와 같은 양태에서, 본 발명은 하나 이상의 다형성 마커에 대한 식별자(identifier); 심방세동, 심방조동 및/또는 뇌졸중으로 진단된 복수의 개인에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립형질의 빈도의 지표(indicator); 및 복수의 기준 개인(reference individual)에서 상기 하나 이상의 다형성 마커의 하나 이상의 대립형질의 빈도의 지표가 저장된 컴퓨터-판독가능한 매체로서, 상기 하나 이상의 다형성 마커는 표 5에 표시된 다형성 마커, 및 이들과 연관 불균형인 다형성으로부터 선택되는 선택되는 것인 컴퓨터-판독가능한 매체에 관한 것이다. 바람직한 구체예에서, 상기 하나 이상의 마커는 D4S406 (서열번호 45), rs2634073 (서열번호 33), rs2200733 (서열번호 28), rs2220427 (서열번호 1), rs10033464 (서열번호 41), 및 rs13143308 (서열번호 51)로부터 선택된다.
본 발명은 또한 개인에서 심장성 부정맥 및/또는 뇌졸중에 대한 유전적 지표(genetic indicator)를 결정하는 장치로서, 컴퓨터 판독가능한 메모리; 및 상기 컴퓨터 판독가능한 메모리 상에 저장된 루틴(routine)을 포함하고, 상기 루틴은 하나 이상의 개인에 대해, 표 5에 표시된 마커들, 및 이들과 연관 불균형인 마커들로부터 선택된 하나 이상의 다형성 마커의 유전형 및/또는 일배체형 정보를 분석하고, 상기 마커 또는 일배체형 정보에 기반한 결과물(output)을 생성하기 위해 프로세서 상에서 실행되도록 개조되고, 상기 결과물은 상기 개인의 심장성 부정맥 및/또는 뇌졸중의 유전적 지표로서 상기 하나 이상의 마커 또는 일배체형의 위험 척도(risk measure)를 포함하는 것인 장치에 관한 것이다. 바람직한 구체예에서, 상기 루틴은 심장성 부정맥 및/또는 뇌졸중으로 진단된 복수의 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립형질 및/또는 하나 이상의 일배체형의 빈도의 지표, 및 복수의 기준 개인에서 하나 이상의 다형성 마커의 하나 이상의 대립형질 또는 하나 이상의 일배체형의 빈도를 결정하는 단계, 및 상기 빈도에 기초하여 상기 하나 이상의 대립형질 및/또는 일배체형에 대한 위첨 척도를 계산하는 단계를 더 포함하고, 위험 척도는 심방세동, 심방조동 및/또는 뇌졸중으로 진단된 복수의 개인에 대한 상기 하나 이상의 마커 및/또는 일배체형 정보에 대해 계산된 위험도에 대비 상기 개인에 대한 하나 이상의 마커 및/또는 일배체형 상태의 비교에 기반하여 계산된다. 일부 구체예에서, 상기 위험 척도는 본 명세서에서 보다 상세하게 기재되는 바와 같이, 오즈비(OR) 또는 상대적 위험도(RR)를 특징으로 한다.
기재된 바와 같이, 본 발명에서 심장성 부정맥 및 뇌졸중의 감수성을 예측하는 것으로 발견된 다형성 마커들, 및 이들과 연관 불균형인 마커들은 본 발명의 다양한 양태를 실시하기 위해 유용하다. 따라서, 특정한 다형성 마커들이 본 발명자들에 의해 염색체 4 상의 특정한 영역과 심장성 부정맥(예를 들면, 심방세동 및 심방조동) 및 뇌졸중의 연관관계를 검출하기 위해 이용되었으나, 상기 마커들과 강한 연관 불균형인 마커들을 평가하는 것이 동일하게 유용하다. 그 결과, 본 발명의 방법, 용도, 키트, 절차, 장치 및 매체의 일 구체예에서, 본 발명의 방법 또는 절차에서 유용한 하나 이상의 다형성 마커 또는 일배체형은 표 5에 표시된 마커들(예를 들면, 표 5A 및 표 5B) 및 이들과 연관 불균형인 마커들 중 하나 이상을 포함한다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커 또는 일배체형은 표 9에 표시된 마커들, 및 이들과 연관 불균형인 마커들 중 하나 이상을 포함한다. 일 구체예에서, 상기 하나 이상의 다형성 마커 또는 일배체형은 표 5에 표시된 마커들 중 하나 이상을 포함한다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커 또는 일배체형은 표 9에 표시된 마커들 중 하나 이상을 포함한다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 4에 표시된 마커들로부터 선택된다. 일 구체예에서, 상기 하나 이상의 마커는 마커 rs2220427 (서열번호 1)과 마커 rs10033464 (서열번호 41), 및 이들과 연관 불균형인 마커들로부터 선택된다. 또 다른 구체예에서, 상기 하나 이상의 다형성 마커는 표 19에 표시된 마커들로부터 선택된다.
일 구체예에서, 상기 하나 이상의 마커 또는 일배체형은 마커 D4S406 (서열번호 45), rs2723296 (서열번호 35), rs16997168 (서열번호 36), rs2723316 (서열번호 37), rs6419178 (서열번호 38), rs1448817 (서열번호 39), rs2634073 (서열번호 33), rs2200733 (서열번호 28), rs2220427 (서열번호 1), rs13105878 (서열번호 40), rs10033464 (서열번호 41), rs13141190 (서열번호 42), rs3853444 (서열번호 43), 및 rs4576077 (서열번호 44) 중 하나 이상을 포함한다. 또 다른 구체예에서, 상기 하나 이상의 마커 또는 일배체형은 마커 D4S406 (서열번호 45), rs2634073 (서열번호 33), rs2200733 (서열번호 28), rs2220427 (서열번호 1), rs10033464 (서열번호 41), 및 rs13143308 (서열번호 51) 중 하나 이상을 포함한다. 또 다른 구체예에서, 상기 하나 이상의 마커는 rs10033464, rs2200733, rs13143308 및rs2220427, 및 이들과 연관 불균형인 마커들로부터 선택된다.
또 다른 구체예에서, 마커 D4S406의 대립형질 -2, -4 및/또는 -8, 마커 rs2723296의 대립형질 G, 마커 rs16997168의 대립형질 T, 마커 rs2723316의 대립형질 T, 마커 rs6419178의 대립형질 A, 마커 rs1448817의 대립형질 G, 마커 rs2634073의 대립형질 A, 마커 rs2200733의 대립형질 T, 마커 rs2220427의 대립형질 T, 마커 rs13105878의 대립형질 C, 마커 rs10033464의 대립형질 T, 마커 rs13141190의 대립형질 A, 마커 rs3853444의 대립형질 A, 및/또는 마커 rs4576077의 대립형질 T의 존재는 상기 개인에서 심장성 부정맥 또는 뇌졸중의 증가된 감수성을 나타낸다.
본 발명의 특정한 구체예에서, 위험 변이(즉, 다형성 마커(예를 들면, SNP)의 특정한 대립형질, 또는 특정한 일배체형)에 의해 부여된 감수성은 증가된 감수성이고, 즉, 본 발명의 마커 및 일배체형은 개인이 심방세동 및 심방조동을 포함한, 심장성 부정맥, 및 뇌졸중을 발병할 증가된 위험도를 부여한다. 감수성은 통상적으로 척도 오즈비(OR) 또는, 대안적으로 상대적 위험도(RR)를 특징으로 한다. 일 구체예에서, 상기 증가된 감수성은 1.3 이상의 오즈비(OR)을 특징으로 한다. 또 다른 구체예에서, 상기 증가된 감수성은 1.4 이상의 오즈비(OR)을 특징으로 한다. 또 다른 구체예에서, 상기 증가된 감수성은 1.5 이상의 오즈비(OR)을 특징으로 한다. 또 다른 구체예에서, 상기 증가된 감수성은 1.6 이상의 오즈비(OR) 또는 상대적 위험도(RR)를 특징으로 한다. 또 다른 구체예에서, 상기 증가된 감수성은 1.8 이상의 오즈비(OR) 또는 상대적 위험도(RR)를 특징으로 한다. 다른 구체예는 1.25, 1.35, 1.45, 1.55, 등을 포함한, OR에 대한 다른 값들, 또는 RR에 대한 유사한 값들에 대한 것이다.
본 발명의 특정한 구체예는 특정한 민족 또는 선조 유래의 개인들에 관한 것이다. 하나의 그와 같은 구체예에서, 개인은 블랙 아프리카계 민족, 아시아계 민족, 코카서스계 민족, 라틴 아메리카계 민족(Hispanic ethnicity)및 아라비아계 민족으로부터 선택된 선조를 갖는다. 특정한 구체예에서, 민족기원은 자가-보고된다. 다른 구체예에서, 선조는 특정한 민족-특이적 유전적 마커의 평가에 의해 결정된다.
발명의 상세한 설명
하기에서 본 발명의 바람직한 구체예가 설명된다.
정의
본 발명에서, 하기의 용어들이 표시된 바와 같은 의미를 갖는다:
본 명세서에 기재된, 심방세동 (Atrial Fibrillation, AF)은 확립된 의학적 기준에 따라 통상적으로 정의된 AF를 의미한다. AF는 클래스 I48의 ICD-10 및 클래스 427.3의 ICD-9에 의해 분류된다.
본 명세서에 기재된, 심방조동(Atrial flutter, AFl)은 확립된 의학적 기준에 따라 통상적으로 정의된 AFl를 의미한다. AFl은 I48의 ICD-10 및 클래스 427.32의 ICD-9에 의해 분류된다.
본 명세서에 기재된 바와 같이, 종종 "마커(marker)"로 불리는, "다형성 마커(polymorphic marker)"는 게놈 다형성 부위(genomic polymorphic site)를 의미한다. 각 다형성 마커는 다형성 부위에서 특정한 대립형질에 특징적인 두 개 이상의 서열 변이를 갖는다. 따라서, 다형성 마커에 대한 유전적 연관(genetic association)은 특정한 다형성 마커의 하나 이상의 특정한 대립형질에 대해 연관이 있다는 것을 의미한다. 마커는 SNP, 마이크로새틀라이트(microsatellite), 삽입, 결실, 중복 및 전위(translocation)를 포함한, 게놈에서 발견되는 임의의 변이 형태의 대립형질을 포함할 수 있다.
"대립형질(allele)"은 염색체 상에 있는 주어진 유전자 좌(위치)의 뉴클레오티드 서열을 의미한다. 다형성 마커 대립형질은 따라서, 염색체 상의 마커의 조성(즉, 서열)을 의미한다. 개인으로부터의 게놈 DNA는 각 염색체 상의 마커의 각 카피를 대표하는, 임의의 주어진 다형성 마커에 대해 두 개의 대립형질을 포함한다.
집단(자연 집단 또는 합성 집단, 예를 들면, 합성 분자들의 라이브러리)에서 하나 이상의 서열이 가능한 뉴클레오티드 위치는 본 명세서에서 "다형성 부위(polymorphic site)"로 지칭된다.
"단일 뉴클레오티드 다형성(Single Nucleotide Polymorphism)" 또는 "SNP"는 게놈의 특정한 위치에 있는 단일 뉴클레오티드가 종의 구성원 간에 또는 개체 내에서 쌍을 이루는 염색체 간에 상이할 때 나타나는 DNA 서열 변이이다. 대부분의 SNP 다형성은 두 개의 대립형질을 갖는다. 각 개체는 이 경우, 상기 다형성의 하나의 대립형질에 대해 동형접합(즉, 개체의 두 개의 염색체 카피 모두 SNP 위치에서 동일한 뉴클레오티드를 가짐)이거나, 또는 개체는 이형접합이다(즉, 상기 개체의 두 개의 자매 염색체(sister nucleotide)가 상이한 뉴클레오티드를 포함함). 본 명세서에서 보고된 바와 같이, SNP 명명은 NCBI(the National Center for Biotechnological Information)에 의해 각각의 독특한 SNP에 부여된 공식적인 기준 SNP(Reference SNP, rs) ID 식별 택(tag)을 의미한다.
본 명세서에 기재된 "변이(variant)"는 기준(reference) DNA와 상이한 DNA의 세그먼트를 의미한다. 본 명세서에서 정의된 "마커(marker)" 또는 "다형성 마커(polymorphic marker)"는 변이이다. 기준과 상이한 대립형질(allele)은 "변이" 대립형질로 지칭된다.
"마이크로새틀라이트(microsatellite)"는 특정한 부위에 있는 길이가 2 내지 8개의 뉴클레오티드로 구성된 염기의 작은 반복체(repeat)(예를 들면, CA 반복체)를 복수 개 갖는 다형성 마커이며, 전체 집단에서 반복체 길이의 수는 변한다. "indel"은 통상적으로 단지 수개의 뉴클레오티드로 구성된 길이의 작은 삽입 또는 결실을 포함하는 다형성의 일반적인 형태이다.
본 명세서에 기재된, "일배체형(haplotype)"은 세그먼트를 따라 배열된 대립형질의 특정한 조합을 특징으로 하는 게놈 DNA의 세그먼트를 의미한다. 인간과 같은 이배체(diploid) 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대해 대립형질의 쌍 중 하나의 대립형질(one member)을 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립형질, 세개 이상의 대립형질, 네개 이상의 대립형질, 또는 다섯개 이상의 대립형질을 포함할 수 있다.
본 명세서에 기재된 용어 "감수성(susceptibility)"은 증가된 감수성 및 감소된 감수성을 모두 포함한다. 따라서, 본 발명의 다형성 마커의 특정한 대립형질 및/또는 일배체형은 1보다 큰 상대적 위험도(RR) 또는 오즈비(OR)을 특징으로 하는, 심방세동 또는 뇌졸중의 증가된 감수성(즉, 증가된 위험도)을 특징으로 할 수 있다. 대안적으로, 본 발명의 마커 및/또는 일배체형은 1 미만의 상대적 위험도를 특징으로 하는, 심방세동 또는 뇌졸중의 감소된 감수성(즉, 감소된 위험도)을 특징으로 한다.
"핵산 시료(nucleic acid sample)"는 개체로부터 수득된 핵산을 함유하는 시료이다. 특정한 구체예에서, 즉, 특정한 다형성 마커 및/또는 일배체형의 검출에서, 핵산 시료는 게놈 DNA를 포함한다. 그와 같은 핵산 시료는 혈액 시료, 양수 시료, 뇌척수액 시료, 또는 피부, 근육, 볼 점막 또는 결막 점막, 태반, 위장관 또는 기타 기관을 포함한, 게놈 DNA를 포함하는 원천(source)으로부터 수득될 수 있다.
용어 "심방세동 및/또는 뇌졸중 치료제(atrial fibrillation and/or stroke therapeutic agent)"는 본 명세서에서 보다 상세하게 설명되는 바와 같이, 심방세동(AF), 심방조동(AFl), 또는 뇌졸중과 연관된 증상을 개선 또는 예방하기 위해 이용될 수 있는 작용제를 의미한다.
본 명세서에 기재된, 용어 "심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산(cardiac arrhythmia (e.g., atrial fibrillation or atrial flutter) and/or stroke -associated nucleic acid)"은 심장성 부정맥, 예를 들면, 심방세동(AF), 심방조동(AFl) 또는 뇌졸중과 연관된 것으로 확인된 핵산을 의미한다. 이는 본 명세서에 기재된 마커 및 일배체형 및 이들과 강한 연관 불균형(LD)인 마커 및 일배체형을 포함하나, 이에 한정되지 않는다. 일 구체예에서, 심방세동, 심방조동 또는 뇌졸중과 연관된 핵산은 심방세동 및 뇌졸중과 연관된 것으로 확인된 LD-블럭 C04를 의미한다. 또 다른 구체예에서, 심방세동, 심방조동 또는 뇌졸중과 연관된 핵산은 PITX2 유전자를 의미한다.
본 명세서에 기재된, 용어 "LD 블럭 C06(LD Block C04)"는 서열번호 50으로 표시되 게놈 서열을 갖는, NCBI (National Center for Biotechnology Information) Build 35의 위치 111,954,811과 112,104,250 사이에 있는 염색체 4 상의 연관 불균형(LD) 블럭을 의미한다.
본 명세서에서 기재된, 용어 "단편(fragment)"은 핵산 또는 단백질 서열의 세그먼트를 의미한다. 단편은 그들의 기준점(reference point)보다 작은 크기이고, 즉, 1000개의 뉴클레오티드로 구성된 기준 핵산 분자의 단편은 1000개보다 작은 수의 뉴클레오티드로 구성된 크기이다. 본 발명의 핵산 단편은 통상적으로 5개보다 많은 수의 뉴클레오티드로 구성된 크기이고, 일반적으로 15개보다 많은 수의 뉴클레오티드로 구성된 크기이며, 상한은 그들의 기준 뉴클레오티드에 의해 또는 뉴클레오티드 단편의 실용적인 유용성에 의해 정의된다. 예를 들면, 본 발명의 일부 구체예에서, 혼성화 프로브로서 유용한 뉴클레오티드 단편은 15개의 뉴클레오티드보다 많고, 약 500개의 뉴클레오티드보다 작은 수의 뉴클레오티드로 구성된다. 다른 크기 범위가 본 발명의 다른 뉴클레오티드 단편 및 단백질 또는 펩티드 단편에 적용될 것이다.
본 명세서에 기재된 용어 "PITX2"는 염색체 4q25 상에 있는 상관-유사 호메오도메인 전사 인자 2(paired-like homeodomain transcription factor 2) 유전자를 의미한다. 이 유전자는 또한 PTX2(pituitary homeobox 2), RIEG1(rieg bicoid-related homeobox transcription factor 1), 솔루르신(solurshin), 및 ARP1(all-1 responsive gene 1)으로도 지칭된다.
본 발명은 인간 게놈의 염색체 4q25 상에 있는 특정한 다형성 마커가 심장성 부정맥 및 뇌졸중과 연관된 것으로 확인되었다는 발견에 관한 것이다. 본 발명의 특정한 구체예에서, 염색체 4q25 상에 있는 다형성 마커들은 심방성 부정맥, 심방세동(AF) 및 심방조동(AFl), 및 뇌졸중과 연관된다. 이 발견들은 본 명세서에서 더 상세하게 기재된, 진단 및 치료 방법, 용도, 키트 및 시스템의 개발을 위해 중요하고 예측하지 못한 영향을 갖는다.
AF에 대한 감수성을 부여하는 유전적 변이의 게놈-전체 스캔에서, 염색체 4q25 상에 있는 여러개의 마커들이 AF와 연관되는 것으로 확인되었다. 가장 유의성 높은 연관은 마커 rs2220427 및 rs2220733에 대해 발견되었고, 상기 마커들은 모두 AF와의 연관관계에 대해 10-9에 인접한 p-값을 가졌고(표 2), 뇌졸중에 대해 보다 작으나, 명목상 유의성 있는 연관관계를 가졌다(표 3). 마이크로새틀라이트 마커 D4S406 (표 1) 및 다수의 SNP 마커들(표 4)을 포함한 다수의 마커들이 이 마커들에 대한 완벽한 대리물(surrogate)로 확인되었다.
상기 결과들의 추가적인 개선(refinement)은 연관 신호가 일반적으로 마커 rs2200733 및 rs10033464 (표 7) 및, 이 마커들과 연관 불균형인 마커들(표 9에 열거된 SNP 마커들을 포함하나, 이에 한정되지 않는 마커들)에 집중되는 것으로 보인다는 것을 밝혔다.
아이슬란드 집단에서의 최초의 관찰이 독립적인 아이슬란드 AF/AFl 코호트, 스웨덴 AF 코호트, 및 미국 AF 코호트(표 7)에서 재현되었다. 아이슬란드 시료들과 통합된 경우, rs2200733에 대한 연관은 명확했고(OR = 1.72, P = 3.3x10-41), rs10033464의 유의성은 게놈-전체 유의성의 역치를 훨씬 초과했다(OR = 1.39, P = 6.9x10-11). 승법 모델(multiplicative model)을 가정하면, 통합된 두 변이의 집단 귀속 위험도(population attributable risk, PAR)는 유럽 선조 유래의 집단에서 약 20%이다. 또한, 상기 연관은 홍콩으로부터의 중국계 AF 코호트에서 재현되었다(표 7).
본 발명자들은 아이슬란드 표본에 대한 AF/AFl의 진단시 연령이 두 개의 SNP, rs2200733 및 rs10033464와 상관관계를 갖는다는 것을 발견했다. 따라서, 진단은 rs2200733의 T 대립형질의 경우, 2.28년 더 빨리 일어나고, rs10033464의 T 대립형질의 경우, 1.10년 더 빨리 일어난다(결합(joint) P = 1.29x10-6). 이 효과는 보다 젊은 나이에 진단된 사람들에서 상기 두 개의 변이의 연관이 가장 강하다는 것에 의해 밝혀졌고, 위험도는 80세에 이른 후에 진단된 사람들에서도 유의성 있게 유지되었다(표 8). 유사한 발병 연령 효과가 미국 코호트에서 관찰되었다(표 8).
본 발명자들은 또한, AF에 대한 것보다 훨씬 더 강한 것으로 보이는, 상기 변이와 AFl 간의 강한 연관 관계를 관찰하였다. 이는 AFl의 진단을 갖는 아이슬란드 환자들의 서브세트에 대한 연관 관계(rs2200733의 경우, OR = 2.60, 95% 신뢰 구산(CI) = 1.83-3.68, P = 7.5x10-8, rs10033464의 경우, OR = 1.94, 95% CI = 1.26-3.00, P = .0028)에 의해 밝혀졌다. 실제로, rs2200733의 경우, 이 명백한 AFl 케이스들에 대한 OR은 AF 표현형을 갖는 케이스들에 대한 OR보다 유의성 있게 더 높았고(P = 0.0026), rs10033464에 대해 거의 유의성 있게 더 높았다(P = .084). AF 및 AFl이 유의성 있는 유전적 위험 인자들을 갖는다는 결과가 SNP rs2200733과 rs10033464에 대한 연관에 의해 예시된다.
본 발명자들은 또한 AF/AFl과 연관관계를 갖는 상기 변이들이 뇌졸중, 특히, 허혈성 뇌졸중과도 연관된다는 것을 확립했다(표 21). 마커 rs2200733은 허혈성 뇌졸중 및 허혈성 뇌졸중(IS)의 하부표현형인 심장색전성 뇌졸중(cardioembolic stroke, CES)에서 유의성 있게 재현되었다. 이 마커 및 마커 rs10033464는 모두 추가적인 아이슬란드 IS 케이스 및 대조군(총 1943명의 케이스/25,708명의 대조군) 및 4개의 대규모 IS 케이스/대조군 재현 세트(4,294명의 케이스/3,709명의 대조군)의 유전형 분석 후에, AF가 주요 원인인, CES에 대해 가장 강력하게 연관되는 것으로 확인되었다(rs2200733: OR=1.53, P=1.5 x 10-12; rs10033464: OR=1.27, P=5.9 x 10-4) (표 21).
rs2200733 및 rs10033464를 포함하는 LD 블럭 내에 존재하는 공지된 유전자는 없다(도 3). 상기 LD 블럭은 하나의 스플라이싱된 EST (DA725631) 및 두개의 단일-엑손 EST(DB324364 및 AF017091)를 포함한다. 다양한 조직으로부터의 cDNA 라이브러리의 RT-PCR은 이 EST들의 발현을 검출하지 않았다(표 16). 인접한 상류 LD 블럭에 위치하는 PITX2 유전자가 상기 유전자 변이에 가장 가까운 유전자이다. PITX2 유전자를 포함하는 상기 LD 블럭 내의 여러 마커들은 표 18에 표시된 바와 같이, AF 및 AFl에 대해 연관을 보이는 마커들과 상관관계를 갖는다. 따라서, PITX2 유전자 내의 변이들이 내재된 원인성 변이(underlying causative variant)일 수 있다. 대안적으로, 본 명세서에 기재된, 본 발명의 변이가 PITX2의 기능, 안정성, 발현, 번역후 변형, 스플라이싱, 메시지 안정성(message stability)에 영향을 미치거나, 또는 다른 수단에 의해, 상기 유전자에 영향을 미쳐서 심방세동, 심방조동 및/또는 뇌졸중과 연관된 증상에 대해 소인을 갖게할 수 있다. 이 유전자에 의해 코딩된 단백질, 상관-유사 호메오도메인 전사 인자 2(paired-like homeodomain transcription factor 2)는 심장의 비대칭적 형태형성을 주도하는 것에 의해 심장 발달에서 중요한 역할을 수행하는 것으로 알려졌기 때문에, AF/AFl에 대한 흥미로운 후보이다(Franco, D., Trends Cardiovasc Med 13: 157-63 (2003)). 또한, 마우스 넉아웃 모델에서, Pitx2는 좌심방에서 동방결절 형성을 위한 디폴트 경로를 억제하는 것으로 확인되었다. 혈액 및 지방 조직과 같은 모든 용이하게 접근가능한 조직에서 PITX2의 mRNA 발현은 매우 적어서, 유전형과 발현 수준 간의 상관관계의 연구를 제한한다. PITX2의 상류의 다음 유전자는 혈관 내피(vascular endothelium)에서 안지오텐신 II의 분해를 담당하는 아미노펩티다아제인 ENPEP이다. 이 유전자는 보다 광범위하게 발현되나, AF와 연관된 변이는 혈액 또는 지방 조직에서 그의 발현에 대해 상관관계를 보이지 않았다. 상기 연관된 변이들의 상류 400 kb 영역 및 하류 1.5 Mb 영역 내에 위치한 다른 설명된 유전자(annotated gene)는 없다.
마커 및 일배체형의 평가
집단 내의 게놈 서열은 개인들이 비교될 때 동일하지 않다. 오히려, 게놈은 게놈 상의 다수의 위치에서 개인들 간에 서열 변이성(sequence variability)을 보인다. 그와 같은 서열 상의 변이는 일반적으로 다형성(polymorphism)으로 지칭되며, 각 게놈 내에 다수의 그와 같은 부위들이 있다. 예를 들면, 인간 게놈은 평균적으로 500 bp마다 나타나는 서열 변이를 보인다. 가장 일반적인 서열 변이는 게놈 내에서의 단일 염기 위치에서의 염기의 변화로 구성되고, 그와 같은 서열 변이, 또는 다형성은 일반적으로 단일 뉴클레오티드 다형성("SNP")로 지칭된다. 이 SNP들은 단일 돌연변이 사건에서 일어난 것으로 사료되며, 따라서, 통상적으로 각 SNP 부위에 두 개의 가능한 대립형질들이 있다; 본래의 대립형질과 돌연변이된 대립형질. 자연적인 유전적 부동(genetic drift) 및 또한 가능한 선택적 압력 때문에, 본래의 돌연변이가 주어진 집단에서 그의 대립형질의 특정한 빈도를 특징으로 하는 다형성을 초래했다. 마이크로새틀라이트, 삽입, 결실, 역전 및 카피수 변화를 포함한, 다수의 다른 종류의 서열 변이가 인간 게놈 내에서 발견된다. 다형성 마이크로새틀라이트는 특정한 부위에 복수 개의 짧은 염기 반복체(small repeat of bases)(예를 들면, CA 반복체, 상보성 가닥 상의 TG)를 가지며, 전체 집단에서 반복체 길이의 수가 변화한다. 일반적인 용어로, 다형성 부위에 대한 서열의 각 버전은 상기 다형성 부위의 특정한 대립형질을 나타낸다. 이 서열 변이들은 모두 해당 서열 변이의 특징적인, 특정한 다형성 부위에서 일어나는, 다형성으로 지칭될 수 있다. 일반적인 용어로, 다형성은 임의의 수의 특정한 대립형질을 포함할 수 있다. 따라서, 본 발명의 일 구체예에서, 다형성은 임의의 주어진 집단에서 둘 이상의 대립형질의 존재를 특징으로 한다. 또 다른 구체예에서, 다형성은 세개 이상의 대립형질의 존재를 특징으로 한다. 다른 구체예에서, 다형성은 4개 이상의 대립형질, 5개 이상의 대립형질, 6개 이상의 대립형질, 7개 이상의 대립형질, 9개 이상의 대립형질 또는 10개 이상의 대립형질의 존재를 특징으로 한다. 모든 그와 같은 다형성은 본 발명의 방법 및 키트에서 이용될 수 있고, 따라서, 본 발명의 범위 내에 속한다.
일부 경우에, 기준 대립형질(reference allele)을 선택하지 않고, 다형성 부위에서 상이한 대립형질을 지칭할 수 있다. 대안적으로, 특정한 다형성 부위에 대해 기준 서열이 지칭될 수 있다. 기준 대립형질은 종종 "야생형(wild-type)" 대립형질로 지칭되고, 이는 통상적으로 최초의 서열결정된(first sequenced) 대립형질 또는 "영향받지 않은(non-affected)" 개체(예를 들면, 성향(trait)이나 질병 표현형을 보이지 않는 개체)로부터의 대립형질로 선택된다.
본 명세서에서 지칭되는 SNP 마커에 대한 대립형질은 이용된 SNP 분석법에서 다형성 부위에서 그들이 나타나는 경우, 염기 A, C, G 또는 T로 지칭된다. 본 명세서에서 이용된 SNP에 대한 대립형질 코드는 하기와 같다: 1 = A, 2 = C, 3 = G, 4 = T. 그러나, 본 발명이 속하는 기술 분야의 당업자는 반대쪽 DNA 가닥을 분석하거나 또는 판독하는 것에 의해, 각 경우에 상보적 대립형질이 측정될 수 있다는 것을 인식할 것이다. 따라서, A/G 다형성을 특징으로 하는 다형성 부위(다형성 마커)에 대해, 이용되는 분석법은 가능한 두 염기, 즉, A 및 G 중 하나 또는 양자 모두의 존재를 특이적으로 검출하도록 설계될 수 있다. 대안적으로, DNA 주형 상의 반대쪽 가닥을 검출하도록 설계된 분석법을 이용하여, 상보적 염기 T 및 C의 존재가 측정될 수 있다. 정량적으로(예를 들면, 상대적 위험도의 측면에서), 동일한 결과가 각 DNA 가닥(+ 가닥 또는 - 가닥)의 측정으로부터 수득될 것이다.
일반적으로, 특정한 서열에 대해 기준 서열이 지정된다. 기준과 상이한 대립형질은 종종 "변이(variant)" 대립형질로 지칭된다. 본 명세서에서 사용된, 변이 서열(variant sequence)은 기준 서열과 상이하나, 그 외에는 실질적으로 유사한 서열을 의미한다. 본 명세서에 기재된 다형성 유전적 마커의 대립형질은 변이(variant)이다. 추가적인 변이들은 폴리펩티드에 영향을 미치는 변화들을 포함할 수 있다. 기준 뉴클레오티드 서열과 비교한 경우, 서열 차이는 프레임 쉬프트(frame shift)를 초래하는, 단일 뉴클레오티드의 삽입 또는 결실, 하나보다 많은 수의 뉴클레오티드의 삽입 또는 결실; 코팅된 아미노산의 변화를 초래하는, 하나 이상의 뉴클레오티드의 변화; 조기 종료 코돈(premature stop codon)의 생성을 초래하는, 하나 이상의 뉴클레오티드의 변화; 뉴클레오티드에 의해 코딩된, 하나 이상의 아미노산의 결실을 초래하는, 수개의 뉴클레오티드의 결실; 판독 프레임(reading frame)의 코딩 서열의 중단(interruption)을 초래하는, 불균등 재조합(unequal recombination) 또는 유전자 전환(gene conversion)과 같은, 하나 또는 수개의 뉴클레오티드의 삽입; 전체 서열 또는 일부 서열의 중복; 전위; 또는 뉴클레오티드 서열의 재배열을 포함한다. 그와 같은 서열 변화는 핵산에 의해 코딩된 폴리펩티드를 변화시킬 수 있다. 예를 들면, 핵산 서열의 변화가 프레임 쉬프트를 유발하는 경우, 프레임 쉬프트는 코딩된 아미노산의 변화를 초래할 수 있고, 및/또는 조기 종료 코돈의 생성을 초래하여, 절단된(truncated) 폴리펩티드의 생성을 유발한다. 대안적으로, 질병 또는 성향과 연관된 다형성은 하나 또는 그 이상의 뉴클레오티드의 동의적 변화(synonymous change)(즉, 아미노산 서열의 변화를 초래하지 않는 변화)일 수 있다. 그와 같은 다형성은 예를 들면, 스플라이싱 부위(splice site)를 변화시키고, mRNA의 안정성 또는 이동에 영향을 미치거나 또는 코딩된 폴리펩티드의 전사 또는 번역에 영향을 미칠 수 있다. 다형성은 또한 증폭 또는 결실과 같은 구조적 변화가 체세포 수준(somatic level)에서 일어날 가능성을 증가시키도록 DNA를 변화시킬 수 있다. 기준 뉴클레오티드 서열에 의해 코딩된 폴리펩티드는 특정한 기준 아미노산 서열을 갖는 "기준(reference)" 폴리펩티드이고, 변이 대립형질에 의해 코딩된 폴리펩티드는 변이 아미노산 서열을 갖는 "변이(variant)" 폴리펩티드로 지칭된다. 서열 또는 기준 서열이 이중가닥 DNA의 (+) 또는 (-) 방향을 나타낼 수 있다. 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 바와 같이, 그와 같은 서열들은 상호 간의 역 상보체(reverse complement)로 관계된다.
일배체형은 세그먼트를 따라 배열된 대립형질의 특정한 조합을 특징으로 하는 DNA의 세그먼트를 의미한다. 인간과 같은 이배체 개체의 경우, 일배체형은 각 다형성 마커 또는 유전자 좌에 대한 1쌍의 대립형질 중 하나의 대립형질을 포함한다. 특정한 구체예에서, 일배체형은 두개 이상의 대립형질, 세개 이상의 대립형질,네개 이상의 대립형질, 또는 다섯개 이상의 대립형질을 포함할 수 있고, 각 대립형질은 세그먼트 상의 특정한 다형성 마커에 대응된다. 일배체형은 다양한 다형성 마커의 조합, 예를 들면, 다형성 부위에 특정한 대립형질을 갖는 SNP와 마이크로새틀라이트의 조합을 포함할 수 있다. 따라서, 일배체형은 다양한 유전적 마커에서 대립형질의 조합을 포함한다.
특정한 다형성 마커 및/또는 일배체형의 검출은 본 발명이 속하는 기술 분야에서 공지된, 다형성 부위에서 서열을 검출하는 방법에 의해 달성될 수 있다. 예를 들면, PCR, LCR, 이중 PCR(nested PCR) 및 핵산 증폭을 위한 기타 기법을 이용한, 형광-기반 기법(Chen, X. et al., Genome Res. 9(5): 492-98 (1999))과 같은, SNP 및/또는 마이크로새틀라이트 마커의 존재에 대한 유전형분석을 위한 표준 기법이 이용될 수 있다. SNP 유전형분석을 위해 이용할 수 있는 특정한 방법들은 TaqMan 유전형 분석법(genotyping assay) 및 SNPlex 플랫폼(Applied Biosystems), 질량 분석법(예를 들면, Sequenom의 MassARRAY 시스템), 미니-시퀀싱(mini-sequencing) 방법, 실시간 PCR, Bio-Plex 시스템(BioRad), CEQ and SNPstream 시스템(Beckman), Molecular Inversion Probe 어레이 기술(예를 들면, Affymetrix GeneChip), BeadArray Technologies(예를 들면, Illumina GoldenGate 및 Infinium 분석법) 및 Centaurus 분석법(Nanogen)을 포함하나, 이에 한정되지 않는다. 상기 방법들 및 본 발명이 속하는 기술분야의 당업자에게 이용가능한 다른 방법에 의해, 마이크로새틀라이트, SNP 또는 다른 종류의 다형성 마커를 포함한, 다형성 마커에서의 하나 이상의 대립형질이 확인될 수 있다.
본 명세서에 기재된 특정한 방법에서, 특정한 질병 또는 성향에 대한 증가된 감수성(즉, 증가된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대해 증가된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립형질 또는 일배체형(즉, 위험 마커 대립형질 또는 일배체형)이 확인된 개체이다. 일 양태에서, 상기 위험 마커 또는 일배체형은 상기 질병 또는 성향의 유의성 있는 증가된 위험도(또는 감수성)를 부과하는 마커 또는 일배체형이다. 일 구체예에서, 마커 또는 일배체형과 연관된 유의성은 상대적 위험도(relative risk, RR)에 의해 측정된다. 또 다른 구체예에서, 마커 또는 일배체형과 연관된 유의성은 오즈비(odds ratio, OR)에 의해 측정된다. 또 다른 구체예에서, 유의성은 백분율로 측정된다. 일 구체예에서, 유의성 있는 증가된 위험도는 1.2 이상, 1.3 이상, 1.4 이상, 1.5 이상, 1.6 이상, 1.7 이상, 1.8 이상, 1.9 이상, 2.0 이상, 2.5 이상, 3.0 이상, 4.0 이상, 및 5.0 이상을 포함하나, 이에 한정되지 않는, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)로 측정된다. 특정한 구체예에서, 1.2 이상의 위험도(상대적 위험도 및/또는 오즈비)는 유의성이 있다. 또 다른 특정한 구체예에서, 1.3 이상의 오즈비는 유의성이 있다. 또 다른 구체예에서, 1.4 이상의 오즈비는 유의성이 있다. 또 다른 구체예에서, 약 1.5 이상의 오즈비는 유의성이 있다. 또 다른 추가적인 구체예에서, 약 1.7 이상의 위험도는 유의성이 있다. 그러나, 다른 컷오프, 예를 들면, 1.15, 1.25, 1.35 이상 등이 고려되며, 그와 같은 컷오프도 또한 본 발명의 범위 내에 속한다. 다른 구체예에서, 위험도의 유의성 있는 증가는 약 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 150%, 200%, 300%, 및 500%를 포함하나, 이에 한정되지 않는, 약 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 증가는 20% 이상이다. 다른 구체예에서, 위험도의 유의성 있는 증가는 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상 및 100% 이상이다. 그러나, 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다.
본 발명의 위험 다형성 마커 또는 일배체형은 하나 이상의 마커의 하나 이상의 대립형질 또는 일배체형이 비교군(대조군)에서의 존재의 빈도 대비 질병 또는 성향(예를 들면, 심장성 부정맥 또는 뇌졸중)에 대한 위험도를 갖는 개체(질병군)에 보다 빈번하게 존재하고, 상기 마커 또는 일배체형의 존재가 상기 질병 또는 성향에 대한 감수성을 나타내는 것인 마커 또는 일배체형이다. 일 구체예에서, 대조군은 집단 시료(population sample), 즉, 일반적인 집단으로부터의 랜덤 시료일 수 있다. 또 다른 구체예에서, 대조군은 질병에 걸리지 않은 개인의 군으로 대표된다. 일 구체예에서, 그와 같은, 질병-불포함(disease-free) 대조군은 하나 이상의 특정한 질병-연관 증상의 부재를 특징으로 할 수 있다. 또 다른 구체예에서, 상기 질병-불포함 대조군은 하나 이상의 질병-특이적 위험 인자의 부재를 특징으로 한다. 일 구체예에서, 그와 같은 위험 인자는 하나 이상의 환경적 위험 인자이다. 대표적인 환경적 인자들은 특정한 질병 또는 성향을 발현할 위험도에 영향을 미치는 것으로 알려지거나, 상기 위험도에 영향을 미치는 것으로 고려되는 천연 산물, 미네날, 또는 기타 화학물질이다. 기타 환경적 위험 인자들은 식음습관(food and drink habit), 주요 거주지의 지리적 위치 및 직업적 위험 인자를 포함하나, 이에 한정되지 않는, 생활방식(lifestyle)과 관련된 위험 인자들이다. 또 다른 구체예에서, 위험 인자는 하나 이상의 유전적 위험 인자이다.
상관관계에 대한 간단한 검정의 예로서 2 x 2 표(two by two table) 상에서의 Fisher-exact 검정이 있다. 염색체의 코호트가 주어지면, 마커 또는 일배체형을 모두 포함하는 염색체, 마커 또는 일배체형을 중 하나를 포함하고, 나머지 하나는 포함하지 않는 염색체 및 마커나 일배체형 중 어느 것도 포함하지 않는 염색체의 갯수로부터 2 x 2 표가 작성된다.
본 발명의 다른 구체예에서, 질병 또는 성향에 대한 감소된 감수성(즉, 감소된 위험도)을 갖는 개체는 상기 질병 또는 성향에 대한 감소된 감수성을 부여하는 하나 이상의 다형성 마커의 하나 이상의 특정한 대립형질 또는 일배체형이 확인된 개체이다. 감소된 위험도를 부여하는 마커 대립형질 및/또는 일배체형은 또한 보호성(protective)인 것으로 표현된다. 일 양태에서, 보호성 마커 또는 일배체형은 질병 또는 성향의 유의성 있는 감소된 위험도(또는 감수성)를 부여하는 마커 또는 일배체형이다. 일 구체예에서, 유의성 있는 감소된 위험도는 0.9 미만, 0.8 미만, 0.7 미만, 0.6 미만, 0.5 미만, 0.4 미만, 0.3 미만, 0.2 미만 및 0.1 미만을 포함하나, 이에 한정되지 않는, 0.9 미만의 상대적 위험도로 측정된다. 하나의 특정한 구체예에서, 유의성 있는 감소된 위험도는 0.7 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.5 미만이다. 또 다른 구체예에서, 유의성 있는 감소된 위험도는 0.3 미만이다. 또 다른 구체예에서, 위험도(또는 감수성)의 감소는 25% 이상, 30% 이상, 35% 이상, 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 95% 이상 및 98% 이상을 포함하나, 이에 한정되지 않는, 20% 이상이다. 하나의 특정한 구체예에서, 위험도의 유의성 있는 감소는 약 30% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 50% 이상이다. 또 다른 구체예에서, 위험도의 유의성 있는 감소는 약 70% 이상이다. 본 발명이 속하는 기술 분야의 당업자에 의해 본 발명의 특징으로 적합한 것으로 간주되는 다른 컷오프 또는 범위도 고려되고, 그들도 본 발명의 범위 내에 속한다.
본 발명이 속하는 기술 분야의 당업자는 연구된 집단에 존재하는 두개의 대립형질을 갖는 마커에 대해, 하나의 대립형질이 상기 집단 내에서 성향 또는 질병을 갖는 개인의 그룹에서 대조군 대비 증가된 것으로 확인되는 경우, 상기 마커의 나머지 다른 대립형질은 상기 성향 또는 질병을 갖는 개인의 그룹에서 감소된 빈도로 발견될 것으로 이해할 것이다. 그와 같은 경우에, 상기 마커의 하나의 대립형질(상기 성향 또는 질병을 갖는 개인에서 증가된 빈도로 발견되는 대립형질)은 위험 대립형질(at-risk allele)이고, 나머지 다른 대립형질은 보호성 대립형질(protective allele)일 것이다.
연관 불균형(Linkage Disequilibrium)
각 감수분열 사건 동안 각 염색체 쌍에 대해 평균 1회 일어나는, 재조합의 자연적인 현상은 자연이 서열(및 결과적으로 생물학적 기능)에 변화를 제공하는 한가지 방법이다. 재조합은 게놈에서 랜덤하게 일어나지 않는 것으로 발견되었다; 오히려, 재조합율의 빈도에 큰 변화가 있어서, 높은 재조합 빈도를 갖는 작은 영역(따라서, 재조합 핫스팟(recombination hotspot)으로 불림) 및 일반적으로 연관 불균형(LD) 블럭이라 불리는, 낮은 재조합 빈도의 보다 넓은 영역을 생성한다(Myers, S. et al., Biochem Soc Trans 34:526-530 (2006); Jeffreys, A.J., et al.,Nature Genet 29:217-222 (2001); May, C.A., et al., Nature Genet 31:272-275(2002)).
연관 불균형(Linkage Disequilibrium, LD)은 두 개의 유전적 요소의 비-랜덤 조합(non-random assortment)을 의미한다. 예를 들면, 특정한 유전적 요소(예를 들면, 다형성 마커의 대립형질, 또는 일배체형)가 0.25(25%)의 빈도로 집단에서 일어나고, 또 다른 요소는 0.25(25%)의 빈도로 일어나는 경우, 두 요소를 모두 갖는 개인의 예상되는 발생율은 상기 요소들의 랜덤 분포를 가정하면, 0.125(12.5%)이다. 그러나, 상기 두 요소들이 0.125보다 더 높은 빈도로 함께 나타나는 것으로 발견되는 경우, 상기 요소들은 연관 불균형에 있다고 하며, 이는 그들이 그들의 독립적인 발생 빈도(예를 들면, 대립형질 또는 일배체형 빈도)가 예측하는 비율보다 더 높은 비율로 함께 유전되는 경향이 있기 때문이다. 개략적으로, LD는 일반적으로 두 요소간의 재조합 사건의 빈도와 상관관계를 갖는다. 집단에서 대립형질 또는 일배체형 빈도는 개체의 유전형을 분석하고 상기 집단에서 각 대립형질 또는 일배체형의 발생 빈도를 결정하는 것에 의해 결정될 수 있다. 이배체의 집단, 예를 들면, 인간 집단의 경우, 개인들은 일반적으로 각 유전적 요소(예를 들면, 마커, 일배체형 또는 유전자)에 대해 두 개의 대립형질을 가질 것이다.
다수의 상이한 척도들이 연관 불균형(LD)의 강도를 평가하기 위해 제안되었다. 대부분은 이대립형질(biallelic) 부위의 쌍 간의 연관의 강도를 획득한다. LD의 두 개의 중요한 일대일 척도(pairwise measures)는 r2 (△2으로 표시되기도 함) 및 |D'|이다. 두 척도는 모두 0(불균형 없음) 내지 1('완전한' 불균형)의 범위이나, 그들의 해석은 약간 다르다. |D'|는 가능한 일배체형 중 2개 또는 3개만 존재하는 경우, 그 값이 1이고, 모든 4개의 가능한 일배체형이 존재하는 경우는 그 값이 1보다 작은 것으로 정의된다. 따라서, 1보다 작은 |D'|의 값은 두 부위 간에 과거에 재조합이 일어났을 수도 있다는 것을 나타낸다(재발성 돌연변이(recurrent mutation)는 |D'|가 1보다 작게할 수 있으나, 단일 뉴클레오티드 다형성(SNP)의 경우, 이는 통상적으로 재조합보다 가능성이 낮은 것으로 간주됨). 척도 r2는 두 부위간의 통계적 상관성을 나타내고, 두 개의 일배체형만 존재하는 경우 1의 값을 취한다.
r2와, 감수성 유전자 좌와 SNP 간의 연관성을 검출하기 위해 요구되는 표본 크기 간에 단순한 반비례 관계(inverse relationship)가 있기 때문에, r2 측정값은 이론의 여지는 있지만 연관 맵핑(association mapping)에 대한 가장 적합한 척도이다. 이 척도는 부위의 쌍에 대해 정의되나, 일부 적용의 경우, 다수의 다형성 부위를 포함하는 전체 영역에서 LD가 얼마나 강한지를 결정하는 것이 바람직할 수 있다(예를 들면, LD의 강도가 유전자 좌들 간에 또는 집단 전체에 있어서 유의성 있게 상이한지 여부, 또는 하나의 영역에 특정한 모델 하에서 예측된 것보다 더 크거나 또는 더 작은 LD가 존재하는지 여부). 한 영역에 대해 LD를 측정하는 것은 간단하지 않으나, 하나의 방법은 집단 유전학에서 개발된, 척도 r을 이용하는 것이다. 개략적으로 말하면, r은 데이터에서 확인되는 LD를 생성하기 위해, 특정한 집단 모델 하에서 어느 정도의 재조합이 요구되는지를 측정한다. 이 종류의 방법은 또한 잠재적으로 LD 데이터가 재조합 핫스팟의 존재에 대한 증거를 제공하는지 여부를 결정하는 문제에 대한 통계적으로 엄격한 방식을 제공할 수 있다. 본 명세서에 기재된 방법 및 절차의 경우, 유의성 있는 r2 값은 0.1 이상, 예를 들면, 0.1 이상, 0.15 이상, 0.2 이상, 0.25 이상, 0.3 이상, 0.35 이상, 0.4 이상, 0.45 이상, 0.5 이상, 0.55 이상, 0.6 이상, 0.65 이상, 0.7 이상, 0.75 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.91 이상, 0.92 이상, 0.93 이상, 0.94 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상 또는 1.0일 수 있다. 하나의 바람직한 구체예에서, 유의성 있는 r2 값은 0.2 이상일 수 있다. 대안적으로, 본 명세서에 기재된 연관 불균형은 0.3 이상, 0.4 이상, 0.5 이상, 0.6 이상, 0.7 이상, 0.8 이상, 0.85 이상, 0.9 이상, 0.95 이상, 0.96 이상, 0.97 이상, 0.98 이상, 0.99 이상과 같은, 0.2 이상의 |D'| 값을 특징으로 하는 연관 불균형을 의미한다. 따라서, 연관 불균형은 별개의 마커들의 대립형질 간의 상관관계를 나타낸다. 연관 불균형은 상관 계수(correlation coefficient) 또는 |D'| (1.0 이하의 r2 및 1.0 이하의 |D'|)에 의해 측정된다. 연관 불균형은 본 명세서에서 정의된 바와 같이, 하나의 인간 집단에서 결정될 수 있거나, 또는 하나보다 많은 인간 집단으로부터의 개인들을 포함하는 시료의 수집물(colleciton)에서 결정될 수 있다. 본 발명의 일 구체예에서, LD는 정의된 바와 같은(http://www.hapmap.org), 하나 이상의 HapMap 집단(코카서스인, 아프리카인, 일본인, 중국인)으로부터의 시료에서 결정된다. 하나의 그와 같은 구체예에서, LD는 HapMap 시료의 CEU 집단에서 결정된다. 또 다른 구체예에서, LD는 YRI 집단에서 결정된다. 또 다른 구체예에서, LD는 아이슬란드 집단에서 결정된다.
게놈의 모든 다형성이 집단 수준에서 동일하다면, 모든 단일 다형성이 연관(association) 연구에서 조사되어야 할 것이다. 그러나, 다형성 간의 연관 불균형 때문에, 긴밀하게 연관된 다형성들이 강한 상관관계를 가지며, 이는 유의성 있는 연관을 관찰하기 위한 연관 연구에서 조사되어야 하는 다형성의 갯수를 감소시킨다. LD의 또 다른 결과는 이 다형성들이 강한 상관관계를 갖는다는 사실 때문에, 다수의 다형성들이 연관 신호(association signal)를 생성할 수 있다는 것이다.
게놈 LD 맵이 게놈 전체에 대해 생성되었고, 그와 같은 LD 맵이 질병-유전자를 맵핑하기 위한 프레임워크로 작용할 것으로 제안되었다(Risch, N. & Merkiangas, K, Science 273:1516-1517 (1996); Maniatis, N., et al., Proc Natl Acad Sci USA 99:2228-2233 (2002); Reich, DE et al, Nature 411:199-204 (2001)).
현재, 인간 게놈의 많은 부분들이 수개의 공통된 일배체형을 포함하는 일련의 별개의 일배체형 블럭들로 분류될 수 있다; 이 블럭들의 경우, 연관 불균형 데이터는 재조합을 나타내는 증거를 거의 제공하지 않는다(예를 들면, Wall., J.D. and Pritchard, J.K., Nature Reviews Genetics 4:587-597 (2003); Daly, M. et al., Nature Genet. 29:229-232 (2001); Gabriel, S.B. et al., Science 296:2225-2229 (2002); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003) 참조).
이와 같은 일배체형 블럭을 정의하는 두 가지 주요한 방법들이 있다: 블럭은 한정된 일배체형 다양성을 갖는 DNA의 영역(예를 들면, Daly, M. et al., Nature Genet. 29:229-232 (2001); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Zhang, K. et al., Proc. Natl. Acad. Sci. USA 99:7335-7339 (2002) 참조), 또는, 연관 불균형을 이용하여 확인된, 광범위한 과거의 재조합(extensive historical recombination)을 갖는 이행 구역(transition zone) 간의 영역(예를 들면, Gabriel, S.B. et al., Science 296:2225-2229 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003); Wang, N. et al., Am. J. Hum. Genet. 71:1227-1234 (2002); Stumpf, M.P., and Goldstein, D.B., Curr. Biol. 13:1-8 (2003) 참조)으로 정의될 수 있다. 보다 최근에, 인간 게놈 전체에 대한 재조합률(recombination rate) 및 상응하는 핫스팟의 상세 맵(fine-scale map)이 작성되었다(Myers, S., et al., Science 310:321-32324 (2005); Myers, S. et al., Biochem Soc Trans 34:526530 (2006)). 상기 맵은 게놈 전체에서 재조합의 엄청난 변이를 보여주며, 재조합률은 핫스팟에서 10-60 cM/Mb로 높았고, 개재 영역(intervening region)에서는 재조합률이 0에 가까워서, 제한적인 일배체형 다양성 및 높은 LD의 영역을 나타낸다. 따라서, 상기 맵은 일배체형 블럭 및/또는 LD 블럭을 재조합 핫스팟에 의해 둘러싸인(flanked) 영역으로 정의하기 위해 이용될 수 있다. 본 명세서에서 사용된, 용어 "일배체형 블럭(haplotype block)" 또는 "LD 블럭"은 전술된 특징들에 의해 정의되는 블럭, 또는 그와 같은 영역을 정의하기 위해 본 발명이 속하는 기술 분야의 당업자에 의해 이용되는 다른 대안적인 방법에 의해 정의되는 블럭을 포함한다.
일배체형 블럭은 단일 마커, 또는 복수 개의 마커를 포함하는 일배체형을 이용하여, 표현형과 일배체형 상태 간의 연관을 맵핑하기 위해 이용될 수 있다. 각 일배체형 블럭에서 주요한 일배체형이 식별되고, 그 후, 일련의 태깅(tagging) SNP 또는 마커들(일배체형들을 구별하기 위해 필요한 최소 세트의 SNP 또는 마커)이 식별될 수 있다. 이 태깅 SNP 또는 마커들은 표현형과 일배체형 간의 연관을 확인하기 위해, 개체들의 군(group)으로부터의 시료의 평가에서 이용될 수 있다. 필요한 경우, 인접한 일배체형 블럭들 간에는 연관 불균형이 존재할 수 있기 때문에, 이 블럭들이 동시에 평가될 수 있다.
따라서, 게놈에서 다형성 마커에 대한 관찰된 연관에 대해, 게놈 내의 추가적인 마커들이 또한 연관을 보일 수 있다는 것이 명백하다. 이는 재조합률의 큰 변이에서 관찰된 바와 같이, 게놈 전체에서 LD의 불균등한 분포의 당연한 결과이다. 따라서, 연관을 검출하기 위해 이용되는 마커들은 주어진 질병 또는 성향과 연관된 게놈 영역(즉, 일배체형 블럭 또는 LD 블럭)에 대한 "택(tag)"을 나타내고, 따라서, 본 발명의 방법 및 키트에서 사용하기에 유용하다. 하나 이상의 원인이 되는(causative)(기능성) 변이 또는 돌연변이가 상기 질병 또는 성향과 연관된 것으로 확인되는 영역 내에 존재할 수 있다. 그와 같은 변이는 연관을 검출하기 위해 이용되는 태깅 마커에 대해 관찰되는 것보다 더 높은 상대적 위험도(RR) 또는 오즈비(OR)를 부여할 수 있다. 따라서, 본 발명은 본 명세서에 기재된 바와 같이, 질병과의 연관을 검출하기 위해 이용되는 마커, 및 상기 마커와 연관 불균형인 마커를 포함한다. 따라서, 본 발명의 특정한 구체예에서, 본 명세서에 기재된 바와 같은, 본 발명의 마커 및/또는 일배체형과 LD인 마커가 대리 마커(surrogate marker)로 이용될 수 있다. 일 구체예에서, 대리 마커는 본 명세서에 기재된 바와 같이, 초기에 상기 질병과 연관된 것으로 확인된 마커 또는 일배체형의 경우 보다 더 작은 상대적 위험도(RR) 및/또는 오즈비(OR)을 갖는다. 다른 구체예에서, 대리 마커는 본 명세서에 기재된 바와 같이, 상기 질환과 연관된 것으로 초기에 확인된 마커에 대해 초기에 결정된 RR 또는 OR 값보다 큰 RR 또는 OR 값을 갖는다. 그와 같은 구체예의 예는 본 명세서에 기재된 변이와 같은, 상기 질병과 연관되는 것으로 초기에 확인된 보다 일반적인 변이(> 10% 집단 빈도)와 LD인 드물거나, 또는 비교적 드문(< 10% 대립형질의 집단 빈도) 변이일 것이다. 본 명세서에 기재된 바와 같이, 본 발명자들에 의해 발견된 연관을 검출하기 위해 그와 같은 마커들을 식별하고 이용하는 것은 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 통상적인 방법에 의해 수행될 수 있고, 따라서, 본 발명의 범위에 속한다.
본 명세서에서 심장성 부정맥(예를 들면, 심방세동 및 심방조동) 및 뇌졸중과 연관된 것으로 확인된 마커들과 연관 불균형인 일부 다형성 마커들이 서열번호 50에 의해 표시된 서열에 의해 정의된 LD 블럭 C04의 물리적 경계 외부에 위치할 수 있다. 이는 강한 LD의 영역(LD 블럭)을 초래했을 수도 있는, 해당 영역에서의 과거의 재조합률(historical recombination rate)의 결과이며, 상기 블럭의 외부에 있는 나머지 마커들은 상기 블럭 내의 마커들과 LD이다. 그와 같은 마커들도, 본 명세서에서 심장성 부정맥 및 뇌졸중과 연관된 것으로 확인된 마커들과의 유전적 관계 때문에 본 발명을 실시하는 데 있어서 동일하게 유용하므로, 본 발명의 범위 내에 속한다. 그와 같은 마커의 예가 표 18(rs7668322 (서열번호 46), rs2197815 (서열번호 47), rs6831623 (서열번호 48), rs2595110 (서열번호 49))에 표시된다.
일배체형 빈도의 결정
기대값-극대화 알고리즘(expectation-maximization algorithm)을 이용하여 환자군 및 대조군에서 일배체형의 빈도를 추정할 수 있다(Dempster A. et al., J. R. Stat. Soc. B, 39:1-38 (1977)). 결실된 유전형 및 그 상태(phase)에 따른 불확실성을 처리할 수 있는 이 알고리즘의 구현이 이용될 수 있다. 귀무 가설(null hypothesis) 하에서, 환자와 대조군은 동일한 빈도를 갖는 것으로 가정된다. 가능성 방식(likelihood approach)을 이용하여, 본 명세서에 기재된 마커들을 포함할 수 있는, 후보 위험-일배체형이 대조군에서보다 환자에서 보다 높은 빈도를 가지며, 다른 일배체형의 빈도는 양 군에서 동일한 것으로 가정되는 것인 대안적인 가설이 테스트된다. 양 가설 하에 가능성이 각각 극대화되고, 상응하는 1-df 가능성 비 통계값이 통계적 유의성을 평가하기 위해 이용된다.
연관 영역(linkage region) 내에서 위험 마커와 일배체형 및 보호성 마커와 일배체형을 찾기 위해, 예를 들면, 마커들이 실제 영역에 걸쳐있는 경우, 유전형 분석된 마커들의 모든 가능한 조합의 연관이 연구된다. 통합된 환자군과 대조군이 원래의 환자군 및 대조군과 동일한 크기인 두개의 세트로 무작위로 분류될 수 있다. 그 후, 마커 및 일배체형 분석이 반복되고, 기록된 가장 유의성 있는 p-값이 결정된다. 이 랜덤화 체계(randomization scheme)는 p-값의 경험적 분포를 구성하기 위해 예를 들면, 100회 이상 반복될 수 있다. 바람직한 구체예에서, 0.05 미만의 p-값은 유의성 있는 마커 및/또는 일배체형 연관을 나타낸다.
일배체형 분석
일배체형 분석의 일반적인 방법은 NEsted MOdels에 적용된 가능성-기반 추론(likelihood-based inference)을 이용하는 단계를 포함한다(Gretarsdottir S., et al., Nat. Genet. 35:131-38 (2003)). 상기 방법은 다수의 다형성 마커, SNP 및 마이크로새틀라이트에 대해 이용될 수 있는 프로그램 NEMO에서 구현된다. 상기 방법 및 소프트웨어는 특별히, 상이한 위험도를 부여하는 일배체형 그룹을 식별하는 것을 목적으로 하는 케이스-대조군(case-control) 연구를 위해 설계된다. 상기 방법 및 프로그램은 또한 LD 구조를 연구하기 위한 도구이다. NEMO에서, 관찰된 데이터가 이를 결실-데이터(missing-data) 문제로 처리하기 때문에, EM 알고리즘을 이용하여, 최대 가능성 추정치, 가능성 비(likelihood ratio) 및 p-값이 직접 계산된다.
상태(phase)의 불확실성 및 결실된 유전형에 따른 정보 소실을 반영한, 관찰된 데이터에 대해 직접 계산된 가능성에 기반한 가능성 비 테스트가 유효한 p-값을 제공하기 위해 이용될 수 있으나, 정보의 불완전성 때문에 소실되는 데이터의 양을 아는 것이 여전히 유용할 것이다. 일배체형 분석의 정보 척도(information measure)는 Nicolae and Kong (Technical Report 537, Department of Statistics, University of Statistics, University of Chicago; Biometrics, 60(2):368-75 (2004))에서 연관성 분석(linkage analysis)를 위해 정의된 정보 척도의 당연한 연장(natural extension)으로 설명되며, NEMO에서 구현된다.
질병에 대한 단일 마커 연관을 위해, 각각의 개별적인 대립형질에 대해 양측 p-값(two-sided p-value)을 계산하기 위해 Fisher exact 테스트가 이용될 수 있다. 통상적으로, 모든 p-값은 특별히 표시되지 않으면, 다중 비교(multiple comparison)에 대해 조정되지 않은 상태로 제시된다. (마이크로새틀라이트, SNP 및 일배체형에 대해) 제시된 빈도는 보인자 빈도(carrier frequency)와 대립되는, 대립형질 빈도(allelic frequency)이다. 연관 분석을 위한 패밀리로 동원된 환자들의 관련성(relatedness)에 따른 편향을 최소화하기 위해, 환자 목록에서 1촌 및 2촌(first and second-degree) 친척들이 제외될 수 있다. 또한, 혈연관계(sibship)에 대해 Risch, N. & Teng, J. (Genome Res., 8:1273-1288 (1998))에 기재된 분산 조정 절차(variance adjustment procedure), DNA 풀링 (ibid)을 확대하여 일반적인 가족 관계(familial relationship)에 적용될 수 있도록, 상기 테스트가 환자들 간의 잔여 관련성(remaining relateteness)에 대해 보정하기 위해 연관에 대해 반복될 수 있고, 비교를 위해 조정된 p-값 및 조정되지 않은 p-값을 제시할 수 있다. 차이는 예상되는 바와 같이 일반적으로 매우 작다. 복수 회의 테스트에 대해 보정된 단일-마커 연관성의 유의성을 평가하기 위해, 본 발명자들은 동일한 유전형 데이터를 이용하여 랜덤화 테스트를 수행할 수 있다. 환자와 대조구의 코호트가 랜덤화되고 연관 분석이 복수 회(예를 들면, 500,000회 이하) 재수행되며, 그 p-값은 본 발명자들이 본래의 환자 및 대조구 코호트를 이용하여 관찰한 p-값과 동일하거나 그보다 더 낮은, 일부 대립형질에 대한 p-값을 생성하는 재현의 일부(fraction of replications)이다.
단일 마커 분석 및 일배체형 분석에 대해, 승법 모델(multiplicative model)(일배체형 상대적 위험도 모델), 즉, 한 사람이 갖는 두 개의 대립형질/일배체형의 위험도들이 곱해진다는 승법 모델을 가정하여 상대적 위험도(RR) 및 집단 귀속 위험도(population attributable risk, PAR)가 계산될 수 있다(Terwilliger, J.D. & Ott, J., Hum. Hered. 42:337-46 (1992) and Falk, C.T. & Rubinstein, P, Ann. Hum. Genet. 51 (Pt 3):227-33 (1987)). 예를 들면, RR이 a 대비 A의 위험도라면, 동형접합체 AA를 갖는 사람의 위험도는 이형접합체 Aa의 위험도의 RR배이고, 동형접합체 aa를 갖는 사람의 RR2배일 것이다. 승법 모델은 분석 및 계산을 단순화하는 유용한 특성을 갖는다- 환자 집단(affected population) 및 대조구 집단 내에서 일배체형은 독립적이고, 즉, 하디-와인버그 평형(Hardy-Weinberg equilibrium)에 있다. 그 결과, 환자(affected)와 대조군 각각의 일배체형 계수(haplotype count)는 다항 분포를 가지나, 대안적인 가설 하에서 상이한 일배체형 빈도를 갖는 다항 분포를 갖는다. 구체적으로, 두개의 일배체형, h i 및 h j 에 대해, risk(h i )/risk(h j ) = (f i /p i )/(f j /p j )이고, 상기에서 f와 p는 각각 환자 집단 및 대조구 집단에서의 빈도를 나타낸다. 실제 모델이 승법성이 아닌 경우, 일부 검정력 손실(power loss)이 있으나, 이 손실은 극단적인 경우를 제외하고는 작은(mild) 경향이 있다. 가장 중요한 것은, p-값은 귀무 가설 하에 계산되기 때문에, 항상 유효하다는 것이다.
NEMO를 이용한 연관 불균형
마커들의 쌍 간의 LD는 D' 및 r2 의 표준 정의를 이용하여 계산될 수 있다(Lewontin, R., Genetics 49:49-67 (1964); Hill, W.G. & Robertson, A. Theor. Appl. Genet. 22:226-231 (1968)). NEMO를 이용하여, 두 마커 대립형질 조합의 빈도가 최대 가능성(maxium likelihood)에 의해 추정되고 연관 균형으로부터의 편차가 가능성 비 테스트(likelihood ratio test)에 의해 평가된다. D' 및 r2의 정의가 한계 대립형질 확률(marginal allele probability)에 의해 가중된 두 마커의 모든 가능한 대립형질 조합에 대해 평균하는 것에 의해 마이크로새틀라이트를 포함하도록 확대된다. 특정한 영역에 대한 LD 구조를 규명하기 위해 모든 마커 조합을 도시(plot)할 때, 본 발명자들은 D'을 좌측 상단 코너(upper left corner)에 도시하고, p-값을 우측 하단 코너에 도시하였다. 상기 LD 플롯에서, 필요한 경우, 마커들은 그들의 물리적 위치에 따라서가 아니라, 등거리로 도시될 수 있다.
위험도 평가 및 진단
본 명세서에 기재된 바와 같이, 특정한 다형성 마커 및 그와 같은 마커를 포함하는 일배체형이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 또는 뇌졸중의 위험도 평가를 위해 유용한 것으로 확인되었다. 위험도 평가는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 또는 뇌졸중에 대한 감수성을 진단하기 위한 마커의 이용을 포함할 수 있다. 다형성 마커의 특정한 대립형질은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 또는 뇌졸중을 갖지 않는 개체들에서보다, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 또는 뇌졸중을 갖는 개체들에서 보다 빈번하게 발견된다. 그러므로, 이 마커 대립형질들은 개체에서 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 또는 뇌졸중, 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 또는 뇌졸중에 대한 감수성을 검출하기 위한 예측적 가치(predictive value)를 갖는다. 본 발명의 마커와 같은, 위험 마커들을 포함하는 일배체형 블럭 또는 LD 블럭 내의 태깅 마커들(tagging markers)이 일배체형 블럭 또는 LD 블럭 내의 다른 마커 및/또는 일배체형에 대한 대리물(surrogate)로 이용될 수 있다. 1의 r 2 값을 갖는 마커들이 위험 변이(at-risk variant)에 대한 완벽한 대리물이고, 즉, 하나의 마커에 대한 유전형이 나머지 마커에 대한 유전형을 완벽하게 예측한다. 1보다 작은 r 2 값을 갖는 마커들도 위험 변이의 대리물일 수 있거나, 또는 대안적으로 그 위험 변이만큼 높거나 또는 그 변이보다 훨씬 더 높은 상대적 위험도값을 갖는 변이를 나타낸다. 확인된 위험 변이는 그 자체로 기능적 변이가 아닐 수 있으나, 이 경우, 진정한 기능적 변이와 연관 불균형 관계일 수 있다. 본 발명은 본 명세서에 개시된 마커에 대한 그와 같은 대리 마커(surrogate marker)의 평가를 포함한다. 그와 같은 마커들이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려진 바와 같이, 공개 데이터베이스에 설명(annotate)되고, 맵핑되고, 열거되어 있거나, 또는 대안적으로 개체들의 군에서 본 발명의 마커에 의해 확인된 영역 또는 그 영역의 일부를 서열결정하고, 결과적으로 수득된 서열의 군에서 다형성을 식별하는 것에 의해 용이하게 식별될 수 있다. 그 결과, 본 발명이 속하는 기술 분야의 당업자는 용이하게, 과도한 실험 없이 본 명세서에 기재된 마커 및/또는 일배체형과 연관 불균형인 대리 마커들의 유전형을 분석할 수 있다. 검출된 위험 변이와 LD인 태깅 마커 또는 대리 마커도 개인에서 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중, 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 또는 뇌졸중에 대한 감수성에 대한 연관을 검출하기 위한 예측값을 갖는다. 본 발명의 마커들과 LD인 이 태깅 마커들 또는 대리 마커들은 또한 이들이 유사하게 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 검출하기 위한 예측적 가치를 갖기 때문에, 일배체형들을 구별하는 다른 마커들을 포함할 수 있다.
본 발명의 마커 및 일배체형, 예를 들면, 표 5 내지 9에 제시된 마커들, 및 이들과 연관 불균형인 마커들은 단독으로, 또는 조합되어 위험도 평가 및 진단적 목적을 위해 유용할 수 있다. 따라서, 개별적인 마커에 의한 위험도의 증가가 비교적 크지 않은 경우, 즉, 10-30%의 수준인 경우에도, 연관은 유의성 있는 영향을 가질 수 있다. 따라서, 상대적으로 일반적인 변이가 전체 위험도에 대해 유의성 있는 기여도를 가질 수 있거나(집단 귀속 위험도(PAR)이 높음), 또는 마커들의 조합이 마커들의 통합된 위험도에 근거하여, 상기 질병을 발병할 유의성 있는 통합 위험도(combined risk)를 갖는 개체들의 그룹을 정의하기 위해 이용될 수 있다.
따라서, 본 발명의 일 구체예에서, 복수의 변이(유전적 마커 및/또는 바이오마커 및/또는 일배체형)가 전체 위험도 평가를 위해 이용된다. 일 구체예에서, 이 변이들은 본 명세서에 개시된 변이들로부터 선택된다. 다른 구체예는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 진단하기 위해 유용한 것으로 알려진 다른 변이들과 조합된, 본 발명의 변이의 용도를 포함한다. 그와 같은 구체예에서, 복수 개의 마커 및/또는 일배체형의 유전형 상태가 개체에서 결정되고, 개체의 상태(status)가 연관된 변이의 집단 빈도, 또는 연령이 조화되고(age-matched) 성별이 조화된(sex-matched) 개체들과 같은, 임상적으로 건강한 개체에서의 변이의 빈도와 비교된다. 다변량 분석(multivariate analysis) 또는 결합 위험도 분석(joint risk analysis)과 같은, 본 발명이 속하는 기술 분야에서 공지된 방법들이 뒤이어 복수 개의 유전자 좌에서의 유전형 상태에 기초하여 부여된 전체 위험도를 결정하기 위해 이용될 수 있다. 그와 같은 분석에 기초한 위험도의 평가가 뒤이어 본 명세서에 기재된, 본 발명의 방법 및 키트에서 이용될 수 있다.
전술된 바와 같이, 인간 게놈의 일배체형 블럭 구조는 질병 또는 성향과 본래 연관된 변이와 연관 불균형인 다수의 변이(마커 및/또는 일배체형)가 상기 질병 또는 성향에 대한 연관을 평가하기 위한 대리 마커로 이용될 수 있다는 효과를 갖는다. 그와 같은 대리 마커의 갯수는 해당 영역에서의 과거 재조합률, 해당 영역에서의 돌연변이 빈도(즉, 해당 영역 내의 다형성 부위 또는 마커의 갯수), 및 해당 영역에서 LD의 정도(LD 블럭의 크기)와 같은 인자들에 의존할 것이다. 이 마커들은 통상적으로 본 명세서에 기재된 방법, 또는 본 발명이 속하는 기술 분야의 당업자에게 공지된 다른 방법을 이용하여 정의된 것과 같은 해당 LD 블럭 또는 일배체형 블럭의 물리적 경계 내에 위치한다. 그러나, 종종, 마커 및 일배체형 연관은 정의된 일배체형 블럭의 물리적 경계를 넘어서 연장되는 것으로 발견된다. 그와 같은 마커 및/또는 일배체형은 그 경우에 또한 정의된 일배체형 블럭 내에 물리적으로 존재하는 마커 및/또는 일배체형에 대한 대리 마커 및/또는 일배체형으로 이용될 수 있다. 그 결과, 본 발명의 마커 및 일배체형과 LD(일반적으로 0.3보다 큰 r2, 또는 0.4보다 큰 r2을 포함한, 0.2보다 큰 r2과 같은, 0.1보다 큰 r2을 특징으로 함)인 마커 및 일배체형도, 물리적으로, 정의된 일배체형 블럭의 경계를 넘어서 존재하더라도, 본 발명의 범위 내에 속한다. 이는 본 명세서에 기재된 마커들(예를 들면, 표 5 및 표 9)을 포함하나, 또한, 표 5 및 표 9에 열거된 하나 이상의 마커와 연관 불균형(예를 들면, 0.2보다 큰 r2 및/또는 |D'| > 0.8을 특징으로 함)인 다른 마커들을 포함한다.
본 명세서에 기재된 SNP 마커의 경우, 환자에서 과량으로 존재하는 것으로 확인된 대립형질(위험-대립형질)에 대한 반대 대립형질(opposite allele)은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에서 감소된 빈도로 발견된다. 따라서, 그와 같은 마커들과 LD이고 및/또는 그와 같은 마커들을 포함하는 이 마커들 및 일배체형은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대해 보호성이고, 즉, 그들은 이 마커들 및/또는 일배체형을 갖는 개인들의 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 발병할 감소된 위험도 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감소된 감수성을 부여한다.
특정한 일배체형을 포함한, 본 발명의 특정 변이들은 일부 경우에, 다양한 유전적 마커들의 조합, 예를 들면, SNP와 마이크로새틀라이트의 조합을 포함한다. 일배체형을 검출하는 것은 본 발명이 속하는 기술 분야에서 알려지고 및/또는 본 명세서에 기재된, 다형성 부위에서의 서열을 검출하는 방법에 의해 달성될 수 있다. 또한, 특정한 일배체형 또는 일련의 마커들과 질병 표현형 간의 상관관계가 표준 기법을 이용하여 검증될 수 있다. 간단한 상관성 테스트의 대표적인 예가 2 x 2 표에서의 Fisher-exact 검정이다.
특정한 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 것으로 확인된 마커 또는 일배체형(예를 들면, 표 5(표 5A 및 5B), 표 9 및/또는 표 19에 열거된 마커들, 및 이들과 연관 불균형인 마커)은 마커 또는 일배체형이 건강한 개체(대조군)에서의 그의 존재의 빈도에 비해, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 위험을 갖는 개체(예를 들면, 영향받은 사람)에 보다 빈번하게 존재하는 마커 또는 일배체형이고, 상기 마커 대립형질 또는 일배체형의 존재는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중, 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 나타낸다. 다른 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 것으로 확인된 하나 이상의 마커와 연관 불균형인 위험 마커(예를 들면, 표 5(표 5A 및 5B)에 열거된 마커들, 및 이들과 연관 불균형인 마커)는 건강한 개체(대조군)에서의 그들의 존재의 빈도 대비, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 위험도를 갖는 개체(예를 들면, 영향받은 개체)에 보다 빈번하게 존재하는 태깅 마커이고, 상기 태깅 마커의 존재는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 증가된 감수성을 나타낸다. 또 다른 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 것으로 확인된 하나 이상의 마커(예를 들면, 표 5(표 5A 및 5B)에 열거된 마커 대립형질, 및 이들과 연관 불균형인 마커)와 연관 불균형인 위험 마커 대립형질(즉, 증가된 감수성을 부여하는 대립형질)은 건강한 개체(대조군)에서 그들의 존재의 빈도 대비, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 위험도를 갖는 개체에 보다 빈번하게 존재하는 하나 이상의 대립형질을 포함하는 마커이고, 상기 마커의 존재는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 증가된 감수성을 나타낸다.
연구 집단(study population)
일반적으로, 본 발명의 방법 및 키트는 임의의 원천, 즉, 임의의 개체으로부터의 게놈 DNA를 포함하는 시료로부터 이용될 수 있다. 바람직한 구체예에서, 개체는 인간이다. 개인은 성인, 아동, 또는 태아일 수 있다. 본 발명은 또한, 표적 집단의 구성원인 개체에서 마커 및/또는 일배체형을 평가하는 방법을 제공한다. 일 구체예에서, 그와 같은 표적 집단은 다른 유전적 인자, 바이오마커, 생체물리적 인자(예를 들면, 체중, BMD, 혈압), 또는 전반적인 건강 및/또는 생활방식 파라미터(예를 들면, 질병 또는 관련 질병의 병력, 질병의 과거 진단, 질병의 가족력)에 기반하여, 상기 질병을 발병할 위험도를 갖는 개체들의 집단 또는 그룹이다.
본 발명은 40세 이상, 45세 이상, 또는 50세 이상, 55세 이상, 60세 이상, 65세 이상, 70세 이상, 75세 이상, 80세 이상, 또는 85세 이상의 개인과 같은, 특정한 연령 서브그룹으로부터의 개인을 포함하는 구체예를 제공한다. 본 발명의 다른 구체예는 80세 미만, 75세 미만, 또는 70세 미만, 65세 미만, 60세 미만, 55세 미만, 50세 미만, 45세 미만, 40세 미만, 35세 미만, 또는 30세 미만과 같은, 85세 미만의 개인과 같은, 다른 연령군에 관한 것이다. 다른 구체예는 질병의 발병시 전술된 임의의 연령 범위의 연령을 갖는 개인에 관한 것이다. 또한, 특정한 구체예에서, 45세를 초과하나, 60세 미만인 발병시 연령과 같은 일정 범위의 연령이 관련된 것일 수 있는 것으로 고려된다. 그러나, 앞서 열거된 연령값에 의해 일괄된 모든 연령 범위를 포함한, 다른 연령 범위도 고려된다.
다른 구체예는 특정한 연령 또는 연령 범위에 상기 질병의 발병 연령을 갖는 개인들에 관한 것이다. 따라서, 유전적 및 비-유전적 소인성 인자들이 개인이 질병을 발병하는 연령에 영향을 미칠 수 있다는 것이 알려져 있다. 심장성 부정맥 및 뇌졸중을 포함한, 심혈관 질환의 경우, 일반적인 위험 인자들이 개인이 상기 질병을 발병할지 여부, 및 어느 연령에 발병할지에 영향을 미칠 수 있다. 따라서, 본 발명의 일부 구체예는 특정한 연령 범위에서 심장성 부정맥(예를 들면, 심방세동 및/또는 심방조동) 또는 뇌졸중의 발병 연령 또는 진단 연령에 관한 것이다. 일 구체예에서, 심장성 부정맥(예를 들면, 심방세동 및/또는 심방조동) 또는 뇌졸중을 발병할 위험을 갖는 개인들은 40세 이상의 연령에서 발병 연령 또는 진단 연령을 갖는다. 다른 구체예에서, 개인들은 45세 이상, 50세 이상, 55세 이상, 60세 이상, 65세 이상, 70세 이상, 75세 이상, 80세 이상, 또는 85세 이상의 발병 연령 또는 진단 연령을 갖는다. 본 발명의 다른 구체예는 80세 미만, 75세 미만, 또는 70세 미만, 65세 미만, 60세 미만, 55세 미만, 50세 미만, 45세 미만, 40세 미만, 35세 미만, 또는 30세 미만과 같은, 85세 미만의 발병 연령 또는 진단 연령을 갖는 개인들에 관한 것이다. 하나의 바람직한 구체예는 80세 미만의 연령에 심방세동 또는 심방조동 또는 뇌졸중으로 진단된 개인들을 포함한다. 또 다른 바람직한 구체예는 70세 미만의 연령에 심방세동 또는 심방조동 또는 뇌졸중으로 진단된 개인들을 포함한다. 또 다른 바람직한 구체예는 60세 미만의 연령에 심방세동 또는 심방조동 또는 뇌졸중으로 진단된 개인들을 포함한다. 또 다른 바람직한 구체예는 50세 미만의 연령에 심방세동 또는 심방조동 또는 뇌졸중으로 진단된 개인들을 포함한다. 다른 구체예는 전술된 바와 같은, 특정한 연령 범위에 상기 질병의 발병 연령을 갖는 개인들에 관한 것이다. 연령 범위는 특정한 구체예에서, 45세를 초과하나, 60세 미만인 발병 연령, 60세를 초과하고 70세 미만인 발병 연령, 70세를 초과하고 80세 미만인 발병 연령, 또는, 60세를 초과하고 80세 미만인 발병 연령과 같은 연령 범위들이 관련될 수 있는 것으로 고려된다. 그러나, 전술된 연령 값들에 의해 일괄된 모든 연령 범위를 포함한, 다른 연령 범위들도 고려된다.
본 발명은 또한 하나의 성별의 개인, 남성 또는 여성에 관한 것이다. 본 발명은 또한 반투(Bantu), 만덴크(Mandenk), 요루바(Yoruba), 산(San), 음부티 피그미(Mbuti Pygmy), 오르카디안(Orcadian), 아디겔(Adygel), 러시안(Russian), 사르디니안(Sardinian), 투스칸(Tuscan), 모자비트(Mozabite), 베두인(Bedouin), 드루즈(Druze), 팔레스티니안(Palestinian), 발로치(Balochi), 브라휘(Brahui), 마크라니(Makrani), 신디(Sindhi), 파탄(Pathan), 부루쇼(Burusho), 하자라(Hazara), 위구르(Uygur), 칼라쉬(Kalash), 한(Han), 다이(Dai), 다우르(Daur), 헤젠(Hezhen), 라후(Lahu), 미아오(Miao), 오로켄(Oroqen), 쉬(She), 투지아(Tujia), 투(Tu), 시보(Xibo), 이(Yi), 몽골란(Mongolan), 낙시(Naxi), 캄보디안(Cambodian), 일본인( Japanese), 야쿠트(Yakut), 멜라네시안(Melanesian), 파푸안(Papuan), 카리티아난(Karitianan), 수루이(Surui), 콜럼비안(Columbian), 마야(Maya) 및 피마(Pima)를 포함하나, 이에 한정되지 않는 하나 이상의 인간 집단으로부터의 인간 개체에 대한 구체예를 제공한다. 본 발명은 또한, 유럽 집단, 미국 집단, 유라시아 집단, 아시아 집단, 중앙/남아시아 집단, 동아시아 집단, 중동 집단, 아프리카 집단, 라틴 아메리카 집단, 및 오세아니아 집단에 관한 것이다. 유럽 집단은 스웨덴 집단, 노르웨이 집단, 핀란드 집단, 러시아 집단, 덴마크 집단, 아이슬란드 집단, 아일랜드 집단, 켈트(Kelt) 집단, 영국 집단, 스코틀랜드 집단, 네덜란드 집단, 벨기에 집단, 프랑스 집단, 독일 집단, 스페인 집단, 포르투갈 집단, 이탈리아 집단, 폴란드 집단, 불가리아 집단, 슬라브 집단, 세르비아 집단, 보스니아 집단, 체코 집단, 그리스 집단, 및 터키 집단을 포함하나, 이에 한정되지 않는다.
하나의 바람직한 구체예에서, 본 발명은 아프리카 후손 또는 계통의 사람을 포함하는 집단과 같은 블랙 아프리카 선조(ancestry)를 포함하는 집단에 관한 것이다. 블랙 아프리가 선조는 흑인(black race)에 속하거나 또는 니그로 인종(negro race)에 속하는, 아프리카계 미국인(African-American), 아프로-아메리칸(Afro-American), 블랙 아메리칸(Black American)으로 자가-보고하는 것에 의해 결정될 수 있다. 예를 들면, 아프리카계 미국인 또는 블랙 아메리칸은 북미에 거주하고 아프리카의 흑인군에 속하는 기원을 갖는 사람들이다. 또 다른 예에서, 블랙 아프리카 가계의 자가-보고된 사람은 하나 이상의 블랙 아프리카 선조의 부모 또는 하나 이상의 블랙 아프리카 선조의 조부모를 가질 수 있다.
개체에서 인종적 기여는 또한 유전적 분석에 의해 결정될 수 있다. 선조의 유전적 분석은 Smith et al. (Am J Hum Genet 74, 1001-13 (2004))에 개시된 마커와 같은, 연관되지 않은(unlinked) 마이크로새틀라이트를 이용하여 수행될 수 있다.
특정한 구체예에서, 본 발명은 앞서 기재된 바와 같이, 특정한 집단에서 확인되는 마커 및/또는 일배체형에 관한 것이다. 본 발명이 속하는 기술 분야의 당업자는 상이한 집단에 적용되는 경우, 연관 불균형(LD)의 척도는 상이한 결과를 가져올 수 있다는 것을 이해할 것이다. 이는 특정한 게놈 영역에서 LD의 차이를 초래했을 수 있는 차등적 선택 압력(differential selective pressure) 및 상이한 인간 집단의 상이한 집단 역사 때문이다. 일부 마커들, 예를 들면, SNP 마커들이 상이한 집단에서 상이한 집단 빈도를 가지거나, 또는 하나의 집단에서는 다형성이나, 또 다른 집단에서는 다형성이 아니라는 것이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 그러나, 본 발명이 속하는 기술 분야의 당업자는 입수가능한 방법을 적용하고, 본 명세서에서 고려되는 바와 같이, 임의의 인간 집단에서 본 발명을 실시할 것이다. 이는 특정한 집단 내에서 가장 강력한 연관을 제공하는 마커들을 확인하기 위해, 본 발명의 LD 영역에서 다형성 마커를 평가하는 것을 포함할 수 있다. 따라서, 본 발명의 위험 변이는 다양한 인간 집단에서 상이한 일배체형 배경에 상이한 빈도로 존재할 수 있다. 그러나, 당해 분야에서 알려진 방법 및 본 발명의 마커를 이용하여, 본 발명이 임의의 인간 집단에서 실시될 수 있다.
유전적 검사의 유용성
본 발명이 속하는 기술 분야의 당업자는 본 명세서에 기재된 변이가 일반적으로 그 자체로 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 발병할 개인의 절대적 확인을 제공하지 않는다는 것을 고려하고 이해할 것이다. 그러나, 본 명세서에 기재된 변이는 본 발명의 위험 또는 보호성 변이를 갖는 개인이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 증상을 발병할 증가된 및/또는 감소된 가능성을 나타낸다. 그러나, 이 정보는 하기에서 보다 상세하게 요약되는 바와 같이, 그 자체로 매우 유용하며, 이 정보는 예를 들면, 조기 단계에 예방책을 개시하거나, 증상의 진행 및/또는 출현을 모니터링하기 위해 정기적인 신체 및/또는 정신 검진을 받거나, 또는 해당 상태를 확인하기 위해 규칙적인 간격으로 검사를 계획하여, 조기에 치료를 적용할 수 있게 하기 때문이다.
심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 발병할 위험도를 부여하는 유전적 변이에 대한 지식은 상기 질병을 발병할 증가된 위험도를 갖는 개체(즉, 위험 변이의 보인자)와 상기 질병을 발병할 감소된 위험도를 갖는 개체(즉, 보호성 변이의 보인자)를 구별하기 위해 유전적 테스트를 적용할 기회를 제공한다. 상기 언급된 두 그룹에 속하는 개체들에 대해, 유전적 테스트의 핵심 가치는 조기 단계에 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중, 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 소인을 진단하고 가장 적절한 치료를 제공할 수 있도록 하기 위해 임상의에게 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중의 예후/공격성(aggressiveness)에 대한 정보를 제공할 수 있는 가능성이다.
유전적 위험 인자의 존재의 지식, 또는 하나 이상의 위험 인자의 보인자일 증가된 위험에 대한 증거는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 관련된 심혈관 질환에 대한 공지된 환경적 위험 인자들을 피하거나 또는 최소화하는 것에 의해 보다 건강한 생활방식을 구현하기 위한 증가된 인센티브를 제공할 수 있기 때문에, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중의 가족력을 갖는 개인들 및 위험 변이의 보인자는 유전적 테스트로부터 잇점을 얻을 수 있다. 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 환자의 유전적 테스트는 또한 상기 질병의 일차적 원인에 대한 매우 유용한 정보를 제공할 수 있고 각 개인에 대해 최상의 치료 옵션 및 약물을 선택하는데 있어서 임상의를 보조할 수 있다.
본 발명은 또한, 개인이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 발병할 위험에 있는지 여부를 결정하는 단계를 포함하는, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 위험도 평가에 관한 것이다. 본 발명의 다형성 마커는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 개인의 위험도 평가를 위해, 단독으로 또는 조합되어 이용될 수 있고, 또한 다른 유전적 위험 마커 또는 바이오마커들과 조합되어 이용될 수 있다. 개인의 심혈관 질환의 발병 위험도에 대한 소인에 영향을 미치는 것으로 알려진 다수의 인자들이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성 인자이고, 본 발명이 속하는 기술 분야의 당업자에게 알려져 있으며 그와 같은 평가를 위해 이용될 수 있다. 이들은 연령, 성별, 흡연 상태, 신체적 활동, 허리-대-엉덩이 둘레 비(waist-to-hip circumference ratio), 심장성 부정맥(특히, 심방세동 및/또는 심방조동) 및/또는 뇌졸중의 가족력, 과거에 진단된 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중, 비만, 고중성지방혈증, 낮은 HDL 콜레스테롤, 고혈압, 상승된 혈압, 콜레스테롤 수준, HDL 콜레스테롤, LDL 콜레스테롤, 중성지방, 아포리포프로프로테인(apolipoprotein) AI 및 B 수준, 피브리노겐, 페리틴, C-반응성 단백질 및 류코트리엔(leukotriene) 수준을 포함하나, 이에 한정되지 않는다. 심방세동/심방조동 및 뇌졸중과 연관된 특정한 바이오마커가 Allard 등(Clin Chem 51:2043-2051 (2005) and Becker (J Thromb Thrombolys 19:71-75 (2005))에서 검토된다. 이들은 피브린 D-이량체, 프로트롬빈 활성화 단편 1.2 (F1.2), 트롬빈-항트롬빈 III 복합체(TAT), 피브리노펩티드 A(FPA), 지질단백질-연관 포스포리파아제 A2(lp-PLA2), 베타-트롬보글로불린, 혈소판 인자 4, P-셀렉틴, 폰 빌리브란트 인자, 프로-나이트리우레틱 펩티드(BNP), 매트릭스 메탈로프로테이나아제-9(MMP-9), PARK7, 뉴클레오시드 디포스페이트 키나아제(NDKA), tau, 신경세포-특이적 에놀라아제, B-타입 신경영양성 성장 인자, 성상 아교세포성 단백질 S-100b, 신경교섬유 산성 단백질, C-반응성 단백질, 혈청 아밀로이드 A, 매트릭스 메탈로프로테이나아제-9, 혈관 및 세포내 세포 부착 분자, 종양 괴사 인자 알파, 및 인터루킨-1, 인터루킨-6, 및 인터루킨-8을 포함한 인터루킨을 포함하나, 이에 한정되지 않는다. 순환하는 전구 세포들이 또한 AF를 위한 유용한 바이오마커인 것으로 시사되었다. 특정한 환경에서, 개인에 대해 하나보다 많은 수의 바이오마커들이 결정되고, 본 명세서에 기재된 하나 이상의 다형성 마커의 결정의 결과와 통합된다. 바람직하게는, 바이오마커는 개인의 혈장 또는 혈청에서 측정된다. 대안적으로, 바이오마커는 측정가능한 양의 바이오마커를 포함하는 다른 적합한 조직에서 결정되고, 그와 같은 구체예도 본 발명의 범위 내에 속한다.
다변량 분석 또는 로지스틱 회귀 분석을 포함한, 본 발명이 속하는 기술 분야에어 알려진 방법들이 전체 위험도 평가를 위해 이용될 수 있다.
심방세동은 개별 환자 및 전체적인 건강 관리 시스템 모두에 큰 중요성을 갖는 질병이다. 심방세동은 영구적인 상태일 수 있으나, 또한 급작성(paroxymal)이고 재발성일 수 있으며, 이 경우 진단이 매우 어려울 수 있다. 심방세동 및 심방조동의 가장 심각한 합병증은 쇠약성 뇌졸중(debilitating stroke)의 발생이다. 중요한것은 뇌졸중의 위험도가 영구적 심방세동 및 급작성 심방세동에서 동일하다는 것이다. 와파린 항응고가 심방세동의 배경 하에서 최초의 뇌졸중 또는 후속 뇌졸중의 에피소드의 위험도를 유의성 있게 저하시킬 수 있다는 것이 반복적으로 입증되었다. 따라서, 와파린에 의한 항응고는 영구성인지 급작성인지 여부에 관계 없이, 심방세동을 갖는 거의 모든 환자에게 뇌졸중-예방을 위한 표준 치료법이다. 와파린이 강력하게 권고되지 않는 유일한 환자들은 낮은 위험도를 갖는 것으로 간주되는 65세 미만의 환자들이고, 즉, 그들은 고혈압이나 관상동맥 질환을 포함한, 기질적 심장 질환(organic heart disease)을 갖지 않고, 뇌졸중이나 일과성 허혈 발작의 과거 병력이 없으며, 비만증을 갖지 않는다. 이 그룹은 뇌졸중의 보다 낮은 위험도를 가지며, 아스피린에 의한 뇌졸중-예방이 권고된다.
급작성 심방세동의 속성 때문에, 이는 진단이 매우 어려울 수 있다. 환자가 심계항진(palpitation), 흉통, 숨가뿜, 현기증, 심장부전, 일과성 허혈 발작, 또는 뇌졸중과 같은, 질병-관련 증상 때문에, 의학적 주의(medical attention)를 필요로 할 때, 정상적인 심장 리듬이 이미 회복되어, 부정맥의 진단을 배제시킬 수 있다. 이 경우에, 리듬 모니터링이 상기 상태를 진단하기 위한 시도에서 빈번하게 적용된다. 심장 리듬(cardiac rhythm)은 통상적으로 24 내지 48시간 동안 지속적으로 모니터링된다. 유감스럽게도, 심방세동 에피소드는 상기 방식에 의해 예측불가능하고 빈번하게 놓쳐진다. 상기 부정맥을 진단하고, 권고된 치료법을 시행하고, 가능하게는 쇠약을 초래하는 최초의 뇌졸중, 또는 재발성 뇌졸중을 예방할 수 있는 기회를 놓쳐서 환자에게 파괴적인 결과가 초래될 수 있다. 심방세동의 의혹이 매우 강한 경우, 연장되고, 보다 복잡한 심장 리듬 모니터링 척도가 이용가능하고 종종 적용된다. 이 테스트들은 비싸고, 현재의 접근방식에 의한 진단 수율은 종종 낮고, 그들이 이 적응증을 위해 드물게 이용된다. 이 상황에서, 유전적 테스트에 의한 추가적인 위험도 계층화가 매우 유용할 수 있다. 대상이 되는 개인이 위험 유전적 변이 또는 보호성 유전적 변이를 갖는다는 것을 이해하는 것이 진단 및/또는 치료에 대한 의사결정에 매우 중요한 기여가 될 수 있다. 이 방식으로, 일부 경우에, 불필요한 테스트 및 치료가 회피될 수 있고, 다른 경우에, 보다 공격적인 진단 방식의 보조로, 부정맥이 진단되고, 및/또는 적합한 치료가 개시되고, 질병의 후반 합병증(later complication)이 감소될 수 있다.
본 발명의 방법
심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중의 위험도 평가 방법이 본 명세서에서 설명되고 본 발명에 포함된다. 본 발명은 또한 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중의 치료제에 대한 반응의 확률에 대해 개인을 평가하는 방법, 및 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중의 치료제의 효과를 평가하는 방법을 포함한다. 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 검출하기 위해 개체로부터의 시료를 분석하는 키트도 본 발명에 포함된다.
본 발명의 진단 및 스크리닝 분석법
특정한 구체예에서, 본 발명은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 개체 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 갖는 개체에서 보다 빈번하게 나타나는 유전적 마커의 특정한 대립형질을 검출하는 것에 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중, 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다. 특정한 구체예에서, 본 발명은 하나 이상의 다형성 마커(예를 들면, 본 명세서에 기재된 마커)의 하나 이상의 대립형질을 검출하는 것에 의해 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 진단하는 방법이다. 본 발명은 특정한 마커의 특정한 대립형질 또는 일배체형의 검출이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 나타내는 것인 방법을 기재한다. 그와 같은 예후적 또는 예측적 분석법은 또한 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중의 증상의 발생 전에 개체의 예방적 치료를 결정하기 위해 이용될 수 있다.
일부 구체예에서, 본 발명은 유전적 위험 변이의 평가 또는 결정, 및 그 해석을 포함할 수 있는, 의료 전문가에 의해 수행되는 진단과 같은 진단의 임상적 적용 방법에 관한 것이다. 다른 구체예에서, 본 발명은 일반인(layman) 또는 비-의료 전문가에 의해 수행되는 위험도 평가(또는 진단) 방법에 관한 것이다. Molecular Inversion Probe 어레이 기술 (예를 들면, Affymetrix GeneChip), 및 BeadArray Technologies (예를 들면, Illumina GoldenGate and Infinium assays)와 같은 SNP 마커의 고효율 유전형분석(high-throughput genotyping)을 포함한, 유전형분석 기술에서의 최근의 기술적 진전은 개인들이 그들의 게놈을 백만개 까지의 SNP에 대해 평가받을 수 있게 한다. 결과적으로 수득된, 개인에게 이용가능하게 된 유전형 정보는 다양한 SNP와 연관된 질병 또는 성향 위험도에 대한 공개 문헌으로부터의 정보와 비교될 수 있다. 따라서, 본 명세서에 기재된 바와 같은, 질병-연관 대립형질의 진단적 응용은 임상적 테스트의 결과에 근거하여 의료전문가에 의해, 또는 개별적인 SNP 단위로, 또는 어레이 기술과 같은 대규모 고효율 방법에 의한 SNP 유전형 분석을 통해 SNP의 평가를 수행하는 서비스를 제공하는 개인을 포함한, 일반인, 또는 비-전문 의료인에 의해 수행될 수 있다. 바꾸어 말하면, 유전적 위험도에 근거한 감수성의 진단 또는 평가가 대상자의 유전형에 대한 정보 및 다양한 위험 인자에 대한 발표문헌에 근거하여, 의료 전문가, 유전적 상담자(genetic counselor), 유전형분석 서비스 제공자 또는 일반인에 의해 이루어질 수 있다. 본 발명에서, 용어 "진단하는(diagnosing)" 및 "감수성을 진단하다(dignose a susceptibility)"는 전술된 방법을 포함한, 모든 이용가능한 진단 방법을 의미하도록 의도된다.
또한, 특정한 다른 구체예에서, 본 발명은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중으로 진단되지 않은 개인 또는 일반적 집단에서보다 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 환자에서 덜 빈번하게 나타나는 특정한 유전적 마커 대립형질 또는 일배체형을 검출하는 것에 의해, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한감소된 감수성을 진단하거나 또는 상기 진단을 보조하는 방법에 관한 것이다.
본 명세서에서 기재되고 예시된 바와 같이, 특정한 마커 대립형질 또는 일배체형(예를 들면, 표 5(표 5A 및 5B)에 열거된 마커들 및 일배체형 및 이들과 연관불균형인 마커들, 예를 들면, 표 4 및/또는 표 9에 열거된 마커들 및 이들과 연관 불균형인 마커들, 예를 들면, 표 19에 표시된 마커들)이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된다. 일 구체예에서, 상기 마커 대립형질 또는 일배체형은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중의 유의성 있는 위험도 또는 그에 대한 감수성을 부여하는 마커 대립형질 또는 일배체형이다. 또 다른 구체예에서, 본 발명은 개인에서 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 진단하는 방법으로서, 상기 방법은 상기 개인으로부터 수득된 핵산 시료에서 하나 이상의 다형성 마커의 하나 이상의 대립형질의 존재 또는 부재를 결정하는 단계를 포함하고, 상기 하나 이상의 다형성 마커는 표 5A 및 표 5B에 열거된 다형성 마커들, 및 이들과 연관 불균형인 마커들로부터 구성된 군으로부터 선택된다. 또 다른 구체예에서, 본 발명은 표 5A 및 표 5B에 열거된 하나 이상의 마커 대립형질 또는 일배체형, 또는 이들과 연관 불균형인 마커를 스크리닝하는 것에 의해, 개인에서 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 진단하는 방법에 관한 것이다. 또 다른 구체예에서, 상기 마커 대립형질 또는 일배체형은 건강한 개체(집단 대조군과 같은, 대조군)에서 그의 존재의 빈도에 비해, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 갖거나 또는, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대해 감수성을 갖는 개체(영향받은 개체)에서 보다 빈번하게 존재한다. 일부 구체예에서, 상기 하나 이상의 마커 대립형질 또는 일배체형의 연관의 유의성은 0.05 미만의 p 값을 특징으로 한다. 다른 구체예에서, 연관의 유의성은 보다 작은 p-값, 예를 들면, 0.01 미만, 0.001 미만, 0.0001 미만, 0.00001 미만, 0.000001 미만, 0.0000001 미만, 0.00000001 미만 또는 0.000000001 미만의 p-값과 같은 보다 작은 p-값을 특징으로 한다.
이 구체예들에서, 상기 하나 이상의 마커 대립형질 또는 일배체형의 존재는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중의 감수성을 나타낸다. 이 진단 방법들은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 하나 이상의 마커 대립형질 또는 일배체형의 존재 또는 부재를 검출하는 단계를 포함한다. 본 명세서에 기재된 일배체형은 다양한 유전적 마커(예를 들면, SNP, 마이크로새틀라이트)에서의 대립형질의 조합을 포함한다. 특정한 일배체형을 구성하는 특정한 유전적 마커 대립형질의 검출은 본 명세서에 기재되고 및/또는 본 발명이 속하는 기술 분야에서 알려진 다양한 방법에 의해 수행될 수 있다. 예를 들면, 유전적 마커는 핵산 수준에서(예를 들면, 직접적인 뉴클레오티드 서열결정에 의해 또는 본 발명이 속하는 기술 분야에서 당업자에게 공지된 다른 수단에 의해) 또는 상기 유전적 마커가 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중-연관 핵산에 의해 코딩된 단백질의 코딩 서열에 영향을 미친다면, 아미노산 수준에서(예를 들면, 단백질 서열결정에 의해 또는 그와 같은 단백질을 인식하는 항체를 이용한 면역분석법에 의해) 검출될 수 있다. 본 발명의 마커 대립형질 또는 일배체형은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 게놈 DNA 서열의 단편에 대응된다. 그와 같은 단편은 대상이 되는 다형성 마커 또는 일배체형의 DNA 서열을 포함하나, 또한 상기 마커 또는 일배체형과 강한 LD(linkage disequilibrium)인 DNA 세그먼트를 포함할 수 있다. 일 구체예에서, 그와 같은 세그먼트는 상기 마커 또는 일배체형과, 0.2 보다 큰 r2 또는 0.8보다 큰 |D'| 값에 의해 결정된 LD인 세그먼트를 포함한다.
일 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성의 진단이 서던 분석(Southern analysis), 노던 분석(Northern analysis), 및/또는 인-시투 혼성화와 같은, 혼성화 방법을 이용하여 달성될 수 있다(모든 보충물(supplement)을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons 참조). 테스트 대상 또는 개체로부터의 게놈 DNA, RNA, 또는 cDNA의 생물학적 시료("테스트 시료(test sample)")가 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 갖거나, 이에 대해 감수성을 갖거나, 또는 이에 대한 소인을 갖는 개체("테스트 개체(test subject)")로부터 수득된다. 대상은 성인, 아동, 또는 태아일 수 있다. 테스트 시료는 혈액 시료, 양수 시료, 뇌척수액 시료, 또는 피부, 근육, 볼 점막 또는 결막 점막, 태반, 위장관 또는 기타 기관으로부터의 조직 시료와 같은, 게놈 DNA를 포함하는 원천(source)으로부터 수득될 수 있다. 태아 세포 또는 조직으로부터의 DNA의 테스트 시료가 양수천자(amniocentesis) 또는 융모막 검사(chorionic villus sampling)와 같은 적합한 방법에 의해 수득될 수 있다. 그 후, DNA, RNA, 또는 cDNA 시료가 검사된다. 특정한 마커 대립형질의 존재는 상기 특정한 대립형질에 특이적인 핵산 프로브의 서열-특이적 혼성화에 의해 표시될 수 있다. 하나 이상의 특정한 마커 대립형질 또는 특정한 일배체형의 존재는 각각 특정한 대립형질에 대해 특이적인, 여러 개의 서열-특이적 핵산 프로브를 이용하는 것에 의해 표시될 수 있다. 일 구체예에서, 일배체형은 특정한 일배체형에 대해 특이적인(즉, 상기 일배체형의 특징적인 특정한 마커 대립형질을 포함하는 DNA 가닥에 특이적으로 혼성화하는) 단일 핵산 프로브에 의해 표시될 수 있다. 서열-특이적 프로브는 게놈 DNA, RNA, 또는 cDNA에 혼성화되도록 지시될 수 있다. 본 명세서에서 사용된, "핵산 프로브(nucleic acid probe)"는 상보적 서열에 혼성화되는 DNA 프로브 또는 RNA 프로브일 수 있다. 본 발명이 속하는 기술 분야의 당업자는 테스트 시료로부터의 게놈 서열에 특정한 대립형질이 존재하는 경우에만 서열 특이적 혼성화가 일어나도록 그와 같은 프로브를 설계하는 방법을 알 것이다.
심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 진단하기 위해, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산을 포함하는 테스트 시료, 예를 들면, 게놈 DNA 시료를 하나 이상의 핵산 프로브와 접촉하는 것에 의해 혼성화 시료가 형성될 수 있다. mRNA 또는 게놈 DNA를 검출하기 위한 프로브의 비-한정적인 예는 본 명세서에 기재된 mRNA 또는 게놈 DNA에 혼성화될 수 있는 표지된 핵산 프로브이다. 상기 핵산 프로브는 예를 들면, 전장(full-length) 핵산 분자, 또는 그의 일부, 예를 들면, 적합한 mRNA 또는 게놈 DNA 서열에 엄격한(stringent) 조건 하에 특이적으로 혼성화하기에 충분한 15개 이상, 30개 이상, 50개 이상, 100개 이상, 250개 이상, 또는 500개 이상의 뉴클레오티드로 구성된 길이의 올리고뉴클레오티드일 수 있다. 상기 뉴클레오티드 프로브는 500개의 뉴클레오티드, 400개의 뉴클레오티드, 300개의 뉴클레오티드, 200개의 뉴클레오티드, 또는 100개의 뉴클레오티드를 포함한, 1000개 이상의 뉴클레오티드로 구성된 길이일 수 있다. 일부 구체예는 15개 내지 1000개의 뉴클레오티드로 구성된 길이의 뉴클레오티드 프로브를 포함한다. 다른 구체예는 15개 내지 500개의 뉴클레오티드, 또는 15개 내지 400개의 뉴클레오티드, 또는 20개 내지 400개의 뉴클레오티드로 구성된 길이의 뉴클레오티드 프로브의 용도에 관한 것이다. 당업자에게 잘 알려진 바와 같이, 본 발명의 뉴클레오티드 프로브의 다른 크기 범위가 고려된다. 일 구체예에서, 상기 핵산 프로브는 선택적으로 명세서에 기재된 마커의 하나 이상의 대립형질, 또는 본 명세서에 기재된 하나 이상의 일배체형을 포함하는, 본 명세서에 기재된, LD Block C04의 뉴클레오티드 서열의 전부 또는 일부를 포함하거나, 또는 상기 프로브는 그와 같은 서열에 상보적인 서열일 수 있다. 특정한 구체예에서, 상기 핵산 프로브는 선택적으로 본 명세서에 기재된 마커의 하나 이상의 대립형질, 또는 하나의 다형성 마커의 하나 이상의 대립형질, 또는 본 명세서에 기재된 하나 이상의 다형성 마커를 포함하는 일배체형을 포함하는, 서열번호 50으로 표시된 LD 블럭 C04의 뉴클레오티드 서열의 부분이거나, 또는 상기 프로브는 그와 같은 서열의 상보적 서열일 수 있다. 본 발명의 진단 분석법에서 이용하기에 적합한 다른 프로브가 본 명세서에 기재된다. 혼성화는 당해 기술 분야의 당업자에게 잘 알려진 방법에 의해 수행될 수 있다(예를 들면, 모든 보충물을 포함한, Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons 참조). 일 구체예에서, 혼성화는 특이적 혼성화, 즉, 불일치를 포함하지 않는 혼성화(정확한 혼성화)를 의미한다. 일 구체예에서, 상기 특이적 혼성화를 위한 혼성화 조건은 높은 엄격성이다.
존재하는 경우, 특이적 혼성화는 표준 방법을 이용하여 검출된다. 핵산 프로브와 테스트 시료 내의 핵산 간에 특이적 혼성화가 일어나면, 상기 시료는 상기 핵산 프로브에 존재하는 뉴클레오티드에 상보적인 대립형질을 포함한다. 본 발명의 마커, 또는 본 발명의 일배체형을 구성하는 마커에 대해, 상기 방법이 반복될 수 있거나, 또는 한번에 하나 이상의 마커 대립형질을 검출하기 위해 복수 개의 프로브가 동시에 이용될 수 있다. 특정한 일배체형의 하나 이상의 대립형질을 포함하는 단일 프로브를 설계할 수 있다(예를 들면, 2개, 3개, 4개, 5개, 또는 특정한 일배체형을 구성하는 모든 마커에 상보적인 대립형질을 포함하는 프로브). 시료에서 일배체형의 특정한 마커의 검출은 상기 시료의 원천이 특정한 일배체형(예를 들면, 일배체형)을 가지며 따라서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대해 감수성을 갖는다는 것을 나타낸다.
또 다른 혼성화 방법에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 다형성의 존재를 확인하기 위해 노던 분석이 이용된다(Current Protocols in Molecular Biology, Ausubel, F. et al., eds., John Wiley & Sons, supra 참조). 노던 분석의 경우, RNA의 테스트 시료가 적합한 수단에 의해 개체로부터 수득된다. 본 명세서에 기재된 바와 같이, 개체로부터의 RNA에 대한 핵산 프로브의 특이적 혼성화는 상기 프로브에 상보적인 특정한 대립형질을 나타낸다. 핵산 프로브의 용도의 대표적인 예를 위해, 예를 들면, 미국특허 제5,288,611호 및 제4,851,330호를 참조한다.
추가적으로, 또는 대안적으로, 펩티드 핵산(peptide nucleic acid, PNA)이 본 명세서에 기재된 혼성화 방법에서 핵산 프로브에 추가하여, 또는 핵산 프로브 대신에 이용될 수 있다. PNA는 유기 염기 (A, G, C, T 또는 U)가 메틸렌 카르보닐 링커를 통해 글리신 질소에 결합된, N-(2-아미노에틸)글리신 유닛과 같은, 펩티드-유사 무기 백본(peptide-like inorganic backbone)을 갖는 DNA 모방체(mimic)이다(예를 들면, Nielsen, P., et al., Bioconjug. Chem. 5:3-7 (1994) 참조). PNA 프로브는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 하나 이상의 마커 대립형질 또는 일배체형을 포함하는 것으로 사료되는 시료 내의 분자에 특이적으로 혼성화하도록 설계될 수 있다. 따라서, PNA 프로브의 혼성화는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 진단할 수 있다.
본 발명의 일 구체예에서, 게놈 DNA를 포함하는 테스트 시료가 개체로부터 수득되고, 본 발명의 하나 이상의 마커 또는 일배체형을 포함하는 단편을 증폭시키기 위해 중합효소 연쇄 반응(PCR)이 이용될 수 있다. 본 명세서에 기재된 바와 같이, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 특정한 마커 대립형질 또는 일배체형의 확인은 다양한 방법(예를 들면, 서열 분석, 제한효소 처리에 의한 분석, 특이적 혼성화, SSCP(single stranded conformation polymorphism), 전기영동 분석 등)을 이용하여 수행될 수 있다. 또 다른 구체예에서, 진단은 정량적 PCR(kinetic thermal cycling)을 이용한 발현 분석에 의해 수행된다. 이 기법은 다형성 및 일배체형의 확인을 가능하게 하기 위해, TaqMan®(Applied Biosystems, Foster City, CA)과 같은 상업적으로 이용가능한 기술을 이용할 수 있다. 상기 기법은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩된 폴리펩티드 또는 스플라이싱 변이의 발현 또는 조성의 변화의 존재를 평가할 수 있다. 또한, 변이의 발현은 물리적으로 또는 기능적으로 상이한 것으로 정량될 수 있다.
본 발명의 또 다른 방법에서, 특정한 대립형질이 기준 서열 대비 제한효소 인식 부위의 생성 또는 제거를 초래하는 경우, 제한효소 처리(restriction digestion)에 의한 분석이 상기 특정한 대립형질을 검출하기 위해 이용될 수 있다. RFLP(Restriction fragment length polymorphism) 분석은 예를 들면, 전술된 Current Protocols in Molecular Biology에 기재된 바와 같이 수행될 수 있다. 관련된 DNA 단편의 제한효소 처리의 결과 패턴(digestion pattern)이 시료 중의 특정한 대립형질의 존재 또는 부재를 나타낸다.
심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 특정한 마커 대립형질 또는 일배체형(예를 들면, 표 5(표 5A 및 5B), 표 9 및/또는 표 10의 다형성 마커)을 검출하기 위해, 서열 분석도 이용될 수 있다. 따라서, 일 구체예에서, 특정한 마커 대립형질 또는 일배체형의 존재 또는 부재의 결정은 대상자 또는 개체로부터 수득된 DNA 또는 RNA의 테스트 시료의 서열 분석을 포함한다. PCR 또는 다른 적합한 방법이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산의 일부를 증폭시키기 위해 이용될 수 있고, 그 후, 특정한 대립형질의 존재가 직접 시료 중의 게놈 DNA의 다형성 부위(또는 복수 개의 다형성 부위들)의 서열을 결정하는 것에 의해 검출될 수 있다.
심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에서 특정한 대립형질(예를 들면, 표 5(표 5A 및 5B), 표 9 및/또는 표 10의 다형성 마커)의 존재를 검출하기 위해, 증폭된 올리고뉴클레오티드와 대립형질-특이적 올리고뉴클레오티드(allele-specific oligonucleotide, ASO) 프로브의 도트-블롯 혼성화(dot-blot hybridization)의 이용을 통해, 대립형질-특이적 올리고뉴클레오티드가 이용될 수 있다(예를 들면, Saiki, R. et al., Nature, 324:163-166 (1986) 참조). "대립형질-특이적 올리고뉴클레오티드(allele-specific oligonucleotide)"(본 명세서에서 "대립형질-특이적 올리고뉴클레오티드 프로브(allele-specific oligonucleotide probe)"로도 지칭됨)는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 특이적으로 혼성화되고, 다형성 부위(예를 들면, 본 명세서에 기재된 다형성)에 특정한 대립형질을 포함하는, 약 10 내지 500 bp(base pairs), 약 15 내지 400 bp, 약 15 내지 200 bp, 약 15 내지 100 bp, 약 15 내지 50 bp, 또는 약 15-30 bp의 올리고뉴클레오티드이다. 하나 이상의, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 특이적인 대립형질-특이적 올리고뉴클레오티드 프로브는 표준 방법을 이용하여 제조될 수 있다(예를 들면, 전술된 바와 같은, Current Protocols in Molecular Biology 참조). 원하는 영역을 증폭하기 위해 PCR이 이용될 수 있다. 증폭된 영역을 포함하는 DNA가 표준 방법을 이용하여 도트-블롯팅될 수 있고(예를 들면, 전술된 바와 같은, Current Protocols in Molecular Biology 참조), 상기 블롯은 올리고뉴클레오티드 프로브와 접촉될 수 있다. 이 때, 증폭된 영역에 대한 프로브의 특이적 혼성화의 존재가 검출될 수 있다. 개체로부터의 DNA에 대한 대립형질-특이적 올리고뉴클레오티드의 특이적 혼성화는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 다형성 부위에서 특이적 대립형질의 존재를 나타낸다(예를 들면, Gibbs, R. et al., Nucleic Acids Res., 17:2437-2448 (1989) 및 WO 93/22456 참조).
LNA(locked nucleic acid)와 같은 유사체의 첨가로, 프라이머 및 프로브의 크기가 8개의 염기까지 감소될 수 있다. LNA는 푸라노오스 고리의 2' 및 4' 위치가 O-메틸렌(oxy-LNA), S-메틸렌(thio-LNA), 또는 아미노 메틸렌(amino-LNA) 모이어티를 통해 결합된 것인 이고리형 DNA 유사체의 새로운 종류이다. 모든 이와 같은 LNA 변이에 공통된 것은 상보적 핵산에 대한 친화도이고, 이는 DNA 유사체에 대해 보고된 것 중 가장 높다. 예를 들면, 특정한 모든 옥시-LNA 노나머는 상응하는 DNA 노나머에 대한 DNA 및 RNA에 대한 28℃와 대조적으로, 상보적 DNA 또는 RNA와의 복합체에서, 64℃ 및 74℃의 용융점(Tm)을 갖는 것으로 확인되었다. LNA가 표준 DNA 또는 RNA 단량체와 조합되어 이용되는 경우, Tm의 실질적인 증가도 수득된다. 프라이머 및 프로브의 경우, LNA 단량체가 포함된 위치에 따라(예를 들면, 3' 말단, 5' 말단, 또는 중간), Tm이 유의성있게 증가될 수 있다.
또 다른 구체예에서, 개체로부터의 표적 핵산 서열 세그먼트에 상보적인 올리고뉴클레오티드 프로브의 어레이가 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에서 다형성을 식별하기 위해 이용될 수 있다(예를 들면, 표 5A 및 5B의 다형성 마커, 및 이들과 연관 불균형인 마커). 예를 들면, 올리고뉴클레오티드 어레이가 이용될 수 있다. 올리고뉴클레오티드 어레이는 일반적으로 상이한 공지된 위치에 있는 기질의 표면에 결합하는 복수 개의 상이한 올리고뉴클레오티드 프로브를 포함한다. "Genechip™"으로도 설명되는, 이 올리고뉴클레오티드 어레이가 일반적으로 본 발명이 속하는 기술 분야에서 기재된다(예를 들면, 미국특허 제5,143,854호, PCT 특허출원 공개 WO 90/15070 및 WO 92/10092 참조). 이 어레이들은 일반적으로 기계적 합성 방법 또는 포토리소그래피 방법과 고상 올리고뉴클레오티드 합성 방법의 조합을 포함하는 광-지시 합성 방법(light-directed synthesis method)를 이용하여 생산된다(각각의 전체 교시가 참조에 의해 본 명세서에 포함된, Fodor, S. et al., Science, 251:767-773 (1991); Pirrung et al., 미국특허 제5,143,854호(또한, 공개된 PCT 출원 WO 90/15070 참조); 및 Fodor. S. et al., 공개된 PCT 출원 WO 92/10092 및 미국특허출원 제5,424,186호 참조). 기계적 합성 방법을 이용한 이 어레이들의 합성을 위한 기법들이 예를 들면, 미국특허 제5,384,261호에 기재되며, 그 전체 교시가 참조에 의해 본 명세서에 포함된다. 또 다른 실시예에서, 선형 어레이(linear array)가 이용될 수 있다. 다형성의 검출을 위한 올리고뉴클레오티드 어레이의 용도의 추가적인 설명이 예를 들면, 미국특허 제5,858,659호 및 제5,837,832호에서 찾을 수 있고, 상기 두 특허의 전체 교시가 참조에 의해 본 명세서에 포함된다.
핵산 분석의 다른 방법들이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 다형성 부위(예를 들면, 표5(5A 및 5B), 표 9 및/또는 표 19의 다형성 마커)에서 특정한 대립형질을 검출하기 위해 이용될 수 있다. 대표적인 방법들은 예를 들면, 직접적인 수동 서열결정(direct manual sequencing) (Church and Gilbert, Proc. Natl. Acad. Sci. USA, 81: 1991-1995 (1988); Sanger, F., et al., Proc. Natl. Acad. Sci. USA, 74:5463-5467 (1977); Beavis, et al., U.S. Patent No. 5,288,644); 자동화된 형광 서열결정(automated fluorescent sequencing); 단일가닥 구조 다형성(SSCP) 분석; CDGE(clamped denaturing gel electrophoresis); DGGE(denaturing gradient gel electrophoresis) (Sheffield, V., et al., Proc. Natl. Acad. Sci. USA, 86:232-236 (1989)), 운동성 변화 분석(mobility shift analysis)(Orita, M., et al., Proc. Natl. Acad. Sci. USA, 86:2766-2770 (1989)), 제한효소 분석(Flavell, R., et al., Cell, 15:25-41 (1978); Geever, R., et al., Proc. Natl. Acad. Sci. USA, 78:5081-5085 (1981)); 헤테로듀플렉스(heteroduplex) 분석; 화학적 불일치 절단(chemical mismatch cleavage, CMC) (Cotton, R., et al., Proc. Natl. Acad. Sci. USA, 85:4397-4401 (1985)); RNase 보호 분석(Myers, R., et al., Science, 230:1242-1246 (1985); E. coli mutS 단백질과 같은, 뉴클레오티드 불일치를 인식하는 폴리펩티드의 이용; 및 대립형질-특이적 PCR을 포함한다.
본 발명의 또 다른 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성의 진단은 본 발명의 유전적 마커(들) 또는 일배체형(들)이 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우들에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩된 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 따라서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성의 진단은 본 발명의 유전적 마커 또는 일배체형이 상기 폴리펩티드의 조성 또는 발현의 변화를 초래하는 경우, 이들 중 하나의 폴리펩티드, 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩되는 또 다른 폴리펩티드의 발현 및/또는 조성을 조사하는 것에 의해 수행될 수 있다. 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대해 연관을 보이는 본 발명의 일배체형 및 마커들은 하나 이상의 인접 유전자(nearby gene)에 대한 효과를 통해 역할을 수행한다. 이 유전자들에 영향을 미치는 가능한 메카니즘은 예를 들면, 전사에 대한 효과, RNA 스플라이싱에 대한 효과, mRNA의 대안적인 스플라이스(alternative splice) 형태의 상대적 양의 변화, RNA 안정성에 대한 효과, 핵으로부터 세포질로의 이동에 대한 효과, 및 번역의 효율성 및 정확성에 대한 효과를 포함한다.
따라서, 또 다른 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 연관을 보이는 본 발명의 변이(마커 또는 일배체형)가 인접 유전자의 발현에 영향을 미친다. 유전자 발현에 영향을 미치는 조절성 요조(regulatory element)가 유전자의 프로모터 영역으로부터 수십 킬로베이스 또는 심지어 수백 킬로베이스 떨어져서 위치할 수 있다는 것이 잘 알려져 있다. 본 발명의 하나 이상의 다형성 마커의 하나 이상의 대립형질의 존재 또는 부재를 분석하는 것에 의해, 따라서, 그와 같은 인접한 유전자의 발현 수준을 평가할 수 있다. 따라서, 본 발명의 마커 또는 일배체형의 검출이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 하나 이상의 유전자의 발현을 평가하기 위해 이용될 수 있다.
ELISA(enzyme linked immunosorbent assay), 웨스턴 블롯(Western blot), 면역침전(immunoprecipitation) 및 면역형광(immunofluorescence)을 포함한 다양한 방법들이 그와 같은 검출을 수행하기 위해 이용될 수 있다. 개체로부터의 테스트 시료가 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화 및/또는 그의 조성의 변화의 존재에 대해 평가된다. 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화가 예를 들면, 정량적인 폴리펩티드 발현(즉, 생성되는 폴리펩티드의 양)의 변화일 수 있다. 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩되는 폴리펩티드의 조성의 변화는 정량적 폴리펩티드 발현의 변화(예를 들면, 돌연변이 폴리펩티드의 발현 또는 상이한 스플라이싱 변이의 발현)이다. 일 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성의 진단은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩되는 특정한 스플라이싱 변이, 또는 스플라이싱 변이의 특정한 패턴을 검출하는 것에 의해 수행된다.
또한, 그와 같은 변화(정량적 및 정성적 변화)가 모두 존재할 수 있다. 본 명세서에서 사용된 폴리펩티드 발현 또는 조성의 "변화(alteration)"는 대조군 시료에서 상기 폴리펩티드의 발현 또는 조성의 변화 대비, 테스트 시료 중의 발현 또는 조성의 변화를 의미한다. 대조군 시료는 테스트 시료에 상응하는 시료(예를 들면, 동일한 종류의 세포로부터 유래된 시료)이고, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 의해 영향받지 않고 및/또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 갖지 않는 개체로부터 유래된다. 일 구체예에서, 대조군 시료는 본 명세서에 기재된 마커 대립형질 또는 일배체형을 갖지 않는 개체로부터 유래된다. 유사하게, 대조군 시료 대비, 테스트 시료 중에 하나 이상의 상이한 스플라이싱 변이의 존재, 또는 테스트 시료 중의 상이한 스플라이싱 변이의 유의성 있게 상이한 양의 존재는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 나타낼 수 있다. 대조군 시료 대비, 테스트 시료 중의 폴리펩티드의 발현 또는 조성의 변화는 특정한 대립형질이 대조군 시료 중의 기준 대비 스플라이스 위치를 변화시키는 경우, 상기 특정한 대립형질을 나타낼 수 있다. 분광분석법, 비색법(colorimetry), 전기영동, 등전점 전기영동법(isoelectric focusing), 및 면역블롯팅(immunoblotting)(예를 들면, 전술된 바와 같은, Current Protocols in Molecular Biology, 특히, 챕터 10 참조)과 같은 면역분석법(immunoassays)(예를 들면, David et al., 미국특허 제4,376,110호)을 포함한, 핵산에 의해 코딩된 폴리펩티드의 발현 또는 조성을 조사하는 다양한 수단이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있고, 이용될 수 있다.
예를 들면, 일 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩되는 폴리펩티드에 결합할 수 있는 항체(예를 들면, 검출가능한 표지를 갖는 항체)가 이용될 수 있다. 항체는 다중클론 항체 또는 단일클론 항체일 수 있다. 완전한 항체, 또는 그의 단편(예를 들면, Fv, Fab, Fab', F(ab')2)이 이용될 수 있다. 프로브 또는 항체에 대해, 용어 "표지된(labeled)"은 검출가능한 물질을 프로브 또는 항체에 결합(즉, 물리적 연결)시키는 것에 의한 프로브 또는 항체의 직접적인 표지화, 및 직접적으로 표지된 또 다른 시약과의 반응성에 의한 프로브 또는 항체의 간접적 표지화를 포함하도록 의도된다. 간접적 표지화의 예는 표지된 이차 항체(예를 들면, 형광-표지된 이차 항체)를 이용한 일차 항체의 검출 및 형광-표지된 스트렙타비딘에 의해 검출될 수 있는, 비오틴에 의한 DNA 프로브의 말단-표지화(end-labeling)를 포함한다.
이 방법의 일 구체예에서, 테스트 시료 중의 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중-연관 핵산에 의해 코딩된 폴리펩티드의 수준 또는 양이 대조군 시료 중의 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩된 폴리펩티드의 수준 또는 양과 비교된다. 대조군 시료 중의 폴리펩티드의 수준 또는 양보다 더 높거나 또는 더 낮고, 그 차이가 통계적으로 유의성이 있는, 테스트 시료 중의 폴리펩티드의 수준 또는 양은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코딩되는 폴리펩티드의 발현의 변화를 나타내고 발현의 차이를 유발하는 특정한 대립형질 또는 일배체형의 존재를 나타낸다. 대안적으로, 테스트 시료 중의 상기 폴리펩티드의 조성은 대조군 시료 중의 상기 폴리펩티드의 조성과 비교된다. 또 다른 구체예에서, 상기 폴리펩티드의 수준 또는 양과 조성이 모두 테스트 시료 및 대조군 시료에서 평가될 수 있다.
또 다른 구체예에서, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성의 진단은 추가적인 단배질-기반 분석법, RNA-기반 분석법 또는 DNA-기반 분석법과 조합하여, 하나 이상의 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 마커 대립형질 또는 일배체형(예를 들면, 표 5A 및 5B에 열거된 마커들, 및 이들과 연관 불균형인 마커들의 연관된 대립형질)을 검출하는 것에 의해 수행된다. 본 발명의 방법은 또한 개체의 가족력 및 위험 인자(예를 들면, 환경적 위험 인자, 생활방식 위험 인자)의 분석과 조합하여 이용될 수 있다.
키트
본 발명의 방법에서 유용한 키트는 본 명세서에 기재된 방법에서 유용한 성분들, 예를 들면, 핵산 증폭용 프라이머, 혼성화 프로브, 제한효소(예를 들면, RFLP 분석용 제한효소), 대립형질-특이적 올리고뉴클레오티드, 본 명세서에 기재된 바와 같은 본 발명의 핵산(예를 들면, 본 발명의 하나 이상의 다형성 마커 및/또는 일배체형을 포함하는 게놈 세그먼트)에 의해 코딩된 변화된 폴리펩티드 또는 본 명세서에 기재된 바와 같은 본 발명의 핵산에 의해 코딩되는 변화되지 않은(원형의) 폴리펩티드에 결합하는 항체, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산의 증폭을 위한 수단, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산의 핵산 서열을 분석하기 위한 수단, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 핵산에 의해 코팅되는 폴리펩티드(예를 들면, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 유전자에 의해 코딩된 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 단백질)의 아미노산 서열을 분석하기 위한 수단, 등을 포함한다. 본 발명의 키트는 예를 들면, 필요한 완충액, 본 발명의 핵산(예를 들면, 본 명세서에 기재된 하나 이상의 다형성 마커)을 증폭하기 위한 핵산 프라이머, 및 그와 같은 프라미어 및 필요한 효소(예를 들면, DNA 중합효소)를 이용하여 증폭된 단편의 대립형질-특이적 검출을 위한 시약을 포함할 수 있다. 추가적으로, 키트는 본 발명의 방법과 조합되어 이용될 수 있는 분석법을 위한 시약들, 예를 들면, 다른 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 진단 분석법에서 이용되는 시약을 제공할 수 있다.
일 구체예에서, 본 발명은 개체에서 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중, 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성의 존재를 검출하기 위해, 개체로부터의 시료를 분석하는 키트로서, 상기 키트는 상기 개체의 게놈에서 본 발명의 하나 이상의 다형성의 하나 이상의 대립형질을 선택적으로 검출하기 위해 필요한 시약들을 포함하는 것인 키트에 관한 것이다. 특정한 구체예에서, 상기 시약은 본 발명의 하나 이상의 다형성을 포함하는 개체의 게놈의 단편에 혼성화하는 하나 이상의 연속적인 올리고뉴클레오티드(contiguous oligonucleotide)를 포함한다. 또 다른 구체예에서, 상기 시약은 개체로부터 수득된 게놈 세그먼트의 반대쪽 가닥에 혼성화하는 한 쌍 이상의 올리고뉴클레오티드를 포함하고, 상기 각 올리고뉴클레오티드 프라이머 쌍은 하나 이상의 다형성을 포함하는 개체의 게놈의 단편을 선택적으로 증폭시키도록 설계되며, 상기 다형성은 표 5A 및 5B에 열거된 다형성 및 이들과 연관 불균형인 다형성 마커로 구성된 군으로부터 선택된다. 또 다른 구체예에서, 상기 단편은 크기가 20 bp 이상이다. 그와 같은 올리고뉴클레오티드 또는 핵산(예를 들면, 올리고뉴클레오티드 프라이머)은 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 나타내는, 다형성(예를 들면, SNP 또는 마이크로새틀라이트)을 둘러싼(flanking) 핵산 서열의 부분을 이용하여 설계될 수 있다. 또 다른 구체예에서, 상기 키트는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 하나 이상의 특정한 다형성 마커 또는 일배체형의 대립형질-특이적 검출을 수행할 수 있는 하나 이상의 표지된 핵산, 및 상기 표지의 검출을 위한 시약을 포함한다. 적합한 표지는 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자(co-factor) 표지, 자성 표지(magnetic label), 스핀 표지(spin label), 에피토프 표지(epitope label)를 포함한다.
특정한 구체예에서, 본 발명의 키트의 시약에 의해 검출될 다형성 마커 또는 일배체형은 표 5A 및 5B에 표시된 마커들로 구성된 군으로부터 선택된, 하나 이상의 마커, 두개 이상의 마커, 세개 이상의 마커, 네개 이상의 마커, 또는 다섯개 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 표 5A 및 5B에 열거된 마커들로부터 선택된다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 표 4 및 표 9에 열거된 마커들을 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 표 5A 및 5B에 열거된 마커들로 구성된 마커들의 군의 하나 이상의 마커와, 0.2보다 큰 r2 값에 의해 정의된 강한 연관 불균형인 마커들의 군으로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 표 4 및 9에 열거된 마커들로 구성된 마커들의 군의 하나 이상의 마커와, 0.2보다 큰 r2 값에 의해 정의왼 강한 연관 불균형인 마커들의 군으로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 마커 rs2220427 (서열번호 1) 또는 마커 rs1033464 (서열번호 41), 또는 이들과 연관 불균형인 마커들을 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 표 19에 결거된 마커들 중 하나 이상을 포함한다. 또 다른 구체예에서, 검출될 마커 또는 일배체형은 마커 D4S406 (서열번호 45), rs2634073 (서열번호 33), rs2200733 (서열번호 28), rs2220427 (서열번호 1), rs10033464 (서열번호 41), 및 rs13143308 (서열번호 51) 및 이들과 연관 불균형인 마커들을 포함한다. 또 다른 구체예에서, 상기 마커 또는 일배체형은 마커 D4S406의 위험 대립형질 -2, -4 및/또는 -8, 마커 rs2634073의 대립형질 A, 마커 rs2200733의 대립형질 T, 마커rs2220427의 대립형질 T, 마커 rs10033464의 대립형질 T, 및/또는 마커 rs13143308의 대립형질 G를 포함한다. 하나의 그와 같은 구체예에서, 연관 불균형은 0.1보다 큰 r2 값에 의해 정의된다. 또 다른 구체예에서, 연관 불균형은 0.2보다 큰 r2 값에 의해 정의된다.
하나의 바람직한 구체예에서, 본 발명의 마커를 검출하기 위한 키트는 검출될 SNP 다형성을 포함하는 주형 DNA의 세그먼트에 혼성화되는, 검출 올리고뉴클레오티드 프로브, 인핸서 올리고뉴클레오티드 프로브 및 엔도뉴클레아제(endonuclease)를 포함한다. 앞서 설명된 바와 같이, 검출 올리고뉴클레오티드 프로브는 그의 3' 말단에 있는 형광 모이어티 또는 그룹 및 그의 5' 말단에 있는 퀀처를 포함하고, Kutyavin et al. (Nucleic Acid Res. 34:e128 (2006))에 기재된 바와 같은 인핸서 올리고뉴클레오티드가 이용된다. 형광 모이어티는 Gig Harbor Green 또는 Yakima Yellow, 또는 다른 적합한 형광 모이어티일 수 있다. 검출 프로브는 검출대상 SNP 다형성을 포함하는 짧은 뉴클레오티드 서열에 혼성화되도록 설계된다. 바람직하게는, 상기 SNP는 검출 프로브의 말단 잔기부터 3' 말단으로부터의 -6 잔기까지 중에 존재한다. 인핸서는 검출 프로브에 대해 3'인 DNA 주형에 혼성화되는 짧은 올리고뉴클레오티드 프로브이다. 상기 프로브들은 검출 프로브와 인핸서 뉴클레오티드 프로브가 모두 주형에 결합된 경우, 상기 검출 프로브와 인핸서 뉴클레오티드 프로브 간에 단일 뉴클레오티드 갭이 존재하도록 설계된다. 상기 갭은 엔도뉴클레아제 IV와 같은, 엔도뉴클레아제에 의해 인식되는 합성 탈염기 부위(synthetic abasic site)를 생성한다. 상기 효소는 완전히 상보적인 검출 프로브로부터 염료를 절단하나, 불일치를 포함하는 검출 프로브는 절단할 수 없다. 따라서, 방출된 형광 모이어티의 형광을 측정하는 것에 의해, 검출 프로브의 뉴클레오티드 서열에 의해 정의된 특정한 대립형질의 존재의 평가가 수행될 수 있다.
검출 프로브는 임의의 적합한 크기일 수 있으나, 바람직하게는 프로브는 비교적 짧다. 일 구체예에서, 상기 프로브는 길이가 5개 내지 100개의 뉴클레오티드로 구성된다. 또 다른 구체예에서,상기 프로브는 길이가 10개 내지 50개의 뉴클레오티드로 구성되고, 또 다른 구체예에서, 상기 프로브는 길이가 12개 내지 30개의 뉴클레오티드로 구성된다. 다른 길이의 프로브들도 가능하고 본 발명이 속하는 기술 분야의 평균적인 당업자의 기술의 범위 내에 속한다.
바람직한 구체예에서, SNP 다형성을 포함하는 DNA 주형은 검출 전에 중합효소 연쇄 반응(PCR)에 의해 증폭되고, 그와 같은 증폭을 위한 프라이머가 시약 키트에 포함된다. 그와 같은 구체예에서, 증폭된 DNA가 검출 프로프 및 인핸서 프로브에 대한 주형으로 기능한다.
검출 프로브, 인핸서 프로브 PCR에 의한 주형의 증폭을 위해 이용되는 프라이머의 특정한 구체예는 변형된 A 및 변형된 G를 포함한, 변형된 염기의 이용을 포함한다. 변형된 염기의 이용은 주형 DNA에 대한 뉴클레오티드 분자(프로브 및/또는 프라이머)의 용융점을 조정하기 위해, 예를 들면, 상보적인 T와 세개의 수소 결합을 형성할 수 있는 능력을 갖는 변형된 A가 이용될 수 있는, 낮은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 높이기 위해, 또는 예를 들면, 상보적인 C와 두 개의 수소 결합만을 형성하는 변형된 G 염기를 이용하는 것에 의해, 높은 비율의 G 또는 C 염기를 포함하는 영역에서 용융점을 낮추기 위해 유용할 수 있다. 바람직한 구체예에서, 검출 뉴클레오티드 프로브의 설계에서 변형된 염기들이 이용된다. 당업자에게 알려진 임의의 변형된 염기가 이 방법에서 선택될 수 있고, 적합한 염기의 선택은 본 명세서의 교시 및 당업자에게 알려진 상업적 출처로부터 이용가능한 공지된 염기에 근거하여 당업자의 범위 내에 속한다.
하나의 그와 같은 구체예에서, 상기 마커 또는 일배체형의 존재는 심방세동 및/또는 뇌졸중에 대한 감수성(증가된 감수성 또는 감소된 감수성)을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 심방세동 및/또는 뇌졸중 치료제에 대한 반응을 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 심방세동 및/또는 뇌졸중의 예후를 나타낸다. 또 다른 구체예에서, 상기 마커 또는 일배체형의 존재는 심방세동 및/또는 뇌졸중의 치료의 진행을 나타낸다. 그와 같은 치료는 수술, 약물, 또는 기타 수단(예를 들면, 생활방식 변화)에 의한 개입을 포함할 수 있다.
치료제
본 발명의 변이(예를 들면, 본 발명의 마커 및/또는 일배체형, 예를 들면, 표 5A 및 5B 및/또는 표 19에 열거된 마커들)는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 신규한 치료제 표적을 확인하기 위해 이용될 수 있다. 예를 들면, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 변이(마커 및/또는 일배체형)를 포함하는 유전자 또는 상기 변이와 연관 불균형인 유전자, 또는 그들의 산물, 및 이 변이 유전자 또는 그들의 산물에 의해 직접적으로 또는 간접적으로 조절되거나 또는 이들과 상호작용하는 유전자 또는 그들의 산물이 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 치료하거나, 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 증상의 발생을 예방 또는 지연시키는 치료제의 개발을 위해 표적화될 수 있다. 치료제는 하나 이상의, 예를 들면, 표적 유전자 또는 그들의 유전자 산물의 기능 및/또는 수준을 조절할 수 있는, 작은 비-단백질 분자 및 작은 비-핵산 분자, 단백질, 펩티드, 핵산(DNA, RNA), PNA(peptide nucleic acid), 또는 그들의 유도체 또는 모방체(mimetics)를 포함할 수 있다.
본 발명의 핵산 및/또는 변이, 또는 그들의 상보적 서열을 포함하는 핵산이 세포, 조직 또는 기관에서 유전자 발현을 조절하기 위한 안티센스 구조물(antisense construct)로서 이용될 수 있다. 안티센스 기법과 연관된 방법은 당업자에게 잘 알려져 있고, AntisenseDrug Technology: Principles, Strategies, and Applications, Crooke, ed., Marcel Dekker Inc., New York (2001)에서 설명되고 검토된다. 일반적으로, 안티센스 핵산 분자는 유전자에 의해 발현되는 mRNA의 영역에 상보적이도록 설계되어, 상기 안티센스 분자가 mRNA에 혼성화되고, 따라서, 상기 mRNA의 단백질로의 번역을 차단한다. 절단제(cleaver) 및 차단제(blocker)를 포함한, 여러 종류의 안티센스 올리고뉴클레오티드가 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다. 전자, 즉, 절단제는 표적 RNA 부위에 결합하고, 상기 표적 RNA를 절단하는, 세포내 뉴클레아제(예를 들면, RnaseH 또는 Rnase L)를 활성화시킨다. 차단제는 표적 RNA에 결합하고, 리보좀의 입체 장애(steric hindrance)에 의해 단백질 번역을 저해한다. 차단제의 예는 핵산, 모르폴리노 화합물, LNA(locked nucleic acid) 및 메틸포스포네이트를 포함한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). 안티센스 올리고뉴클레오티드는 직접적으로 치료제로서 유용하고, 또한 유전자 기능을 결정하고 검증하기 위해, 예를 들면, 유전자 넉-아웃(knock-out) 또는 유전자 넉-다운 실험을 위해 유용하다. 안티센스 기술은 Lavery et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Stephens et al., Curr. Opin. Mol. Ther. 5:118-122 (2003), Kurreck, Eur. J. Biochem. 270:1628-44 (2003), Dias et al., Mol. Cancer Ter. 1:347-55 (2002), Chen, Methods Mol. Med. 75:621-636 (2003), Wang et al., Curr. Cancer Drug Targets 1:177-96 (2001), 및 Bennett, Antisense Nucleic Acid Drug.Dev. 12:215-24 (2002)에 더 설명된다.
본 명세서에 기재된 변이는 특정한 변이에 특이적인 안티센스 시약의 선택 및 설계를 위해 이용될 수 있다. 본 명세서에 기재된 변이에 대한 정보를 이용하여, 하나 이상의 본 발명의 변이를 포함하는 표적 mRNA에 특이적으로 표적화하는 안티센스 올리고뉴클레오티드 또는 다른 안티센스 분자들이 설계될 수 있다. 이 방식으로, 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 mRNA 분자의 발현이 저해되거나 또는 차단될 수 있다. 일 구체예에서, 안티센스 분자는 표적 핵산의 특정한 대립형질 형태(즉, 하나 또는 수개의 변이(대립형질 및/또는 일배체형))에 특이적으로 결합하여, 이 특정한 대립형질 또는 일배체형으로부터 기원된 산물의 번역을 저해하나, 상기 표적 핵산 분자의 특정한 다형성 부위에서 다른 변이 또는 대안적인 변이에는 결합하지 않도록 설계된다.
안티센스 분자는 유전자 발현을 저해하고, 따라서, 단백질 발현을 저해하기 위해 mRNA를 불활성화시키기 위해 이용될 수 있기 때문에, 안티센스 분자는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 같은, 질병 또는 장애를 치료하기 위해 이용될 수 있다. 방법은 mRNA가 번역되는 능력을 약화시키는, mRNA의 하나 이상의 영역에 상보적인 뉴클레오티드 서열을 포함하는 리보자임(ribozyme)에 의한 절단을 포함할 수 있다. 그와 같은 mRNA 영역은 예를 들면, 단백질-코딩 영역, 특히, 촉매 활성, 기질 및/또는 리간드 결합 부위, 또는 단백질의 다른 기능성 도메인에 상응하는 단백질-코딩 영역을 포함한다.
C. elegans (Fire et al.,Nature 391:806-11 (1998))에서의 최초의 발견 이후, 지난 10년간 RNA 간섭(RNA interference, RNAi) 현상이 활발하게 연구되었고, 최근년에, 인간 질병의 치료에서 RNAi의 잠재적 용도가 활발히 탐구되고 있다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)). 유전자 침묵(gene silencing)으로도 불리는, RNA 간섭(RNAi)은 특정한 유전자를 중지(turn off)시키기 위해 이중-가닥 RNA 분자(dsRNA)를 이용하는 것에 기반한다. 세포에서, 세포질 이중가닥-RNA 분자(dsRNA)는 세포성 복합체(cellular complex)에 의해 작은 간섭 RNA(siRNA)로 가공된다. siRNA는 단백질-RNA 복합체를 표적 mRNA 상의 특정한 부위로 표적화되게 하여, 상기 mRNA의 절단을 초래한다(Thompson, Drug Discovery Today, 7:912-917 (2002)). siRNA 분자들은 통상적으로 길이가 약 20개, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다. 따라서, 본 발명의 일 양태는 분리된 핵산 분자, 및 상기 분자들의 RNA 간섭을 위한 용도, 즉, 작은 간섭 RNA 분자(siRNA)로서의 용도에 관한 것이다. 일 구체예에서, 상기 분리된 핵산 분자는 길이가 18개 내지 26개의 뉴클레오티드로 구성되고, 바람직하게는 19개 내지 25개의 뉴클레오티드로 구성되며, 보다 바람직하게는 20개 내지 24개의 뉴클레오티드로 구성되고, 보다 바람직하게는, 21개, 22개 또는 23개의 뉴클레오티드로 구성된다.
RNAi-매개 유전자 침묵을 위한 또 다른 경로는 세포에서 전구체 miRNA(precursor microRNA, pri-miRNA)를 생성하기 위해 가공되는, 내재적으로 코딩된 일차 마이크로RNA(endogenously encoded micorRNA)(pri-miRNA) 전사체에서 기인한다. 이 miRNA 분자들은 핵으로부터 세포질로 유출되고, 세포질에서 성숙 miRNA 분자(mature miRNA)를 생성하기 위해 가공을 거치고, 상기 miRNA는 mRNA의 3' 비번역 영역(untranslated region, UTR) 내의 표적 부위를 인식하는 것에 의해 번역 저해(translational inhibition)를 주도하고, 뒤이어 P-바디(P-body)를 가공하는 것에 의해 mRNA 분해를 주도한다(reviewed in Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007)).
RNAi의 임상적 적용은 바람직하게는 크기가 약 20 내지 23개의 뉴클레오티드로 구성되고, 바람직하게는 2개의 뉴클레오티드로 구성된 3' 오버랩(overlap)을 갖는 것인 합성 siRNA 듀플렉스의 내포를 포함한다. 유전작 발현의 넉다운은 표적 mRNA에 대한 서열-특이적 설계에 의해 확립된다. 그와 같은 분자의 최적 설계 및 합성을 위한 여러 상업적 사이트들이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
다른 적용들은 보다 긴 siRNA 분자(통상적으로 25 내지 30개의 뉴클레오티드로 구성된 길이, 바람직하게는 약 27개의 뉴클레오티드로 구성된 길이), 및 작은 헤어핀 RNA(small hairpin, sh RAN; 통상적으로 약 29개의 뉴클레오티드로 구성된 길이)를 제공한다. 후자는 Amarzguioui et al. (FEBS Lett. 579:5974-81 (2005))에 기재된 바와 같이, 자연적으로 발현된다. 화학적으로 합성된 siRNA 및 shRNA는 인 비보 가공을 위한 기질이며, 일부 경우에, 보다 짧은 설계의 경우보다 더 강력한 유전자 침묵을 제공한다(Kim et al., Nature Biotechnol. 23:222-226 (2005); Siolas et al., Nature Biotechnol. 23:227-231 (2005)). 일반적으로, siRNA의 세포내 농도가 후속 세포 분열에 의해 희석되기 때문에, siRNA는 유전자 발현의 일시적 침묵을 제공한다. 대조적으로, 발현된 shRNA는 shRNA의 전사가 일어나는 동안은, 표적 전사체(target transcript)의 장기적이고 안정적인 넉다운을 매개한다(Marques et al., Nature Biotechnol. 23:559-565 (2006); Brummelkamp et al., Science 296: 550-553 (2002)).
siRNA, miRNA 및 shRNA를 포함하는 RNAi 분자들은 서열-의존적 방식으로 작용하기 때문에, 본 발명의 변이(예를 들면, LD 블럭 C04와 연관된 마커 및 일배체형, 예를 들면, 표 5A 및 5B에 열거된 마커)는 특정한 대립형질 및/또는 일배체형(예를 들면, 본 명세서에 기재된 마커 및 일배체형)을 포함하는 특이적 핵산 분자를 인식하나, 다른 대립형질 또는 일배체형을 포함하는 핵산 분자는 인식하지 않는 RNAi 시약을 설계하기 위해 이용될 수 있다. 따라서, 이 RNAi 시약은 표적 핵산 분자를 인식하고 파괴시킬 수 있다. 안티센스 시약의 경우와 같이, RNAi 시약은 치료제(즉, 질병-연관 유전자 또는 질병-연관 유전자 변이의 중지(turnoff)를 위해) 유용할 수 있으나, 또한 유전자 기능을 규명하고 검증하기 위해 유용할 수 있다(예를 들면, 유전자 넉-아웃 또는 유전자 넉-다운 실험에 의해).
RNAi의 전달은 본 발명이 속하는 기술 분야에서 당업자에게 알려진 다양한 방법에 의해 수행될 수 있다. 비-바이러스 전달(non-viral delivery)을 이용하는 방법은 콜레스테롤, 안정한 핵산-지질 입자(stable nucleic acid-lipid particle, SNALP), 중쇄 항체 단편(Fab), 앱타머(aptamer) 및 나노입자를 포함한다. 바이러스 전달은 렌티바이러스, 아데노바이러스 및 아데노-연관 바이러스(adeno-associated virus)의 이용을 포함한다. 일부 구체예에서, siRNA 분자는 그들의 안정성을 증가시키기 위해 화학적으로 변형된다. 이는 2'-O-메틸푸린 및 2'-플루오로푸린을 포함한, 리보오스의 2' 위치에서의 변형을 포함하고, 이 변형들은 Rnase 활성에 대한 내성을 제공한다. 다른 화학적 변형이 가능하며 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다.
하기의 참조문헌들이 RNAi, 및 RNAi를 이용한 특정한 유전자의 표적화 가능성의 추가적인 요약을 제공한다: Kim & Rossi, Nat. Rev. Genet. 8:173-184 (2007), Chen & Rajewsky, Nat. Rev. Genet. 8: 93-103 (2007), Reynolds, et al., Nat. Biotechnol. 22:326-330 (2004), Chi et al., Proc. Natl. Acad. Sci. USA 100:6343-6346 (2003), Vickers et al., J. Biol. Chem. 278:7108-7118 (2003), Agami, Curr. Opin. Chem. Biol. 6:829-834 (2002), Lavery, et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Shi, Trends Genet. 19:9-12 (2003), Shuey et al., Drug Discov. Today 7:1040-46 (2002), McManus et al., Nat. Rev. Genet. 3:737-747 (2002), Xia et al., Nat. Biotechnol. 20:1006-10 (2002), Plasterk et al., curr. Opin. Genet. Dev. 10:562-7 (2000), Bosher et al., Nat. Cell Biol. 2:E31-6 (2000), and Hunter, Curr. Biol. 9:R440-442 (1999).
심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 포함한 질병에 대한 증가된 소인(predispotion) 또는 질병 발병의 증가된 위험도를 초래하는 유전적 결함, 또는 질병을 유발하는 결함이 상기 결함을 갖는 개체에게 상기 유전적 결함의 부위에 정상/야생형 뉴클레오티드를 공급하는 복구 서열(repair sequence)을 내포하는 핵산 단편을 투여하는 것에 의해 영구적으로 정정될 수 있다. 그와 같은 부위-특이적 복구 서열은 개체의 게놈 DNA의 내재적 복구를 촉진하기 위해 작용하는 RNA/DNA 올리고뉴클레오티드를 포함(concompass)할 수 있다. 복구 서열의 투여는 음이온성 리포좀 내에 캡슐화된, 폴리에틸렌이민과의 복합체, 아데노바이러스 벡터와 같은 바이러스 벡터 또는 투여되는 핵산의 세포내 흡수를 촉진하기에 적합한 다른 약제학적 조성물과 같은, 적합한 비히클에 의해 수행될 수 있다. 그 후, 키메라 올리고뉴클레오티드가 개체의 게놈으로 정상적인 서열의 내포를 유도하여, 정상/야생형 유전자 산물의 발현을 유도하기 때문에, 유전적 결함이 극복될 수 있다. 상기 교체(replacement)가 전파되고, 따라서, 질환 또는 상태와 연관된 증상의 영구적인 치유 및 경감을 가능하게 한다.
본 발명은 심장성 부정맥, 예를 들면, 심방세동 또는 심방조동 및/또는 뇌졸중을 치료하기 위해 이용될 수 있는 화합물 또는 작용제를 확인(식별, identify)하는 방법을 제공한다. 따라서, 본 발명의 변이는 치료제의 확인 및/또는 개발을 위한 표적으로 유용하다. 그와 같은 방법은 작용제 또는 화합물이 본 발명의 하나 이상의 변이(마커 및/또는 일배체형)를 포함하는 핵산, 또는 상기 핵산의 코딩된 산물의 활성 및/또는 발현을 조절하는 능력을 분석하는 단계를 포함할 수 있다. 이는 또한 코딩된 핵산 산물의 원치않는 활성 또는 발현을 저해 또는 변화시키는 작용제 또는 화합물을 확인하기 위해 이용될 수 있다. 그와 같은 실험을 수행하기 위한 분석법은 당업자에게 공지된 바와 같이, 세포-기반 시스템 또는 세포-불포함 시스템에서 수행될 수 있다. 세포-기반 시스템은 본래 목적 핵산 분자를 발현하는 세포, 또는 특정한 원하는 핵산 분자를 발현하도록 유전적으로 변형된 재조합 세포를 포함한다.
환자에서 변이 유전자 발현이 변이-함유 핵산 서열의 발현(예를 들면, 하나 이상의 변이를 함유하는 RNA로 전사되고, 뒤이어 단백질로 번역될 수 있는, 본 발명의 하나 이상의 변이를 포함하는 유전자), 또는 정상적인 전사체의 발현 수준 또는 패턴에 영향을 미치는 변이, 예를 들면, 유전자의 조절 또는 제어 영역의 변이에 따른, 정상/야생형 핵산 서열의 변화된 발현에 의해 평가될 수 있다. 유전자 발현에 대한 분석법은 직접적인 핵산 분석법(mRNA), 발현된 단백질 수준에 대한 분석법, 또는 경로, 예를 들면, 신호 경로(signal pathway)에 관여된 부수적(collateral) 화합물의 분석을 포함한다. 또한, 신호 경로에 대응하여 상향-조절 또는 하향-조절되는 유전자의 발현이 분석될 수 있다. 일 구체예는 루시페라아제와 같은 리포터 유전자를 목적 유전자의 조절 영역에 작동가능하게 연결하는 단계를 포함한다.
일 구체예에서, 세포가 후보 화합물 또는 작용제와 접촉되고, mRAN의 발현이 결정되는 경우, 유전자 발현의 조절제(modulator)가 확인될 수 있다. 후보 화합물 또는 작용제의 존재 하의 mRNA의 발현 수준이 상기 화합물 또는 작용제의 부재 하의 발현 수준에 비교될 수 있다. 이 비교에 근거하여, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 치료하기 위한 후보 화합물 또는 작용제가 변이 유전자의 유전자 발현을 조절하는 화합물 또는 작용제로 확인될 수 있다. mRNA의 발현 또는 코딩된 단백질이 후보 화합물 또는 작용제의 부재시보다 존재 시에 통계적으로 유의성 있게 더 높은 경우, 상기 후보 화합물 또는 작용제는 상기 핵산의 발현의 촉진제 또는 상향-조절제로 확인된다. 핵산 발현 또는 단백질 수준이 후보 화합물 또는 작용제의 부재시 보다 존재 시에 통계적으로 유의성 있게 더 낮은 경우, 상기 후보 화합물은 상기 핵산의 발현의 저해제 또는 하향-조절제로 확인된다.
본 발명은 또한 약물(화합물 및/또는 작용제) 스크리닝을 통해 확인된 화합물을 유전자 조절제(즉, 유전자 발현의 촉진제 및/또는 저해제)로 이용한 치료 방법을 제공한다.
본 발명의 또 다른 양태에서, 약제학적 팩(키트)이 제공되고, 상기 팩(pack)은 치료제 및 본 명세서에 개시된 바와 같은, 본 발명의 하나 이상의 변이에 대해 진단적으로 테스트된 개인에게 상기 치료제를 투여하기 위한 일련의 설명서를 포함한다. 상기 치료제는 소형 분자 약물, 항체, 펩티드, 안티센스 또는 RNAi 분자, 또는 다른 치료 분자일 수 있다. 일 구체예에서, 하나 이상의 본 발명의 변이의 보인자로 확인된 개인은 상기 치료제의 처방 투여량(prescribed dose)을 복용하도록 지시된다. 하나의 그와 같은 구체예에서, 하나 이상의 본 발명의 변이의 동형접합 보인자로 확인된 개인은 상기 치료제의 처방 투여량을 복용하도록 지시된다. 또 다른 구체예에서, 하나 이상의 본 발명의 변이의 비-보인자(non-carrier)로 확인된 개인은 상기 치료제의 처방 투여량을 복용하도록 지시된다.
치료제에 대한 반응의 확률을 평가하는 방법, 치료의 진행을 모니터링하는 방법 및 치료 방법.
본 발명이 속하는 기술 분야에서 공지된 바와 같이, 개체들은 특정한 치료(예를 들면, 치료제 또는 치료 방법)에 대해 차등적 반응을 가질 수 있다. 약물유전학(Pharmacogenomics)은 유전적 변이(예를 들면, 본 발명의 마커 및/또는 일배체형)가 변화된 약물 소인(drug disposition) 및/또는 약물의 비정상적인 또는 변화된 작용 때문에, 약물 반응에 어떻게 영향을 미치는지의 문제를 다룬다. 따라서, 차등적 반응의 근거(basis)가 부분적으로 유전학적으로 결정될 수 있다. 약물 반응에 영향을 미치는 유전적 변이에 따른 임상적 결과는 일부 개체(본 발명의 유전적 변이의 보인자 또는 비-보인자)에서 약물의 독성, 또는 약물의 치료적 실패(therapeutic failure)를 초래할 수 있다. 따라서, 본 발명의 변이는 치료제 및/또는 방법이 신체에 대해 작용하는 방식, 또는 신체가 치료제를 대사하는 방식을 결정할 수 있다.
따라서, 일 구체예에서, 다형성 부위에서 특정한 대립형질 또는 일배체형의 존재는 특정한 치료 방식(treatment modality)에 대한 상이한 반응, 예를 들면, 상이한 반응률(response rate)을 나타낸다. 이는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중으로 진단되고, 다형성 부위에 특정한 대립형질 또는 본 발명의 일배체형(예를 들면, 본 발명의 위험 및 보호성 대립형질 및/또는 일배체형)을 갖는 환자가 상기 질병을 치료하기 위해 이용된 특정한 치료제, 약물 및/또는 다른 치료법에 대해 보다 유리하게 또는 보다 불리하게 반응할 것이라는 것을 의미한다. 따라서, 마커 대립형질 또는 일배체형의 존재 또는 부재는 환자에 대해 어떤 치료가 이용되어야 하는지를 결정하는데 도움이 될 수 있다. 예를 들면, 새로 진단된 환자의 경우, 본 발명의 마커 또는 일배체형의 존재가 (예를 들면, 본 명세서에 기재된 바와 같이, 혈액 시료로부터 유래된 DNA의 테스트를 통해) 평가될 수 있다. 환자가 마커 대립형질 또는 일배체형에 대해 양성인 경우(즉, 마커의 하나 이상의 특정한 대립형질 또는 일배체형이 존재하는 경우), 의사는 하나의 특정한 치료를 권고하고, 환자가 마커의 상기 하나 이상의 대립형질 또는 일배체형에 대해 음성인 경우, 다른 코스의 치료(즉각적인 치료가 아닌, 질병의 진행에 대한 지속적인 모니터링이 수행될 것을 권고하는 것을 포함할 수 있음)가 권고될 수 있다. 따라서, 환자의 보인자 상태가 특정한 치료 방식이 적용되어야 하는지 여부를 결정하는 것을 보조하기 위해 이용될 수 있다. 그 가치는 질병을 조기에 진단하고, 가장 적합한 치료를 선택하며, 임상의에게 가장 적합한 치료를 적용할 수 있도록 질병의 예후/공격성에 대한 정보를 제공할 수 있다는 가능성에 있다.
심방세동 및 심방조동의 치료는 일반적으로 (i) 뇌졸중을 예방하고 및 (ii) 증상을 치료하기 위한 두가지 주요한 목적에 의해 주도된다.
(i) 뇌졸중 예방
항응고는 심방세동에서 뇌졸중 예방을 위한 정선된 치료법이고, 이 부정맥을 갖는 대다수의 환자에게 지시된다. 항응고가 강력하게 권고되지 않는 유일한 환자들은 낮은 위험도를 갖는 것으로 간주되는 65세 미만의 환자들이고, 즉, 그들은 고혈압이나 관상동맥 질환을 포함한, 기질적 심장 질환(organic heart disease)을 갖지 않고, 뇌졸중이나 일과성 허혈 발작의 과거 병력이 없으며, 비만증을 갖지 않는다. 이 그룹은 전체적으로 뇌졸중의 보다 낮은 위험도를 가지며, 아스피린에 의한 뇌졸중-예방이 권고된다. 모든 다른 환자에 대해, 심방세동이 영구적인지, 재발 급작성(recurrent paroxymal)인지, 또는 재발 지속성(recurrent persistent)인지 여부에 관계없이, 항응고가 지시된다. 최초의 급작성 심방세동의 에피소드를 갖는 환자가 어떻게 치료되어야 하는지는 일반화될 수 없고, 그 결정은 각 환자별로 개별화되어야 한다. 심방세동을 갖는 환자가 항부정맥 요법(리듬이 제어됨)으로 동방결절 리듬(sinus rhythm)이 유지되는 것으로 느끼는 경우에도 항응고가 뇌졸중 위험도에 영향을 미치지 않기 때문에, 항응고가 지시된다.
항응고제. 전술된 바와 같이, 심장색전증(cardioembolism) 및 뇌졸중의 예방을 위해, 심방세동에서 항응고가 권장된다. 가장 널리 연구된 경구 항응고제는 와파린이고, 이 약물은 심방세동에서 장기적 경구 항응고를 위해 범용적으로 권고된다. 와파린은 출혈의 위험을 제외하고는 부작용이 거의 없으나, (항응고의 효과를 측정하기 위해) 치료 동안 혈액 값(blood value)의 규칙적이고 세심한 모니터링을 필요로 한다. 경구 항응고제인 지멜라가트란이 심방세동을 가진 환자에서 뇌졸중 예방을 위해 유망하다는 것을 보여주었고 와파린과 같이 정기적인 모니터링을 필요로 하지 않는다는 장점을 갖는다. 그러나, 지멜라가트란은 이유가 밝혀지지 않은 간 손상을 유발하는 것으로 확인되었고 2006년에 시장에서 철수되었다. 헤파린 및 저분자량 헤파린(예를 들면, 에녹사파린, 달테파린, 틴자파린, 아르데파린, 나드로파린, 및 레비파린)을 포함한 여러 작용제들이 정맥내 및/또는 피하 치료법을 위해 이용가능하다. 이 약제들은 항응고의 신속한 개시가 필요한 경우, 또는 경구 항응고 치료법이 고위험 환자에서 중단되어야 하거나 또는 다른 환자에서, 예를 들면, 일련의 절차 때문에 1주일 이상 중단되어야 하는 경우 권장된다. 기타 비경구 항응고제, 예를 들면, 인자 Xa 저해제인 폰다파리눅스 및 이드라파리눅스, 트롬빈-저해제인 레피루딘, 비발리루딘 및 아르가트로반 및 다나파로이드가 이용가능하나, 심방세동에서의 치료제로 특별히 권고되지는 않는다.
(ii) 증상 제어. 심방세동의 증상들을 제어하기 위해 적용되는 의약적 및 수술적 치료법이 개별 환자에게 맞춤화되고 약물, 고주파절제 및/또는 수술에 의한 심장박동수 및/또는 리듬 제어로 구성된다.
항부정맥제(Antiarrhythmic medications). 일반적으로, 심방세동 및 심방조동을 포함한, 심장성 부정맥의 특징인 심장의 비정상적인 리듬을 억제하기 위해 항부정맥제가 이용된다. 항부정맥제의 하나의 분류는 항부정맥제의 다섯개의 주요한 카테로리가 정의되는, Vaughan Williams 분류이다. 클래스 I 작용제는 신속한 나트륨 채널 차단제이고, 차단의 반응속도(kinetics) 및 강도, 및 재분극에 대한 효과에 근거하여 하위로 더 분류된다. 클래스 Ia는 디소피라미드, 모리시진, 프로카인아미드 및 퀴니딘을 포함한다. 클래스 Ib 작용제는 리도카인, 멕실레틴, 토카이니드, 및 페니토인이다. 클래스 Ic 작용제는 엔카이니드, 플레카이니드, 프로파페논, 아즈말린, 시벤졸린 및 데타즈미움(detajmium)이다. 클래스 II 작용제는 베타 차단제이고, 그들은 베타-아드레날린성 수용체에서 카테콜아민의 효과를 차단한다. 베타 차단제의 예는 에스몰롤, 프로프라놀롤, 메토프롤롤, 알프레놀롤, 아테놀롤, 카르베디롤, 비소프롤롤, 아세부톨롤, 나돌롤, 핀돌롤, 라베탈롤, 옥스프레노톨, 펜부톨롤, 티몰롤, 베탁솔롤, 카르텔롤, 소탈롤 및 레보부놀롤이다. 클래스 III 작용제는 혼합된 특성을 가지나, 통합적으로 칼륨 채널 차단제이며 재분극을 지속시킨다. 이 카테고리의 약제들은 아미오다론, 아지밀리드, 브레틸리움, 도페틸리드, 테디사밀, 이부틸리드, 세마틸리드, 소탈롤, N-아세틸 프로카인아미드, 니페칼란트 히드로클로라이드(nifekalant hydrochloride), 베르나칼란트 및 암바실리드이다. 클래스 IV 작용제는 칼슘 차단제이고 베라파밀, 미베프라딜 및 딜티아젬을 포함한다. 마지막으로, 클래스 V 작용제는 다양한 항부정맥제로 구성되고 디곡신 및 아데노신을 포함한다.
심박수 제어. 심장박동수 제어의 유지를 위한 약리적 수단은 베타 차단제, 칼슘 채널 차단제 및 디곡신을 포함한다. 모든 이와 같은 약제들은 방실결절을 통한 전기 전도를 둔화시키고 빠른 심방세동에 대한 심실박동(ventricular rate) 반응을 둔화시킨다. 리듬 제어를 위해 주로 사용되는 일부 항부정맥제(하기 참조)도 방실결절 전도 속도를 둔화시키고 따라서 심실 심장 박동 반응을 둔화시킨다. 이들은 아미오다론, 소탈롤 및 플레카이니드와 같은 일부 클래스 III 및 Ic 약물을 포함한다.
심장박동회복(Cardioversion). 심방세동 또는 심방조동의 동방결절 리듬으로의 심장박동 회복은 동조화된 직류 심장박동회복(synchronized direct-current cardioversion)에 의해 전기적으로, 또는 이부틸리드, 아미오다론, 프로카인아미드, 프로파페논 및 플레카이니드와 같은 약물에 의해 달성될 수 있다.
심장 리듬 제어(Heart rhythm control)
동방결절 리듬의 유지, 즉, 리듬 제어를 위해 이용되는 약물은 주로 클래스 III, Ia 및 Ic로부터의 항부정맥제를 포함한다. 예는 클래스 III의 소탈롤, 아미오다론 및 도페틸리드, 클래스 Ia의 디소피라미드, 프로카인아미드 및 퀴니딘, 및 클래스 Ic의 프로파페논이다. 이 항부정맥제에 의한 치료는 복잡하고, 위험할 수 있으며, 이 약물들을 이용하도록 특별히 교육된 의사들에 의해 지시되어야 한다. 다수의 항부정맥제가 심각한 부작용을 가지며 특정한 집단에서만 이용되어야 한다. 예를 들면, 클래스 Ic 약물은 관상동맥 질환을 갖는 환자에서는 사용되어서는 안되며, 그들이 심방세동을 억제할 수 있더라도, 심방조동에서 실제로 빠른 심실 반응을 촉진할 수 있다. 클래스 Ia 약물은 구조성 심장 질환(structural heart disease)을 갖지 않는 환자에서는 최후의 수단으로 이용될 수 있다. (대부분의 클래스 III 항부정맥제와 같이) 소탈롤은 특히 신장부전을 갖는 환자에서 QT 간격의 유의성 있는 연장을 유발하고, 심각한 심실 부정맥을 촉진할 수 있다. 소탈롤 및 도페틸리드, 및 클래스 Ia 약물은 QT 간격을 모니터링하기 위해 입원환자 기준으로 개시되어야 한다. 아미오다론은 통상적으로 양호하게 내약되고(tolerated) 광범위하게 이용되나, 아미오다론은 장기 치료에 따른 심감한 부작용을 갖는다.
유전적 검사가 어떻게 치료의 선택에 직접적으로 영향을 미치는가
개인들이 최초의(진단된) 급작성 심방세동의 에피소드를 나타내고 에피소드의 발생 후 48시간 미만 내에 자발적으로 동방결절 리듬으로 전환되거나 또는 전기적 또는 화학적 심박회복술을 받는 경우, 항응고 치료를 개시해야하는지 여부의 결정은 대상 환자의 위험도 프로파일 및 담당 의사의 선호도에 따라 개별화된다. 이는 환자가 항응고 치료를 받는 것이 환자의 생명에 주요한 영향을 갖기 때문에 하기 어려운 선택일 수 있다. 종종 그와 같은 상황에서 항응고를 중단하는 결정이 내려질 수 있고 이는 환자에서 심각한 결과를 초래하지 않을 수 있다. 반면에, 환자가 나중에 뇌졸중을 발병하고 따라서, 예방의 기회를 놓친 것일 수 있다. 그와 같은 상황에서, 환자가 위험 변이의 보인자라는 것을 아는 것은 매우 중요하고 항응고 치료의 개시를 뒷받침할 수 있다.
65세 미만의 연령에 심방세동으로 진단받고, 그 외에는 뇌졸중에 대한 낮은 위험도를 갖는 것으로 간주되는, 즉, 기질성 심장질환, 고혈압, 당뇨병 및 과거의 뇌졸중 이력을 갖지 않는 개인은 일반적으로 뇌졸중-예방을 위해서 아스피린으로만 치료되고, 항응고에 의해 치료받지 않는다. 그와 같은 환자가 본 명세서에 기재된 위험 변이에 대해 보인자인 것으로 확인되면, 이것은 다른 경우에 권고되는 것보다 더 빨리 항응고를 개시하는 것에 대한 뒷받침으로 간주될 수 있다. 심방세동으로부터의 뇌졸중의 결과는 파괴적일 수 있기 때문에, 이는 합리적 고려일 것이다.
허혈성 뇌졸중은 일반적으로 의심되는 원인에 근거하여 5개의 서브타입으로 분류된다; 주동맥 죽상경화증, 소동맥 폐색(small artery occlusion), 심장성 폐색증(주로 심방세동에 의함), 기타 결정된 원인의 뇌졸중 및 원인미상(undetermined cause)의 뇌졸중(원인이 확인되지 않거나 둘 이상의 가능한 원인들이 존재함). 중요한 것은 심장성 폐색증에 의한 뇌졸중이 최고의 재발율을 가지며, 가장 크게 손상시키며 가장 낮은 생존률과 연관된다는 것이다. 따라서, 특히 치료수단이 서브타입에 따라 변하기 때문에, 뇌졸중의 주요 원인으로서 심방세동을 간과해서는 안된다. 따라서, 개인이 뇌졸중 또는 일과성 허혈 발작으로 진단되고 타당하게 가능한(plausible) 원인이 표준 정밀검사(workup)에도 불구하고 확인되지 않는 경우, 환자가 위험 변이의 보인자라는 것을 아는 것은 매우 유용하고 항응고 치료의 개시 또는 심방세동을 진단하기 위한 시도에서 보다 공격적인 진단 테스트를 뒷받침할 수 있다.
또한, 본 발명의 마커들은 임상 시험의 검정력(power) 및 효과를 증가시키기 위해 이용될 수 있다. 따라서, 본 발명의 하나 이상의 위험 변이의 보인자인 개체, 즉, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 발병할 증가될 위험도를 부여하는 하나 이상의 다형성 마커의 하나 이상의 대립형질의 보인자인 개체는 특정한 치료 방식, 예를 들면, 전술된 것들과 같은 치료 방식에 반응할 가능성이 더 높을 수 있다. 일 구체예에서, 특정한 치료(예를 들면, 작은 분자 약물)가 표적화하는 경로 및/또는 대사 네트워크 내의 유전자에 대한 위험 변이를 갖는 개체가 치료에 대한 반응자일 가능성이 더 높다. 또 다른 구체예에서, 그 발현 및/또는 기능이 위험 변이에 의해 변화되는 것인 유전자에 대한 위험 변이를 갖는 개체는 그 유전자, 그의 발현 또는 그의 유전자 산물을 표적으로 하는 치료 방식의 반응자일 가능성이 더 높다. 이 적용은 임상 시험의 안전성을 향상시킬 수 있으나, 또한 임상 시험이 통계적으로 유의성 있는 효능을 입증할 가능성을 강화할 수 있고, 집단의 특정한 서브-그룹에 한정될 수 있다. 따라서, 그와 같은 시험의 하나의 가능한 결과는 통계적으로 유의성있게 특정한 유전적 변이, 예를 들면, 본 발명의 마커 및 일배체형의 보인자가 치료제에 대한 양성 반응을 보일, 즉, 처방된 치료제 또는 약물을 투여할 경우, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 증상의 경감을 경험할 가능성이 있다는 것이다.
또 다른 양태에서, 본 발명의 마커 및 일배체형은 특정한 개인을 위한 약제학적 작용제의 선택을 표적화하기 위해 이용될 수 있다. 치료 방식의 맞춤화된(personalized) 선택, 생활방식 변화 또는 상기 두가지의 조합이 본 발명의 위험 변이의 이용에 의해 실현될 수 있다. 따라서, 본 발명의 특정한 마커에 대한 개인의 상태의 지식이 본 발명의 위험 변이에 의해 영향받은 유전자 또는 유전자 사물을 표적화하는 치료 옵션의 선택을 위해 유용할 수 있다. 변이의 특정한 조합이 하나의 치료 옵션의 선택을 위해 유용할 수 있고, 다른 유전자 변이 조합은 다른 치료 옵션을 표적화할 수 있다. 그와 같은 변이의 조합은 임상적으로 신뢰성있는 정확도로 치료 모듈의 선택을 결정하기 위해 필요한 경우, 하나의 변이, 두개의 변이, 세개의 변이, 또는 네개 또는 그 이상의 변이를 포함할 수 있다.
컴퓨터-구현 응용(Computer-implemented application)
본 발명은 또한 본 명세서에서 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중과 연관된 것으로 기재된 다형성 마커 및 일배체형의 컴퓨터-구현 응용(computer-implemented applicatoin)에 관한 것이다. 그와 같은 응용은 본 발명의 방법에서 유용한 유전형 데이터를 저장, 처리(manipulate)하거나 또는 분석하기 위해 유용할 수 있다. 하나의 예는 개인으로부터 유래된 유전형 정보를 판독가능한 매체(readable media) 상에 저장하여, 제3자(예를 들면, 개인)에게 유전형 정보를 제공할 수 있거나, 또는 유전형 데이터로부터 정보를 수득하기 위해, 예를 들면, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 증가된 감수성에 기여하는 유전적 위험 인자에 대한 정보에 비교하고, 그와 같은 비교에 근거한 결과를 보고하는 것에 관한 것이다.
하나의 그와 같은 양태는 컴퓨터-판독가능한 매체(computer-readable media)에 관한 것이다. 일반적으로, 그와 같은 매체는 (i) 하나 이상의 다형성 마커 또는 일배체형에 대한 식별자(identifier) 정보; (ii) 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중을 갖는 개체에서, 상기 하나 이상의 마커의 하나 이상의 대립형질의 빈도, 또는 일배체형의 빈도의 식별자; 및 기준 집단(reference population)에서 상기 하나 이상의 마커의 하나 이상의 대립형질의 빈도, 또는 일배체형의 빈도의 식별자를 저장하는 능력을 갖는다. 기준 집단은 질병-불포함 개인의 집단일 수 있다. 대안적으로, 기준 집단은 일반적인 집단으로부터의 랜덤 표존이고, 따라서, 전반적으로 상기 집단을 대표한다. 빈도 지표는 계산된 빈도, 대립형질 및/또는 일배체형 카피의 계수(count), 또는 특정한 매체를 위해 적합한 실제 빈도의 정규화된(normalized) 또는 달리 처리된(manipulated) 값일 수 있다.
선조 정보(ancestry informaton), 성별, 신체적 특성 또는 특징(신장 및 체중 포함)에 대한 정보, 생화학적 측정값(예를 들면, 혈압, 혈중 지질 수준, 공복 혈당 수준(fasting glucose level), 인슐린 반응 측정값), 또는 특정한 개인의 유전형 상태에 관하여 저장 또는 처리되는 것이 바람직한 다른 유용한 정보와 같은, 개인에 대한 추가적인 정보가 상기 매체에 저장될 수 있다.
본 발명은 또한 개인에서 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 결정하기 위해 유용한 유전적 데이터의 결정 또는 처리를 위해 적합한 장치에 관한 것이다. 그와 같은 장치는 컴퓨터-판독가능한 메모리, 컴퓨터-판독가능한 메모리 상에 저장된 데이터를 처리하기 위한 루틴(routine), 및 유전적 데이터의 척도를 포함한 결과물(output)을 생성하기 위한 루틴을 포함할 수 있다. 그와 같은 척도는 대립형질 빈도 또는 일배체형 빈도, 유전형 계수(genotype count), 성별, 연령, 표현형 정보, 오즈비(OR) 값 또는 상대적 위험도(RR), 집단 귀속 위험도(PAR)와 같은 값, 또는 본래의 유전형 데이터의 직접적인 통계값이거나 또는 유전적 데이터에 근거한 계산에 기반한 다른 유용한 정보를 포함할 수 있다.
전술된 적용들은 모두 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 평가하는 방법에 대해 보다 상세하게 기재된 본 발명의 마커 및 일배체형으로 실시될 수 있다. 따라서, 이 적용들은 일반적으로, 표 5, 표 4, 표 9 및 표 19에 열거된 마커, 및 이들과 연관 불균형인 마커들을 이용하여 실시될 수 있다. 일 구체예에서, 상기 마커 또는 일배체형은 서열번호 50에 표시된 서열의 게놈 세그먼트 내에 존재한다. 또 다른 구체예에서, 상기 마커 또는 일배체형은 표 19에 표시된 마커들로부터 선택된 하나 이상의 마커를 포함한다. 또 다른 구체예에서, 상기 마커 및 일배체형은 D4S406 (서열번호 45), rs2634073 (서열번호 33), rs2200733 (서열번호 28), rs2220427 (서열번호 1), rs10033464 (서열번호 41), 및 rs13143308 (서열번호 51), 선택적으로, 이들과 연관 불균형인 마커를 포함하는 군으로부터 선택된 하나 이상의 마커를 포함한다. 하나의 그와 같은 구체예에서, 연관 불균형은 0.1보다 큰 r2의 수치값에 의해 정의된다. 또 다른 그와 같은 구체예에서, 연관 불균형은 0.2보다 큰 r2의 수치값에 의해 정의된다. 또 다른 구체예에서, 상기 마커 또는 일배체형은 마커 D4S406의 대립형질 -2, -4 및/또는 -8, 마커 rs2634073의 대립형질 A, 마커 rs2200733의 대립형질 T, 마커rs2220427의 대립형질 T, 마커 rs10033464의 대립형질 T, 및/또는 마커 rs13143308의 대립형질 G로부터 선택된 하나 이상의 마커를 포함한다.
핵산 및 폴리펩티드
본 명세서에 기재된 핵산 및 폴리펩티드는 전술된 바와 같은, 본 발명의 방법 및 키트에서 이용될 수 있다.
본 명세서에서 사용된, "분리된(isolated)" 핵산 분자는 (게놈 서열에서와 같이) 정상적으로 유전자 또는 뉴클레오티드 서열을 둘러싸는(flank) 핵산으로부터 분리되고 및/또는 (예를 들면, RNA 라이브러리에서와 같이) 다른 전사된 서열들로부터 완전하게 또는 부분적으로 분리된 핵산이다. 예를 들면, 본 발명의 분리된 핵산은 핵산이 자연적으로 생성되는 복잡한 세포 매질(cellular milieu), 또는 재조합 기법에 의해 생성되는 경우 배양 배지, 또는 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학물질들에 대해 실질적으로 분리될 수 있다. 일부 경우에, 분리된 물질은 조성(예를 들면, 다른 물질을 포함하는 조 추출물), 완충 시스템 또는 시약 혼합물(reagent mix)의 부분을 형성할 것이다. 다른 상황들에서, 상기 물질은 예를 들면, 폴리아크릴아미드 겔 전기영동(PAGE) 또는 컬럼 크로마토그래피(예를 들면, HPLC)에 의해 결정되는 바와 같이, 필수적인 균질성(essential homogeneity)까지 정제될 수 있다. 본 발명의 분리된 핵산 분자는 존재하는 모든 거대분자 종의 약 50% 이상, 약 80% 이상, 또는 약 90% 이상(몰 기준)을 구성할 수 있다. 게놈 DNA에 대해, 용어 "분리된(isolated)"은 또한 본래 게놈 DNA가 결합되어 있는 염색체로부터 분리된 핵산 분자를 의미한다. 예를 들면, 분리된 핵산 분자는 핵산 분자가 유래된 세포의 게놈 DNA에서 핵산 분자를 둘러싸는 뉴클레오티드의 약 250 kb, 200 kb, 150 kb, 100 kb, 75 kb, 50 kb, 25 kb, 10 kb, 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb 미만을 포함할 수 있다.
핵산 분자는 다른 코딩 서열 또는 조절 서열에 융합될 수 있고, 여전히 분리된 것으로 고려될 수 있다. 따라서, 벡터 내에 포함된 재조합 DNA는 본 명세서에서 사용된 "분리된"의 정의에 포함된다. 또한, 분리된 핵산 분자는 이종(heterologous) 숙주 세포 또는 이종 개체 내의 재조합 DNA 분자, 및 용액 중의 부분적으로 또는 실질적으로 정제된 DNA 분자를 포함한다. "분리된" 핵산 분자는 또한 본 발명의 DNA 분자의 인 비보 및 인 비트로 RNA 전사체를 포함한다. 분리된 핵산 분자 또는 뉴클레오티드 서열은 화학적으로 합성되거나 또는 재조합 수단에 의해 생산된 핵산 분자 또는 뉴클레오티드 서열을 포함할 수 있다. 그와 같은 분리된 뉴클레오티드 서열이 예를 들면, 코딩된 폴리펩티드의 제조에서, 상동성 서열(예를 들면, 다른 포유동물 종으로부터)의 분리를 위해, 유전자 맵핑을 위해(예를 들면, 염색체와의 인 시투 혼성화에 의해), 또는 예를 들면, 노던 블롯 분석 또는 기타 혼성화 기법과 같은 조직 (예를 들면, 인간 조직) 중의 유전자의 발현을 검출하기 위해, 프로브로서 유용하다.
본 발명은 또한 높은 엄격성의 혼성화 조건, 예를 들면, 선택적 혼성화를 위한 조건 하에, 본 명세서에 기재된 뉴클레오티드 서열에 혼성화되는 핵산 분자(예를 들면, 본 명세서에 기재된 일배체형과 연관된 다형성 부위를 포함하는 뉴클레오티드 서열에 특이적으로 혼성화하는 핵산 분자)에 관한 것이다. 일 구체예에서, 본 발명은 높은 엄격성의 혼성화 및 세척 조건(예를 들면, 선택적 혼성화를 위한 조건) 하에, LD Block C04 (서열번호 50)의 뉴클레오티드 서열을 포함하는 뉴클레오티드 서열에 혼성화되는 변이를 포함한다. 그와 같은 핵산 분자는 (예를 들면, 높은 엄격성 조건 하에) 대립형질- 또는 서열-특이적 혼성화에 의해 검출 및/또는 분리될 수 있다. 핵산 혼성화를 위한 엄격성 조건 및 방법이 "Current Protocols in Molecular Biology" (Ausubel, F. et al., Current Protocols in Molecular Biology, John Wiley & Sons, (1998))의 페이지 2.10.1-2.10.16 및 페이지 6.3.1-6.3.6, 및 Kraus, M. and Aaronson, S., Methods Enzymol., 200:546-556 (1991)에서 설명되며, 이들의 전체 교시가 참조에 의해 본 명세서에 포함된다.
두 개의 뉴클레오티드 서열 또는 아미노산 서열 간의 퍼센트 동일성(percent identity)은 최적의 비교 목적을 위해 서열들을 정렬시키는 것에 의해(예를 들면, 제1 서열의 서열에 갭이 도입될 수 있음) 결정될 수 있다. 상응하는 위치의 뉴클레오티드 또는 아미노산이 비교되고, 두 서열 간의 퍼센트 동일성은 상기 서열들 간에 공유하는 동일한 위치의 갯수의 함수이다(즉, % 동일성 = 동일한 위치의 갯수(#)/위치의 총 갯수(#) x 100). 특정한 구체예에서, 비교 목적을 위해 정렬된 서열의 길이는 기준 서열의 길이의 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상이다. 두 서열의 실제적인 비교는 잘 알려진 방법, 예를 들면, 수학적 알고리즘을 이용하여 달성될 수 있다. 그와 같은 수학적 알고리즘의 비-한정적인 예가 Karlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90:5873-5877 (1993)에 기재된다. 그와 같은 알고리즘이 Altschul, S. et al., Nucleic Acids Res., 25:3389-3402 (1997)에 기재된 바와 같이, NBLAST 및 XBLAST 프로그램(버전 2.0)에 구현된다. BLAST 및 Gapped BLAST 프로그램을 이용하는 경우, 개별적인 프로그램(예를 들면, NBLAST)의 디폴트 파라미터가 이용될 수 있다. ncbi.nlm.nih.gov에서 월드 와이드 웹사이트를 참조한다. 일 구체예에서, 서열 비교를 위한 파라미터는 score=100, wordlength=12로 설정되거나, 또는 변할 수 있다(예를 들면, W=5 또는 W=20).
다른 예들은 Myers and Miller, CABIOS (1989)의 알고리즘, Torellis, A. and Robotti, C., Comput. Appl. Biosci. 10:3-5 (1994)에 기재된 ADVANCE and ADAM; 및 Pearson, W. and Lipman, D., Proc. Natl. Acad. Sci. USA, 85:2444-48 (1988)에 기재된 FASTA를 포함한다. 또 다른 구체예에서, 두 개의 아미노산 서열 간의 퍼센트 동일성은 GCG 소프트웨어 패키지(Accelrys, Cambridge, UK) 중의 GAP 프로그램을 이용하여 달성될 수 있다.
본 발명은 또한 높은 엄격성 조건 하에 LD Block C04 (서열번호 50)의 뉴클레오티드 서열을 포함하거나 또는 상기 서열로 구성되거나, 또는 LD Block C04 (서열번호 50)의 뉴클레오티드 서열의 상보체를 포함하거나, 이로 구성된 뉴클레오티드 서열의 핵산에 혼성화되는 단편 또는 부분을 포함하고, 상기 뉴클레오티드 서열은 본 명세서에 기재된 마커 및 일배체형에 포함된 하나 이상의 다형성 대립형질을 포함하는 것인 분리된 핵산 분자를 제공한다. 본 발명의 핵산 단편은 약 15개 이상, 약 18개 이상, 20개, 23개 또는 25개 이상의 뉴클레오티드로 구성된 길이이고, 30개, 40개, 50개, 100개, 200개, 500개, 1000개, 10,000개 또는 그 이상의 뉴클레오티드로 구성된 길이일 수 있다.
본 발명의 핵산 단편은 본 명세서에 기재된 바와 같은 분석법에서 프로브 또는 프라이머로서 이용된다. "프로브(probe)" 또는 "프라이머(primer)"는 핵산 분자의 상보적 가닥에 염기-특이적 방식으로 혼성화하는 올리고뉴클레오티드이다. DNA 및 RNA 외에, 그와 같은 프로브 및 프라이머는 Nielsen, P. et al., Science 254:1497-1500 (1991)에 기재된 바와 같은 PNA(polypeptide nucleic acid)를 포함한다. 프로브 또는 프라이머는 핵산 분자 중의 약 15개 이상, 통상적으로 약 20개 내지 25개, 및 특정한 구체예에서, 약 40개, 50개, 또는 75개의 연속적 뉴클레오티드에 혼성화하는 뉴크레오티드 서열의 영역을 포함한다. 일 구체예에서, 상기 프로브 또는 프라이머는 본 명세서에 기재된 하나 이상의 다형성 마커의 하나 이상의 대립형질 또는 하나 이상의 일배체형, 또는 이들의 상보체를 포함한다. 특정한 구체예에서, 프로브 또는 프라이머는 100개 또는 그 미만의 뉴클레오티드를 포함할 수 있고, 예를 들면, 특정한 구체예에서, 6개 내지 50개의 뉴클레오티드, 또는 예를 들면, 12개 내지 30개의 뉴클레오티드를 포함할 수 있다. 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 약 70% 이상, 약 80% 이상, 약 85% 이상, 약 90% 이상, 또는 약 95% 이상 동일하다. 또 다른 구체예에서, 프로브 또는 프라이머는 연속적인 뉴클레오티드 서열 또는 상기 연속적인 뉴클레오티드 서열의 상보체에 선택적으로 혼성화될 수 있다. 종종, 프로브 또는 프라이머는 표지, 예를 들면, 방사성동위원소, 형광 표지, 효소 표지, 효소 보조-인자 표지, 자성 표지(magnetic label), 스핀 표지, 에피토프 표지를 더 포함한다.
전술된 바와 같은, 본 발명의 핵산 분자는 당업자에게 잘 알려진 표준 분자 생물학 기법을 이용하여 확인되고 분리될 수 있다. 증폭된 DNA가 표지화되고(예를 들면, 방사성표지되고) 인간 세포로부터 유래된 cDNA 라이브러리를 스크리닝하기 위한 프로브로 이용될 수 있다. cDNA는 mRNA로부터 유래되고 적합한 벡터에 담길 수 있다. 상응하는 클론들이 분리될 수 있고, DNA가 인 비보 절제(in vivo excision) 후에 수득될 수 있고, 적합한 분자량의 폴리펩티드를 코딩하는 정확한 해독 프레임을 식별하기 위해 클로닝된 삽입물(insert)이 본 발명이 속하는 기술 분야에서 인정되는 방법에 의해 한 배향(orientation) 또는 양쪽 배향으로 서열결정될 수 있다. 이 방법들 또는 유사한 방법들을 이용하여, 폴리펩티드 및 상기 폴리펩티드를 코딩하는 DNA가 분리되고, 서열결정되며, 더 규명될 수 있다.
일반적으로, 본 발명의 분리된 핵산 서열은 서던 겔(Southern gel)에서 분자량 마커, 및 관련된 유전자 위치에 맵핑하기 위해 표지화된 염색체 마커로 이용될 수 있다. 상기 핵산 서열은 또한 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중 또는 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 감수성을 확인하기 위해, 환자의 내재적 DNA 서열과 비교하기 위해 이용될 수 있고, 관련된 DNA 서열을 혼성화하고 발견하기 위해, 또는 시료로부터 공지된 서열을 제거하기 위해(예를 들면, 공통 유전자 제거 혼성화법(subtractive hybridization)) 프로브로서 이용될 수 있다. 핵산 서열은 유전자 지문법(genetic fingerprinting)을 위한 프라이머를 수득하기 위해, 면역화 기법을 이용하여 항-폴리펩티드 항체를 생성하기 위해, 및/또는 항-DNA 항체를 생성시키기거나 또는 면역 반응을 유발하기 위해 항원으로서 이용될 수 있다.
항체
유전자 산물의 하나의 형태에 특이적으로 결합하나, 상기 유전자 산물의 다른 형태에는 결합하지 않는 다중클론 항체 및/또는 단일클론 항체가 또한 제공된다. 다형성 부위 또는 부위들을 포함하는 변이 또는 기준 유전자 산물의 일부에 결합하는 항체도 제공된다. 본 명세서에서 사용된 용어 "항체(antibody)"는 면역글로불린 분자 및 면역글로불린 분자의 면역학적으로 활성인 부분, 즉, 항원에 특이적으로 결합하는 항원-결합 부위를 포함하는 분자를 의미한다. 본 발명의 폴리펩티드에 특이적으로 결합하는 분자는 폴리펩티드 또는 그의 단편에 결합하나, 자연적으로 상기 폴리펩티드를 포함하는 시료, 예를 들면, 생물학적 시료 중의 다른 분자에는 실질적으로 결합하지 않는 분자이다. 면역글로불린 분자의 면역학적 활성 부분의 예는 펩신과 같은 효소에 의해 항체를 처리하는 것에 의해 생성될 수 있는 F(ab) and F(ab')2 단편을 포함한다. 본 발명은 본 발명의 폴리펩티드에 결합하는 다중클론 항체 및 단일클론 항체를 제공한다. 본 명세서에서 사용된, 용어 "단일클론 항체(monoclonal antibody)" 또는 "단일클론 항체 조성물(monoclonal antibody composition)"은 본 발명의 폴리펩티드의 특정한 에피토프와 면역반응할 수 있는 항원 결합 부위의 단 하나의 종만을 포함하는 항체 분자의 집단을 의미한다. 따라서, 단일클론 항체 조성물은 일반적으로 그와 면역반응하는 본 발명의 특정한 폴리펩티드에 대한 단일 결합 친화도를 보인다.
다중클론 항체는 적합한 개체를 원하는 면역원(immunogen), 예를 들면, 본 발명의 폴리펩티드 또는 그의 단편으로 면역화시키는 것에 의해 전술된 바와 같이 제조될 수 있다. 면역화된 개체에서 항체 역가(antibody titer)는 시간의 경과에 대해, 표준 기법, 예를 들면, 고정화된 폴리펩티드를 이용한, ELISA(enzyme linked immunosorbent assay)에 의해 모니터링될 수 있다. 필요한 경우, 폴리펩티드에 대한 항체 분자가 포유동물(예를 들면, 혈액)로부터 분리되고, IgG 분획을 수득하기 위힌 단백질 A 크로마토그래피와 같은, 잘 알려진 기법에 의해 더 정제될 수 있다. 면역화 후 적절한 시점에, 예를 들면, 항체 역가가 최고인 시점에, 항체-생성 세포들이 개체로부터 수득되고, Kohler and Milstein, Nature 256:495-497 (1975)에 의해 최초로 개시된 하이브리도마 기법, 인간 B 세포 하이브리도마 기법(Kozbor et al., Immunol. Today 4: 72 (1983)), EBV-하이브리도마 기법(Cole et al., Monoclonal Antibodies and Cancer Therapy, Alan R. Liss,1985, Inc., pp. 77-96) 또는 트리오마(trioma) 기법과 같은 표준 기법에 의해 단일클론 항체를 제조하기 위해 이용될 수 있다. 하이브리도마를 생성하는 기술이 잘 알려져 있다(일반적으로, Current Protocols in Immunology (1994) Collgan et al., (eds.) John Wiley & Sons, Inc., New York, NY 참조). 요약하면, 불멸 세포주(immortal cell line)(일반적으로, 골수종(myeloma))가 전술된 바와 같이 면역원에 의해 면역화된 포유동물로부터의 림프구(일반적으로, 비장림프구(splenocyte))에 융합되고, 결과물인 하이브리도마 세포의 배양 상층액이 본 발명의 폴리펩티드에 결합하는 단일클론 항체를 생성하는 하이브리도마를 확인하기 위해 스크리닝된다.
림프구와 불멸화된 세포주를 융합시키기 위해 이용되는 다수의 잘 알려진 프로토콜이 본 발명의 폴리펩티드에 대한 단일클론 항체를 생성할 목적으로 적용될 수 있다(예를 들면, Current Protocols in Immunology, supra; Galfre et al., Nature 266:55052 (1977); R.H. Kenneth, in Monoclonal Antibodies: A New Dimension In Biological Analyses, Plenum Publishing Corp., New York, New York (1980); 및 Lerner, Yale J. Biol. Med. 54:387-402 (1981) 참조). 또한, 통상적인 당업자는 역시 유용할, 그와 같은 방법의 다양한 변형이 존재한다는 것을 이해할 것이다.
단일클론 항체-분비 하이브리도마 제조의 대안으로, 본 발명의 폴리펩티드에 대한 단일클론 항체가 상기 폴리펩티드로 재조합 조합적 면역글로불린 라이브러리(recombinant combinatorial immunoglobulin library)(예를 들면, 항체 파아지 표시(phage display) 라이브러리)를 스크리닝하고, 그에 의해 상기 폴리펩티드에 결합하는 면역글로불린 라이브러리 구성물을 분리하는 것에 의해 식별되고 분리될 수 있다. 파아지 표시 라이브러리를 생성하고 스크리닝하기 위한 키트가 상업적으로 이용가능하다(예를 들면, the Pharmacia Recombinant Phage Antibody System, Catalog No. 27-9400-01; 및 Stratagene Surf ZAP™ Phage Display Kit, Catalog No. 240612). 추가적으로, 항체 표시 라이브러리를 생성하고 스크리닝하기 위해 이용할 수 있는 특히 유용한 방법 및 시약의 예를, 예를 들면, 미국특허 제5,223,409호; PCT 공개 WO 92/18619; PCT 공개 WO 91/17271; PCT 공개 WO 92/20791; PCT 공개 WO 92/15679; PCT 공개 WO 93/01288; PCT 공개 WO 92/01047; PCT 공개 WO 92/09690; PCT 공개 WO 90/02809; Fuchs et al., Bio/Technology 9: 1370-1372 (1991); Hay et al., Hum. Antibod. Hybridomas 3:81-85 (1992); Huse et al., Science 246: 1275-1281 (1989); 및 Griffiths et al., EMBO J. 12:725-734 (1993)에서 찾을 수 있다.
추가적으로, 표준 재조합 DNA 기법을 이용하여 제조될 수 있는, 인간 부분 및 비-인간(non-human) 부분을 모두 포함하는, 키메라 단일클론 항체 및 인간화(humanized) 단일클론 항체와 같은 재조합 항체가 본 발명의 범위에 속한다. 그와 같은 키메라 항체 및 인간화 단일클론 항체는 본 발명이 속하는 기술 분야에서 알려진 재조합 DNA 기법에 의해 생산될 수 있다.
일반적으로, 항체(예를 들면, 단일크론 항체)는 친화도 크로마토그래피 또는 면역침전과 같은 표준 기법에 의해 본 발명의 폴리펩티드를 분리하기 위해 이용될 수 있다. 폴리펩티드-특이적 항체는 세포로부터 천연 폴리펩티드 및 숙주 세포에서 발현된 재조합기법에 의해 생산된 폴리펩티드의 정제를 촉진할 수 있다. 또한, 본 발명의 폴리펩티드에 대해 특이적인 항체는 폴리펩티드의 양(abundance) 및 발현 패턴을 평가하기 위해 폴리펩티드를 (예를 들면, 세포 용해액, 세포 상층액, 또는 조직 시료에서) 검출하기 위해 이용될 수 있다. 항체는 임상 테스트 절차의 일부로서, 예를 들면, 주어진 치료 계획(treatment regime)의 효능을 결정하기 위해, 조직에서 단백질 수준을 진단 목적으로 모니터링하기 위해 이용될 수 있다. 그의 검출을 촉진하기 위해 항체는 검출가능한 물질에 결합될 수 있다. 검출가능한 물질의 예는 다양한 효소, 보조 그룹(prosthetic group), 형광 물질, 발광 물질, 생물발광 물질, 및 방사성활성 물질을 포함한다. 적합한 효소의 예는 호스래디쉬 퍼옥시다아제(horseradish peroxidase), 알칼리 포스파타아제, 베타-갈락토시다아제, 또는 아세틸콜린에스테라아제를 포함하고; 적합한 보조 그룹 복합체(prothetic group complex)의 예는 스트렙타비딘/비오틴 및 아비딘/비오틴을 포함하며; 적합한 형광 물질의 예는 움벨리페론(umbelliferone), 플루오레세인(fluorescein), 플루오레세인 이소티오시아네이트, 로다민(rhodamine), 디클로로트리아지닐아민 플루오레세인, 단실 클로라이드(dansyl chloride) 또는 피코에리트린(phycoerythrin)을 포함하고; 발광 물질의 예는 루미놀을 포함하며; 생물발광 물질의 예는 루시페라아제, 루시페린, 및 에쿼린(aequorin)을 포함하고, 및 적합한 방사성활성 물질의 예는 125I, 131I, 35S 또는 3H를 포함한다.
항체는 또한 약물유전학 분석에서 유용할 수 있다. 그와 같은 구체에에서, 본 명세서에 기재된 바와 같은 핵산에 의해 코딩되는 변이 단백질에 대한 항체, 예를 들면, 하나 이상의 본 발명의 다형성 마커를 포함하는 핵산에 의해 코딩된 변이 단백질에 대한 항체가 변형된 치료 방식을 필요로 하는 개체를 식별하기 위해 이용될 수 있다.
항체는 또한 질병의 활성 단계와 같은 질병 상태, 또는 단백질의 기능과 관련된 질병, 특히, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 소인을 갖는 개인에서 변이 단백질의 발현을 평가하기 위해 유용할 수 있다. 본 명세서에 기재된 하나 이상의 다형성 마커 또는 일배체형을 포함하는 핵산에 의해 코딩된 본 발명의 변이 단백질에 특이적인 항체는 상기 변이 단백질의 존재를 스크리닝하기 위해, 예를 들면, 상기 변이 단백질의 존재에 의해 표시된 바와 같이, 심장성 부정맥(예를 들면, 심방세동 또는 심방조동) 및/또는 뇌졸중에 대한 소인을 스크리닝하기 위해 이용될 수 있다.
항체는 다른 방법들에서 이용될 수 있다. 따라서, 항체는 전기영동 이동성(electrophoretic mobility), 등전점, 트립신 또는 기타 단백질분해효소에 의한 처리와 함께 본 발명의 변이 단백질과 같은 단백질을 평가하기 위한 진단 도구로서, 또는 본 발명이 속하는 기술 분야의 당업자에게 알려진 다른 물리적 분석법(physical assay)에서 이용하기에 유용하다. 항체는 또한 조직형 검사(tissue typing)에서 이용될 수 있다. 하나의 그와 같은 구체예에서, 특정한 변이 단백질이 특정한 조직형에서의 발현과 상관되며, 상기 변이 단백질에 대한 특이적 항체가 상기 특이적 조직형을 식별하기 위해 이용될 수 있다.
변이 단백질을 포함한, 단백질의 세포내 국재화(subcellular localization) 가 또한 항체를 이용하여 결정될 수 있고, 다양한 조직의 세포에서 단백질의 비정상적인 세포내 국재화를 평가하기 위해 적용될 수 있다. 그와 같은 용도는 유전적 테스트에 적용될 수 있으나, 또한, 특정한 치료 방식을 모니터링하기 위해 적용될 수 있다. 치료가 변이 단백질의 발현 수준 또는 존재, 또는 비정상적인 조직 분포 또는 발생에 따른 발현(developmental expression)을 정정하는 것을 목적으로 하는 경우, 상기 변이 단백질 또는 그의 단편에 대해 특이적인 항체가 치료 효능을 모니터링하기 위해 이용될 수 있다.
항체는 또한, 예를 들면, 변이 단백질이 결합 분자 또는 파트너에 결합하는 것을 차단하는 것에 의해 변이 단백질 기능의 저해를 위해 유용하다. 그와 같은 용도는 또한 치료가 변이 단백질의 기능을 저해하는 것을 포함하는 치료적 상황에 적용될 수 있다. 항체는 예를 들면, 결합을 차단하거나 또는 경쟁적으로 저해하여, 그에 의해, 단백질의 활성을 조절한다(즉, 촉진하거나 또는 길항시킨다). 특정한 기능한 위해 요구되는 부위를 포함하는 특정한 단백질 단편에 대한 항체, 또는 세포 또는 세포막과 결합된 완전한 단백질에 대한 항체가 제조될 수 있다. 인 비보 투여를 위해, 항체는 방사성 핵종(radionuclide), 효소, 면역원성 에피토프, 또는 세균성 독소를 포함한 세포독성제(디프테리아 또는 리신(ricin)과 같은 식물 독소)와 같은 추가적인 치료적 유효탑재물(therapeutic payload)과 결합될 수 있다. 항체 또는 그의 단편의 인 비보 반감기는 폴리에틸렌 글리콜로의 접합을 통한 페길화(pegylation)에 의해 증가될 수 있다.
본 발명은 또한 본 명세서에 기재된 방법에서 항체를 사용하기 위한 키트에 관한 것이다. 이는 테스트 시료에서 변이 단백질의 존재를 검출하기 위한 키트를 포함하나, 이에 한정되지 않는다. 하나의 바람직한 구체예는 표지된 또는 표지가능한 항체 및 생물학적 시료에서 변이 단백질을 검출하기 위한 화합물 또는 작용제, 상기 시료 중의 변이 단백질의 양 또는 존재 또는 부재를 결정하기 위한 수단, 및 상기 시료 중의 변이 단백질의 양과 표준을 비교하기 위한 수단, 및 키트의 사용 설명서를 포함한다.
이하, 본 발명은 하기의 비-한정적인 실시예에 의해 예시될 것이다.
실시예 1. 염색체 4 상의 심방세동에 대한 위험 변이의 확인
하기는 SNP 마커의 단일-포인트(single point) 분석을 통해 심방세동 및/또는 뇌졸중과 연관된 것으로 확인된 감수성 인자들의 확인의 설명을 포함한다.
방법. 본 연구는 아이슬란드 데이터 보호청(the Data Protection Commission of Iceland) 및 아이슬란드 국가 생명윤리위원회(the National Bioethics Committee of Iceland)로부터 허가되었다.
아이슬란드 AF 코호트. 환자들은 모두 1987년부터 2003년까지 아이슬란드의 레이캬비크에 있는 랜드스피탈리 대학교 병원(Landspitali University Hospital)에서 AF로 진단되었다. 진단은 P 파를 보이지 않고 불규칙적으로 불균칙적인 R-R 구간을 보여주는 12-유도 심전도(12 leading electocardiogram)에 의해 확인되었다. 모든 ECG는 심장전문의에 의해 수동으로 판독되었다.
아이슬란드 뇌졸중 코호트. 뇌졸중 코호트는 아이슬란드의 두개의 주요 종합병원 및 아이슬란드 심장협회(the Icelandic Heart Association)로부터 유래되었다. 출혈성 뇌졸중을 갖는 환자들이 모든 환자들의 6%를 차지했다(아이슬란드 타입의 아밀로이드증성 유전성 뇌출혈을 갖는 환자와 지주막하 출혈(subarachnoid hemorrhage)을 갖는 환자들은 배제시켰다). 허혈성 뇌졸중이 전체 환자의 67%를 차지했고, TIA는 27%를 차지했다. 본 연구에서 뇌졸중 서브타입의 분포는 다른 코카서스계 집단에서 보고된 분포와 유사했다(Mohr, J.P., et al., Neurology, 28:754-762 (1978); L. R. Caplan, In Stroke, A Clinical Approach (Butterworth-Heinemann, Stoneham, MA, ed 3, (1993)).
유전형 분석(Genotyping). 단일 칩((Illumina, San Diego, CA, USA)) 상에서 약 317,000개의 단일 염기 다형성(SNP)를 분석하기 위해 Illumina사의 Infinium HumanHap300 SNP 칩을 이용하여 심방세동(AF)으로 진단받은 아이슬란드인 437명과 7406명의 집단 대조군(population control)의 전체-게놈 스캔(genome-wide scan)을 수행하였다. 다른 케이스-대조군(case-control) 코호트에서의 재현(replication)을 위한 SNP 유전형 분석은 Centaurus 플랫폼(Nanogen)을 이용하여 수행하였다. 뇌졸중으로 진단된 총 347명의 개인과 7497명의 대조군에 대해서도 심방세동과 연관된 것으로 확인된 LD 블럭 내의 SNP의 유전형 분석을 수행하였다.
연관 분석을 위한 통계적 방법. 심방세동 또는 뇌졸중에 대한 단일 마커 연관에 대해, 본 발명자들은 각 대립형질의 양측 p-값을 계산하기 위해 가능성 비 검 정(likelihood ratio test)을 이용하였다. 본 발명자들은 승법 모델(multiplicative model)을 가정하여, 상대적 위험도(RR) 및 집단 귀속 위험도(PAR)을 계산하였다(C. T. Falk, P. Rubinstein, Ann Hum Genet 51 (Pt 3), 227 (1987); J. D. Terwilliger, J. Ott, Hum Hered 42, 337 (1992)). CEPH Caucasian HapMap 데이터에 대해, 본 발명자들은 D'(R. C. Lewontin, Genetics 50, 757 (1964)) 및 R2(W. G. Hill, A. Robertson, Genetics 60, 615 (Nov, 1968))의 표준 정의를 이용하여 SNP 쌍들 간의 LD를 계산하였다. 특정한 영역에서 LD 구조를 규명하기 위해 모든 SNP 조합을 도식화하는 경우, 본 발명자들은 좌측 상단 코너에 D'을 기재하고, 우측 하단 코너에 p-값을 기재하였다. 본 발명자들이 제공한 LD 플롯에서, 본 발명자들은 마커들을 그들의 물리적 위치에 따라서가 아니라, 등거리로 도시하였다.
결과
전체-게놈 연관 연구
본 발명자들은 Illumina 330K 칩을 이용하여, 437명의 아이슬란드 심방세동 환자 및 7406명의 집단 대조군 개인을 대상으로 성공적으로 유전형을 분석하였다. 연관 분석은 단일 SNP에 대해 수행하였다. 가장 유의성 있는 연관은 마커 rs2220427 및 rs2220733에 대해 확인되었고, 상기 두 마커는 모두 10-9에 근접한 p-값을 가져왔다. 수행된 테스트 횟수에 대해 보정한 후, rs2220427에 대한 값은 유 의성이 있었고, 즉, 상기 연관은 게놈-전제 수준에서 유의성이 있었다.
영향받은 개체들에서 동형접합형의 명백한 초과가 있었다. 본 발명자들은 승법 모델(P=.002)과 열성 모델(recessive model)(P=.001)을 모두 수용하지 않았다. 최상의 맞춤 모델(best fitting model)은 이형접합체 보인자에 대해 1.46의 위험도를 주고, 동형접합체 보인자에 대해 5.17의 위험도를 주었다. 이 완전한 모델(full model)을 무연관(no association)의 귀무 모델(null model)에 비교한 (보정되지 않은) P-값은 5.43e-11이다. 이 데이터는 2 카피의 상기 위험 대립형질을 갖는 개인들이 단순한 승법 모델에 근거하여 예상되는 것보다 더 높은 위험도에 있다는 것을 보여준다.
모든 유전형에 대해 발병 연령 모델(age at onset model)을 맞추는 것은 4.84e-5의 P-값을 준다. 이형접합체는 비-보인자보다 1.4090년 더 빠른 발병을 가지며, 동형접합체는 비-보인자보다 9.6126년 더 빠른 발병을 갖는 것으로 추정된다. 이는 발병 연령의 유의성 있는 효과를 보여준다- 위험 변이를 갖는 개인들은 상기 위험 대립형질의 비-보인자인 개인들보다 더 어린 연령에 AF를 발병할 유의성 있는 위험을 갖는다.
rs2220427 주위의 마커를 조사하여, 본 발명자들은 마이크로새틀라이트 마커 D4S406가 rs2220427에 대한 대리 마커(surrogate marker)로 이용될 수 있다는 것을 확인하였다. 특히, (CEPH 기준 대비) 대립형질 -2, -4 및 -8은 일배체형 빈도에 근 거하여 SNP를 태깅하기에 충분한 것으로 확인되었다:
표 1.
rs2220427과 D4S406 간의 관계
따라서, D4S406 마커에 대해 분석되었으나, rs222047에 대해서는 분석되지 않은 개인의 경우, -2, -4 및 -8 대립형질을 합치는 것은 상기 SNP의 4 대립형질의 빈도의 매우 우수한 추정치를 가져온다. 본 발명자들은 이 방식으로 1268명의 케이스 및 69,070명의 대조군으로 구성된, AF에 대한 아이슬란드 재현 코호트를 분석하였다. 결과는 상기 연관이 2.94e-14의 p-값 및 1.53의 상대적 위험도(승법 모델)을 수반했다는 점에서 상당히 극적이었다. 따라서, 본 발명자들의 최초 발견이 독립적인 아이슬란드 코호트에서 재현되었다.
실시예 2. AF 위험 변이의 특성규명
하기는 염색체 4q25 상의 심방세동에 대한 위험도를 부여하는 변이의 확인에 대한 추가적인 설명을 포함한다.
심방세동(AF)은 사람에서 가장 흔한 지속성 심장성 부정맥이고 심방의 혼돈된 전기적 활성을 특징으로 한다1. 심방세동은 80세 이상의 개인 10명 중 1명에게 영향을 미치고, 유의성 있는 이환율을 유발하며, 사망률의 독립적인 예측자이다2. 최근의 연구는 AF에 대한 유전적 기여의 증거를 제공했다3-5. 칼륨 채녈 유전자의 돌연변이가 가족성(familiar) AF와 연관되었으나6-10 모든 AF 케이스의 작은 비율만을 차지한다11, 12. 본 발명자들은 게놈-전체 연관 스캔을 수행하고, 뒤이어 유럽 가계의 3개의 집단 및 홍콩의 중국인 집단(Chinese population from Hong Kong)에서 재현(replication) 연구를 수행하고 염색체 4q25 상의 두개의 서열 변이의 AF에 대한 강한 연관을 발견하였다. 유럽 가계의 개인의 약 35%가 하나 이상의 상기 변이를 가졌고 AF의 위험도는 카피당 1.72 및 1.39씩 증가되었다. 보다 강한 연관이 상기 중국인 집단에서 재현되었고, 상기 집단에서 75%의 개인이 상기 변이를 가졌고 AF의 위험도는 카피당 1.42씩 증가하였다. 통상적인 심방조동(AFl)을 갖는 개인에서 보다 강한 연관이 관찰되었다. 두 변이는 모두 심장의 좌-우 비대칭에서 중요한 역할을 수행하는 것으로 알려진 PITX2에 인접하여 위치했다13-15. 본 발명자들은 AF 및/또는 AFl을 갖는 아이슬란드 집단에 대해 Illumina Hap300 BeadChip을 이용하여 전체-게놈 연관 연구를 수행하였다. 본 발명자들의 적격 기준(quality criteria)을 만족시키는 316,515개의 SNP를 아이슬란드의 550명의 환자 및 4,476명의 대조군 시 료에서 AF/AFl에 대한 연관에 대해 개별적으로 테스트하였다. 염색체 4q25 상에 있는 단일 연관 불균형(LD) 블럭 내에 위치한, 3개의 강한 상관관계를 갖는 SNP가 테스트된 316,515 개의 SNP에 대해 고려한 후 게놈-전체적으로 유의성 있는 것으로 확인된 SNP들이었다(P < 0.05/316,515 = 1.58 x 10-7): rs2200733 (OR = 1.75; P = 1.6 x 10-10), rs2220427 (OR = 1.75; P = 1.9 x 10-10) 및 rs2634073 (OR = 1.60; P = 2.1 x 10-9). 아이슬란드 집단에 근거한 이 결과 및 모든 다른 결과들은 개인의 관련성(relatedness)에 대해 조정되었다. 두개의 가장 유의성 있는 SNP, rs2200733과 rs2220427이 CEPH CEU HapMap16 데이터세트에서 상호간에 완벽한 대리물(perfect proxy)이고 아이슬란드 데이터 세트(D' = 1, r 2 = .999)에서 상호 간에 완벽한 대리물인 것에 근접하며, 따라서, rs2200733만이 하기의 검토에서 언급될 것이다. 아이슬란드 데이터세트에서 rs2634073의 rs2200733에 대한 상관관계는 보다 약했다(D' = .95, r 2 = .605). 상기 최초의 3개의 SNP의 주변에서 Illumina Hap300 SNP의 추가적인 연구 및 rs2200733에 대한 연관의 조건화(conditioning) 후에, 새로운 SNP, rs10033464에 대한 연관이 확인되었다(OR = 1.42; P = .0024). rs2200733 및 rs10033464에 대한 연관을 고려한 후, rs2634073에 대한 연관은 더 이상 유의성이 없었다(P = 0.30). 이후로, 따라서, 표 7에 제시된 것들을 포함한, rs2200733 T 및 rs10033464 T에 대한 모든 연관분석 결과는 개별적으로 각 SNP의 주요 대립형질에 대한 비교가 아닌, 상기 두개의 위험 대립형질 중 어느 것도 갖지 않는 야생형 일배체형에 대한 비교에 근거하여 수득되었다. 구체적으로, rs2200733 T 및 rs10033464 T에 대한 오즈비는 각각 조건적으로 계산되고 야생형 대비 각 변이의 추정된 상대적 위험도로 해석될 수 있었다. 위험 대립형질, rs2200733의 T 및 rs10033464의 T는 아이슬란드에서 각각 12.05% 및 8.53%의 추정된 집단 대립형질 빈도를 갖고, 아이슬란드 데이터세트 또는 CEU HapMap 데이터세트에서, 동일한 염색체 상에서 함께 관찰되지 않는다. rs2200733의 T 대립형질 또는 rs10033464의 T 대립형질을 갖는 염색체에 완전히 일치되는 소수 대립형질(minor allele)을 갖는, 제3 SNP, rs13143308이 CEU HapMap 데이터세트를 통해 확인되었다. 도 2는 연관된 영역의 주요한 SNP에 대한 일배체형 구조를 보여준다. CEU HapMap 표본(시료)에서 이 3개의 주요한 SNP 각각의 완벽한 대용물(즉, 완벽한 대리물, 태깅 SNP에 대해 r2 = 1.0)인 일련의 SNP가 표 9에 제공되고 상대적 위치들이 도 3에 표시된다. 본 발명자들은 열거된 SNP들이 그들의 동등하고, 편리성을 위해 주로 선택되는 SNP에 의해 정의된 일배체형의 대표로 간주되어야 한다는 것을 강조한다.
상기 두개의 SNP와 동일한 LD 블럭에 위치한, 마이크로새틀라이트 마커, D4S406이 확인되었다. 아이슬란드에서, D4S406의 4개의 최단 대립형질 중 3개(-8, -4, 및 -2)를 통합하여 rs2200733의 T 대립형질에 대한 완벽에 가까운 대리물(D' = .995, r 2 = .98)을 형성하고, 상기 나머지 두개의 최단 대립형질(-6 및 0)은 rs10033464의 T 대립형질의 우수한 대리물(D' = .98, r 2 = .75)을 형성한다(표 10). D4S406의 나머지(보다 긴) 대립형질 중 어느 것도 짧은 대립형질의 효과를 고려한 후 AF/AFl과 연관되지 않았다. 아이슬란드에서의 최초의 발견의 재현을 위해, SNP가 이용가능하지 않은 경우, 정보를 제공하기 위해, D4S406 유전형을 이용하였다.
최초의 발견을 재현하기 위한 시도로, 본 발명자들은 2,251명의 AF/AFl 환자 및 13,238명의 대조군으로 구성된 추가적인 아이슬란드 시료를 분석하였다(표 7). 두 SNP의 AF/AFl에 대한 연관이 이 시료들에서 재현되었고(rs2200733에 대해, OR = 1.64, P = 2.7x10-23, rs10033464에 대해, OR = 1.40, P = 8.2x10-8) 두 SNP 모두 통합된 아이슬란드 표본에서 전체-게놈 유의성을 달성하였다(rs2200733에 대해, OR=1.68, P = 1.9x10-30, rs10033464에 대해, OR = 1.38, P = 9.4x10-9). 본 발명자들은 또한 404명의 추가적인 AF 케이스 및 2,036명의 추가적인 대조군에서 본 발명자들의 신호 주변의 영역에서 모든 18개의 Hap300 Illumina SNP를 분석하였다. 이 SNP들 중 어느 것도 rs2200733 및 rs10033464에 대한 연관을 고려한 후에는 유의성이 유지되지 않았다(표 11).
본 발명자들의 결과를 재현하기 위한 추가적인 시도에서, 본 발명자들은 두 개의 유럽 선조의 집단, 즉 143명의 케이스 및 738명의 대조군으로 구성된 스웨덴 유래의 집단과 636명의 케이스 및 804명의 대조군으로 구성된 미국 유래의 집단에서 이 변이들의 AF에 대한 연관에 대해 테스트하였다(표 7). rs2200733에 대한 연관은 두 집단에서 강하게 재현되었다(스웨덴의 경우, OR = 2.01, P = 0.00027, 미국의 경우, OR = 1.84, P = 9.8x10-10). rs10033464에 대한 연관은 더 약하나, 그럼 에도 불구하고 스웨덴 집단에서 재현되었고(OR = 1.65, P = 0.0087) 미국 집단에서도 거의 유의성이 있었다(OR = 1.30, P = 0.052). 아이슬란드 표본들과 통합된 경우, rs2200733에 대한 연관은 명확했고(OR = 1.72, P = 3.3x10-41), rs10033464의 유의성은 게놈-전체 유의성의 역치(threshold)를 크게 초과했다(OR = 1.39, P = 6.9x10-11). 승법 모델을 가정하면, 통합된 상기 두 변이의 집단 귀속 위험도(PAR)는 유럽 선조의 집단들에서 약 20%이다.
마지막으로, 본 발명자들은 333명의 케이스 및 2,836명의 대조군으로 구성된 홍콩계 한족 집단(Han Chinese population from Hong Kong)에서 이 신호들을 재현하고자 시도하였다. rs2200733 T에 대한 연관은 유의성 있게 재현되었으나(OR = 1.42, P = 0.00064), rs10033464 T에 대한 연관은 비록 올바른 방향이었으나, 유의성이 없었다(OR = 1.08, P = 0.55)(표 7). 흥미롭게도, rs2200733의 T 대립형질은 유럽 가계의 집단(대조군의 대립형질 빈도: 0.098-0.139)에서보다 중국 집단에서 훨씬 더 빈번했고(대조군의 대립형질 빈도: 0.528)(도 2), 이는 추정된 위험도는 더 낮았으나, 약 35%의 훨씬 더 높은 결합 PAR(joint PAR)에 반영되었다. 상기 두개의 변이를 포함하는 LD 블럭은 CEU HapMap 표본에서보다 중국 CHB 및 일본 JPT HapMap 표본에서 더 단편화되었다(도 3). 따라서, 본 발명자들은 상기 홍콩 집단에서 CEU 표본에서 rs2200733과 완전한 LD이나, CHB 및 JPT 표본에서는 불완전한 LD인 여러 마커들을 분석하였다(표 12). 이 마커들은 AF에 대해 s2200733보다 더 약한 겉보기 연관(apparant association)을 가져서, 상기 연관을 주도하는 기능성 변 이가 최초의 rs2200733 변이 주변의 약 20 kb 영역에 위치하고, CHB 및 JPT 표본에서는 rs2200733과 동등한 SNP(도 3에서 적색으로 표시됨)에 의해 정의된다는 것을 시사했다.
최초의 아이슬란드 발견 표본의 경우, rs2200733은 rs10033464보다 더 높은 OR을 가졌다 (P = 0.041). 이는 재현 표본에서도 유효했고, 전반적으로, 상기 두 변이와 연관된 위험도에서 유의성 있는 차이가 있었다(통합된 유럽 표본의 경우, P = 0.00019이고, 홍콩 표몬의 경우 P = 0.0099임). 유전형-특이적 오즈비가 연구된 경우, 통합된 데이터세트에서 승법 모델로부터의 일부 편차를 검출할 수 있었다(유럽 표본에 대해, P = 0.018, 표 13 참조). 비-보인자 대비 이형접합형 보인자의 추정된 위험도는 유사했으나, rs2200733 T와 rs10033464 T의 동형접합형 보인자는 각각 승법 모델에 의해 예측된 것보다 더 높은 추정 위험도 및 더 낮은 추정 위험도를 가졌다. 홍콩 표본에서 유사한 경향이 관찰되었다; 그러나, 상기 표본 크기는 너무 작아서 그와 같은 편차를 유의성 있게 검출할 수 있는 검정력(power)을 갖지 않았다. 유럽 가계의 통합된 집단에서, rs2200733 T에 대해 동형접합인 개인들에 대한 관찰된 OR은 야생형 일배체형에 대해 동형접합인 개인 대비 3.64였고, 중국 집단 의 경우, 1.77이어서, 이 변이들이 AF의 예측 모델링에서 중요한 성분이라는 것을 보여주었다.
아이슬란드 표본에 대한 AF/AFl의 진단 연령은 상기 두개의 SNP와 상관관계를 가졌다(진단은 rs2200733의 T 대립형질의 경우, 2.28년 더 빨리 일어나고, rs10033464 T 대립형질의 경우, 1.10년 더 빨리 일어남, 결합(joint) P = 1.29x10-6). 진단 연령의 효과는 또한 연관의 강도를 측정하고, 진단 연령에 의해 계층화시키는 것에 의해 평가되었다. 상기 두 변이의 연관은 80세의 연령에 도달한 후에 진단된 사람들에서도 위험도가 유의성이 있었으나, 더 젊은 연령에서 진단된 사람들에서 가장 강력했다(표 8). AF의 진단 연령에 대한 정보는 스웨덴 표본에 대해서는 입수가능하지 않았다. 미국 표본은 두개의 주요한 그룹, 즉, 특발성 AF(lone AF), 또는 AF 및 고혈압(HTN)을 갖는 청년층(younger) 환자들, 및 주로 출혈성 뇌졸중 및 허혈성 뇌졸중 환자들인 장년층(older) AF 케이스들로 구성되었다. 양 집단에서, 장년층 케이스에서보다 청년층 AF 케이스에서 보다 강한 연관관계를 향하는 명확한 경향이 있었다. 본 발명자들의 데이터 분석은 성별에 따른 차등적 연관을 시사하지 않았다(표 8).
AFl은 종종 AF를 수반하나, 단독으로 일어날 수 있다17. 흥미롭게도, 본 발명자들은 상기 변이와 AFl 아이슬란드 환자의 작은 서브세트(N=116) 간의 강한 연관을 관찰했다(rs2200733에 대해, OR = 2.60, 95% 신뢰구간(CI) = 1.83-3.68, P = 7.5x10-8, rs10033464에 대해 OR = 1.94, 95% CI = 1.26-3.00, P = .0028). 실제로, rs2200733의 경우, 이 명확한 AFl 케이스에 대한 OR은 AF 표현형을 갖는 케이스에 대한 OR보다 유의성 있게 높았고(P = 0.0026), rs10033464의 경우, 거의 유의성있게 더 높았다(P = .084). 본 발명자들의 결과는 이 성향들이 유전적 위험 인자들을 공유하나, AFl이 AF보다 표현형에 의해 덜 영향받는다는 것을 시사했다.
아이슬란드 표본에서, AF에 대한 위험 인자로 알려진, 비만, 고혈압 또는 심근경색증에 대한 연관을 보이는 변이는 없었다(모든 경우에서, 관찰된 OR < 1.1, 표 14). 이 음성 결과들은 새로운 변이가 이 표현형들과 연관될 가능성을 배제하지는 않으나, 보인자의 미국 특발성 AF의 더 높은 위험도 및 보다 젊은 발병 연령과 함께, 이 결과들은 상기 새로운 변이가 이 공지된 위험 인자들을 통해 AF의 위험도에 영향을 미치지 않는다는 것을 시사한다.
rs2200733 및 rs10033464를 포함하는 LD 블럭에 존재하는 공지된 유전자는 없다(도 3). 상기 LD 블럭은 하나의 스플라이싱된 EST (DA725631)와 두 개의 단일-엑손(single-exon) EST(DB324364 및 AF017091)를 포함했다. 다양한 조직으로부터의 cDNA 라이브러리의 RT-PCR은 이 EST의 발현을 검출하지 않았다(표 16). 인접한 상류 LD 블럭에 위치한 PITX2 유전자는 상기 위험 변이에 가장 근접한 유전자이다. PITX2 유전자를 포함하는 LD 블럭 내의 여러 마커들은 표 18에 표시된 바와 같이, AF 및 AFl에 대한 연관을 보이는 마커들과 상관관계를 갖는다. 이 유전자에 의해 코딩된 단백질, PITX2(paired-like homeodomain transcription factor 2)는 심장의 비대칭적 형태형성을 주도하는 것에 의해 심장 발달에서 중요한 역할을 수행하는 것으로 알려졌기 때문에, AF/AFl에 대한 흥미로운 후보이다13. 마우스 넉아웃 모델에서, Pitx2는 좌심방에서 동방결절 형성을 위한 디폴트 경로를 억제하는 것으로 확인되었다14, 15. 혈액 및 지방 조직과 같은 모든 용이하게 접근가능한 조직에서 PITX2의 mRNA 발현은 매우 적어서, 유전형과 발현 수준 간의 상관관계의 연구를 제한한다. PITX2의 상류의 다음 유전자는 혈관 내피(vascular endothelium)에서 안지오텐신 II의 분해를 담당하는 아미노펩티다아제인 ENPEP이다8. 이 유전자는 보다 광범위하게 발현되나, AF와 연관된 변이는 혈액 또는 지방 조직에서 그의 발현에 대해 상관관계를 보이지 않았다. 상기 연관된 변이들의 상류 400 kb 영역 및 하류 1.5 Mb 영역 내에 위치한 다른 설명된 유전자(annotated gene)는 없다.
요약하면, 본 발명자들은 염색체 4q25 상에서 유럽 가계의 3개의 별개의 집단에서 AF와 강하게 연관된 두 개의 변이를 확인하였다. 보다 강한 변이는 또한 중국인 집단에서 잘 재현되었고, 상기 집단에서 유럽 가계의 집단에서보다 훨씬 더 일반적이고, 더 높은 PAR을 갖는다. 이 연관은 청년층 환자 및 특발성 AF를 갖는 환자에서 특히 주목되나, AF의 보다 일반적으로 접하는 형태를 갖는 장년층 환자에도 존재한다. 이 연관의 메카니즘은 알려져 있지 않으나, 본 발명자들의 결과는 AF의 분자적 기초(molecular underpinnings)에 대한 추가적인 연구를 위한 기반을 제공한다.
방법
대상자
아이슬란드 케이스는 1987년부터 2005년까지 아이슬란드의 2개의 최대 종합병원에서 AF 및/또는 AFl로 진단된 모든 환자들로 구성되었다. 스웨덴 케이스는 1996년부터 2002년까지 진행중인 유전적 역학 연구, 남부 스톡홀름 허혈성 뇌졸중 연구(South Stockholm Ischemic Stroke Study)의 일부로 모집되었다. 미국 케이스는 AF 진단을 받은 뇌졸중 환자들과 고혈압의 공존 진단(coexisting diagnosis)을 갖는 특발성 AF 또는 AF를 갖는 청년층의 연속(consecutive) 환자들의 혼합이었다. 홍콩 케이스는 AF 진단을 갖는 뇌졸중과 당뇨병 환자의 모임이었다. AF 진단은 모든 연구 집단에서 12-유도 심전도(twelve lead electrocardiogram)에 의해 확인되었다.
아이슬란드 대조군은 deCODE에서 다른 유전적 연구에 참가했던 개인들로부터환자 및 대조군의 1촌 친척(first-degree relative)을 제외하고, 무작위로 선택하였다(표 15). 스웨덴 대조군은 환자들과 동일한 지역에서 헌혈자들(2001년) 및 건강한 지원자들(1990-1994년)로부터 모집되었다. U.S. 대조군은 대규모 1차 진료 기관 및 출혈성 뇌졸중 연구에 참가한 환자들로부터 모집되었다. 홍콩 대조군은 AF 진단을 받지 않은 개인들이었다.
아이슬란드 연구 집단
본 연구는 초기에 참여에 동의한 모든 환자들을 포함했고, 이들은 아이슬란드의 유일한 3차 진료 기관인, 레이캬비크의 랜드스피탈리 대학교 병원, 및 아이슬란드의 2번째로 큰 병원인 아쿠레이리(Akureyri) 지역 병원에서 1987년부터 2005년까지 AF 및/또는 AFl(ICD 10 진단 I48 및 ICD 9 진단 427.3)로 진단받았다. 모든 진단은 심장전문의에 의해 수동으로 판독된 12-유도 심전도(EKG)에 의해 확인되었 다. 환자가 임상적 증상을 갖는지 여부에 관계 없이, 개심술(open cardiac surgery) 직후에 진단받은 환자들을 제외한 모든 케이스들이 포함되었다.
Infinium II 분석 방법 및 Sentrix HumanHap300 BeadChip (Illumina, San Diego, CA, USA)을 이용하여, 게놈-전체 SNP 유전형 분석에서 본 발명자들의 QC(quality control) 기준에 따라 550명의 케이스의 세트를 성공적으로 유전형 분석하였다. 550명 환자(370명의 남성 및 180명의 여성)의 이 최초 그룹에 대한 평균 진단 연령은 72.5세(SD = 11.0)였고, 범위는 34.7세 내지 96.2세였다. 2,273명의 환자(1,359명의 남성 및 913명의 여성)의 검증 그룹(valdation group)은 70.5세 (SD = 13.0)의 평균 진단 연령을 가졌고 범위는 16.8세 내지 100.6세였다. 본 연구에서 이용된 AF/AFl 불포함 대조군(평균 연령 61.5세(SD = 15.8)인 최초의 게놈-전체 스크리닝에서의 2,201명의 남성 및 2,275명의 여성과, 평균 연령 61.9세(SD = 18.4)의 검증 단계에서의 5,654명의 남성 및 7,597명의 여성)은 아이슬란드 계통 데이터베이스(genealogical database)로부터 무작위로 선택된 대조군 및 deCODE의 다른 진행중인 관련된 유전적 연구로부터의 개인들로 구성되었다. AF/AFl을 갖는 1촌 친척(동기, 부모, 또는 자손)을 갖는 대조군 또는 1촌 대조군 친척은 분석에서 배제시켰다.
아이슬란드 MI, 비만 및 고혈압 집단
MI를 앓은 개인들이 a) 아이슬란드에서 1981년에서 2002년에 75세 전에 MI를 가졌고, MONICA 기준 9 (REF II)를 충족시키거나, 또는 2003년부터 2005년에 레이 캬비크의 주요 병원에서 MI 퇴원 진단(discharge diagnosis)을 받은 10,000명 이상의 개인의 등록부로부터 확인되었다. 상기 등록부의 모든 개인들의 MI 진단은 신호, 증상, 심전도, 심장 효소 및 부검 소견에 근거한 엄격한 기준을 따랐다. 유전형 정보는 평균 연령 72.6세(SD = 11.7)의 2,462명의 남성 및 1,114명의 여성에 대해 입수가능했다. deCODE에서 심혈관 심방세동 및/또는 뇌졸중(CVD) 유전 프로그램에 참가한 개인들(CVD를 갖는 환자, 그들의 1촌 친척 또는 배우자)을 대상으로 체질량 지수(Body mass index, BMI)를 측정하였다. 본 연구의 목적으로, BMI > 35인 대상자를 비만으로 정의하였다. 평균 연령 53.2세(SD = 16.1)인 555명의 남성 및 1,046명의 여성에 대해 유전형 정보가 입수가능했다. 고혈압 환자들은 아이슬란드의 랜드스피탈리(Landspitali) 대학교 병원에서 통원 고혈압 클리닉(ambulatory hypertension clinic)에 참가한 환자들을 포함하고, 및/또는 상기 병원으로부터 퇴원에 대한 진단을 받은 환자들을 포함했다. 그들이 고혈압의 치료로 항고혈압 약물을 복용하고 있다는 것을 확인하는 것에 의해 진단을 검증하였다. 평균 연령 71.5세(SD = 12.5)인, 1,293명의 남성 및 1,327명의 여성에 대해 유전형 정보가 입수가능했다. 본 연구는 아이슬란드 데이터 보호청(the Data Protection Commission of Iceland) 및 아이슬란드의 국가 생명윤리 위원회(the National Bioethics Committee of Iceland)에 의해 허가되었다. 모든 환자, 친척 및 대조군으로부터 고 지된 동의서(written informed consent)를 받았다.
스웨덴 연구 집단
스웨덴 스톡홀름의 카롤린스카(Karolinska) 대학 병원, 후딩게(Huddinge) 유닛의 뇌졸중 유닛 또는 뇌졸중 통원환자 클리닉에 다니는 허혈성 뇌졸중 또는 TIA를 갖는 환자들이 지속적인 유전적 역학 연구인 SSISS(the South Stockholm Ischemic Stroke Study)의 일부로 1996년부터 2002년까지 모집되었다. 본 연구는 카롤린스카 생명윤리 위원회(the Bioethics Committee of Karolinska Institutet)(Dnr 286/96 and 08/02)에 의해 허가되었다. 스웨덴 표본에서 AF 진단은 12-유도 EKG에 근거하였다. 스웨덴 AF 케이스에서 남성의 비율은 46.2%였고, 스웨덴 AF 케이스의 평균 뇌졸중 진단 연령은 74.4세(SD=8.7)였다.
본 연구에서 이용된 스웨덴 대조군은 이 지역의 일반 집단을 대표하는 환자와 동일한 스웨덴 중부의 지역으로부터 모집된 집단-기반 대조군이었다. 개인들은 정상 기준 집단을 대표하기 위해 카롤린스카 대학 병원의 임상화학과에 의해 모집된 건강한 지원자(1990년-1994년에 모집됨) 또는 헌혈자(2001년에 모집됨)였다. 스웨덴 대조군에서 남성의 비율은 59.7%였고, 스웨덴 대조군의 모집시 평균 연령은 43.1세(SD=12.3)였다.
U.S. 연구 집단
U.S. 대상자들은 1998년 1월부터 2006년 7월까지 메사츄세추 종합병원(MGH) 에서 진행중인 케이스-대조군 및 코호트 연구에 등록되었다. 이 연구들의 모든 측면은 지역 기관 검토 위원회(Institutional Review Board)에 의해 허가되었다. 상기 케이스-대조군 연구에 등록된 대상자들은 CT 또는 MRI에 의해 확인된 급성 허혈성 뇌졸중 또는 출혈성 뇌졸중으로 하나의 급성 전문 병원(acute control care hospital)에 입원한 환자들로 구성되었다. 모집된 328명의 출혈성 뇌졸중 환자 중에서, 78명은 AF로 진단되어 현재의 연구를 위한 케이스로 이용되었고 나머지 250명은 대조군으로 이용되었다. 170명의 허혈성 뇌졸중 환자들은 AF 진단을 받았고 케이스로 처리되었으나, 허혈성 뇌졸중 환자 중 아무도 대조군으로 처리되지 않았다. 원발성 지주막하 출혈(primary subarachnoid hemorrhage) 및 두부 외상에 따른 뇌내출혈, 종양, 혈관기형, 또는 혈관염을 가진 환자들은 배제시켰다. 624명의 뇌졸중-불포함 대조군을 병원 관할 구역에 속하는 대형, 일차 진료 기관(>18,000명의 환자) 및 병원의 항응고 관리부(Anticoagulation Management Service)로부터 모집하였다. 대조군으로 모집된 624명의 개인들 중 70명은 AF로 진단되고 본 연구의 목적을 위해 케이스로 처리되었다. 대조군으로 이용된 모든 개인들 중 50.9%가 남성있었고, 그들의 평균 연령은 67.4세(SD=12.3)였다. 모든 대상자 또는 동반한 정보제공자가 유전적 연구의 참여에 대해 고지된 동의를 제공하고 병력, 투약, 사회 및 가족력에 대해 전향적으로 인터뷰되었다. 심방세동의 존재 또는 부제는 인터뷰 및 의료 기록의 검토를 통해 전향적으로 문서화되었다.
미국 대상자들의 제2 부분은 유전 연구의 참여에 대해 고지된 동의서를 제공했던 부정맥 진료부로 위탁된 고혈압의 공존 진단을 받은 특발성 AF 또는 AF의 연 속적 환자들로 구성되었다. 선발(inclusion) 기준은 EKG에 의해 증명된 AF, 및 65세 이하의 연령이었다. 배제(exclusion) 기준은 심장초음파 검사에 의해 확인된 구조성 심장 심방세동 및/또는 뇌졸중, 류마티스 심장 심방세동 및/또는 뇌졸중, 갑상선 기능항진증, 심근경색증, 또는 울혈성 심장부전(congestive heart failure)이었다. 과거의 건강 상태, 투약, 증상 및 AF의 개시를 위한 가능한 유발자(trigger)를 확인하기 위해 각 환자를 대상으로 신체 검사 및 표준화된 인터뷰를 실시하였다. 모든 환자들은 12-유도 EKG, 심장초음파, 및 실험실 연구에 의해 평가되었다. EKG 및 심장초음파는 표준 기준을 이용하여 해석되었다.
홍콩 연구 집단
홍콩 연구 집단의 모든 대상자들은 홍콩에 거주하는 남부 한족계(southern Han Chinese ancestry)였다. 케이스는 Prince of Wales Hospital Diabetes Registry23로부터 선택된 217명(49.1% 남성, 평균 연령 68.1세(SD=9.6)) 및 Stroke Registry24로부터의 116명의 대상자(30.2% 남성, 평균 연령 76.1세 (SD=10.9))였다. 모든 대상자들은 EKG에 의해 심방세동을 갖는 것으로 진단되었다. 대조군은 AF의 증거를 갖지 않는 2,836명의 대상자로 구성되었다. 각 참가 대상자로부터 고지된 동의서를 받았다. 본 연구는 홍콩 중문대학교 임상연구 윤리 위원회(the Clinical Research Ethics Committee of the Chinese University of Hong Kong)에 의해 허가 되었다.
Illumina 게놈 전체 유전형 분석
모든 아이슬란드 케이스-시료 및 대조군 시료를 국제 HapMap 프로젝트의 I 상(phase I)으로부터 유래된 317,503개의 일배체형 태깅 SNP를 포함하는, Infinium HumanHap300 SNP 칩(Illumina, SanDiego, CA, USA)에 의해 분석하였다. 상기 칩 상에서 분석된 SNP 중에서, 162개의 SNP는 유전형을 생성하지 않았고, 추가적으로 178개의 SNP는 90% 미만의 수율을 가졌다. 48개의 SNP는 단형성(monomorphic)이었고, 107개의 다른 SNP들은 거의 단형성이었다(즉, 환자와 대조군의 통합된 코호트에서 소수 대립형질 빈도가 0.001 미만이었음). 추가적인 475개의 SNP는 대조군에서 하디-와인버그 평형(Hardy-Weinberg equilibrium)으로부터 매우 유의성 있는 왜곡을 보였다(p < 1x10-10). 마지막으로, 일부 마커들(n=18)은 내부적으로 수행된 상이한 지속적인 게놈-전체 연관 연구에서 특정한 영역 및 가능한 신호의 조사 후에 유전형분석 문제를 갖는 것으로 결정되었다. 따라서, 본문에서 제시된 최종 분석은 316,515개의 SNP를 이용하였다. 98% 미만의 콜 레이트(call rate)를 갖는 모든 시료를 분석에서 배제시켰다.
단일 SNP- 및 마이크로새틀라이트 유전형분석.
Centaurus (Nanogen) 플랫폼에 의해, SNP 유전형 분석을 수행하였다25. 각 Centaurus SNP 분석법의 질은 CEU 및/또는 YRI HapMap 시료에서 각 분석물의 유전형 분석을 수행하고 그 결과를 HapMap 데이터와 비교하는 것에 의해 평가하였다. 1.5%를 초과하는 불일치율(mismatch rate)을 갖는 분석물은 사용하지 않았고 LD인 것으로 알려진 마커에 대해 연관 불균형(LD) 테스트를 이용하였다.
연관 분석
rs2200733, rs4611994 (rs2200733에 대한 완벽한 대용물), rs13143308, 및 rs6843082 (rs13143308에 대한 완벽한 대용물)에 대해, 모든 참가 개인들의 유전형분석을 수행하고자 하였다. 각 SNP에 대해, 수율은 각 그룹에서 90%보다 높았다. 또한, 모든 아이슬란드 및 스웨덴 대상자들에 대해, D4S406 마이크로새틀라이트에 대한 유전형이 입수가능했다. 유전형분석의 중복 때문에, 관찰된 유전형이 본 발명자들이 이전에 사용했던 가능성 방식(likelihood approach)을 통해 결실된 유전형에 의해 소실된 정보의 양을 감소시켰다26. 이는 표에 제시된 결과들이 항상 동일한 수의 개인에 기반하여, 결과의 의미있는 비교를 가능하게 하였다. rs10033464에 대한 데이터는 최초 아이슬란드 발견 표본 및 HapMap 프로젝트에서 직접적으로만 입수가능했기 때문에, rs2200733 C rs13143308 T 일배체형이 이 SNP를 태깅하기 위해 이용되었다. 이 태깅은 최초 발견 표본 및 CEPH CEU HapMap 표본(시료)에서 모두 완전했다.
연관 분석을 위해 이전에 개시되고 NEMO 소프트웨어에서 구현된 가능성 절차 를 이용하였다. 본 발명자들은 표준 가능성 비 통계값을 이용하여, 각 표현형에 대한 대립형질의 연관을 테스트하였고, 상기 통계값은 대상자들이 관련되지 않은 경우, 귀무 가설 하에, 1의 자유도(degree of freedom)를 갖는, 점진적인(asymptotically) 카이-스퀘어(chi-square) 분포를 가졌을 것이다. 개인의 두 개의 염색체에 대해 승법 모델을 가정하여, 대립형질-특이적 OR을 계산하였다4. 복수 개의 케이스-대조군으로부터의 결과를 그룹들이 상이한 대립형질 집단 빈도, 일배체형 및 유전형을 가질 수 있으나, 공통된 상대적 위험도를 갖는 것으로 가정되는 Mantel-Haenszel 모델5을 이용하여 통합하였다. 모든 대조군에서 하디-와인버그 평형으로부터의 유의성 있는 편차는 없었다.
표 7 및 8에서, rs2200733 및 rs10033464에 대한 P 값은 위험 대립형질 중 어느 것도 갖지 않는 야생형 rs2200733 C, rs13143308 G, rs10033464 G 일배체형에 대한 비교에 근거하여 계산하였다. rs2200733 T에 대한 상응하는 조건적 오즈비는 [f(rs2200733 T)/f(WT)]/[p(rs2200733 T)/p(WT)]로 정의되었고, 식 중에서 WT는 야생형 일배체형을 의미하고, f(.) 및 p(.)는 각각 케이스 및 대조군에서의 빈도를 의미한다. 승법 모델 하에서 대조군이 집단 대조군으로 간주될 수 있는 경우, 이 조건적 오즈비는 야생형 대비 rs2200733 T의 상대적 위험도의 적합한 추정치이다. rs13143308 T에 대한 조건적 오즈비는 유사하게 정의되며 유사한 해석을 갖는다.
관련성(relatedness) 및 게놈 대조군(Genomic Control)에 대한 보정.
아이슬란드 케이스-대조군에서 일부 개인들은 상호 간에 관련되어, 전술된 카이-스퀘어 테스트 통계값이 평균 >1 및 중앙값 >0.675을 갖게 하였다26. 본 발명자들은 731,175명의 아이슬란드인의 계통(genealogy)을 통해 유전형을 시뮬레이션한, 이전에 개시된 절차를 이용하여 팽창 인자(inflation factor)를 추정하였다30. 316,515개의 게놈-전체 스캔 SNP에 대한 유전형이 이용가능한 최초 발견 표본에 대해, 본 발명자들은 또한, 게놈 대조군을 이용하고 316,515개의 카이-스퀘어 통계값의 평균을 계산하고, 상기 316,515개의 카이-스퀘어 통계값의 중앙값을 계산하고 이를 이전에 개시된 바와 같이31, 32 0.67526 로 나누는 것에 의해 팽창 인자를 추정하였다. 이 최초 표본들에 대해, 본 발명자들의 계통 방법 및 두 개의 게놈 대조군 방법에 의해 추정된 팽창 인자들은 유사한 팽창 인자 추정치를 가져왔다; 각각, 1.047, 1.058 및 1.054. 제시된 P 값 및 신뢰 구간은 계통학 방법에 의해 추정된 팽창 인자에 의한 조정에 근거한다.
cDNA 라이브러리의 PCR 스크리닝.
LD 블럭 내의 스플라이싱된 EST(DA725631, DB324364 및 AF017091)의 발현을 확인하기 위해, 본 발명자들은 deCODE에서 생성된 라이브러리 및 상업적으로 입수가능한 cDNA 라이브러리를 스크리닝하였다. 스크리닝된 상업적 라이브러리는 심장 (Clontech-639304), 대동맥(Clontech-639325), 골수(Clontech 7416-1), 정소 (Clontech 7414-1) 및 전뇌(whole brain)(BD S0598) Marathon Ready cDNA 라이브러리였다. 또한, 전혈 및 EBV-형질전환된 인간 림프구 세포주(lymphoblastoid cell line)에 대한 cDNA 라이브러리를 구축하였다. 상기 림프구 세포주 및 전혈로부터, 각각 Qiagen의 RNeasy RNA 분리 키트(Cat. 75144) 및 전혈로부터의 RNeasy RNA 분리 키트(Cat. 52304)를 이용하여 총 RNA를 분리하였다. High Capacity cDNA Archive Kit with random primers (Applied Biosystems PN 4322171)를 이용하여 deCODE에서 cDNA 라이브러리를 제조하였다.
PCR 스크리닝은 제조사의 설명서에 따라, Operon Biotechnologies로부터의 PCR 프라이머를 이용하고, Advantage® 2 PCR Enzyme RT_PCR System (Clontech)을 이용하여 수행하였다. PCR 반응은 3,5μM 최종 농도의 정방향 및 역방향 프라이머(표 16), 2mM dNTP, 1x Advantage 2 PCR 완충액 및 0.5㎕의 cDNA 라이브러리를 포함하는 10 ㎕ 부피로 수행하였다.
노던 블롯 분석.
상업적인 다중 조직 폴리-A 노던 블롯을 Clontech (Human Cardiovascular system, Cat. 636825)로부터 수득하였다.
사용된 프로브는 하기와 같다:
i) RZPD Deutsches Ressourcenzentrum fur Genomforschung GmbH, Germany, http://www.rzpd.de/products/genomecube.shtml) (서열 검증됨, 데이터는 표시되지 않음)로부터 수득된 PITX2 cDNA 클론(HU3_p983E0327D);
ii) RT-PCR 실험으로부터 수득된 ENPEP 전사체의 엑손 1-12에 상응하는 cDNA 클론. ENPEP 클론은 서열에 의해 확인되었다:
Megaprime 표지화 키트(GE Healthcare Cat. RPN 1607)를 이용하여, cDNA 단편을 [α-32P]dCTP(비활성 6000Ci/mmol)로 방사성표지화시키고, ProbeQuant G-50 마이크로컬럼(GE Healthcare Cat. 27-5335-01)을 이용하여, 결합되지 않는 뉴클레오티드를 반응물로부터 제거하였다. 막을 30분 이상 동안 Rapid-hyb 완충액(GE Healthcare Cat. RPN 1635)에서 예비-혼성화시키고 뒤이어 100-300ng의 표지화된 cDNA 프로브로 혼성화시켰다. 혼성화는 Rapid-hyb 완충액에서 65℃에서 밤새 수행하였다. 예비-혼성화 용액 중의 필터에 첨가하기 전에, 표지된 프로브를 95℃에서 5분간 가열하였다. 혼성화 후에, 상기 막을 실온에서 낮은 엄격성(low stringency)하에 2x SSC, 0.05% SDS에서 30-40분간 세척하고 뒤이어 50℃에서 40분간 0.1x SSC, 0.1% SDS 중의 높은 엄격성 하의 세척을 2회 수행하였다. 블롯을 즉시 밀봉하 고 Kodak BioMax MR X-ray 필름(Cat. 8715187)에 노출시켰다.
AF 영역 내의 후보 조절 변이(candidate regulatory variant)의 조사
AF와 연관된 SNP 주변의 172.5 kb 영역에 대해 SNP 위치 및 보존된 전사 인자 결합 부위(transcription factor binding site, TFBS)를 추출하기 위해 UCSC 브라우저를 이용하였다(hg release 17, 염색체 4, 111,942,401-112,114,901). 두 개의 표를 교차 참조하고, 결합 부위에 위치하는 SNP의 경우, HapMap 데이터에서 rs2220427 또는 rs6843082와의 LD에 대해 더 조사하였다. 이는 인간 게놈의 발표(release) 16, 17 및 18에 대해 수행되었으나, 결과는 hg 17 좌표(coordinate)로 보고되었다. 이는 공지된 전사 인자에 대한 보존된 결합 부위에 위치한 3개의 SNP를 가져왔다(표 17). 이 분석은 i) AF 일배체형이 완전히 서열결정되지 않았고, ii) 여러 개의 후보 SNP들이 Hapmap에서 분석되지 않았고 그들이 AF 일배체형 상에 존재하는지 알려져 있지 않으며, iii) 덜 보존된 영역에서의 다형성이 기능성일 수 있기 때문에, 기능성 후보들(functional candidates)의 제한된 표본을 검출할 뿐이라는 것에 유의한다.
3개의 TFBS의 진화적 보존
UCSC 게놈에서 Multiz 정렬을 이용하는 것은 이 SNP들에 의해 영향받은 영역의 진화적 보존의 평가를 가능하게 했다. 세개의 경우 모두, TF 결합 부위의 코어(core) 부분은 온전했으나, 영향받은 위치들은 상이한 정도로 보존되었다. rs12510087에 의해 영향받은 SOX5는 포유동물에서 가장 낮은 정도로 보존되었으나, (rs2220427에 의해 영향받은) 두번째는 현저하게 보존되었다(Opossum을 제외하고는, 닭의 모든 종에서 유지됨). rs17042171 돌연변이는 NFAT 결합 부위의 코어 GGAAAA 모티프의 마지막 위치에 있었다. 보존은 이 위치에서 G가 선호되어, GGAAAG 모티프가 생성되었다는 것을 보여준다.
ENPEP의 유전형과 발현 간의 상관관계
1,002명으로부터 밤새 금식(저녁 9시 이후) 후, 오전 8시와 10시 사이에 혈액을 채취하고, 정맥절개(phlebotomy) 후 2시간 이내에 RNA를 추출하였다. RNeasy Mini Kit (QIAGEN GmbH, Hilden, Germany)를 이용하여 RNA 분리를 수행하였다. 673명의 개인에서 리도카인-아드레날린(1%) 10 ml를 이용한 국소 마취 후에, 비키니 라인에서 3 cm 절개를 통해 피하 지방 시료(5-10 cm3)를 얻었다(부위-특이적 변이를 피하기 위해 항상 동일한 부위로부터 채취함). RNeasy Mini Kit (QIAGEN GmbH, Hilden, Germany)로 총 RNA의 정제를 수행하였다.
Agilent 2100 Bioanalyzer (Agilent Technologies, Palo Alto, U.S., CA)에서의 분석을 통해 총 RNA의 완전성(integrity)을 평가하였다. 기준 풀(reference pool), 총 1,765개의 시료를 포함한, 각 표지화된 RNA 시료를 Agilent Technologies에 의해 제조된 Human 25K 어레이에 혼성화시켰다. 개시된 바와 같이, 백그라운드 노이즈, 단일-채널 강도(single-channel intensity) 및 연관된 측정값 오차 추정치를 수득하기 위해 어레이 이미지를 처리하였다11. 두 시료 간의 발현 변화를 평균 로그값(log10) 발현 비(mean logarithm ratio, MLR), 즉, 어레이 상의 각 스팟에 대해 두 채널의 백그라운드 보정된 강도값 대비 발현 비로 정량하였다12. 혼성화는 표준 QC 방법, 즉, Cy3를 Cy5 강도를 비교하는, 스파이크-인 화합물(spike-in compound)에서의 신호대잡음비(signal to noise ratio), 재현성, 및 정확도를 통해 수행하였다.
혈액 (rs2200733 및 rs10033464에 대해, 각각 P = 0.90 및 P = 0.82) 또는 지방 조직(rs2200733 및 rs10033464에 대해, 각각 P = 0.23 및 P = 0.37)에서 연령 및 성별에 대해 조정된 ENPEP의 발현과 상관관계를 갖는 연관된 SNP는 없었다.
참조 문헌
1. Go, A. S. et al. Prevalence of diagnosed atrial fibrillation in adults: national implications for rhythm management and stroke prevention: the AnTicoagulation and Risk Factors in Atrial Fibrillation (ATRIA) Study. Jama 285, 2370-5 (2001).
2. Miyasaka, Y. et al. Secular trends in incidence of atrial fibrillation in Olmsted County, Minnesota, 1980 to 2000, and implications on the projections for future prevalence. Circulation 114, 119-25 (2006).
3. Arnar, D. O. et al. Familial aggregation of atrial fibrillation in Iceland. Eur Heart J 27, 708-12 (2006).
4. Fox, C. S. et al. Parental atrial fibrillation as a risk factor for atrial fibrillation in offspring. Jama 291, 2851-5 (2004).
5. Ellinor, P. T., Yoerger, D. M., Ruskin, J. N. & MacRae, C. A. Familial aggregation in lone atrial fibrillation. Hum Genet 118, 179-84 (2005).
6. Chen, Y. H. et al. KCNQ1 gain-of-function mutation in familial atrial fibrillation. Science 299, 251-4 (2003).
7. Yang, Y. et al. Identification of a KCNE2 gain-of-function mutation in patients with familial atrial fibrillation. Am J Hum Genet 75, 899-905 (2004).
8. Xia, M. et al. A Kir2.1 gain-of-function mutation underlies familial atrial fibrillation. Biochem Biophys Res Commun 332, 1012-9 (2005).
9. Olson, T. M. et al. Kv1.5 channelopathy due to KCNA5 loss-of-function mutation causes human atrial fibrillation. Hum Mol Genet 15, 2185-91 (2006).
10. Hong, K., Bjerregaard, P., Gussak, I. & Brugada, R. Short QT syndrome and atrial fibrillation caused by mutation in KCNH2. J Cardiovasc Electrophysiol 16, 394-6 (2005).
11. Ellinor, P. T. et al. Mutations in the long QT gene, KCNQ1, are an uncommon cause of atrial fibrillation. Heart 90, 1487-8 (2004).
12. Ellinor, P. T., Petrov-Kondratov, V. I., Zakharova, E., Nam, E. G. & MacRae, C. A. Potassium channel gene mutations rarely cause atrial fibrillation. BMC Med Genet 7, 70 (2006).
13. Franco, D. & Campione, M. The role of Pitx2 during cardiac development. Linking left-right signaling and congenital heart atrial fibrillation and /or strokes. Trends Cardiovasc Med 13, 157-63 (2003).
14. Faucourt, M., Houliston, E., Besnardeau, L., Kimelman, D. & Lepage, T. The pitx2 homeobox protein is required early for endoderm formation and nodal signaling. Dev Biol 229, 287-306 (2001).
15. Mommersteeg, M. T. et al. Molecular Pathway for the Localized Formation of the Sinoatrial Node. Circ Res (2007).
16. A haplotype map of the human genome. Nature 437, 1299-320 (2005).
17. Waldo, A. L. The interrelationship between atrial fibrillation and atrial flutter. Prog Cardiovasc Dis 48, 41-56 (2005).
18. Zini, S. et al. Identification of metabolic pathways of brain angiotensin II and III using specific aminopeptidase inhibitors: predominant role of angiotensin III in the control of vasopressin release. Proc Natl Acad Sci U S A 93, 11968-73 (1996).
19. Gretarsdottir, S. et al. The gene encoding phosphodiesterase 4D confers risk of ischemic stroke. Nat Genet 35, 131-8 (2003).
20. Falk, C. T. & Rubinstein, P. Haplotype relative risks: an easy reliable way to construct a proper control sample for risk calculations. Ann Hum Genet 51 (Pt 3), 227-33 (1987).
21. Mantel, N. & Haenszel, W. Statistical aspects of the analysis of data from retrospective studies of atrial fibrillation and /or stroke. J Natl Cancer Inst. 22, 719-48 (1959).
22. Grant, S. F. et al. Variant of transcription factor 7-like 2 (TCF7L2) gene confers risk of type 2 diabetes. Nat Genet 38, 320-3 (2006).
23. Yang, X. et al. Development and validation of stroke risk equation for Hong Kong Chinese patients with type 2 diabetes: the Hong Kong Diabetes Registry. Diabetes Care 30, 65-70 (2007).
24. Baum, L. et al. Methylenetetrahydrofolate reductase gene A222V polymorphism and risk of ischemic stroke. Clin Chem Lab Med 42, 1370-6 (2004).
25. Kutyavin, I. V. et al. A novel endonuclease IV post-PCR genotyping system. Nucleic Acids Research 34, e128 (2006).
26. Amundadottir, L. T. et al. A common variant associated with prostate cancer in European and African populations. Nat Genet 38, 652-8 (2006).
27. Gretarsdottir, S. et al. The gene encoding phosphodiesterase 4D confers risk of ischemic stroke. Nat Genet 35, 131-8 (2003).
28. Falk, C. T. & Rubinstein, P. Haplotype relative risks: an easy reliable way to construct a proper control sample for risk calculations. Ann Hum Genet 51 (Pt 3), 227-33 (1987).
29. Mantel, N. & Haenszel, W. Statistical aspects of the analysis of data from retrospective studies of atrial fibrillation and /or stroke. J Natl Cancer Inst. 22, 719-48 (1959).
30. Grant, S. F. et al. Variant of transcription factor 7-like 2 (TCF7L2) gene confers risk of type 2 diabetes. Nat Genet 38, 320-3 (2006).
31. Devlin, B. & Roeder, K. Genomic Control for association studies. Biometrics 55, 997-1004 (1999).
32. Devlin, B., Bacanu, S.-A. & Roeder, K. Genomic control to the extreme. Nature Genetics 36, 1129-1130 (2004).
33. Nomenclature and criteria for diagnosis of ischemic heart atrial fibrillation and /or stroke. Report of the Joint International Society and Federation of Cardiology/World Health Organization task force on standardization of clinical nomenclature. Circulation 59, 607-9 (1979).
34. Alpert, J. S., Thygesen, K., Antman, E. & Bassand, J. P. Myocardial infarction redefined--a consensus document of The Joint European Society of Cardiology/American College of Cardiology Committee for the redefinition of myocardial infarction. J Am Coll Cardiol 36, 959-69 (2000).
35. Monks, S. A. et al. Genetic inheritance of gene expression in human cell lines. Am J Hum Genet 75, 1094-105 (2004).
36. Schadt, E. E. et al. Genetics of gene expression surveyed in maize, mouse and man. Nature 422, 297-302 (2003).
실시예 3. 염색체 4 변이의 허혈성 뇌졸중(Ischemic stroke)에 대한 연관
뇌졸중은 서구 사회에서 일반적인 사망 원인이고 성인 장애의 주요한 원인이다. 뇌졸중은 또한 현재 인구 고령화 및 심혈관 질환에 대한 변형가능한(modifiable) 위험 인자들의 변화 때문에, 저-소득 및 중간-소득 국가들에서 주요한 보건 문제가 되고 있다1. 뇌졸중은 단일 질병이 아니라, 다수의 유전적 및 환경적 위험 인자들을 갖는 이질적 장애들의 군으로 구성된 매우 복잡한 증후군이다2,3. 쌍생아, 가족력, 동물 모델에 대한 연구가4-8 일반적인 형태의 뇌졸중에 대한 유전적 기여의 증거를 제공하나, 모든 집단에 대해 일관된 결과를 보여주는 주요한 위험 변이는 아직 확인되지 않았다.
대부분의 뇌손상(cerebral insult)(>80%)을 일으키는, 허혈성 뇌졸중(IS)은 혈전증 또는 색전증으로부터 유발되어, 뇌동맥의 폐쇄를 초래한다. 다양한 병리생 리학적 메카니즘이 IS를 유발할 수 있으나, 가장 일반적인 것은 주동맥 죽상동맥경화증(large artery atherosclerosis, LAA), 심장색전성 뇌졸중(cardioembolic stroke, CES) 및 소혈관 질환(small vessel disease, SVD)이다9.
방법
연구 집단.
아이슬란드: 아이슬란드 뇌졸중 환자들은 1993년부터 2006년까지, 레이캬비크에 있는 유일한 대학 병원인 랜드스피탈리 대학 병원에서 허혈성 뇌졸중 또는 TIA로 진단받은 4,000명 이상의 등록부로부터 모집되었다. 뇌졸중 환자들은 deCODE의 심혈관 질환(CVD) 유전학 프로그램을 통해 최근 9년간 등록되었다. 뇌졸중 진단은 신경전문의에 의해 임상적으로 확인되었다(하기 참조). 발견 코호트(discovery cohort)는 1,661명의 환자를 포함했고, 4q25 상의 SNP를 분석할 때, 본 발명자들은 추가적인 282명의 환자를 이용했다(평균연령±SD: 77.2±11.3세, 45% 여성). 본 발명자들은 하기를 포함하는, deCODE에서 수행된 다양한 유전학 프로그램으로부터의 25,708명의 대조군(평균연령±SD: 59.2±21.1세, 59% 여성)을 이용했다: 복부동맥류(250), 심방세동(1,150), 중독(750), 알쯔하이머(350), 불안증(200), 천식(1300), COPD (850), 결장암(200), 심부 정맥 혈전증(550), 난독증(200), 감염 질환(250), 장수(400), 폐암(750), 심근경색증(2,400), 편두통(1,100), 말초 동맥 질환(1,200), 다낭성 난소 증후군(1,200), 임신 중독증(700), 전립선암(400), 건 선(750), 류마티스 관절염(550), 하지불안 증후군(350), 및 타입 2 당뇨병(400).
본 연구는 아이슬란드 데이터 보호청(DPC) 및 아이슬란드 국가 생명윤리 위원회에 의해 허가되었다. 모든 참가자들은 고지된 동의서를 제출하였다.
스웨덴: 스웨덴 스톡홀름의 카롤린스카 대학 병원, 후딩게 유닛의 뇌졸중 유닛 또는 뇌졸중 통원환자 클리닉에 다니는 허혈성 뇌졸중 환자들이 진행 중인 유전적 역학 연구인 SSISS(the South Stockholm Ischemic Stroke Study)의 일부로 1996년부터 2002년까지 모집되었다.(평균연령±SD: 67.3±11.8세, 44% 여성). 본 연구에서 이용된 스웨덴 대조군은 환자들과 동일한 스웨덴 중부의 지역으로부터 모집된, 이 지역의 일반 집단을 대표하는 집단-기반 대조군이었다. 개인들은 정상 기준 집단을 대표하기 위해 카롤린스카 대학 병원의 임상화학과에 의해 모집된 건강한 지원자(1990년-1994년에 모집됨) 또는 후딩게 또는 카롤린스카 대학 병원에서 모집된 헌혈자였다(후딩게 병원으로부터의 대조군의 경우, 평균연령±SD: 46.8±15.9세, 41% 여성, 카롤린스카 병원에서 모집된 헌혈자에 대한 연령 정보는 입수가능하지 않았음). 본 연구는 카롤린스카 연구소 생명윤리 위원회(Bioethics Committee of Karolinska Institutet)에 의해 허가되었다.
남부-독일: 본 명세서에서, 독일-S(Germany-S)로 지칭되는, 독일 집단은 독일, 뮌헨 대학교, 그로스하데른 병원(Klinikum Grosshadern), 신경과의 뇌졸중 유닛에서 2001년부터 2006년까지 순차적으로 모집된 IS 환자들로 구성되었다(평균연령±SD: 65.3±13.7세, 38% 여성). 대조군은 심혈관 질환의 병력을 갖지 않는, 연령 및 성별이 조화된(age and gender matched) 개인들로 구성되었다(평균연령±SD: 62.7±10.9세, 38% 여성). 이들은 뮌헨 부근의 지역사회 기반 역학 연구 프로젝트(ommunity based epidemiological project)인 KORA S4 연구로부터 선택되었다23. 본 연구는 지역 윤리위원회에 의해 허가되고, 모든 개인들(또는 친척 또는 법정 후견인)로부터 고지된 동의를 받았다.
독일, 웨스트팔리아(Westphalia) 지역: 독일-W(Germany-W)로 지칭되는, 제2의 독일 집단은 2000년부터 2003년까지의 기간 동안, 독일 서부에 위치한, 웨스트팔리아 뇌졸중 등록부(Westphalian Stroke Register)에 참가한 병원을 통해 모집된허혈성 뇌졸중 환자들이었다(평균연령±SD: 70.4±12.6세, 53% 여성). 뇌졸중의 자가-보고 이력이 없는 집단 대조군은 동일한 지역에서 수행되고, 뒤이어 케이스에 빈도가 조화된, 단면적, 전향적, 집단 기반 도르트문트 보건 연구(Dortmund Health Study)24로부터 유래되었다(평균연령±SD: 52.3±13.7세, 53% 여성). 양 연구는 모두 뮌스터 대학(University of Munster)의 윤리 위원회에 의해 허가되었다. 모든 참가자들은 그들의 고지된 동의를 제출하였다.
SE-잉글랜드, 영국. 1995년부터 2002년까지 뇌혈관 치료에 참여한 유럽 가계의 허혈성 뇌졸중 환자들을 모집하였다. 모든 케이스들은 원래의 이미징을 검토하는 것에 의해 숙련된 뇌졸중 신경전문의에 의해 표현형분석되었다(평균연령±SD: 64.6±12.7세, 41% 여성). 증후성 뇌혈관 질환(symptomatic cerebrovascular disease)을 갖지 않는 지역 대조군(community control)도 환자들과 동일한 지리적 지역으로부터의 가정의(family doctor) 목록을 표본추출(sampling)하는 것에 의해 모집되었다. 환자군과 유사한 연령 및 성별의 분포를 제공하기 위해 표본추출을 계층화시켰다(평균연령±SD: 64.8±8.6세, 41% 여성). 본 연구는 지역 연구 윤리 위원회에 의해 허가되고 모든 참가자들로부터 고지된 동의를 받았다.
표현형분석(phenotyping). 본 연구에는 허혈성 뇌졸중을 갖는 환자들만 포함되고 출혈성 뇌졸중을 갖는 환자들은 포함되지 않았다. 모든 환자들은 CT(computed tomography) 및/또는 MRI(magnectic resonance imaging)에 의한 뇌 영상촬영(brain imaging)을 포함한, 임상적으로 관련된 진단 정밀검사(work-up), 및 경동맥 및 척추동맥의 이중 초음파검사(duplex ultrasonography), 심장초음파, Holter 모니터링, MR-혈관조영술, CT-혈관조영줄 및 혈액 검사를 포함한 보조적 진단 검사를 받았다. 임상적으로 확인된 일과성 허혈 발작(TIA)을 갖는 환자들이 아이슬란드, 독일-S(Germany-S) 및 스웨덴으로부터의 허혈성 뇌졸중 그룹에 포함되었다. 환자들은 TOAST(the Trial of Org 10172 in Acute Stroke Treatment)25에 따라, 병인 서브타입(etiologic subtype)으로 분류되었다. 이 분류는 6개의 카테고리를 포함한다: (1) 주동맥 폐쇄성 질환(large-artery occlusive disease)(대혈관 질환), (2) 심장성 폐색증(심인성 뇌졸중), (3) 소혈관 질환(열공 뇌졸중), (4) 기타 결정된 병인, (5) 진단 노력에도 불구하고 밝혀지지 않은 병인, 또는 (6) 둘 이상의 병인. TOAST 카테고리 4-6으로 분류된 환자들은 독일-W(Germany-W)의 뇌졸중 집단에서 제외되었다. 아이슬란드에서, 환자들은 통상적으로 이용되는 기준, 즉, 협착(stenosis) ≥ 50%보다 더 엄격한 기준인 협착 ≥ 70%인 경우, 주동맥 폐쇄성 질환을 갖는 것으로 분류되었다. 아이슬란드의 발견 집단의 표본 및 4개의 재현 표본 세트에서 뇌졸중 환자의 TOAST(Trial of Org 10172 in Acute Stroke Treatment) 분류 시스템25 에 따른 서브타입으로의 분류가 표 1에 열거된다.
Illumina 게놈-전체 유전형분석. 모든 아이슬란드 케이스-시료 및 대조군 시료를 국제 HapMap 프로젝트의 I 상(phase I)으로부터 유래된 317,503개의 태깅 SNP를 포함하는, Infinium HumanHap300 SNP 칩(Illumina, SanDiego, CA, USA)에 의해 분석하였다. 상기 칩 상에서 분석된 SNP 중에서, (i) 케이스나 대조군에서 95% 미만의 콜 레이트(call rate)를 갖거나; (ii) 집단에서 1% 미만의 MAF(Minor Allele Frequency)를 갖거나; 또는 (iii) 대조군에서 하디-와인버그 평형(Hardy-Weinberg equilibrium)으로부터 유의성 있는 왜곡을 보인(P<1 x 10-10), 6,622개의 SNP를 배제시켰다. 98% 미만의 콜 레이트(call rate)를 갖는 시료를 분석에서 배제시켰다. 최종 분석에서, 310,881개의 SNP가 이용되었다.
단일 SNP 유전형분석. 아이슬란드, 레이캬비크에 있는 deCODE Genetics에서 Centaurus (Nanogen) 플랫폼을 이용하여 총 121개의 SNP에 대한 단일 SNP 유전형분석을 수행하였다26. 각 SNP 분석법의 질은 CEU HapMap 시료의 유전형분석을 공중에게 이용가능한 HapMap 데이터와 비교하는 것에 의해 평가하였다. 모든 SNP가 불일 치 테스트, 연관 불균형(LD) 테스트를 통과했고, 하디-와인버그 평형 상태에 있었다.
연관 분석. 연관 분석을 위해, 본 발명자들은 위험도에 대한 승법 모델을 가정하여, 즉, 한 사람이 갖는 두 대립형질의 위험도가 곱해진다는 것을 가정하여, 각각의 개별적인 대립형질에 대한 양측 P-값 및 대립형질-특이적 OR을 계산하기 위해, deCODE에서 작성된 NEMO 소프트웨어에서 구현된27, 표준 가능성 비 통계값(standard likelihood ratio statistics)을 이용하였다. 보인자 빈도(carrier frequency)가 아닌 대립형질 빈도가 마커에 대해 제시되었다.
염색체 4q25 상의 유전자 좌에서, 본 발명자들은 3개의 SNP, rs2200733, rs10033464 및 rs13143308을 분석하였다. 3번재 SNP, rs13143308은 rs2200733 및 rs10033464 모두와 높은 LD에 있고(상기 두개에 대한 D'=0.99), rs2200733 대립형질 T 또는 rs10033464 대립형질 T를 갖는 염색체에 완전히 일치하는 소수 대립형질(minor allele)을 가졌다. Centaurus 분석법을 이용하여 모든 집단에서 상기 SNP의 유전형분석이 수행되었고, Illumina Infinium 플랫폼 상에서 rs2200733 또는 rs10033464에 대한 결실된 데이터를 갖는 개인들에 대해 유전형을 추측하기 위해 이용되었다. 표 21 및 보충적 표 22에서, 위험 대립형질 rs2200733-T 및 rs10033464-T에 대한 P 값과 OR은 상기 위험 대립형질을 포함하지 않는, 야생형 rs2200733 대립형질 C, rs13143308 대립형질 G, rs10033464 대립형질 G 일배체형과 의 비교에 근거하여 계산되었다11.
아이슬란드 연구 그룹의 경우, 대상자의 관련성 및 게놈 대조군 방법을 이용한 다른 가능한 집단 계층화에 대한 조정 후 P 값이 주어졌다10. 카이-스퀘어 통계값에 대한 팽창 인자는 IS, CES, LAA 및 SVD의 게놈-전체 연관 분석에 대해 각각 1.07, 1.04, 1.06 및 1.02였다. 상기 4q 유전자 좌에 대해 추가적인 케이스 및 대조군을 분석하여, 본 발명자들은 이전에 개시된28 바와 같은 시뮬레이션을 이용하여 팽창 인자를 추정하였다. 결과적으로 수득된 팽창 인자는 IS, CES, IS excl CES, LVD, SVD, 기타, 미공지 병인 및 둘 이상의 원인의 그룹에 대해, 각각 1.09, 1.03, 1.06, 1.05, 1.01, 1.00, 1.01 및 1.00이었다.
이용된 많은 수의 대조군 때문에, 케이스 및 대조군의 관련성에 대한 조정 후 유효 표본 크기는 2,690명의 IS 환자 및 2,690명의 대조군을 테스트하는 것에 해당했다. CES, LAA 및 SVD 환자에 대한 상응하는 유효 표본 크기는 각각 710명, 417명 및 467명이었다.
복수 개의 케이스-대조군으로부터의 결과를 그룹들이 대립형질에 대한 상이한 집단 빈도, 일배체형 및 유전형을 가질 수 있으나, 공통된 상대적 위험도를 갖 는 것으로 가정하는 Mantel-Haenszel 모델을 이용하여 통합하였다29.
결과
LD Block C04 영역 내의 변이의 허혈성 뇌졸중에 대한 연관이 조사되었다. 4q25 상의 두개의 AF 위험 변이, rs2200733
색전성 뇌졸중(CES) 및 소혈관 질환(SVD)을 발병할 위험도에 대한 기여를 조사하기 위해, 본 발명자들은 아이슬란드 표본에서 마커 rs2200733 및 마커 rs10033464의 유전형을 분석하고, 재현 목적으로, 본 발명자들은 또한 남부-독일(1,181명의 케이스 및 1,189명의 대조군, 독일-S), 스웨덴(1,032명의 케이스 및 1,387명의 대조군), 독일의 웨스트팔리아 지역(1,388명의 케이스 및 1,106명의 대조군, 독일-W), 및 영국(654명의 케이스/676명의 대조군, UK)의 코호트에서 재현 데이터 세트를 분석하였다. 본 연구 코호트의 표현형 분류가 표 20에 표시된다.
이 특정한 SNP들에 대해, 아이슬란드로부터의 추가적인 환자(282) 및 대조군 (14,893)의 유전형을 분석하였다. 연관 테스트는 각 SNP를 야생형 일배체형과 비교하는 것에 의해 수행하였다(방법 참조). 표 21에 표시된 바와 같이, rs2200733은 모든 표본 세트에서 허혈성 뇌졸중의 증가된 위험도를 부여했고, 허혈성 뇌졸중에 대한 연관은 통합 OR=1.26 (P =8.8 x 10-11)로 매우 유의성이 높았다. rs10033464의 경우, 허혈성 뇌졸중과의 연관은 유의성이 없었다(OR=1.03, P=0.45). 그러나, 두 SNP는 모두 심장색전성 뇌졸중과 유의성있게 연관되었고, 이 위험도는 허혈성 뇌졸중 그룹 전체에서보다 훨씬 더 높았다(rs2200733: OR=1.53, P=1.5 x 10-12; rs10033464: OR=1.27, P=5.9 x 10-4). 이는 심방세동의 이 서브표현형에 대한 공지된 기여로부터 예상된 바와 같다. 허혈성 뇌졸중 그룹으로부터 심장색전성 뇌졸중을 갖는 환자들을 제거하는 것에 의해, 두 SNP에 대해 관찰된 효과는 나머지 허혈성 뇌졸중 환자에서 더 낮았으나, 보다 강한 변이에 대해서는 유의성 있게 유지되었다(rs2200733: OR=1.18, P=1.5 x 10-5, rs10033464: OR=0.96, P=0.39). 심장색전성 뇌졸중과 별도로, 주동맥 죽상동맥경화증 및 뇌졸중은 rs2200733과 유의성 있는 연관을 보이는 유일한 서브표현형이었다(OR=1.22, P=1.5x 10-3, 표 2 및 OR=1.18, P=0.01). 이 결과들은 잠재성(cryptogenic) 뇌졸중 또는 주동맥 죽상동맥경화증으로 분류된 뇌졸중의 상당한 부분이 진단되지 않은, 간헐적 AF 때문일 수 있다는 것을 시사한다.
전술된 바와 같이(실시예 2), rs2200733 및 rs10033464의 위험 대립형질은 심방세동의 진단 연령과 유의성 있는 상관관계를 갖는다. 동일한 방향의 유의성 없는 경향이 심장색전성 뇌졸중의 진단 연령에 대한 본 발명자들의 연구에서 관찰되어(T rs2200733 카피당 0.62년, P=0.33 및 T rs10033464 카피당 0.29년, P=0.71, 표 23), 관찰된 AF에 대한 연령 효과가 비록 더 약한 효과이긴 하나, 심장색전성 뇌졸중에도 적용될 수 있다는 것을 시사한다.
검토
1661명의 아이슬란드 IS 환자들 및 10815명의 대조군에 대한 이 연구 및 대규모이고 특성이 잘 규명된 유럽 허혈성 뇌졸중 케이스/대조군 표본 세트에 대한 후속 재현을 통해, 본 발명자들은 허혈성 뇌졸중과 연관된, rs2200733에 태깅된, 염색체 4q25 상에 있는 위험 변이를 확인하고 검증하였다. 본 발명자들의 연구에서, 예상된 바와 같이, 이 변이들은 심방세동의 주요한 합병증인 서브표현형, 심장 색전성 뇌졸중과 가장 강하게 연관되었다. 심장색전성 뇌졸중을 갖지 않는 허혈성 뇌졸중 환자들에서 관찰된 위험도는 심방세동이 종종 증상이 없거나 또는 간헐적이고, 결과적으로 뇌졸중 환자에서 검출하기 어려울 수 있기 때문에, 심방세동 및 그에 따른 심장색전성 뇌졸중의 저진단(underdiagnosis)때문일 수 있다.
허혈성 뇌졸중의 30% 까지가 대부분 심방세동(7, 8)의 존재 하에 일어나는 심장색전증(5, 6)에 의해 유발된다. 심방세동은 인간의 가장 일반적인 지속성 심장성 부정맥이고 그 유병율은 연령과 함께 증가되어 80세 이상의 연령층의 약 10%에 영향을 미친다(3, 9). 따라서, AF는 뇌졸중에 대한 가장 강력한 독립적 위험 인자이고 집단 수준에서, AF는 뇌졸중의 위험도의 4배 내지 5배 증가와 연관된다(3, 7, 8, 10). 또한, 심장색전성 뇌졸중은 일반적으로 중증이고, 이는 다른 서브타입의 뇌졸중보다 더 높은 장애율(diablilty), 더 높은 뇌졸중 재발율 및 더 높은 사망률에 의해 반영된다(6, 11). AF에 대한 위험에 있는 환자들의 조기 검출은 향후 뇌졸중을 앓을 위험도를 낮추기 위해 중요하다. AF를 갖는 환자들에서 뇌졸중 예방에 대한 임상 시험은 항응고제의 투약(예를 들면, 와파린)이 뇌졸중의 위험도를 상당히 낮추고(7, 12) 아스피린 및 클로피도그렐과 같은 항-혈소판제보다 훨씬 더 효과적이라는 것을 보여주었다. 본 발명자들의 결과는 뇌졸중 환자의 상당한 비율이 진단되지 않은 심방세동을 가지며 잠재성 뇌졸중 또는 주혈관 뇌졸중(large vessel stroke)로 분류된다는 것을 강하게 시사한다. 그와 같은 환자들은 24 내지 48시간의 심장 모니터링의 통상적인 정밀검사(workup) 동안 검출되지 않는, 무증상, 간헐적 AF를 가질 수 있다. 이는 추가적인 4 내지 7일의 활동성 심장 모니터 링(ambulatory cardiac monitoring)을 받은 뇌졸중후 환자(post-stroke patient)의 두 연구에 의해 지지된다; 이전에 진단되지 않은 간헐적 AF의 비율은 5.6 및 14.3%였다(13, 14). 무증상 또는 간헐적 AF를 갖는 뇌졸중 환자들은 대신에, 예를 들면, 잠재성 뇌졸중 또는 주혈관성 뇌졸중으로 오진단되는 경우, 부적절하게 치료되며, 이는 그와 같은 환자들이 와파린 대신에, 항-혈소판제를 복용하게 되기 때문이다. 따라서, AF에 대한 이 마커들은 어느 환자가 AF의 존재 또는 부재를 증명하기 위해, 통원 환자로서 지속적인 심장 모니터링에 의해 혜택을 받을 수 있는지를 결정하는 것에 기여할 수 있다. 이 발견들이 뇌졸중의 더 우수한 예방 또는 치료로 실현될 수 있는지 여부를 결정하기 위해서 전향(prospective) 연구가 요구된다.
참조문헌
1. Strong, K., Mathers, C. & Bonita, R. Preventing stroke: saving lives around the world. Lancet Neurol 6, 182-7 (2007).
2. Hassan, A. & Markus, H.S. Genetics and ischaemic stroke. Brain 123 (Pt 9), 1784-812 (2000).
3. Markus, H. Genes for stroke. J Neurol Neurosurg Psychiatry 75, 1229-31 (2004).
4. Flossmann, E., Schulz, U.G. & Rothwell, P.M. Systematic review of methods and results of studies of the genetic epidemiology of ischemic stroke. Stroke 35, 212-27 (2004).
5. Brass, L.M., Isaacsohn, J.L., Merikangas, K.R. & Robinette, C.D. A study of twins and stroke. Stroke 23, 221-3 (1992).
6. Jerrard-Dunne, P., Cloud, G., Hassan, A. & Markus, H.S. Evaluating the genetic component of ischemic stroke subtypes: a family history study. Stroke 34, 1364-9 (2003).
7. Jousilahti, P., Rastenyte, D., Tuomilehto, J., Sarti, C. & Vartiainen, E. Parental history of cardiovascular disease and risk of stroke. A prospective follow-up of 14371 middle-aged men and women in Finland. Stroke 28, 1361-6 (1997).
8. Rubattu, S. et al. Chromosomal mapping of quantitative trait loci contributing to stroke in a rat model of complex human disease. Nat Genet 13, 429-34 (1996).
9. Dichgans, M. Genetics of ischaemic stroke. Lancet Neurol 6, 149-61 (2007).
10. Devlin, B. & Roeder, K. Genomic control for association studies. Biometrics 55, 997-1004 (1999).
11. Gudbjartsson, D.F. et al. Variants conferring risk of atrial fibrillation on chromosome 4q25. Nature 448, 353-7 (2007).
12. Ferro, J.M. Cardioembolic stroke: an update. Lancet Neurol 2, 177-88 (2003).
13. Murtagh, B. & Smalling, R.W. Cardioembolic stroke. Curr Atheroscler Rep 8, 310-6 (2006).
14. Lip, G.Y. & Lim, H.S. Atrial fibrillation and stroke prevention. Lancet Neurol 6, 981-93 (2007).
15. Wolf, P.A. & Singer, D.E. Preventing stroke in atrial fibrillation. Am Fam Physician 56, 2242-50 (1997).
16. Feinberg, W.M., Blackshear, J.L., Laupacis, A., Kronmal, R. & Hart, R.G. Prevalence, age distribution, and gender of patients with atrial fibrillation. Analysis and implications. Arch Intern Med 155, 469-73 (1995).
17. Go, A.S. et al. Prevalence of diagnosed atrial fibrillation in adults: national implications for rhythm management and stroke prevention: the AnTicoagulation and Risk Factors in Atrial Fibrillation (ATRIA) Study. Jama 285, 2370-5 (2001).
18. Wolf, P.A., Abbott, R.D. & Kannel, W.B. Atrial fibrillation as an independent risk factor for stroke: the Framingham Study. Stroke 22, 983-8 (1991).
19. Lip, G.Y. & Boos, C.J. Antithrombotic treatment in atrial fibrillation. Heart 92, 155-61 (2006).
20. Hart, R.G., Pearce, L.A. & Aguilar, M.I. Meta-analysis: antithrombotic therapy to prevent stroke in patients who have nonvalvular atrial fibrillation. Ann Intern Med 146, 857-67 (2007).
21. Barthelemy, J.C. et al. Automatic cardiac event recorders reveal paroxysmal atrial fibrillation after unexplained strokes or transient ischemic attacks. Ann Noninvasive Electrocardiol 8, 194-9 (2003).
22. Jabaudon, D., Sztajzel, J., Sievert, K., Landis, T. & Sztajzel, R. Usefulness of ambulatory 7-day ECG monitoring for the detection of atrial fibrillation and flutter after acute stroke and transient ischemic attack. Stroke 35, 1647-51 (2004).
23. Wichmann, H.E., Gieger, C. & Illig, T. KORA-gen--resource for population genetics, controls and a broad spectrum of disease phenotypes. Gesundheitswesen 67 Suppl 1, S26-30 (2005).
24. Berger, K. et al. The glu298asp polymorphism in the nitric oxide synthase 3 gene is associated with the risk of ischemic stroke in two large independent case-control studies. Hum Genet 121, 169-78 (2007).
25. Adams, H.P., Jr. et al. Classification of subtype of acute ischemic stroke. Definitions for use in a multicenter clinical trial. TOAST. Trial of Org 10172 in Acute Stroke Treatment. Stroke 24, 35-41 (1993).
26. Kutyavin, I.V. et al. A novel endonuclease IV post-PCR genotyping system. Nucleic Acids Res 34, e128 (2006).