본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서 내에서 사용되는 용어 "예측 또는 진단"은 질병 발생의 예측, 질병 발생 위험도(risk) 및 질병에 대한 발병 감수성(susceptibility)을 결정하거나 도출시키는데 사용되는 모든 유형의 분석을 포함하며, 바람직하게는 고혈압인지 여부를 판단하여 진단을 하거나 발병 위험을 예측하는 것을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 명세서 내에서 사용되는 용어 "대립유전자(allele)"는 상동염색체의 동일한 유전자 좌우에 존재하는 한 유전자의 여러 타입을 말하며, 예컨데, SNP는 두 종류의 대립인자(biallele)를 갖는다. 대립유전자 빈도는 특정 인구집단 내 유전적 다형성을 나타내는데 사용될 수 있다.
본 명세서 내에서 사용되는 용어 "rs_id"는 1998년부터 SNP 정보를 축적하기 시작한 NCBI가 초기에 등록되는 모든 SNP에 대하여 부여한 독립된 표지자를 의미할 수 있다. 본 명세서 내에서는 rs(number)와 같은 형태로 기재하였으며, 이는 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서의 다형성 마커인 SNP를 의미할 수 있으며, 당업자라면 rs-id를 이용하여 SNP의 위치 및 서열을 용이하게 NCBI를 통하여 확인할 수 있다. 나아가, NCBI의 dbSNP(The Single Nucleotide Polymorphism Database) 번호인 rs_id에 해당하는 구체적인 서열 및 이에 대한 정보는 시간이 지남에 따라(Genome Reference Consortium human genome build 버전에 따라) 조금씩 변경될 수 있으나, 본 발명의 범위가 변경된 서열에도 미치는 것은 당업자에게 자명할 것이다.
본 명세서 내에서 사용되는 용어 "폴리뉴클레오티드(polynucleotide) 또는 핵산"은 단일 또는 이중 가닥의 형태의 DNA 또는 RNA를 의미할 수 있다. DNA는 아데닌(adenine, A), 구아닌(guanine, G), 시토신(cytosine, C), 티민(thymine, T) 네 가지 염기로 구성되어 있으며, RNA는 티민 대신 우라실(Uracil, U)을 가지고 있다. 핵산 이중 가닥에서 A는 T 또는 U, C는 G 염기와 수소결합을 이루는데, 이러한 염기의 관계를 상보적(complementary)이라고 한다. 나아가, 본 명세서 내에서 사용되는 용어 "유전체 DNA(genomic DNA)"는 한 개체의 유전자의 총 염기서열로서, 거의 완전한 유전정보를 포함하고 있는 DNA를 의미할 수 있다. 더 나아가, 본 명세서 내에서 사용되는 용어 "단백질(protein)"은 아미노산 잔기의 중합체를 의미하며, 폴리펩타이드 또는 펩타이드(peptide)와 호환성 있게 사용될 수 있다.
본 명세서 내에서 사용되는 "아미노산의 일문자(삼문자) "는 생화학 분야에서의 표준 약어 규정에 따라 다음의 아미노산을 의미할 수 있다. A(Ala): 알라닌, C(Cys): 시스테인, D(Asp): 아스파르트산, E(Glu): 글루탐산, F(Phe): 페닐알라닌, G(Gly): 글라이신, H(His): 히스티딘, I(IIe): 이소류신, K(Lys): 라이신, L(Leu): 류신, M(Met): 메티오닌, N(Asn): 아스파라진, O(Ply): 피롤라이신, P(Pro): 프롤린, Q(Gln): 글루타민, R(Arg): 아르지닌, S(Ser): 세린, T(Thr): 쓰레오닌, U(Sec): 셀레노시스테인, V(Val): 발린, W(Trp): 트립토판 및 Y(Tyr): 타이로신.
본 명세서 내에서 사용되는 "전장 유전체 연관 분석(genome wide association study, GWAS)"는 특정 형질(질병)과 관련이 있는 유전적 변이를 발굴하기 위한 분석법으로, 전체 유전체 또는 특정 유전체 영역에 대한 SNP 또는 유전 변이를 대표할 수 있는 마커를 이용하여 특정 형질(질병)과의 연관성 연구를 수행하며, 연관성 연구 결과가 특정 형질군(질병군)과 정상군 중 특정 형질군(질병군)에서 특정 유전변이가 빈번하게 나타날 경우 연관성이 있다고 표현할 수 있다.
본 명세서 내에서 사용되는 용어 "개체"는 특정 형질 즉, 소금 민감성 또는 고혈압 질병에 대한 예측 또는 진단을 하기 위한 피험자를 의미할 수 있다. 이에, 개체로부터 분리된 생물학적 시료로부터 DNA를 수득하여, 개체에 대한 전술한 특정 형질에 대하여 예측 또는 진단할 수 있다. 이때, 생물학적 시료는 머리카락, 뇨, 혈액, 각종 체액, 분리된 조직, 분리된 세포 및 타액을 포함할 수 있으나, 이에 제한되는 것은 아니며, DNA가 추출할 수 있는 개체로부터의 모든 물질을 포함할 수 있다.
고혈압에 대한 정보 제공 방법 및 이에 따른 키트
이하에서는, 도 1을 참조하여 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법 및 이에 따른 키트에 대하여 구체적으로 설명한다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에 대한 흐름도가 도시된다. 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법은 개체로부터 분리된 생물학적 시료로부터 EML6, FGF5, NT5C2, ATP2B1 및 LINC00936 사이, PRDM8 및 FGF5 사이, C6orf10 및 HLA-DQB1 사이, RNF213, GML 및 CYP11B1 사이, CNNM2 및 NT5C2 사이, MYL2 및 CUX2 사이 및 JAG1 중 적어도 하나의 유전자 영역에 대한 SNP(single nucleotide polymorphism) 유전자형을 검출하는 단계(S110) 및 검출된 유전자형을 기초로 개체에 대한 고혈압 발병 위험을 결정하는 단계(S120)를 포함할 수 있다.
이때, SNP(single nucleotide polymorphism) 즉, 단일염기다형성은 하나의 유전자 좌위(locus)에 두 가지 이상의 대립 유전자(allele)가 존재하는 다형성 부위(polymorphic site) 중에서, 단일 염기만이 다른 것을 의미한다. SNP는 비교적 그 빈도가 높고 안정하며, 유전체 전체에 분포되어 있어 개체의 유전적 다양성을 발생시킬 수 있다. 또한, SNP는 일반적으로 단일 염기 다형성에 수반되어 표현형의 변화를 포함할 수도 있는데, 본 발명의 SNP는 소급 감수성 및 이에 따른 고혈압 발병의 차이를 나타낼 수 있다. 나아가, 본 명세서에서 "SNP"는 "변이" 및 "SNP 마커"와 혼용되어 사용될 수 있다.
먼저, 개체로부터 분리된 생물학적 시료의 DNA로부터 EML6, FGF5, NT5C2, ATP2B1 및 LINC00936 사이, PRDM8 및 FGF5 사이, C6orf10 및 HLA-DQB1 사이, RNF213, GML 및 CYP11B1 사이, CNNM2 및 NT5C2 사이, MYL2 및 CUX2 사이 및 JAG1 중 적어도 하나의 유전자 영역에 대한 SNP(single nucleotide polymorphism) 유전자형을 검출하는 단계(S110)에서는 rs67617923, rs16998073, rs11191582, rs11105378, rs12509595, rs6913309, rs112735431, rs3819496, rs140473396, rs12229654 및 rs1887320 중 적어도 하나의 SNP를 검출할 수 있다.
보다 구체적으로, 먼저, rs67617923인 SNP은 EML6 유전자 영역에 대한 서열번호 1의 폴리뉴클레오티드에서 101번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 1의 폴리뉴클레오티드에서 101번째 해당하는 염기는 G 또는 A이며, rs67617923은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
그 다음, rs16998073인 SNP은 FGF5 유전자 영역에 대한 서열번호 2의 폴리뉴클레오티드에서 101번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 2의 폴리뉴클레오티드에서 101번째 해당하는 염기는 A 또는 T이며, rs16998073은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
그 다음, rs11191582인 SNP은 NT5C2 유전자 영역에 대한 서열번호 3의 폴리뉴클레오티드에서 101번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 3의 폴리뉴클레오티드에서 101번째 해당하는 염기는 G 또는 A이며, rs11191582은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
그 다음, rs11105378인 SNP은 ATP2B1 및 LINC00936 사이 유전자 영역에 대한 서열번호 4의 폴리뉴클레오티드에서 101번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 4의 폴리뉴클레오티드에서 101번째 해당하는 염기는 C 또는 T이며, rs11105378은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
그 다음, rs12509595인 SNP은 PRDM8 및 FGF5 사이 유전자 영역에 대한 서열번호 5의 폴리뉴클레오티드에서 101번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 5의 폴리뉴클레오티드에서 101번째 해당하는 염기는 T 또는 C이며, rs12509595은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
그 다음, rs6913309인 SNP은 C6orf10 및 HLA-DQB1 사이 유전자 영역에 대한 서열번호 6의 폴리뉴클레오티드에서 81번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 6의 폴리뉴클레오티드에서 81번째 해당하는 염기는 T 또는 A이며, rs6913309은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
그 다음, rs112735431인 SNP은 RNF213 유전자 영역에 대한 서열번호 7의 폴리뉴클레오티드에서 100번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 7의 폴리뉴클레오티드에서 100번째 해당하는 염기는 G 또는 A이며, rs112735431은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
그 다음, rs3819496인 SNP은 GML 및 CYP11B1 사이 유전자 영역에 대한 서열번호 8의 폴리뉴클레오티드에서 91번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 8의 폴리뉴클레오티드에서 91번째 해당하는 염기는 A 또는 G이며, rs3819496은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
그 다음, rs140473396인 SNP은 CNNM2 및 NT5C2 사이 유전자 영역에 대한 서열번호 9의 폴리뉴클레오티드에서 51번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 9의 폴리뉴클레오티드에서 51번째 해당하는 염기는 ACACACAC 또는 AC이며, rs140473396은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다. 보다 구체적으로, rs140473396인 SNP은 여러 형태의 SNP가 삽입(Insertion) 및/또는 삭제(Deletion)이 반복되는 구간임에 따라, 서열번호 9의 폴리뉴클레오티드에서 51번째 해당하는 염기는 ACACACAC 또는 AC 뿐만 아니라, 더 다양한 염기의 배열이 포함될 수 있다.
그 다음, rs12229654인 SNP은 MYL2 및 CUX2 사이 유전자 영역에 대한 서열번호 10의 폴리뉴클레오티드에서 101번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 10의 폴리뉴클레오티드에서 101번째 해당하는 염기는 T 또는 G이며, rs140473396은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
마지막으로, rs1887320인 SNP은 JAG1 유전자 영역에 대한 서열번호 11의 폴리뉴클레오티드에서 101번째 해당하는 염기를 포함하는 전체 또는 일부의 폴리뉴클레오티드일 수 있다. 나아가, 서열번호 11의 폴리뉴클레오티드에서 101번째 해당하는 염기는 A 또는 G이며, rs1887320은 이를 포함하는 5 내지 300개의 연속적인 염기로 구성되는 폴리뉴클레오티드 또는 이에 상보적인 폴리뉴클레오티드일 수 있으나, 이에 제한되는 것은 아니다.
또한, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서 이용되는 SNP 즉, 서열번호 1 내지 11에 대한 염기서열은, 생물학적 균등 활성을 갖는 변이를 고려한다면, 서열목록에 기재된 서열과 실질적인 동일성(substantial identity)을 나타내는 서열도 포함할 수 있다. 이때, 실질적인 동일성(substantial identity)은 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서의 서열과 임의의 다른 서열을 최대한 대응되도록 얼라인(align)하고, 당 업계에서 통상적으로 이용되는 알고리즘을 이용하여 얼라인된 서열을 분석한 경우에, 최소 60 %, 바람직하게는 70 %, 더욱 바람직하게는 80 %, 더더욱 바람직하게는 90 %의 상동성을 나타내는 서열을 의미할 수 있다. 따라서, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서 이용되는 SNP는 전술한 SNP를 포함하는 서열번호 1 내지 11로 표시되는 염기서열과 높은 상동성을 갖는 염기서열, 예를 들면, 그 상동성이 70 % 이상, 바람직하게는 80 % 이상, 가장 바람직하게는 90 % 이상의 높은 상동성을 갖는 염기서열 모두 포함할 수 있다.
나아가, 개체로부터 분리된 생물학적 시료의 DNA로부터 EML6, FGF5, NT5C2, ATP2B1 및 LINC00936 사이, PRDM8 및 FGF5 사이, C6orf10 및 HLA-DQB1 사이, RNF213, GML 및 CYP11B1 사이, CNNM2 및 NT5C2 사이, MYL2 및 CUX2 사이 및 JAG1 중 적어도 하나의 유전자 영역에 대한 SNP(single nucleotide polymorphism) 유전자형을 검출하는 단계(S110)에서는 서열(sequencing) 분석, 마이크로어레이에 의한 혼성화, 대립 유전자 특이적인 PCR(allele specific PCR), 다이나믹 대립 유전자 혼성화 기법(dynamic allele-specific hybridization, DASH), PCR 연장 분석, PCR-SSCP(PCR-single strand conformation polymorphism), PCR-RFLP(PCR-resctriction fragment length polymorphism) 및 TaqMan 기법 중 적어도 하나의 방법에 의해 수행될 수 있으나, 이에 제한되는 것은 아니며, 본 발명이 속하는 기술분야의 당업자가 염기서열 확인에 이용할 수 있는 다양한 방법들을 모두 포함할 수 있다.
보다 구체적으로, SNP 유전자형의 검출은 SNP가 위치하는 염기를 3' 말단으로 하여 고안한 프라이머를 포함한 프라이머 세트를 이용하여 전술한 SNP가 위치하는 DNA 단편을 증폭하는 PCR 방법이 이용될 수 있다.
예를 들어, 특정 염기가 A에서 G로 치환된 경우의 검출은 A를 3' 말단염기로 포함하는 프라이머 및 적당한 크기의 DNA 단편을 증폭할 수 있는 반대 방향 프라이머를 고안하여 PCR 반응을 수행할 수 있다. 이에, 전술한 SNP 위치의 염기가 A인 경우에는 증폭반응이 정상적으로 수행되어 원하는 위치의 밴드가 관찰되고, 전술한 염기가 G로 치환된 경우에는 프라이머는 주형 DNA에 상보결합할 수 있으나, 3' 말단 쪽이 상보결합을 하지 못하여 증폭 반응이 제대로 수행되지 않아 밴드가 관찰되지 않을 수 있다.
나아가, PCR 연장 분석은 먼저 단일염기 다형성이 위치하는 염기를 포함하는 DNA 단편을 프라이머 쌍으로 증폭을 한 다음, 반응에 첨가된 모든 뉴클레오타이드를 탈인산화시킴으로써 불활성화시키고, 여기에 SNP 특이적 연장 프라이머, dNTP 혼합물, 다이디옥시뉴클레오타이드, 반응 완충액 및 DNA 중합효소를 첨가하여 프라이머 연장반응을 수행함으로써 이루어 질 수 있다.
이때, 연장 프라이머는 SNP가 위치하는 염기의 5' 방향의 바로 인접한 염기를 3' 말단으로 삼으며, dNTP 혼합물에는 다이디옥시뉴클레오타이드와 동일한 염기를 갖는 핵산이 제외되고, 다이디옥시뉴클레오타이드는 SNP를 나타내는 염기 종류 중 하나에서 선택된다. 예를 들어, A에서 G로의 치환이 있는 경우에 dGTP, dCTP 및 TTP 혼합물과 ddATP를 첨가하면 프라이머는 DNA 중합효소에 의하여 연장되고, 몇개의 염기가 지난 후 A 염기가 최초로 나타나는 위치에서 ddATP에 의하여 프라이머 연장반응이 종결될 수 있다. 이때, 염기의 치환이 일어나지 않았다면, 그 위치에서 연장반응이 종결되므로, 연장된 프라이머의 길이를 비교함으로써 SNP를 나타내는 염기 종류를 판별할 수 있다.
나아가, 검출방법은 연장 프라이머 또는 다이디옥시뉴클레오타이드를 형광 표지한 경우에는 일반적인 염기서열 결정에 사용되는 유전자 분석기의 형광을 검출로 SNP를 검출할 수 있으며, 무-표지된 연장 프라이머 및 다이디옥시뉴클레오타이드를 사용할 경우에는 MALDITOF(matrix assisted laser desorption ionization-time of flight)기법을 이용하여 분자량을 측정함으로써 SNP를 검출할 수 있다. 그러나, 전술한 방법은 예시적인 SNP 검출 방법으로써, 이에 제한되는 것은 아니며, 다양한 방법이 이용되어 SNP 검출 방법이 수행될 수 있다.
그 다음, 검출된 유전자형을 기초로 개체에 대한 고혈압 발병 위험을 결정하는 단계(S120)에서는 전술한 방법에 의하여 검출된 SNP의 특정 염기를 통하여 개체의 소금 섭취에 따른 고혈압 발병의 위험을 결정할 수 있다. 보다 구체적으로, EML6, FGF5, NT5C2, ATP2B1 및 LINC00936 사이, PRDM8 및 FGF5 사이, C6orf10 및 HLA-DQB1 사이, RNF213, GML 및 CYP11B1 사이, CNNM2 및 NT5C2 사이, MYL2 및 CUX2 사이 및 JAG1 유전자 영역에 대한 각각의 서열번호 1 내지 11의 폴리뉴클레오티드에서 51 내지 101번째 해당하는 염기 중 하나에 따라, 미리 결정된 수준의 나트륨 섭취량에 따른 고혈압 발병 고위험군 및 저위험군으로 결정할 수 있다.
예를 들어, 먼저, EML6 유전자 영역에 대한 서열번호 1의 폴리뉴클레오티드에서 101번째 해당하는 염기는 G 또는 A를 포함할 수 있으며, 이때, 염기가 A인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 고혈압 발병 고위험군으로 결정할 수 있다.
그 다음, FGF5 유전자 영역에 대한 서열번호 2의 폴리뉴클레오티드에서 101번째 해당하는 염기는 A 또는 T를 포함할 수 있으며, 이때, 염기가 T인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 고혈압 발병 고위험군으로 결정할 수 있다.
그 다음, NT5C2 유전자 영역에 대한 서열번호 3의 폴리뉴클레오티드에서 101번째 해당하는 염기는 G 또는 A를 포함할 수 있으며, 이때, 염기가 A인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 고혈압 발병 저위험군으로 결정할 수 있다.
그 다음, ATP2B1 및 LINC00936 사이 유전자 영역에 대한 서열번호 4의 폴리뉴클레오티드에서 101번째 해당하는 염기는 C 또는 T를 포함할 수 있으며, 이때, 염기가 T인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 고혈압 발병 저위험군으로 결정할 수 있다.
그 다음, PRDM8 및 FGF5 사이 유전자 영역에 대한 서열번호 5의 폴리뉴클레오티드에서 101번째 해당하는 염기는 T 또는 C를 포함할 수 있으며, 이때, 염기가 C인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 소금 섭취 2g/day 이상인 경우, 고혈압 발병 고위험군으로 결정할 수 있다.
그 다음, C6orf10 및 HLA-DQB1 사이 유전자 영역에 대한 서열번호 6의 폴리뉴클레오티드에서 81번째 해당하는 염기는 T 또는 A를 포함할 수 있으며, 이때, 염기가 A인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 소금 섭취 2g/day 이상인 경우, 고혈압 발병 고위험군으로 결정할 수 있다.
그 다음, RNF213 유전자 영역에 대한 서열번호 7의 폴리뉴클레오티드에서 100번째 해당하는 염기는 G 또는 A를 포함할 수 있으며, 이때, 염기가 A인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 소금 섭취 2g/day 이상인 경우, 고혈압 발병 고위험군으로 결정할 수 있다.
그 다음, GML 및 CYP11B1 사이 유전자 영역에 대한 서열번호 8의 폴리뉴클레오티드에서 91번째 해당하는 염기는 A 또는 G를 포함할 수 있으며, 이때, 염기가 G인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 소금 섭취 2g/day 이상인 경우, 고혈압 발병 저위험군으로 결정할 수 있다.
그 다음, CNNM2 및 NT5C2 사이 유전자 영역에 대한 서열번호 9의 폴리뉴클레오티드에서 51번째 해당하는 염기는 ACACACAC 또는 AC를 포함할 수 있으며, 이때, 염기가 AC인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 소금 섭취 2g/day 이상인 경우, 고혈압 발병 저위험군으로 결정할 수 있다. 이때, CNNM2 및 NT5C2 사이 유전자 영역에 대한 서열번호 9의 폴리뉴클레오티드에서 51번째 해당하는 염기인 rs140473396는 여러 형태의 SNP가 삽입(Insertion) 및/또는 삭제(Deletion)이 반복되는 구간임에 따라, 서열번호 9의 폴리뉴클레오티드에서 51번째 해당하는 염기는 ACACACAC 또는 AC 뿐만 아니라, 더 다양한 염기의 배열이 포함될 수 있다.
그 다음, MYL2 및 CUX2 사이 유전자 영역에 대한 서열번호 10의 폴리뉴클레오티드에서 101번째 해당하는 염기는 T 또는 G를 포함할 수 있으며, 이때, 염기가 G인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 소금 섭취 2g/day 이상인 경우, 고혈압 발병 저위험군으로 결정할 수 있다.
마지막으로, JAG1 유전자 영역에 대한 서열번호 11의 폴리뉴클레오티드에서 101번째 해당하는 염기는 A 또는 G를 포함할 수 있으며, 이때, 염기가 G인 경우, 고혈압 발병 위험을 결정하는 단계(S120)에서는 개체를 소금 섭취 2g/day 이상인 경우, 고혈압 발병 저위험군으로 결정할 수 있다.
이에, 본 발명의 일 실시예 따른 고혈압에 대한 정보 제공 방법은 전술한 방법에 의하여, 소금 섭취에 따른 개체의 고혈압 발병 위험 및 감수성을 예측 및 진단할 수 있다.
나아가, 본 발명은 전술한 고혈압에 대한 정보 제공 방법에 기초한 조성물 및 이를 포함하는 키트를 제공할 수 있다.
먼저, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공용 조성물은 개체로부터 분리된 생물학적 시료의 DNA로부터 EML6, FGF5, NT5C2, ATP2B1 및 LINC00936 사이, PRDM8 및 FGF5 사이, C6orf10 및 HLA-DQB1 사이, RNF213, GML 및 CYP11B1 사이, CNNM2 및 NT5C2 사이, MYL2 및 CUX2 사이 및 JAG1 중 적어도 하나의 유전자 영역에 대한 SNP(single nucleotide polymorphism) 부위를 포함하는 폴리뉴클레오티드를 증폭 또는 검출하도록 구성된 프로브(probe) 또는 프라이머(primer) 제제를 포함할 수 있다.
이때, 프로브는 특정 유전자의 mRNA나 cDNA(complementary DNA), DNA 등에 특이적으로 결합할 수 있는 수개 내지 수백 개의 염기(base pair) 길이를 가지는 RNA 또는 DNA 등의 폴리뉴클레오티드 단편을 의미할 수 있으며, 육안으로 인식 가능하도록 프로브의 5' 또는 3' 말단에 형광 또는 방사선 등의 표지(labeling) 인자가 추가로 부착되어 있음에 따라, 결합하는 대상의 mRNA나 cDNA의 존재 유무, 발현양 등을 확인할 수 있다. 예를 들어, 프로브는 SNP에 결합하거나 SNP를 인식할 수 있는 즉, SNP를 포함하는 폴리뉴클레오티드 서열에 대해 상보적인 서열을 포함할 수 있다. 나아가, 프로브는 올리고 뉴클레오타이드 (oligonucleotide) 프로브, 단일 사슬 DNA(single stranded DNA) 프로브, 이중 사슬 DNA(double stranded DNA) 프로브, RNA 프로브 등의 형태일 수 있으며,
이때, 이러한 프로브의 선택 및 혼성화(hybridization) 조건은 당업계에 공지된 기술에 따라 적절하게 선택할 수 있다. 나아가, 프로브는 대립형질(또는 대 립유전자, allele)을 검출하기 위한 진단 방법 등에 사용될 수 있다. 이때, 진단 방법에는 서던 블롯 등과 같은 핵산의 혼성화에 근거한 검출 방법들이 포함되며, DNA 칩을 이용한 방법에서 DNA 칩의 기판에 미리 결합된 형태로도 제공될 수 있으나, 이에 제한되는 것은 아니다.
나아가, 프라이머는 DNA 합성의 개시점(starting point)으로 작용하는 짧은 단일가닥 올리고뉴클레오티드를 의미할 수 있다. 프라이머는 적합한 완충액(buffer) 및 온도 조건에서 주형 (template)인 폴리뉴클레오티드에 특이적으로 결합하고, DNA 중합효소(DNA polymerase)가 프라이머에 주형 DNA에 상보적인 염기를 갖는 뉴클레오사이드 트리포스페이트를 추가하여 연결함으로써 DNA가 합성된다. 프라이머는 일반적으로 15 내지 30개의 염기서열로 이루어져 있으며, 염기 구성과 길이에 따라 주형 가닥에 결합하는 온도(melting temperature, Tm)가 달라질 수 있다. 프라이머의 서열은 주형의 일부 염기 서열과 완전하게 상보적인 서열을 가질 필요는 없으며, 주형과 혼성화되어 프라이머 고유의 작용을 할 수 있는 범위 내에서의 충분한 상보성을 가지면 충분하다. 증폭 반응(polymerase chain reaction, PCR)을 위한 프라이머는 증폭하고자 하는 폴리뉴클 레오티드의 특정 구간의 양쪽 끝부분(5'말단 또는 3'말단)의 주형(또는 센스, sense)과 반대편(안티센스, antisense)에 각각 상보적으로 결합하는 한 쌍(세트)로 구성될 수 있다. 나아가, 프라이머는 당업자라면 전술한 서열번호 1 내지 11의 SNP 부위에 대한 cDNA 또는 유전적 DNA의 염기서열을 참조하여, 프라이머쌍을 용이하게 디자인할 수 있다.
또한, 본 발명은 전술한 고혈압에 대한 정보 제공 방법에 기초한 조성물의 프로브 또는 프라이머는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이때, 변형의 비-제한적인 예로는 메틸화, "캡핑", 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오티드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형 등을 포함할 수 있으나, 이에 제한되는 것은 아니다.
이에, 본 발명은 고혈압에 대한 정보 제공 방법에 기초한 조성물의 프로브 또는 프라이머는 EML6의 유전자 영역에 대한 서열번호 1에서 101번째 염기인 G 또는 A, FGF5의 유전자 영역에 대한 서열번호 2에서 101번째 염기인 A 또는 T, NT5C2의 유전자 영역에 대한 서열번호 3에서 101번째 염기인 G 또는 A, ATP2B1 및 LINC00936 사이의 유전자 영역에 대한 서열번호 4에서 101번째 염기인 C 또는 T, PRDM8 및 FGF5 사이의 유전자 영역에 대한 서열번호 5에서 101번째 염기인 T 또는 C, C6orf10 및 HLA-DQB1 사이의 유전자 영역에 대한 서열번호 6에서 81번째 염기인 T 또는 A, RNF213의 유전자 영역에 대한 서열번호 7에서 100번째 염기인 G 또는 A, GML 및 CYP11B1 사이의 유전자 영역에 대한 서열번호 8에서 91번째 염기인 A 또는 G, CNNM2 및 NT5C2 사이의 유전자 영역에 대한 서열번호 9에서 51번째 염기인 ACACACAC 또는 AC, MYL2 및 CUX2 사이의 유전자 영역에 대한 서열번호 10에서 101번째 염기인 T 또는 G 및 JAG1의 유전자 영역에 대한 서열번호 11에서 101번째 염기인 A 또는 G를 증폭 또는 검출할 수 있다.
그 다음, 본 발명은 고혈압에 대한 정보 제공 방법에 기초한 조성물을 포함하는 키트는 RT-PCR, ddPCR, 마이크로어레이 칩 및 DNA 칩 키트 중 적어도 하나일 수 있으며, 전술한 서열번호 1 내지 11의 SNP의 증폭을 통해 검출하거나, SNP의 발현 수준을 검출함으로써, 개체의 소금 섭취에 따른 고혈압에 대한 정보를 결정할 수 있다.
예를 들어, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에 기초한 조성물을 포함하는 키트가 RT-PCR 또는 dd-PCR을 수행하기 위해 필요한 키트일 경우, SNP에 대한 특이적인 각각의 프로브 또는 프라이머쌍 외에도, 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액, 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사효 소와 같은 효소, DNase, RNAse 억제제, DEPC-수(DEPC-water), 멸균수 등을 포함할 수 있으나, 이에 제한되는 것은 아니다. 또한, 대조군으로 사용되는 유전자에 특이적인 프라이머 쌍을 포함할 수 있다.
나아가, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에 기초한 조성물을 포함하는 키트는 DNA 칩을 수행하기 위한 키트일 수 있다. DNA 칩은 일반적으로 편평한 고체 지지판 표면에 핵산 종을 격자형 배열 (gridded array)로 부착한 것으로, 칩 표면에 핵산이 일정하게 배열되어, DNA 칩 상의 핵산과 칩 표면에 처리된 용액 내에 포함된 상보적인 핵산 간에 다중 혼성화 반응이 일어나 대량 병렬 분석이 가능하도록 하는 분석 도구이다.
더 나아가, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에 기초한 조성물을 포함하는 키트는 마이크로어레이 칩을 수행하기 위한 키트일 수 있다. 마이크로어레이 칩을 수행하기 위한 키트일 경우, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에 기초한 조성물을 포함하는 키트는 서열번호 1 내지 11 중 적어도 하나의 SNP를 포함하는 핵산이 고정화되어 있는 기판을 갖는 마이크로어레이를 포함할 수 있다. 마이크로어레이는 본 발명의 폴리뉴클레오티드, 프라이머 또는 프로브를 포함하는 것을 제외하고는 통상적인 마이크로어레이로 이루어질 수 있다. 마이크로어레이 상에서의 핵산의 혼성화 및 혼성화 결과의 검출은 당업계에 잘 알려져 있다. 이때, 검출은 예를 들어, 핵산 시료를 Cy3 및 Cy5와 같은 형광 물질을 포함하는 검출 가능한 신호를 발생시킬 수 있는 표지 인자로 표지한 다음, 마이크로어레이 상에 혼성화하고, 표지 물질로부터 발생하는 신호를 검출함으로써 혼성화 결과를 검출할 수 있다.
더 나아가, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에 기초한 조성물을 포함하는 키트는 측정된 유전자 영역에 대한 SNP의 유전자형에 따라, 소금 섭취에 따른 개체의 고혈압에 대한 발병 감수성을 나타내도록 구성된 표시 수단을 더 포함힐 수 있다. 보다 구체적으로, 표시 수단은, 서열번호 1 내지 11의 SNP 즉, 51 내지 101번째 염기 중 하나에 따라, 소금 섭취가 2g/day 미만인 경우의 고혈압에 대한 발병 감수성 및 소금 섭취가 2g/day 이상인 경우의 고혈압에 대한 발병 감수성 중 적어도 하나를 표시할 수 있으나, 이에 제한되는 것은 아니며, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법을 통하여 도출될 수 있는 다양한 정보를 모두 표시할 수 있다.
이상의 과정을 통하여, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법, 이에 기초한 조성물 및 이를 포함하는 키트는 유전자 검출 및 확인을 통하여, 개체에 대한 질병 즉, 고혈압을 예측 및 진단할 수 있으며, 또한, 고혈압에 주요 원인일 수 있는 소금 섭취에 따른 고혈압의 발병 감수성을 예측 및 진단하여, 영양학적 관리를 통한 개체의 고혈압 발병율을 감소시킬 수 있다.
이하에서는, 도 2 내지 도 7을 참조하여, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법의 SNP에 대하여 설명하도록 한다.
도 2는 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서의 분석 집단에 대한 선별 과정을 예시적으로 도시한 개략도이다.
본 발명의 발명자들은 한국인 게놈에 최적화된 유전자 변이를 선별하기 위하여, 먼저, 의료기관 및 의료관련 센터에서 건강 검진을 받은 40세 이상의 남녀를 표본으로 수집하였고, 이 중, 혈압, 허리 둘레, 체질량, 알코올, 흡연 및 운동 등의 자료에 대하여 결측치(missing value)가 있는 경우는 제외되었다.
그 다음, 선별된 집단 중 수축기 혈압 140 mmHg 이상(SBP≥140mmHg), 이완기 혈압 90 mmHg 이상(DBP≥90mmHg) 및 과거 고혈압 병력이 있는 환자의 경우는 고혈압 환자로 정의하였으며, 나트륨 섭취량에 따라 집단을 나누었다. 보다 구체적으로, 본 발명의 발명자들은 전술한 제외 기준이 적용된 집단을 고혈압 및 심혈관 질환이 없는 대조군(control group) 및 고혈압 및 심혈관 질환이 있는 환자군 즉, 사례군(case group)으로 나눈 다음, 다시 각각에 대한 집단 내에서, 나트륨 섭취량이 2g/일 이상인 그룹 1(group 1) 및 나트륨 섭취량이 2g/일 미만인 그룹 2(group 2)라 나누어 각각의 그룹들을 비교하였다.
이때, 각 그룹들의 비교는 EDTA을 포함하는 혈액 튜브에 혈액을 추출한 후, 한국 국립 바이오 뱅크의 array (KoreanChip)을 이용하여 각 그룹들의 SNP 유전자형을 추출하였다. 나아가, SNP 및 소금 섭취에 따른 고혈압의 연관성을 확인하기 위하여, 로지스틱 회귀 분석을 이용하여 오차 비율(Odds Ratio, OR) 및 95 % 신뢰 구간(confidence intervals, CI)를 산출하여 나타냈다.
이에 따라, 최종 수득된 집단 자료는 앞서 언급된 제외 기준이 적용됨으로서 소금 섭취 및 이에 따른 고혈압을 야기시킬 수 있는 유전자를 쉽게 확인할 수 있으며, 더 나아가 한국인에 최적화된 유전자를 선발할 수 있는 효과가 있다.
나아가, 도 3을 참조하면, 전술한 과정에 의하여 선발된 분석 집단에 대한 일반적인 특성 결과가 도시된다. 먼저, 고혈압에 유무에 상관없이, 나트륨 섭취가 2g/일 이상인 그룹은 허리 둘레(Waist circumferences) 및 이완기 혈압(DBP)이 나트륨 섭취가 2g/일 미만인 그룹보다 유의하게 높은 것으로 나타난다(P-value1<0.0001).
나아가, 고혈압이 없으며, 나트륨 섭취가 2g/일 이상인 그룹은 평균 허리 둘레(Waist circumferences), 수축기 혈압(SBP) 및 이완기 혈압(DBP)이 나트륨 섭취가 2g/일 미만인 그룹보다 유의하게 높은 것으로 나타난다(P-value2<0.0001).
더 나아가, 고혈압을 가지고 있으며, 나트륨 섭취가 2g/일 이상인 그룹은 체질량 지수(BMI) 및 허리 둘레(Waist circumferences)가 나트륨 섭취가 2g/일 미만인 그룹보다 유의하게 높은 것으로 나타난다(P-value3<0.0001).
결과적으로, 나트륨 섭취에 따라, 체질량 지수(BMI), 허리 둘레(Waist circumferences), 수축기 혈압(SBP) 및 이완기 혈압(DBP)이 달라질 수 있다.
도 4a 및 4b는 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서의 한국인에 따른 고혈압 감수성 유전자 결과이다.
먼저, 도 4a를 참조하면, 종래의 전장 유전체 연관 분석(genome-wide association study, GWAS)에서 밝혀진 고혈압 감수성에 대한 유전자 좌위(loci) 즉, SNP가 도시된다. 종래에 밝혀진 고혈압 감수성에 대한 SNP는 rs12037987, rs13394970, rs72806698, rs73029563, rs388224, rs16998073, rs6590816, rs11105365 및 rs167479을 포함할 수 있으며, 이들의 오즈비(Odds Ratio, OR)은 0.899 내지 1.240인 것으로 나타난다. 즉, 개체가 종래의 rs12037987, rs13394970, rs72806698, rs73029563, rs388224, rs16998073, rs6590816, rs11105365 및 rs167479 중 적어도 하나를 포함한 경우, 이를 포함하지 않은 개체보다 0.899 내지 1.240배 정도 고혈압에 대한 감수성 높은 것으로 나타남에 따라, 고혈압 발생율이 높아질 수 있다.
그 다음, 도 4b를 참조하면, 전술한 도 2의 결정된 집단을 통하여 선택된 고혈압 감수성에 대한 유전자 좌위(loci) 즉, SNP가 도시된다. 전술한 도 2의 결정된 집단을 통하여 선택된 고혈압 감수성에 대한 SNP는 총 1,278개이며, 이 중 고혈압과 관련하여 연관성이 높은 SNP는 rs3821843, rs6831174, rs112590692, rs2472928, rs3819305, rs7812039, rs4527847, rs4948645, rs140473396, rs7938342, rs7485618, rs112735431 및 rs913220인 것으로 나타나며(P<1X10-8), 이들의 오즈비는 0.848 내지 1.651인 것으로 나타난다. 즉, 개체가 rs3821843, rs6831174, rs112590692, rs2472928, rs3819305, rs7812039, rs4527847, rs4948645, rs140473396, rs7938342, rs7485618, rs112735431 및 rs913220 중 적어도 하나를 포함한 경우, 이를 포함하지 않은 개체보다 0.848 내지 1.651배 정도 고혈압에 대한 감수성이 높은 것으로 나타나며, 이는 전술한 종래의 SNP와 유사한 수준인 것으로 나타난다.
나아가, 도 4b에 도시된 SNP는 전술한 종래의 도 4a의 SNP와 전혀 상이한 SNP인 것으로 나타난다. 즉, 이러한 많은 SNP에 대한 결과는 집단에 따라 특이적으로 고혈압에 대하여 감수성을 갖게 하는 유전자가 존재하는 것을 의미할 수 있다.
도 5는 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서의 나트륨 섭취량에 따른 고혈압 감수성 유전자 좌위와 관련된 SNP 결과이다.
먼저, 나트륨 섭취가 2g/일 미만인 경우, 고혈압과 통계적으로 유의하게 연관성 있는 SNP는 rs67617923, rs16998073, rs11191582 및 rs11105378인 것으로 나타난다(P=5X10-6 내지 P=5X10-9).
이 중, rs67617923 및 rs16998073는 각각 오즈비가 1.294 및 1.245로서, 개체가 rs67617923 및 rs16998073를 포함한 경우, 이를 포함하지 않은 개체보다 각각 1.294 및 1.245배 정도 고혈압 발병율이 높은 것으로 나타난다. 이에, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서는 개체가 rs67617923 및 rs16998073 중 적어도 하나를 포함한 경우, 개체를 고혈압 발병 고위험군으로 결정할 수 있다. 즉, rs67617923 및 rs16998073 중 적어도 하나를 포함하는 개체는, 이를 포함하지 않는 개체보다 나트륨에 대한 감수성이 높으며, 이에 따른 고혈압 발병율도 높을 수 있다.
이때, rs67617923는 EML6 유전자에 포함된 SNP이며, 2번 염색체의 54968517 bp 위치의 A 유전자형(염기)일 수 있다. 또한, rs16998073는 FGF5 유전자에 포함된 SNP이며, 4번 염색체의 81184341 bp 위치의 T 유전자형(염기)일 수 있다.
그 다음, rs11191582 및 rs11105378는 각각 오즈비가 0.849 및 0.874로서, 개체가 rs67617923 및 rs16998073를 포함한 경우, 이를 포함하지 않은 개체보다 각각 0.849 및 0.874배 정도 고혈압 발병율이 낮은 것으로 나타난다. 이에, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서는 개체가 rs11191582 및 rs11105378 중 적어도 하나를 포함한 경우, 개체를 고혈압 발병 저위험군으로 결정할 수 있다.
이때, rs11191582는 NT5C2 유전자에 포함된 SNP이며, 10번 염색체의 104913653 bp 위치의 A 유전자형(염기)일 수 있다. 또한, rs11105378는 ATP2B1 및 LINC00936 사이 유전자 영역에 포함된 SNP이며, 12번 염색체의 90090741 bp 위치의 T 유전자형(염기)일 수 있다.
나아가, 나트륨 섭취가 2g/일 이상인 경우, 고혈압과 통계적을 유의하게 연관성 있는 SNP는 rs12509595, rs6913309, rs112735431, rs3819496, rs140473396, rs12229654, rs112735431 및 rs1887320인 것으로 나타난다(P=5X10-6 내지 P=5X10-9).
이 중, rs12509595, rs6913309 및 rs112735431는 각각 오즈비가 1.228, 1.145 및 1.706으로서, 개체가 rs12509595, rs6913309 및 rs112735431를 포함한 경우, 이를 포함하지 않은 개체보다 각각 1.228, 1.145 및 1.706배 정도 고혈압 발병율이 높은 것으로 나타난다. 이에, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서는 개체가 rs12509595, rs6913309 및 rs112735431 중 적어도 하나를 포함한 경우, 개체를 나트륨 섭취 2g/day 이상인 경우, 고혈압 발병 고위험군으로 결정할 수 있다. 즉, rs12509595, rs6913309 및 rs112735431 중 적어도 하나를 포함하는 개체는, 이를 포함하지 않는 개체보다 나트륨에 대한 감수성이 높으며, 이에 따른 고혈압 발병율도 높을 수 있다.
이때, rs12509595는 PRDM8 및 FGF5 사이 유전자 영역에 포함된 SNP이며, 4번 염색체의 81182554 bp 위치의 C 유전자형(염기)일 수 있다. 또한, rs6913309는 C6orf10 및 HLA-DQB1 사이 유전자 영역에 포함된 SNP이며, 6번 염색체의 32339840 bp 위치의 A 유전자형(염기)일 수 있다. 또한, rs112735431는 RNF213 유전자에 포함된 SNP이며, 17번 염색체의 78358945 bp 위치의 A 유전자형(염기)일 수 있다.
그 다음, rs3819496, rs140473396, rs12229654 및 rs1887320은 각각 오즈비가 0.892, 0.836, 0.834 및 0.892로서, 개체가 rs3819496, rs140473396, rs12229654 및 rs1887320를 포함한 경우, 이를 포함하지 않은 개체보다 각각 0.892, 0.836, 0.834 및 0.892배 정도 고혈압 발병율이 낮은 것으로 나타난다. 이에, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서는 개체가 rs3819496, rs140473396, rs12229654 및 rs1887320 중 적어도 하나를 포함한 경우, 개체를 나트륨 섭취 2g/day 이상인 경우, 고혈압 발병 저위험군으로 결정할 수 있다. 즉, rs3819496, rs140473396, rs12229654 및 rs1887320 중 적어도 하나를 포함하는 개체는, 이를 포함하지 않는 개체보다 나트륨에 대한 감수성이 낮으며, 이에 따른 고혈압 발병율도 낮을 수 있다.
이때, rs3819496는 GML 및 CYP11B1 사이 유전자 영역에 포함된 SNP이며, 8번 염색체의 143923891 bp 위치의 G 유전자형(염기)일 수 있다. 또한, rs140473396는 CNNM2 및 NT5C2 사이 유전자 영역에 포함된 SNP이며, 10번 염색체의 104795885 bp 위치의 AC 유전자형(염기)일 수 있다. 또한, rs12229654는 MYL2 및 CUX2 사이 유전자 영역에 포함된 SNP이며, 12번 염색체의 111414461 bp 위치의 G 유전자형(염기)일 수 있다. 또한, rs1887320는 JAG1 유전자에 포함된 SNP이며, 20번 염색체의 10965998 bp 위치의 G 유전자형(염기)일 수 있다.
이에, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법은 rs67617923, rs16998073, rs11191582, rs11105378, rs12509595, rs6913309, rs112735431, rs3819496, rs140473396, rs12229654 및 rs1887320 중 적어도 하나를 통하여, 개체에 대한 나트륨 섭취량에 따른 고혈압에 대한 발병 위험을 예측 및 진단할 수 있다.
나아가, 도 6a 및 6b를 참조하면, 전술한 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서의 SNP에 대한 결과가 도시된다.
먼저, 도 6a를 참조하면, 나트륨 섭취가 2g/일 미만인 경우, 고혈압에 대한 발병 위험을 예측 및 진단할 수 있는 SNP가 도시된다.
나트륨 섭취가 2g/일 미만인 경우, 고혈압에 대한 발병율을 증가시킬 수 있는 SNP는 rs67617923 및 rs16998073을 포함하는 것으로 나타난다.
이때, rs67617923는 EML6 유전자 영역에 대한 서열번호 1에서 101번째 염기가 A이며, 이를 검출함으로써, 개체를 나트륨에 대한 감수성이 높음에 따라, 소량의 나트륨 섭취에도 고혈압이 발병할 수 있는 고혈압 발병 고위험군으로 결정할 수 있다. 나아가, EML6 유전자 영역에 대한 서열번호 1에서 101번째 염기가 G인 경우에는, 개체를 정상 또는 고혈압 발병 저위험군으로 결정할 수 있다.
또한, rs16998073는 FGF5 유전자 영역에 대한 서열번호 2에서 101번째 염기가 T이며, 이를 검출함으로써, 개체를 나트륨에 대한 감수성이 높음에 따라, 소량의 나트륨 섭취에도 고혈압이 발병할 수 있는 고혈압 발병 고위험군으로 결정할 수 있다. 나아가, FGF5 유전자 영역에 대한 서열번호 2에서 101번째 염기가 A인 경우에는, 개체를 정상 또는 고혈압 발병 저위험군으로 결정할 수 있다.
나트륨 섭취가 2g/일 미만인 경우, 고혈압에 대한 발병율을 감소시킬 수 있는 SNP는 rs11191582 또는 rs11105378을 포함하는 것으로 나타난다.
이때, rs11191582는 NT5C2 유전자 영역에 대한 서열번호 3에서 101번째 염기가 A이며, 이를 검출함으로써, 개체를 고혈압 발병 저위험군으로 결정할 수 있다. 나아가, NT5C2 유전자 영역에 대한 서열번호 3에서 101번째 염기가 G인 경우에는, 개체를 정상으로 결정할 수 있다.
또한, rs11105378는 ATP2B1 및 LINC00936 사이 유전자 영역에 대한 서열번호 4에서 101번째 염기가 T이며, 이를 검출함으로써, 개체를 고혈압 발병 저위험군으로 결정할 수 있다. 나아가, ATP2B1 및 LINC00936 사이 유전자 영역에 대한 서열번호 4에서 101번째 염기가 C인 경우에는, 개체를 정상으로 결정할 수 있다.
그 다음, 도 6b를 참조하면, 나트륨 섭취가 2g/일 이상인 경우, 고혈압에 대한 발병 위험을 예측 및 진단할 수 있는 SNP가 도시된다.
나트륨 섭취가 2g/일 이상인 경우, 고혈압에 대한 발병율을 증가시킬 수 있는 SNP는 rs12509595, rs6913309 및 rs112735431을 포함하는 것으로 나타난다.
이때, rs12509595는 PRDM8 및 FGF5 사이 유전자 영역에 대한 서열번호 5에서 101번째 염기가 C이며, 이를 검출함으로써, 개체를 나트륨에 대한 감수성이 높음에 따라, 나트륨 섭취가 2g/일 이상인 경우, 고혈압이 발병할 수 있는 고혈압 발병 고위험군으로 결정할 수 있다. 나아가, PRDM8 및 FGF5 사이 유전자 영역에 대한 서열번호 5에서 101번째 염기가 T인 경우에는, 개체를 정상 또는 고혈압 발병 저위험군으로 결정할 수 있다.
또한, rs6913309는 C6orf10 및 HLA-DQB1 사이 유전자 영역에 대한 서열번호 6에서 81번째 염기가 A이며, 이를 검출함으로써, 개체를 나트륨에 대한 감수성이 높음에 따라, 나트륨 섭취가 2g/일 이상인 경우, 고혈압이 발병할 수 있는 고혈압 발병 고위험군으로 결정할 수 있다. 나아가, C6orf10 및 HLA-DQB1 사이 유전자 영역에 대한 서열번호 6에서 81번째 염기가 T인 경우에는, 개체를 정상 또는 고혈압 발병 저위험군으로 결정할 수 있다.
또한, rs112735431는 RNF213 유전자 영역에 대한 서열번호 7에서 100번째 염기가 A이며, 이를 검출함으로써, 개체를 나트륨에 대한 감수성이 높음에 따라, 나트륨 섭취가 2g/일 이상인 경우, 고혈압이 발병할 수 있는 고혈압 발병 고위험군으로 결정할 수 있다. 나아가, RNF213 유전자 영역에 대한 서열번호 7에서 100번째 염기가 G인 경우에는, 개체를 정상 또는 고혈압 발병 저위험군으로 결정할 수 있다.
나트륨 섭취가 2g/일 이상인 경우, 고혈압에 대한 발병율을 증가시킬 수 있는 SNP는 rs3819496, rs140473396, rs12229654 및 rs1887320을 포함하는 것으로 나타난다.
이때, rs3819496는 GML 및 CYP11B1 사이 유전자 영역에 대한 서열번호 8에서 91번째 염기가 G이며, 이를 검출함으로써, 개체를 고혈압 발병 저위험군으로 결정할 수 있다. 나아가, GML 및 CYP11B1 사이 유전자 영역에 대한 서열번호 8에서 91번째 염기가 A인 경우에는, 개체를 정상으로 결정할 수 있다.
또한, rs140473396는 CNNM2 및 NT5C2 사이 유전자 영역에 대한 서열번호 9에서 51번째 염기가 AC이며, 이를 검출함으로써, 개체를 고혈압 발병 저위험군으로 결정할 수 있다. 나아가, CNNM2 및 NT5C2 사이 유전자 영역에 대한 서열번호 9에서 51번째 염기가 AC인 경우에는, 개체를 정상으로 결정할 수 있다.
또한, rs12229654는 MYL2 및 CUX2 사이 유전자 영역에 대한 서열번호 10에서 101번째 염기가 G이며, 이를 검출함으로써, 개체를 고혈압 발병 저위험군으로 결정할 수 있다. 나아가, MYL2 및 CUX2 사이 유전자 영역에 대한 서열번호 10에서 101번째 염기가 T인 경우에는, 개체를 정상으로 결정할 수 있다.
또한, rs1887320는 JAG1 유전자 영역에 대한 서열번호 11에서 101번째 염기가 G이며, 이를 검출함으로써, 개체를 고혈압 발병 저위험군으로 결정할 수 있다. 나아가, JAG1 유전자 영역에 대한 서열번호 11에서 101번째 염기가 A인 경우에는, 개체를 정상으로 결정할 수 있다.
관련하여, 도 7을 참조하면, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서의 SNP를 포함하는 유전자 영역에 대한 마이애미 플롯 결과가 도시된다. 이때, 마이애미 플롯(Miami plot)은 각 SNP에서의 통계값 즉, p-value를 SNP의 유전체 내 위치에 따라 산점도(scatter plot)로 표시하여 시각화한 도표이며, 이를 통하여 표현형과 연관성을 보이는 경우, 해당 좌위(locus)에서 역치 이상 또는 역치 근처의 유의성을 보이는 SNP가 무리지어 나타날 수 있다.
나트륨을 2g/일 이상으로 섭취한 경우, p value 5x10-8 이하의 통계적으로 유의적인 SNP를 포함하는 유전자는 FGF5, HLA-DQ5, CYP17A1, CNNM2, NT5C2, ATP2B1, MYL2, RNF213 및 JAG1을 포함하는 것으로 나타난다. 즉, 전술한 FGF5, HLA-DQ5, CYP17A1, CNNM2, NT5C2, ATP2B1, MYL2, RNF213 및 JAG1 유전자 영역에 대한 SNP가 다른 SNP보다 나트륨 2g/일 이상 섭취한 경우의 고혈압과 유의적으로 연관성을 가지는 것으로 의미할 수 있다.
이에, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서 나트륨 섭취 2g/일 이상 경우, 고혈압과 연관성을 갖는 SNP의 유전자는 PRDM8 - FGF5, C6orf10 - HLA-DQB1, RNF213, GML - CYP11B1, CNNM2 - NT5C2, MYL2 - CUX2 및 JAG1 중 적어도 하나를 포함할 수 있으며, GML - CYP11B1를 제외한 SNP들은 전술한 마이애미 플롯에서 높은 유의성을 보임에 따라, 보다 예측력 및 진단력이 높은 마커일 수 있다. 이에, 바람직하게는, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서 나트륨 섭취 2g/일 이상 경우, 고혈압과 연관성을 갖는 SNP의 유전자는 PRDM8 - FGF5, C6orf10 - HLA-DQB1, RNF213, CNNM2 - NT5C2, MYL2 - CUX2 및 JAG1 중 적어도 하나일 수 있다.
나아가, 나트륨을 2g/일 미만으로 섭취한 경우, p value 5x10-8 이하의 유의적인 SNP를 포함하는 유전자는 SPTBN1, FGF5, CYP17A1, CNNM2, NT5C2 및 ATP2B1을 포함하는 것으로 나타난다. 즉, 전술한 SPTBN1, FGF5, CYP17A1, CNNM2, NT5C2 및 ATP2B1 유전자 영역에 대한 SNP가 다른 SNP보다 나트륨 2g/일 미만 섭취한 경우의 고혈압과 유의적으로 연관성을 가지는 것으로 의미할 수 있다.
이에, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서 나트륨 섭취 2g/일 미만인 경우, 고혈압과 연관성을 갖는 SNP의 유전자는 EML6, FGF5, NT5C2 및 ATP2B1 - LINC00936 중 적어도 하나를 포함할 수 있으며, EML6를 제외한 SNP들은 전술한 마이애미 플롯에서 높은 유의성을 보임에 따라, 보다 예측력 및 진단력이 높은 마커일 수 있다. 이에, 바람직하게는, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법에서 나트륨 섭취 2g/일 미만인 경우, 고혈압과 연관성을 갖는 SNP의 유전자는 FGF5, NT5C2 및 ATP2B1 - LINC00936 중 적어도 하나일 수 있다.
이상의 결과에 따라, 본 발명의 일 실시예에 따른 고혈압에 대한 정보 제공 방법은 나트륨 섭취에 따른 높은 통계학적 유의성 및 연관성을 가진 마커를 제공함으로써, 보다 정확하게 고혈압을 예측 및 진단할 수 있으며, 나아가, 고혈압을 조기에 예측 및 진단함으로써, 개체가 스스로 고혈압 예방 및 치료를 위한 영양학적 관리를 수행할 수 있어 고혈압에 대한 치료적 효과가 증진될 수 있다.
이상 첨부된 도면을 참조하여 본 발명의 실시 예들을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시 예로 국한되는 것은 아니고, 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서, 본 발명에 개시된 실시 예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시 예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 그러므로, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.