KR102254341B1 - methods for diagnosing the high risk group of Diabetes based on Genetic Risk Score - Google Patents
methods for diagnosing the high risk group of Diabetes based on Genetic Risk Score Download PDFInfo
- Publication number
- KR102254341B1 KR102254341B1 KR1020200132461A KR20200132461A KR102254341B1 KR 102254341 B1 KR102254341 B1 KR 102254341B1 KR 1020200132461 A KR1020200132461 A KR 1020200132461A KR 20200132461 A KR20200132461 A KR 20200132461A KR 102254341 B1 KR102254341 B1 KR 102254341B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- polymorphic site
- allele
- genotype
- diabetes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002068 genetic effect Effects 0.000 title claims abstract description 78
- 238000000034 method Methods 0.000 title claims abstract description 54
- 206010012601 diabetes mellitus Diseases 0.000 title abstract description 31
- 239000008280 blood Substances 0.000 claims abstract description 38
- 210000004369 blood Anatomy 0.000 claims abstract description 38
- 238000003745 diagnosis Methods 0.000 claims abstract description 7
- 208000001072 type 2 diabetes mellitus Diseases 0.000 claims description 89
- 108700028369 Alleles Proteins 0.000 claims description 88
- 239000003550 marker Substances 0.000 claims description 39
- 239000000523 sample Substances 0.000 claims description 27
- 239000002773 nucleotide Substances 0.000 claims description 24
- 125000003729 nucleotide group Chemical group 0.000 claims description 24
- 239000000203 mixture Substances 0.000 claims description 21
- 108091033319 polynucleotide Proteins 0.000 claims description 15
- 239000002157 polynucleotide Substances 0.000 claims description 15
- 102000040430 polynucleotide Human genes 0.000 claims description 15
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 14
- 239000008103 glucose Substances 0.000 claims description 14
- 239000012472 biological sample Substances 0.000 claims description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 3
- 210000002381 plasma Anatomy 0.000 claims description 2
- 210000003296 saliva Anatomy 0.000 claims description 2
- 210000002966 serum Anatomy 0.000 claims description 2
- 230000035772 mutation Effects 0.000 abstract description 23
- 201000010099 disease Diseases 0.000 abstract description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 11
- 230000002265 prevention Effects 0.000 abstract description 5
- 230000007613 environmental effect Effects 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 59
- 241000282414 Homo sapiens Species 0.000 description 57
- 238000004458 analytical method Methods 0.000 description 24
- 230000000694 effects Effects 0.000 description 17
- 150000007523 nucleic acids Chemical group 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 11
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 230000007614 genetic variation Effects 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- 206010022489 Insulin Resistance Diseases 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 239000003298 DNA probe Substances 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000017011 Glycated Hemoglobin A Human genes 0.000 description 2
- 102000004877 Insulin Human genes 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 2
- 238000012097 association analysis method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000003935 denaturing gradient gel electrophoresis Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 108091005995 glycated hemoglobin Proteins 0.000 description 2
- 201000001421 hyperglycemia Diseases 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000007410 oral glucose tolerance test Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 238000012502 risk assessment Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- 206010010071 Coma Diseases 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 101000829171 Hypocrea virens (strain Gv29-8 / FGSC 10586) Effector TSP1 Proteins 0.000 description 1
- 206010052341 Impaired insulin secretion Diseases 0.000 description 1
- 102000003746 Insulin Receptor Human genes 0.000 description 1
- 108010001127 Insulin Receptor Proteins 0.000 description 1
- 206010023379 Ketoacidosis Diseases 0.000 description 1
- 208000007976 Ketosis Diseases 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 108020004518 RNA Probes Proteins 0.000 description 1
- 239000003391 RNA probe Substances 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000007844 allele-specific PCR Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000025938 carbohydrate utilization Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000005786 degenerative changes Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 238000011841 epidemiological investigation Methods 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 230000009229 glucose formation Effects 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 208000017169 kidney disease Diseases 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000010197 meta-analysis Methods 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000003234 polygenic effect Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 235000017924 poor diet Nutrition 0.000 description 1
- 239000013615 primer Substances 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000001373 regressive effect Effects 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Data Mining & Analysis (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Physiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Crystallography & Structural Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
본 발명은 유전적 위험도 평가 기반의 당뇨병 고위험군을 진단하는 방법에 관한 것이다.The present invention relates to a method for diagnosing a high risk group of diabetes based on genetic risk assessment.
탄수화물 이용이 감소되고 지질 및 단백질 이용이 강화된 대사 질환인 당뇨병은 인슐린의 절대적 결핍 또는 상대적 결핍에 의해 유발된다. 보다 심각한 경우에, 당뇨병은 만성 고지혈증, 당뇨, 수분 및 전해질 손실, 케토산증 및 혼수 (coma)를 특징으로 한다. 장기 합병증은 신경병증, 신장병증 (nephropathy), 대소 혈관의 전신 퇴화성변화 (generalized degenerative change) 및 감염에 대한 증가된 감수성을 포함한다. 가장 일반적인 형태의 당뇨병은 표적 조직에서 손상된 인슐린 분비 및 인슐린 내성에 의한 고혈당증을 특징으로 하는 제2형 당뇨병이다.Diabetes, a metabolic disease with reduced carbohydrate utilization and enhanced lipid and protein utilization, is caused by an absolute or relative deficiency of insulin. In more severe cases, diabetes is characterized by chronic hyperlipidemia, diabetes, loss of water and electrolytes, ketoacidosis, and coma. Long-term complications include neuropathy, nephropathy, generalized degenerative changes in large and small vessels, and increased susceptibility to infection. The most common form of diabetes is
제2형 당뇨병은 인슐린 저항성이 있는 것이 특징이며, 인체조직의 인슐린에 대한 반응 결손은 인슐린 수용체와 관련이 있다고 여겨지고 있다. 제2형 당뇨병 초기에 나타나는 이상 증세는 인슐린 감수성의 감소이며, 이 단계에서는 인슐린 감수성을 향상시키거나 간의 포도당 생산을 줄이는 투약과 다양한 조치로 고혈당증이 역전될 수 있다. 제2형 당뇨병은 주로 생활방식의 요소나 유전에 의하며, 비만 (체질량 지수 30 초과로 정의), 운동 부족, 부실한 식사, 스트레스, 도시화 등을 포함한 몇 가지 생활방식 요소들은 제2형 당뇨병의 발생에 있어 중요하다고 알려져 있다.
또한, 대한당뇨병학회에 따르면 2016년 기준 30세 이상 성인 7명 중 1명이 당뇨병 환자이고, 전국적으로 약 501만명의 환자가 있을 것으로 추정하고 있다. 당뇨병 진료비는 2010년 1조 4천억원에서 2015년 1조 8천억원으로 33.3% 증가하는 등 당뇨병으로 인한 대한민국의 사회경제적 부담이 가속화고 있다.In addition, according to the Korean Diabetes Association, it is estimated that as of 2016, 1 out of 7 adults over the age of 30 is diabetic, and there are about 5,100,000 patients nationwide. Diabetes medical expenses increased 33.3% from 1.4 trillion won in 2010 to 1.8 trillion won in 2015, accelerating the socio-economic burden of diabetes in Korea.
기존에 당뇨병 진단을 위해 사용되는 혈당, 당화혈색소 등 임상역학 변수와 다양한 마커 등의 수치는 당뇨병 발생이 급격하게 증가하는 40대 이후에 주로 차이가 나타나기 때문에, 단기간 변화에 대한 당뇨병 예측에 활용 될 수 있으나 40대 이전에 고위험군을 조기에 선별하고 예방에 활용하기 어렵다는 문제가 있다. 또한, 기존에 발굴된 수십개 수준의 유전변이 정보를 이용하여 제2형 당뇨를 예측하는 방법이 제안된바 있으나 질환 예측률이 낮고 (약 70% 수준) 질환에 대한 통계적인 설명력이 낮다는 단점이 있다. 최근 연구에서는 전장유전체연관성분석법 (Genome-wide association study, 이하 GWAS)을 이용하여 제2형 당뇨병에 관련된 약 300여개의 유전변이를 보고하고 있다. 이러한 유전변이 정보를 이용하여 인구집단 내 상위 5%에 해당하는 제2형 당뇨의 유전적 고위험군을 분석하였을 때, 나머지 95% 인구집단에 비해서 약 2~3배 당뇨 발병율이 높다는 것이 확인되었다. 그러나, 이때 선별된 고위험군들 중 당뇨병이 없는 정상군도 상당수 있는 것으로 나타났다. 따라서, 제2형 당뇨병의 유전적 고위험군 선별에 대하여 정확도가 우수한 키트 개발이 필요한 실정이다.Since the levels of clinical epidemiologic variables such as blood sugar and glycated hemoglobin and various markers, which have been used for diabetic diagnosis, mainly differ after the 40s when the incidence of diabetes increases rapidly, they can be used to predict diabetes against short-term changes. However, there is a problem that it is difficult to select high-risk groups early and use them for prevention before their 40s. In addition, a method for predicting
본 발명의 목적은 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법을 제공하는 데 있다.An object of the present invention is to provide a method of providing information necessary for diagnosing or predicting the onset of
또한, 본 발명의 다른 목적은 제2형 당뇨병 진단 또는 발병 예측용 다형성 마커 조성물을 제공하는 데 있다.In addition, another object of the present invention is to provide a polymorphic marker composition for diagnosing or predicting the onset of
또한, 본 발명의 다른 목적은 상기 마커 조성물을 포함하는 제2형 당뇨병 진단 또는 발병 예측용 조성물을 제공하는 데 있다.In addition, another object of the present invention is to provide a composition for diagnosing or predicting the onset of
또한, 본 발명의 다른 목적은 상기 마커 조성물을 포함하는 제2형 당뇨병 발병 위험을 예측하기 위한 키트를 제공하는 데 있다.In addition, another object of the present invention is to provide a kit for predicting the risk of developing
생물학적 시료로부터 서열번호 1 내지 26의 6 번째 염기서열에 위치하는 다형성 부위를 포함하는 공복혈당 관련 다형성 마커 (polymorphic marker)에 대한 유전적 위험도 점수 (Genetic Risk Score, GRS)를 계산하는 단계;Calculating a genetic risk score (GRS) for a fasting blood sugar-related polymorphic marker including a polymorphic site located in the sixth nucleotide sequence of SEQ ID NOs: 1 to 26 from the biological sample;
생물학적 시료로부터 제2형 당뇨병 관련 다형성 마커 (polymorphic marker)에 대한 유전적 위험도 점수 (Genetic Risk Score, GRS)를 계산하는 단계;Calculating a genetic risk score (GRS) for a
공복혈당 유전적 위험도 점수 및 제2형 당뇨병 유전적 위험도 점수 각각을 기반으로 고위험군을 선별하는 단계;Selecting a high-risk group based on each of the fasting glucose genetic risk score and the
공복혈당 유전적 위험도 기반 고위험군 및 제2형 당뇨병 유전적 위험도 기반 고위험군에 모두 속하면 제2형 당뇨병 고위험군으로 판단하는 단계;를 포함하는 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법을 제공한다.A method of providing information necessary for diagnosing or predicting the onset of
이어서, 본 발명은 서열번호 1 내지 26의 염기서열로 표시되는 폴리뉴클레오티드에서, 각 염기서열의 6번째에 위치하는 다형성 부위를 포함하는 10개 이상의 연속적인 염기서열로 구성된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는, 제2형 당뇨병 진단 또는 발병 예측용 다형성 마커 조성물을 제공한다.Subsequently, in the polynucleotide represented by the nucleotide sequence of SEQ ID NO: 1 to 26, a polynucleotide composed of 10 or more consecutive nucleotide sequences including a polymorphic site located at the sixth position of each nucleotide sequence or a complementary polynucleotide thereof It provides a polymorphic marker composition for diagnosing or predicting the onset of
아울러, 본 발명은 상기 마커 조성물을 포함하는 제2형 당뇨병 진단 또는 발병 예측용 조성물을 제공한다.In addition, the present invention provides a composition for diagnosing or predicting the onset of
마지막으로, 본 발명은 상기 마커 조성물을 포함하는 제2형 당뇨병 진단 또는 발병 예측용 키트를 제공한다.Finally, the present invention provides a kit for diagnosing or predicting the onset of
본 발명의 제2형 당뇨병 진단 또는 발병 예측 방법은 제2형 당뇨병과 관련하여 기 보고된 유전변이 175개 유전변이와 공복혈당과 연관성을 나타내는 56개 유전변이에 대한 유전적 위험도를 점수화하여 복합적으로 분석함으로써 나이와 성별, 환경적인 영향 등의 추가적인 검사 없이 각 개인의 유전정보만을 이용하여 제2형 당뇨의 유전적 고위험군을 선별할 수 있으며 제2형 당뇨의 유전적 고위험군 선별에 따라 맞춤형 진료, 치료 및 예방에 활용할 수 있다.The method for diagnosing or predicting the onset of
도 1은 한국인칩 유전체정보 정도관리 흐름도를 도식화하여 나타낸 것이다.
도 2는 한국인칩의 주요 콘텐츠를 나타낸 표이다.
도 3은 분석 대상자의 기초 통계 자료를 나타낸 표이다.
도 4는 공복혈당 관련 56개 유전변이의 맨하탄 플롯 (Manhattan plot) 결과를 나타낸 그래프이다.
도 5는 공복혈당에 따른 제2형 당뇨병 유병률 변화를 나타낸 그래프이다.1 is a schematic diagram of a flow chart of quality control of Korean chip genome information.
2 is a table showing the main contents of the Korean chip.
3 is a table showing basic statistical data of an analysis subject.
4 is a graph showing the results of a Manhattan plot of 56 genetic variants related to fasting blood sugar.
5 is a graph showing the change in the prevalence of
이하, 본 발명에서 사용되는 용어를 상세히 설명한다.Hereinafter, terms used in the present invention will be described in detail.
본 발명에서 사용되는 용어 “다형성 (polymorphism)”이란 하나의 유전자 좌위 (locus)에 두 가지 이상의 대립 유전자 (allele)가 존재하는 경우를 말하며 다형성 부위 중에서, 사람에 따라 단일 염기만이 다른 것을 단일 염기 다형성 (single nucleotide polymorphism, SNP)이라 한다. 바람직한 다형성 마커는 선택된 집단에서 1% 이상, 더욱 바람직하게는 5% 또는 10% 이상의 발생 빈도를 나타내는 두 가지 이상의 대립 유전자를 가진다. 따라서, 다형성 마커에 대한 유전적 연관 (genetic association)은 특정한 다형성 마커의 하나 이상의 특정한 대립형질에 대해 연관이 있다는 것을 의미한다. 마커는 단일 염기 다형성 (SNP), 마이크로새틀라이트 (microsatellite), 삽입, 결실, 중복 및 전위 (translocation)를 포함한, 게놈에서 발견되는 임의의 변이 형태의 대립형질을 포함할 수 있다.The term “polymorphism” as used in the present invention refers to a case in which two or more alleles exist in one locus. Among the polymorphic sites, only a single base differs from one person to another. It is called single nucleotide polymorphism (SNP). Preferred polymorphic markers have two or more alleles that exhibit a frequency of occurrence of at least 1%, more preferably at least 5% or 10% in the selected population. Thus, a genetic association for a polymorphic marker means that there is an association for one or more specific alleles of a specific polymorphic marker. Markers can include any variant form of allele found in the genome, including single base polymorphism (SNP), microsatellite, insertions, deletions, duplications and translocations.
본 발명에서 사용되는 용어 “대립 유전자 (allele)” 또는 “대립형질”이란 상동 염색체의 동일한 유전자 좌위에 존재하는 한 유전자의 여러 타입을 말한다. 대립 유전자는 다형성을 나타내는데 사용되기도 하며, 예컨대, SNP는 두 종류의 대립 인자 (biallele)를 갖는다.The term "allele" or "allele" used in the present invention refers to several types of one gene present at the same locus of a homologous chromosome. Alleles are also used to indicate polymorphism, for example, SNPs have two types of alleles.
본 발명에서 사용되는 용어 “rs_id”란 1998년부터 SNP 정보를 축적하기 시작한 NCBI가 초기에 등록되는 모든 SNP에 대하여 부여한 독립된 표지자인 rs-ID를 의미한다. 본 발명에서는 rs831571와 같은 형태로 기재하였다. 이와 같은 표에 기재된 rs_id는 본 발명의 다형성 마커인 SNP 마커를 의미한다. 당업자라면 상기 rs_id를 이용하여 SNP의 위치 및 서열을 용이하게 확인할 수 있을 것이다. NCBI의 dbSNP (The Single Nucleotide Polymorphism Database) 번호인 rs_id에 해당하는 구체적인 서열은 시간이 지남에 따라 약간 변경될 수 있다. 본 발명의 범위가 상기 변경된 서열에도 미치는 것은 당업자에게 자명할 것이다.The term “rs_id” used in the present invention refers to rs-ID, which is an independent marker assigned to all SNPs initially registered by NCBI, which has started accumulating SNP information since 1998. In the present invention, it is described in the same form as rs831571. The rs_id described in this table refers to the SNP marker, which is a polymorphic marker of the present invention. Those skilled in the art will be able to easily identify the location and sequence of the SNP using the rs_id. The specific sequence corresponding to the NCBI's dbSNP (The Single Nucleotide Polymorphism Database) number, rs_id, may change slightly over time. It will be apparent to those skilled in the art that the scope of the present invention also extends to the altered sequence.
본 발명에서 사용되는 용어 “진단 또는 발병 예측”이란 질병 발생의 예측 및 질병 발생 위험도를 결정하거나 도출시키는데 사용되는 모든 유형의 분석을 포함하며, 바람직하게는 제2형 당뇨인지 여부를 판단하여 진단을 하거나 발병 위험을 예측하는 것일 수 있다.The term “diagnosis or onset prediction” used in the present invention includes all types of analysis used to predict disease occurrence and determine or derive the risk of disease occurrence, and preferably determine whether or not
이하, 본 발명에 대하여 보다 상세하게 설명하도록 한다.Hereinafter, the present invention will be described in more detail.
본 발명자들은 125,872명에 대한 유전체정보 분석을 통해 약 830만개의 단일 염기 다형성 (single nucleotide polymorphism, SNP) 정보를 획득하고, 이를 이용하여 공복혈당과 연관성을 나타내는 26개의 새로운 유전변이 및 30개의 기 보고된 유전변이를 발굴하였다. 또한, 제2형 당뇨병과 관련하여 기 보고된 유전변이 175개 유전변이와 공복혈당과 연관성을 나타내는 56개 유전변이에 대한 각각의 유전적 위험도 기반 고위험군에 속하는 경우 제2형 당뇨병 발병률이 더 높은 유전적 고위험군에 대한 예측 정확도가 현저히 높아진다는 것을 확인하고 본 발명을 완성하였다.The present inventors obtained about 8.3 million single nucleotide polymorphism (SNP) information through genomic information analysis of 125,872 people, and reported 26 new genetic mutations and 30 groups showing association with fasting blood sugar using this information. The genetic variation was discovered. In addition, the genetic risk of each of the 175 genetic mutations previously reported related to
본 발명은 생물학적 시료로부터 서열번호 1 내지 26의 6 번째 염기서열에 위치하는 다형성 부위를 포함하는 공복혈당 관련 다형성 마커 (polymorphic marker)에 대한 유전적 위험도 점수 (Genetic Risk Score, GRS)를 계산하는 단계;The present invention is a step of calculating a genetic risk score (GRS) for a fasting blood sugar-related polymorphic marker including a polymorphic site located at the sixth nucleotide sequence of SEQ ID NOs: 1 to 26 from a biological sample. ;
공복혈당 유전적 위험도 점수 및 제2형 당뇨병 유전적 위험도 점수 각각을 기반으로 고위험군을 선별하는 단계;Selecting a high-risk group based on each of the fasting glucose genetic risk score and the
공복혈당 유전적 위험도 기반 고위험군 및 제2형 당뇨병 유전적 위험도 기반 고위험군에 모두 속하면 제2형 당뇨병 고위험군으로 판단하는 단계;를 포함하는 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법을 제공한다.A method of providing information necessary for diagnosing or predicting the onset of
또한, 상기 공복혈당 관련 다형성 마커 (polymorphic marker)는 서열번호 27 내지 56의 6 번째 염기서열에 위치하는 다형성 마커를 더 포함하는 것일 수 있으나, 당 분야에 알려진 공복혈당과 관련된 다형성 마커라면 제한되지 않는다.In addition, the fasting blood glucose-related polymorphic marker may further include a polymorphic marker positioned at the 6th nucleotide sequence of SEQ ID NOs: 27 to 56, but is not limited as long as it is a polymorphic marker related to fasting blood glucose known in the art. .
또한, 상기 생물학적 시료는 조직, 세포, 전혈, 혈청, 혈장 및 타액으로 이루어지는 군으로부터 선택되는 것일 수 있으나, 이에 제한되지 않는다.In addition, the biological sample may be selected from the group consisting of tissue, cells, whole blood, serum, plasma, and saliva, but is not limited thereto.
또한, 유전적 위험도 (Genetic Risk Score, GRS)는 수학식 1을 이용하여 계산된 것일 수 있다.In addition, the genetic risk (Genetic Risk Score, GRS) may be calculated using Equation 1.
[수학식 1][Equation 1]
상기 수학식 1에서,In Equation 1,
n은 총 다형성 마커의 수를 의미한다.n means the total number of polymorphic markers.
i는 다형성마커 서열번호를 의미한다.i means the polymorphic marker sequence number.
j는 샘플 번호를 의미한다.j stands for the sample number.
β는 베타 계수로 다형성 마커의 유전적 효과 (effect size)를 의미한다.β is the beta coefficient, meaning the genetic effect (effect size) of the polymorphic marker.
x는 j 샘플이 대립유전자 (effective allele)의 존재 또는 부재에 따라 0, 1, 또는 2 중 하나의 대립유전자 수치를 의미한다. 대립유전형의 수치는 유전형 예측 방법 (genotype imputation)을 사용하는 경우 0~2 사이의 실수 값으로 대체된다.x means the allele value of one of 0, 1, or 2 in the j sample depending on the presence or absence of an effective allele. The value of the allele is replaced with a real value between 0 and 2 when using genotype imputation.
또한, 상기 유전자 위험도 점수 (Genetic Risk Score, GRS)는 각 SNP 좌위에 존재하는 위험 대립유전자의 수를 세부점수로 부여하고 그 세부 점수의 총합으로 계산되는 것이 바람직하다.In addition, the Genetic Risk Score (GRS) is preferably assigned the number of risk alleles present in each SNP locus as a detailed score and calculated as the sum of the detailed scores.
본 발명의 일실시예에 있어서, 상기 유전적 위험도 점수 (Genetic Risk Score)를 계산하는 단계는 생물학적 시료로부터 하기 표 1 및 표 2에 기재된 모든 다형성 마커 (polymorphic marker) 좌위의 효과 대립유전자 (Allele)의 존재 또는 부재를 결정하는 단계; 상기 각 좌위의 효과 대립유전자 (effective allele)의 존재 또는 부재에 따라 각 좌위에 0, 1, 또는 2 중 하나의 대립유전자 수치를 부여하는 단계로서, 효과 대립유전자 (effective allele)이 부재한 경우에는 0, 효과 대립유전자가 한 개의 반수체에만 존재하는 경우에는 1, 효과 대립유전자가 두 개의 반수체에 모두 존재하는 경우에는 2의 수치를 부여하는 단계; 및 제2형 당뇨병 환자의 각 좌위의 효과 대립유전자 빈도와 정상 대조군의 효과 대립유전자 빈도를 비교하여 각 좌위에서의 베타 계수 (β)를 산출하여 유전적 위험도 점수 (Genetic Risk Score, GRS)를 계산하는 단계;를 포함할 수 있다.In one embodiment of the present invention, the step of calculating the genetic risk score is the effect of the locus of all polymorphic markers shown in Tables 1 and 2 below from a biological sample. Determining the presence or absence of; A step of assigning a value of one allele of 0, 1, or 2 to each locus according to the presence or absence of an effective allele of each locus, and in the absence of an effective allele Assigning a value of 0, 1 when the effect allele is present in only one haploid, and 2 when the effect allele is present in both haploids; And by comparing the frequency of the effect allele of each locus in
여기서, 일례로 질병 유전적 위험도를 wGRS (weighted genetic risk score) 방식을 설명하였으나, 본 발명은 이에 한정되지 않고 실시예에 따라 genetic risk score, polygenic risk score, machine learning 방법, 선형회귀분석 방법 등 다양한 위험도 계산 방식을 이용할 수 있다.Here, as an example, the weighted genetic risk score (wGRS) method has been described for disease genetic risk, but the present invention is not limited thereto, and various methods such as genetic risk score, polygenic risk score, machine learning method, linear regression analysis method, etc. Risk calculation methods can be used.
또한, 상기 유전적 위험도를 사용자가 소속된 집단 (예컨대, 동일 국가, 동일 거주 지역, 동일 연령대 등) 내의 다른 사용자의 질병 유전적 위험도와 대비하여 상대적인 값으로 변환할 수 있다. 이때, 질병 유전적 위험도를 상대적인 값으로 변환하는 이유는, 사용되는 유전자 마커의 수에 따라 유전적 위험도 (genetic risk score) 절대값이 크게 변화할 수 있고, 질병 유전적 위험도와 표현형 유전적 위험도의 계산 방법이 서로 상이할 수 있기 때문에, 상대적인 순위로 노멀라이제이션 (normalization)하기 위함이다.In addition, the genetic risk may be converted into a relative value compared to the disease genetic risk of other users in the group to which the user belongs (eg, the same country, the same residential area, the same age group, etc.). At this time, the reason for converting the disease genetic risk to a relative value is that the absolute value of the genetic risk score can vary greatly depending on the number of genetic markers used, and the difference between the disease genetic risk and the phenotypic genetic risk. Since the calculation methods can be different from each other, this is for normalization in relative order.
또한, 상기 효과 대립유전자 (effective allele)는 effect size 의 기준이 되는 대립형질 (allele)을 의미하고, 본 발명에서는 서열번호 1 내지 26의 염기서열로 표시되는 폴리뉴클레오티드에서, 각 염기서열의 6번째 다형성 부위가 효과 대립유전자 (effective allele)인 경우, effect size가 양의 실수 일 경우 공복혈당 증가 및 제2형 당뇨병 발병 위험이 높다고 예측할 수 있다.In addition, the effective allele means an allele that is the criterion of the effect size, and in the present invention, in the polynucleotide represented by the nucleotide sequences of SEQ ID NOs: 1 to 26, the sixth of each nucleotide sequence If the polymorphic site is an effective allele, and the effect size is a positive mistake, it can be predicted that there is a high risk of fasting blood sugar and
또한, 상기 방법은 서열번호 1 내지 26의 다형성 부위에 동형 혹은 이형 대립유전자형을 갖는 경우, 제2형 당뇨병 발병 위험이 높다고 예측할 수 있다.In addition, the above method can predict that the risk of developing
구체적으로, 서열번호 1의 다형성 부위의 유전자형이 A인 경우,Specifically, when the genotype of the polymorphic site of SEQ ID NO: 1 is A,
서열번호 2의 다형성 부위의 유전자형이 A인 경우,When the genotype of the polymorphic site of SEQ ID NO: 2 is A,
서열번호 3의 다형성 부위의 유전자형이 ATCTCTC인 경우,When the genotype of the polymorphic site of SEQ ID NO: 3 is ATCTCTC,
서열번호 4의 다형성 부위의 유전자형이 G인 경우,When the genotype of the polymorphic site of SEQ ID NO: 4 is G,
서열번호 5의 다형성 부위의 유전자형이 A인 경우,When the genotype of the polymorphic site of SEQ ID NO: 5 is A,
서열번호 6의 다형성 부위의 유전자형이 C인 경우,When the genotype of the polymorphic site of SEQ ID NO: 6 is C,
서열번호 7의 다형성 부위의 유전자형이 T인 경우,When the genotype of the polymorphic site of SEQ ID NO: 7 is T,
서열번호 8의 다형성 부위의 유전자형이 A인 경우,When the genotype of the polymorphic site of SEQ ID NO: 8 is A,
서열번호 9의 다형성 부위의 유전자형이 T인 경우,When the genotype of the polymorphic site of SEQ ID NO: 9 is T,
서열번호 10의 다형성 부위의 유전자형이 A인 경우,When the genotype of the polymorphic site of SEQ ID NO: 10 is A,
서열번호 11의 다형성 부위의 유전자형이 C인 경우,When the genotype of the polymorphic site of SEQ ID NO: 11 is C,
서열번호 12의 다형성 부위의 유전자형이 A인 경우,When the genotype of the polymorphic site of SEQ ID NO: 12 is A,
서열번호 13의 다형성 부위의 유전자형이 T인 경우,When the genotype of the polymorphic site of SEQ ID NO: 13 is T,
서열번호 14의 다형성 부위의 유전자형이 C인 경우,When the genotype of the polymorphic site of SEQ ID NO: 14 is C,
서열번호 15의 다형성 부위의 유전자형이 A인 경우,When the genotype of the polymorphic site of SEQ ID NO: 15 is A,
서열번호 16의 다형성 부위의 유전자형이 C인 경우,When the genotype of the polymorphic site of SEQ ID NO: 16 is C,
서열번호 17의 다형성 부위의 유전자형이 C인 경우,When the genotype of the polymorphic site of SEQ ID NO: 17 is C,
서열번호 18의 다형성 부위의 유전자형이 G인 경우,When the genotype of the polymorphic site of SEQ ID NO: 18 is G,
서열번호 19의 다형성 부위의 유전자형이 C인 경우,When the genotype of the polymorphic site of SEQ ID NO: 19 is C,
서열번호 20의 다형성 부위의 유전자형이 AAAAC인 경우,When the genotype of the polymorphic site of SEQ ID NO: 20 is AAAAC,
서열번호 21의 다형성 부위의 유전자형이 C인 경우,When the genotype of the polymorphic site of SEQ ID NO: 21 is C,
서열번호 22의 다형성 부위의 유전자형이 A인 경우,When the genotype of the polymorphic site of SEQ ID NO: 22 is A,
서열번호 23의 다형성 부위의 유전자형이 G인 경우,When the genotype of the polymorphic site of SEQ ID NO: 23 is G,
서열번호 24의 다형성 부위의 유전자형이 T인 경우,When the genotype of the polymorphic site of SEQ ID NO: 24 is T,
서열번호 25의 다형성 부위의 유전자형이 G인 경우 또는When the genotype of the polymorphic site of SEQ ID NO: 25 is G, or
서열번호 26의 다형성 부위의 유전자형이 C인 경우에 effect size가 양의 실수 이면 공복혈당 증가 및 제2형 당뇨병 발병 위험도가 높다고 예측할 수 있다.When the genotype of the polymorphic site of SEQ ID NO: 26 is C, if the effect size is a positive real number, it can be predicted that the risk of developing fasting blood sugar and
또한, 상기 진단은 한국인을 대상으로 하는 것이 바람직하나, 이에 한정되지 않는다.In addition, the diagnosis is preferably for Koreans, but is not limited thereto.
또한, 본 발명의 다형성 마커에 대한 유전자형의 확인은 시퀀싱 분석, 자동염기서열분석기를 사용한 시퀀싱 분석, 파이로시퀀싱 (pyrosequencing), 마이크로어레이에 의한 혼성화, PCR-RELP법 (restriction fragment length polymorphism), PCR-SSCP법 (single strand conformation polymorphism), PCR-SSO법 (specific sequence oligonucleotide), PCR-SSO법과 도트 하이브리드화법을 조합한 ASO (allele specific oligonucleotide) 하이브리드화법, TaqMan-PCR법, MALDI-TOF/MS법, RCA법 (rolling circle amplification), HRM (high resolution melting)법, 프라이머신장법, 서던 블롯 하이브리드화법, 도트 하이브리드화법 등의 공지의 방법에 의하여 수행될 수 있다. 상기 분석 결과들은 당업계에서 일반적으로 사용되는 통계학적 분석 방법을 이용하여 통계 처리할 수 있으며, 예를 들면, 스튜던트 t-검정 (Student's t-test), 카이-스퀘어 테스트 (Chi-square test), 선형 회귀선분석(linear regression line analysis), 다변량 로지스틱 회귀분석 (multiple logistic regression analysis) 등을 통해 얻은 연속 변수 (continuous variables), 절대 변수 (categorical variables), 대응비 (odds ratio) 및 95% 신뢰구간 (confidence interval) 등의 변수를 이용하여 분석할 수 있다.In addition, identification of the genotype for the polymorphic marker of the present invention includes sequencing analysis, sequencing analysis using an automatic sequencing analyzer, pyrosequencing, hybridization by microarray, PCR-RELP method (restriction fragment length polymorphism), PCR -SSCP method (single strand conformation polymorphism), PCR-SSO method (specific sequence oligonucleotide), ASO (allele specific oligonucleotide) hybridization method combining PCR-SSO method and dot hybridization method, TaqMan-PCR method, MALDI-TOF/MS method , RCA method (rolling circle amplification), HRM (high resolution melting) method, primer extension method, Southern blot hybridization method, dot hybridization method, and the like. The analysis results can be statistically processed using statistical analysis methods commonly used in the art, for example, Student's t-test, Chi-square test, Continuous variables, categorical variables, odds ratio, and 95% confidence intervals obtained through linear regression line analysis, multiple logistic regression analysis, etc. confidence interval).
이어서, 본 발명은 서열번호 1 내지 26의 염기서열로 표시되는 폴리뉴클레오티드에서, 각각 염기서열의 6번째에 위치하는 다형성 부위를 포함하는 10개 이상의 연속적인 염기서열로 구성된 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드에 특이적으로 결합하는 프라이머 또는 프로브를 포함하는, 제2형 당뇨병 진단 또는 발병 예측용 다형성 마커 조성물을 제공한다.Subsequently, in the polynucleotide represented by the nucleotide sequence of SEQ ID NO: 1 to 26, a polynucleotide composed of 10 or more consecutive nucleotide sequences including a polymorphic site located at the 6th nucleotide sequence or a complementary polynucleotide thereof It provides a polymorphic marker composition for diagnosing or predicting the onset of
또한, 상기 다형성 부위는 단일염기다형성 (single nucleotide polymorphism)일 수 있으며, 다형성 부위가 효과 대립유전자형 (effective allele)를 가지는 경우 제2형 당뇨병 발병 위험도가 높다고 예측할 수 있다. 상기 서열번호 1 내지 26의 다형성 부위의 효과 대립유전자형 (effective allele)은 상기 기술한 바와 같다.In addition, the polymorphic site may be single nucleotide polymorphism, and if the polymorphic site has an effective allele, it can be predicted that the risk of developing
또한, 상기 폴리뉴클레오티드 또는 그의 상보적 폴리뉴클레오티드와 특이적으로 결합하는 프라이머 또는 프로브는 대립형질 특이적 (allele-specific)이다.In addition, the primer or probe that specifically binds to the polynucleotide or its complementary polynucleotide is allele-specific.
상기 "프라이머"란 짧은 자유 수산화기를 가지는 핵산서열로서 상보적인 템플리트와 염기쌍을 형성할 수 있고 템플리트 가닥 복사를 위한 시작 지점으로 기능하는 짧은 핵산서열을 말한다. 본 발명의 프라이머는 예를 들면, 포스포르아미다이트 고체 지지체 방법과 같은 당 분야에 공지된 방법을 이용하여 화학적으로 합성할 수 있다.The "primer" refers to a short nucleic acid sequence that can form a base pair with a complementary template as a nucleic acid sequence having a short free hydroxyl group and serves as a starting point for copying the template strand. The primer of the present invention can be chemically synthesized using a method known in the art, such as, for example, a phosphoramidite solid support method.
상기 "프로브"는 mRNA와 특이적으로 결합할 수 있는 수개 내지 수백 개의 염기로 이루어진 RNA 또는 DNA 등의 핵산 단편을 의미하며 라벨링되어 있어 특정 mRNA의 존재유무를 확인할 수 있다. 프로브는 올리고뉴클레오타이드 프로브, 단쇄 DNA 프로브, 이중쇄 DNA 프로브, RNA 프로브 등의 형태로 제작될 수 있고 비오틴, FITC, 로다민, DIG 등으로 표지되거나 방사선 동위 원소 등으로 표지될 수 있다.The "probe" refers to a nucleic acid fragment such as RNA or DNA composed of several to hundreds of bases capable of specifically binding to mRNA, and is labeled so that the presence or absence of a specific mRNA can be confirmed. Probes may be prepared in the form of oligonucleotide probes, single-stranded DNA probes, double-stranded DNA probes, RNA probes, and the like, and may be labeled with biotin, FITC, rhodamine, DIG, or the like, or labeled with radioactive isotopes.
또한, 상기 프로브는 검출 가능한 물질 예를 들면, 적합한 신호를 제공하고 충분한 반감기를 갖는 방사성 표지로 표지할 수 있다. 표지된 프로브는 문헌 (Sambook et al., Molecular Cloning, A LaboratoryMannual, 1989)에 공지된 바와 같은 고체 지지체 상의 핵산에 혼성화시킬 수 있다.In addition, the probe can be labeled with a detectable substance such as a radioactive label that provides a suitable signal and has a sufficient half-life. Labeled probes can be hybridized to nucleic acids on solid supports as known from Sambook et al., Molecular Cloning, A LaboratoryMannual, 1989.
또한, 상기 프로브는 대립유전자 특이적 프로브로서, 핵산 단편 중에 다형성 부위가 존재하여, 하나의 대립유전자를 포함한 핵산 단편에는 혼성화하지만, 다른 대립유전자를 포함한 핵산 단편에는 혼성화하지 않을 수 있다. 이 경우 혼성화 조건은 대립형질 간의 혼성화 강도에 있어서 유의한 차이를 보여 대립형질 중 하나에만 혼성화되도록 충분히 엄격해야 한다. 바람직하게는 프로브는 혼성화에서의 최대 효율을 위하여 단일 가닥일 수 있으나, 이에 제한되지 않는다.In addition, the probe is an allele-specific probe, and a polymorphic site exists in a nucleic acid fragment, and thus hybridizes to a nucleic acid fragment containing one allele, but may not hybridize to a nucleic acid fragment containing another allele. In this case, the hybridization conditions should be sufficiently stringent so that only one of the alleles is hybridized to show a significant difference in hybridization strength between alleles. Preferably, the probe may be single stranded for maximum efficiency in hybridization, but is not limited thereto.
아울러, 본 발명은 상기 다형성 마커 조성물을 포함하는, 제2형 당뇨병 진단 또는 발병 예측용 조성물을 제공한다.In addition, the present invention provides a composition for diagnosing or predicting the onset of
또한, 상기 조성물은 본 발명의 특징인 서열번호 1 내지 26의 염기서열로 표시되는 폴리뉴클레오티드에서 6번째 염기에 해당하는 다형성 부위를 검출할 수 있는 프라이머 또는 프로브를 포함하는 다형성 마커를 이용하여 제2형 당뇨병을 진단 또는 발병을 예측할 수 있다.In addition, the composition is a second polymorphic marker including a primer or probe capable of detecting a polymorphic site corresponding to the sixth base in the polynucleotide represented by the nucleotide sequence of SEQ ID NO: 1 to 26, which is a characteristic of the present invention. Diabetes type diabetes can be diagnosed or predicted onset.
또한, 프라이머를 이용한 특정 핵산의 검출은 PCR과 같은 증폭 방법을 사용하여 목적 유전자의 서열을 증폭한 다음 당 분야에 공지된 방법으로 유전자의 증폭여부를 확인함으로써 수행될 수 있다. 또한, 프로브를 이용한 특정 핵산의 검출은 적합한 조건하에서 시료 핵산을 프로브와 접촉시킨 후 혼성화되는 핵산의 존재여부를 확인함으로써 수행될 수 있다.In addition, detection of a specific nucleic acid using a primer can be performed by amplifying the sequence of the target gene using an amplification method such as PCR, and then confirming whether the gene is amplified by a method known in the art. In addition, detection of a specific nucleic acid using a probe may be performed by contacting a sample nucleic acid with a probe under suitable conditions and then confirming the presence or absence of a hybridized nucleic acid.
또한, 상기 프로브나 프라이머를 이용하여 특정 핵산을 검출할 수 있는 방법으로는 예를 들면, 이에 한정되지는 않으나 중합효소 연쇄반응 (PCR), DNA 시퀀싱, RT-PCR, 프라이머 연장법 (Nikiforeov et al., Nucl Acids Res 22, 4167-4175, 1994), 올리고뉴클레오타이드 연장 분석 (Nickerson et al., Pro Nat Acad Sci USA, 87, 8923-8927, 1990), 대립형질 특이적 PCR법 (Rust et al., Nucl Acids Res, 6, 3623-3629, 1993), RNase 불일치절단 (RNase mismatch cleavage, Myers et al., Science, 230, 1242-1246, 1985), 단일가닥 입체 다형화 (single strand conformation lymorphism, Orita et al., Pro Nat Acad Sci USA, 86, 2766-2770, 1989), SSCP 및 헤테로두플렉스 동시 분석법 (Lee et al., Mol Cells, 5:668-672, 1995), 변성 구배 젤 전기영동 (DGGE, Cariello et al., Am J Hum Genet, 42, 726-734, 1988), 변성 고압 액체 크로마토그래피 (Underhill et al., Genome Res, 7, 996-1005, 1997), 혼성화 반응, DNA 칩 등이 있다. 상기 혼성화 반응의 예로는 노던 하이브리다이제이션 (Maniatis T. et al., Molecular Cloning, Cold Spring Habor Laboratory, NY, 1982), 인시츄 하이브리다이제이션 (Jacquemier et al., Bull Cancer, 90:31-8, 2003) 및 마이크로어레이 (Macgregor, Expert, Rev Mol Diagn 3:185-200, 2003) 방법 등이 있다.In addition, methods for detecting a specific nucleic acid using the probe or primer include, but are not limited to, polymerase chain reaction (PCR), DNA sequencing, RT-PCR, primer extension method (Nikiforeov et al. .,
상기 본 발명의 제2형 당뇨병 진단 또는 발병 예측용 조성물은 상술한 핵산을 검출하는 방법에 일반적으로 사용되는 시약을 추가로 포함할 수 있다. 예를 들면, PCR 반응에 요구되는 dNTP(deoxynulceotide triphosphate), 내열성 중합효소(polymerase), 염화마그네슘 등의 금속이온염이 포함할 수 있으며, 시퀀싱에 요구되는 dNTP, 시쿼나제(sequenase) 등을 포함할 수 있다.The composition for diagnosing or predicting the onset of
마지막으로, 본 발명은 상기 다형성 마커 조성물을 포함하는, 제2형 당뇨병 진단 또는 발병 예측용 키트를 제공한다.Finally, the present invention provides a kit for diagnosing or predicting the onset of
또한, 상기 키트는 다형성 마커 중 1종 이상의 마커를 확인하기 위한 폴리뉴클레오티드, 프라이머 또는 프로브뿐만 아니라 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성 성분 조성물, 용액 또는 장치가 포함될 수 있다.In addition, the kit may include a polynucleotide, a primer, or a probe for identifying one or more of the polymorphic markers, as well as one or more other component compositions, solutions, or devices suitable for an analysis method.
예를 들어, 본 발명의 키트는 PCR을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. PCR 키트는, 상기 다형성 마커에 대한 특이적인 폴리뉴클레오티드, 프라이머 또는 프로브 외에도 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액 (pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드 (dNTPs), Taq-폴리머라아제 및 역전사효소와 같은 효소, DNase, RNAse 억제제, DEPC-수 (DEPC-water) 및 멸균수 등을 포함할 수 있다.For example, the kit of the present invention may be a kit including essential elements necessary for performing PCR. PCR kits, in addition to the polynucleotides, primers or probes specific for the polymorphic marker, test tubes or other suitable containers, reaction buffers (various in pH and magnesium concentration), deoxynucleotides (dNTPs), Taq-polymerase and reverse transcription. Enzymes such as enzymes, DNase, RNAse inhibitors, DEPC-water and sterile water may be included.
본 발명의 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법에 따르면, 제2형 당뇨병과 관련하여 기 보고된 유전변이 175개와 공복혈당과 연관성을 나타내는 56개 유전변이를 각각 유전적 위험도 점수화하여 복합적으로 분석함으로써 제2형 당뇨병을 조기에 진단하고, 발병 위험을 예측할 수 있다.According to the method for providing information necessary for diagnosing or predicting the onset of
이하, 본 발명의 실시예를 첨부된 도면을 참고하여 보다 상세하게 설명하도록 한다. 그러나, 하기의 실시예는 본 발명의 내용을 구체화하기 위한 것일 뿐, 이에 의해 본 발명이 한정되는 것은 아닐 것이다.Hereinafter, embodiments of the present invention will be described in more detail with reference to the accompanying drawings. However, the following examples are only for embodiing the contents of the present invention, and the present invention is not limited thereto.
<실시예 1> 유전체정보의 정도관리<Example 1> Quality control of genome information
도 1을 참조하여 134,721명의 유전체역학조사사업 참여자를 대상으로 한국인칩을 이용하여 유전체정보를 생산하고, 생산된 유전체정보는 도 2를 참조하여 정도관리 파이프라인에 따라서 genotype calling, low quality 유전변이 제거, low quality 샘플 제거, MDS (Multi-dimensional scaling)/PCA (Principal Component Analysis)를 통한 이상치 제거 등을 수행하여 정제하였다. 정제 후 125,872명에 대한 유전체정보를 확보하였으며, 이를 이용하여 후속 분석을 진행하였다.With reference to Fig. 1, genome information is produced using Korean chips for 134,721 participants in the genome epidemiological investigation project, and the produced genome information is genotype calling and low quality genetic mutations removed according to the quality control pipeline with reference to Fig. 2 , removal of low quality samples, and removal of outliers through MDS (Multi-dimensional scaling)/PCA (Principal Component Analysis), etc. were performed. After purification, genome information for 125,872 people was secured, and subsequent analysis was conducted using this.
<실시예 2> 유전체정보 분석<Example 2> Genomic information analysis
정제 후 125,872명에 대한 유전체 정보는 Eagle 소프트웨어로 phasing 분석, Impute v4 소트프웨어로 imputation 분석을 수행하였다. 유전체정보 분석을 통해 약 830만개의 단일 염기 다형성 (single nucleotide polymorphism, SNP) 정보를 획득하였다. 125,872명의 임상역학정보 중 공복혈당 (Fasting Plasma Glucose, FPG), 당화혈색소 (Hemoglobin A1c, HbA1c) 등 분석하였으며, 분석 시 각 정보에 영향을 줄 수 있는 질병 과거력, 약물력 등을 제외하였다. 특히 제2형 당뇨 환자군은 각 정보 분석 시 제외하였다 (도 3 참조).After purification, the genome information of 125,872 people was analyzed by phasing with Eagle software and imputation with Impute v4 software. Through genomic information analysis, information on about 8.3 million single nucleotide polymorphisms (SNPs) was obtained. Among the clinical epidemiological information of 125,872 people, fasting plasma glucose (FPG) and glycated hemoglobin (Hemoglobin A1c, HbA1c) were analyzed, and disease history and drug history that may affect each information were excluded. In particular, the
제 2형 당뇨 환자 및 정상군은 ADA (American Diabetes Association)에서 제시하는 기준에 따라 아래와 같이 정의하였다. 하기 기준에 따라 선별된 제2형 당뇨 환자 수는 12,135명이었다.
제2형 당뇨 환자: FPG >= 126 mg/dL (7.0 mmol/L), oral glucose tolerance test (OGTT) 이후 2시간 혈당 >= 200mg/dL (11.1 mmol/L), 또는 HbA1c >= 6.5% (48 mmol/mol). 그 외 과거력 정보에 따라 제2형 당뇨로 진단 받은 경우 포함.
정상군: FPG < 100mg/dL (5.6 mmol/L), OGTT < 140 mg/dL (7.8 mmol/L), 또는 HbA1c < 6% (48 mmol/mol). 모든 사람은 제2형 당뇨병으로 진단받은 적이 없어야함.Normal group: FPG <100 mg/dL (5.6 mmol/L), OGTT <140 mg/dL (7.8 mmol/L), or HbA1c <6% (48 mmol/mol). Not everyone should have been diagnosed with
<실시예 3> 전장유전체연관성 분석 방법<Example 3> Method for analyzing full-length genetic association
공복혈당과 연관성을 나타내는 유전변이를 선정하기 위하여 전장유전체연관성분석법을 이용하였다. 결측치 예측 (Imputation)이 완료된 자료와 상기 임상역학정보를 이용하여 125,872명에서 나타나는 공복혈당과 모든 유전변이에 대한 연관성 분석을 수행하였다. 제2형 당뇨병과 관련되어 기존에 보고된 유전변이 정보를 추출하였으며, 그 중 본 연구에서는 기 보고된 175개의 유전변이 정보를 활용하여 제2형 당뇨병과의 연관성을 분석하였다 (표 1). 상기 연관성 분석은 선형 회귀분석 (Linear regression)으로 수행하였으며 나이, 성별, 코호트 지역에 대해 보정하였다.In order to select a genetic variation that is associated with fasting blood sugar, a full-length genetic association analysis method was used. Using the data for which the missing value was predicted (Imputation) was completed and the clinical epidemiologic information, a correlation analysis was performed for fasting blood glucose in 125,872 patients and all genetic mutations. Previously reported genetic variation information related to
공복혈당과 관련된 유전변이 발굴의 통계적 검정력을 확보하기 위해서 Biobank Japan에서 공개한 약 16만명의 공복혈당과 유전변이의 연관성 분석 결과 (약 6백만개 유전변이)와 통합하여 Inverse-variance weighted meta-analysis를 수행하였다. 분석 후 heterogeneity가 높은 (P < 0.001) 결과는 제거하였다. 그 결과 공복혈당과 관련된 26개의 기존에 보고되지 않은 새로운 유전변이와 30개의 기 보고된 유전변이를 발굴하였다. 공복혈당과 관련된 56개의 유전변이는 도 4 및 표 2에 나타내었다. 도 4는 공복혈당 관련 56개 유전변이의 맨하탄 플롯 (Manhattan plot) 결과를 나타낸 그래프이다. x축은 chromosome, y축은 -log10 (P-value), 파란색은 기 보고된 유전변이, 빨간색은 신규 유전변이를 의미한다.In order to secure the statistical power of the discovery of genetic mutations related to fasting blood glucose, inverse-variance weighted meta-analysis was performed by integrating with the results of the association analysis (about 6 million genetic mutations) between about 160,000 fasting blood glucose and genetic mutations published by Biobank Japan. Performed. After analysis, the results of high heterogeneity (P <0.001) were removed. As a result, 26 unreported new genetic mutations and 30 previously reported genetic mutations related to fasting blood glucose were identified. 56 genetic mutations related to fasting blood sugar are shown in Fig. 4 and Table 2. 4 is a graph showing the results of a Manhattan plot of 56 genetic mutations related to fasting blood sugar. The x-axis represents the chromosome, the y-axis represents -log10 (P-value), the blue represents the previously reported genetic mutation, and the red represents the new genetic variant.
Chromosome, position 정보는 hg19를 기준으로 작성됨.Chromosome, position information is written based on hg19.
Effective allele: effect size 의 기준이 되는 대립형질 (allele),Effective allele: allele, which is the criterion for effect size,
Other allele: 그 외 대립형질.Other allele: Other allele.
Probe: 대립형질을 기준으로 양측 5개 염기로 총 11개 염기서열. 6번째 염기서열이 Other allele에 해당함. 대립형질이 2개 이상 염기일 경우, 6번째 염기서열부터 Other allele 대립형질의 길이만큼 해당됨.Probe: A total of 11 base sequences with 5 bases on both sides based on the allele. The 6th nucleotide sequence corresponds to Other allele. If the allele is 2 or more bases, the length of the other allele allele from the 6th nucleotide sequence corresponds
AlleleEffective
Allele
AlleleOther
Allele
Chromosome, position 정보는 hg19를 기준으로 작성됨.Chromosome, position information is written based on hg19.
Effective allele: effect size 의 기준이 되는 대립형질 (allele),Effective allele: allele, which is the criterion for effect size,
Other allele: 그 외 대립형질.Other allele: Other allele.
Probe: 대립형질을 기준으로 양측 5개 염기로 총 11개 염기서열. 6번째 염기서열이 Other allele에 해당함. 대립형질이 2개 이상 염기일 경우, 6번째 염기서열부터 Other allele 대립형질의 길이만큼 해당됨.Probe: A total of 11 base sequences with 5 bases on both sides based on the allele. The 6th nucleotide sequence corresponds to Other allele. If the allele is 2 or more bases, the length of the other allele allele from the 6th nucleotide sequence corresponds
<실시예 4> 유전적 위험도 분석 방법<Example 4> Genetic risk analysis method
유전체정보를 이용하여 상기 표 1 및 표 2에 기재된 모든 다형성 마커 (polymorphic marker)를 실시예 3에서 전장유전체연관성분석법에 사용된 한국인칩 유전체정보에서 추출하여 각 다형성 마커 (polymorphic marker)에 대한 효과 대립유전자 (Allele)의 존재 또는 부재를 확인하였다.Using genome information, all polymorphic markers listed in Tables 1 and 2 were extracted from the Korean chip genome information used in the full-length genome association analysis method in Example 3, and the effect of each polymorphic marker was confronted. The presence or absence of a gene (Allele) was confirmed.
효과 대립유전자 (effective allele)가 부재한 경우에는 0, 효과 대립유전자가 한 개의 반수체에만 존재하는 경우에는 1, 효과 대립유전자가 두 개의 반수체에 모두 존재하는 경우에는 2의 수치를 부여하였다. 유전형 예측방법 (genotype imputation)을 이용하여 대립유전형의 수치를 확인하는 경우에는 대립유전형의 사후 확률 (posterior probability)에 따라서 0~2 사이의 실수 값을 가지게 된다. 제2형 당뇨병 환자의 각 다형성 마커 좌위의 효과 대립유전자 빈도와 정상 대조군의 효과 대립유전자 빈도를 비교하여 각 좌위에서의 베타 계수 (β)를 산출하여 하기 수학식 1에 대입하여 유전적 위험도 점수 (Genetic Risk Score, GRS)를 계산하였다. 계산된 유전적 위험도는 표준정규분포를 가지도록 표준화하였다.In the absence of an effective allele, a value of 0, a value of 1 when an effect allele exists in only one haploid, and 2 when an effect allele exists in both haploids. When the value of the allele is checked using genotype imputation, it has a real value between 0 and 2 depending on the posterior probability of the allele. The effect of each polymorphic marker locus in
n: 총 다형성 마커의 수,n: total number of polymorphic markers,
i: 다형성 마커 서열번호,i: polymorphic marker sequence number,
j: 샘플 번호.j: Sample number.
β: 베타 계수 (다형성 마커의 유전적 효과 (effect size))β: beta coefficient (genetic effect of polymorphic markers (effect size))
x는 j 샘플이 대립유전형(effective allele)의 존재 또는 부재에 따라 0, 1, 또는 2 중 하나의 대립유전형 수치를 의미한다. 대립유전형의 수치는 유전형 예측 방법(genotype imputation)을 사용하는 경우 0~2 사이의 실수 값으로 대체된다.x denotes an allelic value of one of 0, 1, or 2 in the j sample depending on the presence or absence of an effective allele. The value of the allele is replaced with a real value between 0 and 2 when using genotype imputation.
<실시예 5> 유전적 고위험군 분석<Example 5> Genetic high risk group analysis
유전적 고위험군을 분석하기 위해 계산된 유전적 위험도를 오름차순으로 정렬하였으며, 정렬된 값에 따라서 백분위수 또는 30개의 그룹으로 구분하였다.In order to analyze the genetic high-risk group, the calculated genetic risks were sorted in ascending order, and according to the sorted values, they were divided into percentiles or 30 groups.
유전적 고위험군은 중위수 그룹 (30번째 중 15번째 그룹 또는 40~60% 백분위 그룹) 및 저위험군 (30번째 중 1번째 그룹 (하위 약 3.3%) 등)에서 나타나는 제2형 당뇨병 유병률과 비교하였다. 분석 방법으로는 로지스틱 회귀분석 (Logistic regression)을 이용하였으며 성별, 나이, 코호트 지역을 보정하였다.The genetic high-risk group was compared with the prevalence of
그 결과, 공복혈당 유전적 위험도를 30개 그룹으로 구분하였을 때 가장 고위험군 그룹 (상위 3.3%)는 14.9%의 제2형 당뇨병 유병률을 보였으며 이는 중간 그룹에 비해서 1.5배, 가장 낮은 그룹 (하위 3.3%)에 비해서는 3배의 유병률이 증가하는 것을 확인하였다 (도 5). 또한, 공복혈당 유전적 위험도 기반 유전적 고위험군은 상위 1%의 경우 2.27배, 상위 5%의 경우 2.04배의 당뇨 발병 위험이 증가하는 것을 확인하였으며 제2형 당뇨 유전적 위험도 기반 유전적 고위험군은 상위 1%의 경우 4.58배, 상위 5%의 경우 3.43배의 당뇨 발병 위험이 증가하는 것을 확인하였다 (표 3).As a result, when the genetic risk of fasting blood glucose was divided into 30 groups, the highest risk group (top 3.3%) had a prevalence of
<실시예 6> 유전적 고위험군의 복합 분석<Example 6> Complex analysis of genetic high-risk group
공복혈당 유전적 위험도 및 제2형 당뇨 유전적 위험도를 백분위로 구분하고, 각 유전적 위험도를 기반으로 모두 고위험군에 속하는 집단에 대해 나머지 집단과 비교 분석하였다. 분석 방법으로는 로지스틱 회귀분석 (Logistic regression)을 이용하였으며 성별, 나이, 코호트 지역을 보정하였다.The genetic risk of fasting blood glucose and the genetic risk of
그 결과, 공복혈당 및 제2형 당뇨의 유전적 위험도를 기반으로 모두 상위 1% 이상에 해당하는 유전적 고위험군은 8.08배, 상위 5%의 경우 5.28배의 당뇨 발병 위험이 증가하는 것을 확인하였다.As a result, based on the genetic risk of fasting blood sugar and
상기 결과를 독립적인 유전체정보에서 검증하기 위해 22,686명에 대한 한국인칩 유전체정보 중에서 동일한 유전변이 정보를 추출하여, 상기 방법과 동일하게 유전적 위험도를 측정하고 제2형 당뇨병 발병률을 분석하였다. 그러나, 초기 분석에 사용된 12만 6천명에 비해서는 적은 수로, 1% 수준의 고위험군 분석은 적은 샘플 수로 인해 분석 결과에서 제외하였다. 그 결과는 표 4에 나타내었다.In order to verify the above results from the independent genome information, the same genetic mutation information was extracted from the genome information of Korean chips for 22,686 people, and the genetic risk was measured in the same manner as the above method, and the incidence of
표 4에 나타낸 바와 같이, 공복혈당 및 제2형 당뇨의 유전적 위험도 모두 상위 5% 이상에 해당하는 유전적 고위험군은 3.51배의 당뇨 발병률을 보여주고 있어, 1.94 내지 2.65배를 보이는 공복혈당 또는 제2형 당뇨의 유전적 위험도 기반 고위험군 보다 상회하는 당뇨 발병률을 확인 할 수 있었다.As shown in Table 4, the genetic high-risk group corresponding to the top 5% or higher in both the fasting blood sugar and the genetic risk of
이러한 결과는, 본 발명의 각각의 유전적 위험도를 복합적으로 분석하여 공복혈당 (FPG) 기반 유전적 위험도 고위험군과 제2형 당뇨 (T2D) 기반 유전적 위험도 고위험군에 모두 해당되는 경우에 제2형 당뇨병의 유전적 고위험군으로 선별하는 방법은 공복혈당 (FPG)과 관련된 유전변이에 대한 유전적 위험도, 제2형 당뇨 (T2D) 관련된 유전변이에 대한 유전적 위험도를 각각 단독으로 분석하여 제2형 당뇨병 고위험군을 선별하는 기존 방법과 비교하여 선별 정확도가 현저히 우수하고, 제2형 당뇨 발병률이 더 높은 유전적 고위험군을 정교하게 선별 할 수 있어 제2형 당뇨의 유전적 고위험군 선별에 따라 맞춤형 진료, 치료 및 예방에 활용할 수 있다는 것을 의미한다.These results are based on a complex analysis of the genetic risk of each of the present invention, and
이상에서 살펴본 바와 같이, 본 발명의 구체적인 실시예를 상세하게 설명되었으나, 본 발명의 사상을 이해하는 당업자는 동일한 사상의 범위 내에서 다른 구성요소를 추가, 변경, 삭제 등을 통하여, 퇴보적인 다른 발명이나 본 발명 사상의 범위 내에 포함되는 다른 실시예를 용이하게 제안할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상술한 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.As described above, the specific embodiments of the present invention have been described in detail, but those skilled in the art who understand the spirit of the present invention can add, change, delete other elements within the scope of the same idea, and other regressive inventions. However, it will be possible to easily propose other embodiments included within the scope of the spirit of the present invention. Therefore, it should be understood that the embodiments described above are illustrative and non-limiting in all respects. The scope of the present invention is indicated by the scope of the claims to be described later rather than the detailed description described above, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts are included in the scope of the present invention. Should be interpreted as.
<110> Korea Disease Control and Prevention Agency, KDCA <120> methods for diagnosing the high risk group of Diabetes based on Genetic Risk Score <130> PN2007-308 <160> 56 <170> KoPatentIn 3.0 <210> 1 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 1 atcacgaggt c 11 <210> 2 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 2 tttgggaact a 11 <210> 3 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> ATCTCTC/A <400> 3 tttctatctc t 11 <210> 4 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/C <400> 4 ttccacgtat a 11 <210> 5 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/T <400> 5 agacatccct t 11 <210> 6 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 6 tgtggtggca g 11 <210> 7 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 7 ctacacgcct c 11 <210> 8 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 8 acggcgaggc c 11 <210> 9 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/A <400> 9 tgaacaatct t 11 <210> 10 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 10 agatcgtgcc a 11 <210> 11 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 11 gggcatggtg g 11 <210> 12 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 12 atactgtgtc a 11 <210> 13 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 13 acctccgtct c 11 <210> 14 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 14 gagcttgtgt g 11 <210> 15 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 15 gaaccgaggc c 11 <210> 16 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 16 tggcttgagc a 11 <210> 17 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/G <400> 17 ggcaggtaca g 11 <210> 18 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/A <400> 18 cccagattca a 11 <210> 19 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 19 tggattgatc a 11 <210> 20 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> AAAAC/A <400> 20 tcttaaaaac a 11 <210> 21 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 21 agagatgaga t 11 <210> 22 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 22 tgctggcgta g 11 <210> 23 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/A <400> 23 caggtatggt g 11 <210> 24 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> T/TA <400> 24 ttttttaaaa g 11 <210> 25 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> G/GA <400> 25 aaaaagaaaa a 11 <210> 26 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> C/CA <400> 26 tttcacaatt t 11 <210> 27 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(8) <223> A/ATT <400> 27 agctaatttt t 11 <210> 28 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/G <400> 28 tgtttgctgt c 11 <210> 29 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(10) <223> A/ATTTG <400> 29 atcttatttg t 11 <210> 30 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> T/TG <400> 30 agagatgggg g 11 <210> 31 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/C <400> 31 aagcacccag a 11 <210> 32 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 32 aacatggtga a 11 <210> 33 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/A <400> 33 ccaccagcag c 11 <210> 34 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 34 gggtggacct g 11 <210> 35 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/T <400> 35 ttttttaatt t 11 <210> 36 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 36 caagcgaggg g 11 <210> 37 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/T <400> 37 gagtttgggg t 11 <210> 38 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(8) <223> C/CTG <400> 38 aggctctgtg g 11 <210> 39 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 39 gtgaggagtt c 11 <210> 40 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 40 ccagccggga c 11 <210> 41 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/A <400> 41 tgggcatggt g 11 <210> 42 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> A/AT <400> 42 gtgctatttt t 11 <210> 43 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 43 ggggtttcac c 11 <210> 44 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 44 cctaacgcag t 11 <210> 45 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 45 gttgcggggc t 11 <210> 46 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 46 gaggcggggc a 11 <210> 47 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 47 gggctggtcc a 11 <210> 48 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 48 cgtcggcagg a 11 <210> 49 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 49 aagcacggca c 11 <210> 50 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> TTGAGAAATCTCTATACTATTTTCCATAGTGACTG/T <400> 50 gctctttgag a 11 <210> 51 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 51 acactgaagt g 11 <210> 52 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/A <400> 52 tttttaaaaa a 11 <210> 53 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 53 tagacgaaat g 11 <210> 54 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> A/AT <400> 54 catatatttt t 11 <210> 55 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(8) <223> C/CTT <400> 55 aaatcctttt t 11 <210> 56 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> AG/A <400> 56 ggtgaagaag a 11 <110> Korea Disease Control and Prevention Agency, KDCA <120> methods for diagnosing the high risk group of Diabetes based on Genetic Risk Score <130> PN2007-308 <160> 56 <170> KoPatentIn 3.0 <210> 1 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 1 atcacgaggt c 11 <210> 2 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 2 tttgggaact a 11 <210> 3 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> ATCTCTC/A <400> 3 tttctatctc t 11 <210> 4 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/C <400> 4 ttccacgtat a 11 <210> 5 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/T <400> 5 agacatccct t 11 <210> 6 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 6 tgtggtggca g 11 <210> 7 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 7 ctacacgcct c 11 <210> 8 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 8 acggcgaggc c 11 <210> 9 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/A <400> 9 tgaacaatct t 11 <210> 10 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 10 agatcgtgcc a 11 <210> 11 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 11 gggcatggtg g 11 <210> 12 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 12 atactgtgtc a 11 <210> 13 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 13 acctccgtct c 11 <210> 14 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 14 gagcttgtgt g 11 <210> 15 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 15 gaaccgaggc c 11 <210> 16 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 16 tggcttgagc a 11 <210> 17 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/G <400> 17 ggcaggtaca g 11 <210> 18 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/A <400> 18 cccagattca a 11 <210> 19 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 19 tggattgatc a 11 <210> 20 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> AAAAC/A <400> 20 tcttaaaaac a 11 <210> 21 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 21 agagatgaga t 11 <210> 22 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 22 tgctggcgta g 11 <210> 23 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/A <400> 23 caggtatggt g 11 <210> 24 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> T/TA <400> 24 ttttttaaaa g 11 <210> 25 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> G/GA <400> 25 aaaaagaaaa a 11 <210> 26 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> C/CA <400> 26 tttcacaatt t 11 <210> 27 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(8) <223> A/ATT <400> 27 agctaatttt t 11 <210> 28 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/G <400> 28 tgtttgctgt c 11 <210> 29 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(10) <223> A/ATTTG <400> 29 atcttatttg t 11 <210> 30 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> T/TG <400> 30 agagatgggg g 11 <210> 31 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/C <400> 31 aagcacccag a 11 <210> 32 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 32 aacatggtga a 11 <210> 33 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/A <400> 33 ccaccagcag c 11 <210> 34 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 34 gggtggacct g 11 <210> 35 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/T <400> 35 ttttttaatt t 11 <210> 36 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 36 caagcgaggg g 11 <210> 37 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/T <400> 37 gagtttgggg t 11 <210> 38 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(8) <223> C/CTG <400> 38 aggctctgtg g 11 <210> 39 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 39 gtgaggagtt c 11 <210> 40 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 40 ccagccggga c 11 <210> 41 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> G/A <400> 41 tgggcatggt g 11 <210> 42 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> A/AT <400> 42 gtgctatttt t 11 <210> 43 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> C/T <400> 43 ggggtttcac c 11 <210> 44 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 44 cctaacgcag t 11 <210> 45 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 45 gttgcggggc t 11 <210> 46 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 46 gaggcggggc a 11 <210> 47 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 47 gggctggtcc a 11 <210> 48 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 48 cgtcggcagg a 11 <210> 49 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/C <400> 49 aagcacggca c 11 <210> 50 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> TTGAGAAATCTCTATACTATTTTCCATAGTGACTG/T <400> 50 gctctttgag a 11 <210> 51 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 51 acactgaagt g 11 <210> 52 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> T/A <400> 52 tttttaaaaa a 11 <210> 53 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> A/G <400> 53 tagacgaaat g 11 <210> 54 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(7) <223> A/AT <400> 54 catatatttt t 11 <210> 55 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6)..(8) <223> C/CTT <400> 55 aaatcctttt t 11 <210> 56 <211> 11 <212> DNA <213> Homo sapiens <220> <221> variation <222> (6) <223> AG/A <400> 56 ggtgaagaag a 11
Claims (11)
생물학적 시료로부터 제2형 당뇨병 관련 다형성 마커 (polymorphic marker)에 대한 유전적 위험도 점수 (Genetic Risk Score, GRS)를 계산하는 단계;
공복혈당 유전적 위험도 점수 및 제2형 당뇨병 유전적 위험도 점수 각각을 기반으로 고위험군을 선별하는 단계;
공복혈당 유전적 위험도 기반 고위험군 및 제2형 당뇨병 유전적 위험도 기반 고위험군에 모두 속하면 제2형 당뇨병 고위험군으로 판단하는 단계;를 포함하는, 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법.
Calculating a genetic risk score (GRS) for a fasting blood sugar-related polymorphic marker including a polymorphic site located in the sixth nucleotide sequence of SEQ ID NOs: 1 to 26 from the biological sample;
Calculating a genetic risk score (GRS) for a type 2 diabetes-related polymorphic marker from the biological sample;
Selecting a high-risk group based on each of the fasting glucose genetic risk score and the type 2 diabetes genetic risk score;
A method of providing information necessary for diagnosing or predicting the onset of type 2 diabetes, including; determining as a high risk group for type 2 diabetes when belonging to both the high risk group based on the genetic risk of fasting blood sugar and the high risk group based on the type 2 diabetes .
상기 공복혈당 관련 다형성 마커 (polymorphic marker)는 서열번호 27 내지 56의 6 번째 염기서열에 위치하는 다형성 부위를 포함하는 다형성 마커를 더 포함하는 것을 특징으로 하는, 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법.
The method of claim 1,
The fasting blood glucose-related polymorphic marker further comprises a polymorphic marker including a polymorphic site located at the 6th nucleotide sequence of SEQ ID NOs: 27 to 56, which is necessary for diagnosing or predicting the onset of type 2 diabetes. How to provide information.
상기 생물학적 시료는 조직, 세포, 전혈, 혈청, 혈장 및 타액으로 이루어지는 군으로부터 선택되는 것을 특징으로 하는, 제2형 당뇨병 진단에 필요한 정보를 제공하는 방법.
The method of claim 1,
The biological sample is a method of providing information necessary for diagnosing type 2 diabetes, characterized in that it is selected from the group consisting of tissue, cells, whole blood, serum, plasma, and saliva.
상기 유전적 위험도 (Genetic Risk Score, GRS)는 하기 수학식 1을 이용하여 계산된 것인, 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법:
[수학식 1]
상기 수학식 1에서 n은 총 다형성 마커의 수이고, i는 다형성마커 서열번호이며, β는 다형성 마커의 유전적 효과 (effect size)이고, x는 샘플 j의 대립유전자 수치인 것인, 방법.
The method of claim 1,
The genetic risk (Genetic Risk Score, GRS) is calculated using the following Equation 1, a method of providing information necessary for diagnosing type 2 diabetes or predicting the onset:
[Equation 1]
In Equation 1, n is the total number of polymorphic markers, i is the polymorphic marker sequence number, β is the genetic effect of the polymorphic marker, and x is the allele value of the sample j.
서열번호 1의 다형성 부위의 유전자형이 A인 경우,
서열번호 2의 다형성 부위의 유전자형이 A인 경우,
서열번호 3의 다형성 부위의 유전자형이 ATCTCTC인 경우,
서열번호 4의 다형성 부위의 유전자형이 G인 경우,
서열번호 5의 다형성 부위의 유전자형이 A인 경우,
서열번호 6의 다형성 부위의 유전자형이 C인 경우,
서열번호 7의 다형성 부위의 유전자형이 T인 경우,
서열번호 8의 다형성 부위의 유전자형이 A인 경우,
서열번호 9의 다형성 부위의 유전자형이 T인 경우,
서열번호 10의 다형성 부위의 유전자형이 A인 경우,
서열번호 11의 다형성 부위의 유전자형이 C인 경우,
서열번호 12의 다형성 부위의 유전자형이 A인 경우,
서열번호 13의 다형성 부위의 유전자형이 T인 경우,
서열번호 14의 다형성 부위의 유전자형이 C인 경우,
서열번호 15의 다형성 부위의 유전자형이 A인 경우,
서열번호 16의 다형성 부위의 유전자형이 C인 경우,
서열번호 17의 다형성 부위의 유전자형이 C인 경우,
서열번호 18의 다형성 부위의 유전자형이 G인 경우,
서열번호 19의 다형성 부위의 유전자형이 C인 경우,
서열번호 20의 다형성 부위의 유전자형이 AAAAC인 경우,
서열번호 21의 다형성 부위의 유전자형이 C인 경우,
서열번호 22의 다형성 부위의 유전자형이 A인 경우,
서열번호 23의 다형성 부위의 유전자형이 G인 경우,
서열번호 24의 다형성 부위의 유전자형이 T인 경우,
서열번호 25의 다형성 부위의 유전자형이 G인 경우 및
서열번호 26의 다형성 부위의 유전자형이 C인 경우에 제2형 당뇨병 발병 위험도가 높다고 예측하는 것을 특징으로 하는, 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법.
The method of claim 1,
When the genotype of the polymorphic site of SEQ ID NO: 1 is A,
When the genotype of the polymorphic site of SEQ ID NO: 2 is A,
When the genotype of the polymorphic site of SEQ ID NO: 3 is ATCTCTC,
When the genotype of the polymorphic site of SEQ ID NO: 4 is G,
When the genotype of the polymorphic site of SEQ ID NO: 5 is A,
When the genotype of the polymorphic site of SEQ ID NO: 6 is C,
When the genotype of the polymorphic site of SEQ ID NO: 7 is T,
When the genotype of the polymorphic site of SEQ ID NO: 8 is A,
When the genotype of the polymorphic site of SEQ ID NO: 9 is T,
When the genotype of the polymorphic site of SEQ ID NO: 10 is A,
When the genotype of the polymorphic site of SEQ ID NO: 11 is C,
When the genotype of the polymorphic site of SEQ ID NO: 12 is A,
When the genotype of the polymorphic site of SEQ ID NO: 13 is T,
When the genotype of the polymorphic site of SEQ ID NO: 14 is C,
When the genotype of the polymorphic site of SEQ ID NO: 15 is A,
When the genotype of the polymorphic site of SEQ ID NO: 16 is C,
When the genotype of the polymorphic site of SEQ ID NO: 17 is C,
When the genotype of the polymorphic site of SEQ ID NO: 18 is G,
When the genotype of the polymorphic site of SEQ ID NO: 19 is C,
When the genotype of the polymorphic site of SEQ ID NO: 20 is AAAAC,
When the genotype of the polymorphic site of SEQ ID NO: 21 is C,
When the genotype of the polymorphic site of SEQ ID NO: 22 is A,
When the genotype of the polymorphic site of SEQ ID NO: 23 is G,
When the genotype of the polymorphic site of SEQ ID NO: 24 is T,
When the genotype of the polymorphic site of SEQ ID NO: 25 is G, and
A method for providing information necessary for diagnosing or predicting the onset of type 2 diabetes, characterized in that it predicts that the risk of developing type 2 diabetes is high when the genotype of the polymorphic site of SEQ ID NO: 26 is C.
상기 진단은 한국인을 대상으로 하는 것을 특징으로 하는, 제2형 당뇨병 진단 또는 발병 예측에 필요한 정보를 제공하는 방법.
The method of claim 1,
The method for providing information necessary for diagnosing or predicting the onset of type 2 diabetes, characterized in that the diagnosis is for Koreans.
In the polynucleotide represented by the nucleotide sequence of SEQ ID NO: 1 to 26, a polynucleotide composed of 10 or more consecutive nucleotide sequences including a polymorphic site located at the 6th position of each nucleotide sequence or a complementary polynucleotide thereof is specifically A polymorphic marker composition for diagnosing or predicting the onset of type 2 diabetes, comprising a primer or probe that binds.
서열번호 1의 다형성 부위의 대립유전자형은 A,
서열번호 2의 다형성 부위의 대립유전자형은 A,
서열번호 3의 다형성 부위의 대립유전자형은 ATCTCTC,
서열번호 4의 다형성 부위의 대립유전자형은 G,
서열번호 5의 다형성 부위의 대립유전자형은 A,
서열번호 6의 다형성 부위의 대립유전자형은 C,
서열번호 7의 다형성 부위의 대립유전자형은 T,
서열번호 8의 다형성 부위의 대립유전자형은 A,
서열번호 9의 다형성 부위의 대립유전자형은 T,
서열번호 10의 다형성 부위의 대립유전자형은 A,
서열번호 11의 다형성 부위의 대립유전자형은 C,
서열번호 12의 다형성 부위의 대립유전자형은 A,
서열번호 13의 다형성 부위의 대립유전자형은 T,
서열번호 14의 다형성 부위의 대립유전자형은 C,
서열번호 15의 다형성 부위의 대립유전자형은 A,
서열번호 16의 다형성 부위의 대립유전자형은 C,
서열번호 17의 다형성 부위의 대립유전자형은 C,
서열번호 18의 다형성 부위의 대립유전자형은 G,
서열번호 19의 다형성 부위의 대립유전자형은 C,
서열번호 20의 다형성 부위의 대립유전자형은 AAAAC,
서열번호 21의 다형성 부위의 대립유전자형은 C,
서열번호 22의 다형성 부위의 대립유전자형은 A,
서열번호 23의 다형성 부위의 대립유전자형은 G,
서열번호 24의 다형성 부위의 대립유전자형은 T,
서열번호 25의 다형성 부위의 대립유전자형은 G 및
서열번호 26의 다형성 부위의 대립유전자형은 C인 것을 특징으로 하는, 제2형 당뇨병 진단 또는 발병 예측용 다형성 마커 조성물.
The method of claim 7,
The allele of the polymorphic site of SEQ ID NO: 1 is A,
The allele of the polymorphic site of SEQ ID NO: 2 is A,
The allele of the polymorphic site of SEQ ID NO: 3 is ATCTCTC,
The allele of the polymorphic site of SEQ ID NO: 4 is G,
The allele of the polymorphic site of SEQ ID NO: 5 is A,
The allele of the polymorphic site of SEQ ID NO: 6 is C,
The allele of the polymorphic site of SEQ ID NO: 7 is T,
The allele of the polymorphic site of SEQ ID NO: 8 is A,
The allele of the polymorphic site of SEQ ID NO: 9 is T,
The allele of the polymorphic site of SEQ ID NO: 10 is A,
The allele of the polymorphic site of SEQ ID NO: 11 is C,
The allele of the polymorphic site of SEQ ID NO: 12 is A,
The allele of the polymorphic site of SEQ ID NO: 13 is T,
The allele of the polymorphic site of SEQ ID NO: 14 is C,
The allele of the polymorphic site of SEQ ID NO: 15 is A,
The allele of the polymorphic site of SEQ ID NO: 16 is C,
The allele of the polymorphic site of SEQ ID NO: 17 is C,
The allele of the polymorphic site of SEQ ID NO: 18 is G,
The allele of the polymorphic site of SEQ ID NO: 19 is C,
The allele of the polymorphic site of SEQ ID NO: 20 is AAAAC,
The allele of the polymorphic site of SEQ ID NO: 21 is C,
The allele of the polymorphic site of SEQ ID NO: 22 is A,
The allele of the polymorphic site of SEQ ID NO: 23 is G,
The allele of the polymorphic site of SEQ ID NO: 24 is T,
The allele of the polymorphic site of SEQ ID NO: 25 is G and
The polymorphic marker composition for diagnosing or predicting the onset of type 2 diabetes, characterized in that the allele of the polymorphic site of SEQ ID NO: 26 is C.
상기 진단은 한국인을 대상으로 하는 것을 특징으로 하는, 제2형 당뇨병 진단 또는 발병 예측용 다형성 마커 조성물.
The method of claim 7,
The diagnosis is a polymorphic marker composition for diagnosing or predicting the onset of type 2 diabetes, characterized in that for Koreans.
A composition for diagnosing or predicting the onset of type 2 diabetes, comprising the marker composition of any one of claims 7 to 9.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020200132461A KR102254341B1 (en) | 2020-10-14 | 2020-10-14 | methods for diagnosing the high risk group of Diabetes based on Genetic Risk Score |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020200132461A KR102254341B1 (en) | 2020-10-14 | 2020-10-14 | methods for diagnosing the high risk group of Diabetes based on Genetic Risk Score |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR102254341B1 true KR102254341B1 (en) | 2021-05-21 |
Family
ID=76157583
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020200132461A Active KR102254341B1 (en) | 2020-10-14 | 2020-10-14 | methods for diagnosing the high risk group of Diabetes based on Genetic Risk Score |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102254341B1 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025084481A1 (en) * | 2023-10-20 | 2025-04-24 | (주)아이크로진 | Method for selecting genetic high-risk group for type 2 diabetes by considering genetic variants associated with obesity and type 2 diabetes |
-
2020
- 2020-10-14 KR KR1020200132461A patent/KR102254341B1/en active Active
Non-Patent Citations (2)
| Title |
|---|
| Anubha Mahajan 외, Nature Genetics, 2018.10.08., Vol.50, pp1505-1513. * |
| Minako Imamura 외, Human Molecular Genetics, 2012.03.28., Vol.21, No.13, pp3042-3049. * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025084481A1 (en) * | 2023-10-20 | 2025-04-24 | (주)아이크로진 | Method for selecting genetic high-risk group for type 2 diabetes by considering genetic variants associated with obesity and type 2 diabetes |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102158717B1 (en) | SNP marker for diagnosis of intracranial aneurysm comprising SNP of CD163L1 gene | |
| KR102158716B1 (en) | SNP marker for diagnosis of intracranial aneurysm comprising SNP of ARHGAP32 gene | |
| KR101979633B1 (en) | SNP markers for metabolic syndrome and use thereof | |
| KR102254341B1 (en) | methods for diagnosing the high risk group of Diabetes based on Genetic Risk Score | |
| CN106834501A (en) | To the fat related mononucleotide polymorphism site of Children in China and its application | |
| KR102189142B1 (en) | SNP as a marker for predicting exacerbation of chronic kidney disease and uses thereof | |
| KR20170051747A (en) | Single nucleotide polymorphism markers for determining of probability of skin wrinkle and use thereof | |
| KR102158713B1 (en) | SNP marker for diagnosis of intracranial aneurysm comprising SNP of GBA gene | |
| CN116083562B (en) | SNP marker combination and primer set related to aspirin resistance auxiliary diagnosis and application thereof | |
| KR102511162B1 (en) | HLA-DRB1 genotype analysis method using Korean-specific SNPs and optimized pipeline | |
| KR102543976B1 (en) | HLA-B genotype analysis method using Korean-specific SNPs and optimized pipeline | |
| KR102189144B1 (en) | Marker for predicting exacerbation of chronic kidney disease and method for predicting exacerbation using the same | |
| KR102189143B1 (en) | Composition and method for prognosing chronic kidney disease | |
| US9752195B2 (en) | TTC8 as prognostic gene for progressive retinal atrophy in dogs | |
| KR102511160B1 (en) | Methods for predicting the high risk group of hypercholesterolemia by using total cholesterol associated genetic variants | |
| KR20210132277A (en) | SNP markers for diagnosing Cold Hands/Feet Syndrome and use thereof | |
| KR102511161B1 (en) | HLA-A genotype analysis method using Korean-specific SNPs and optimized pipeline | |
| KR102409336B1 (en) | SNP markers for Immunoglobulin A (IgA) nephropathy and IgA vasculitis diagnosis and diagnosis method using the same | |
| KR101972355B1 (en) | Polymorphic Marker of obesity or obesity related diseases in Korean and Method of Predicting obesity or obesity related diseases Risk in Korean Using The Genotype Information | |
| KR102181563B1 (en) | Single nucleotide polymorphism marker for diagnosing precocious puberty or prognosising treatment of precocious puberty, and use thereof | |
| KR20250040125A (en) | Method for determining the risk of developing high risk open angle glaucoma in Koreans specific by polygenic risk score analysis | |
| CN101871003A (en) | Kit and primers for predicting the susceptibility of type 2 diabetes in Chinese | |
| KR102158720B1 (en) | SNP marker for diagnosis of intracranial aneurysm comprising SNP of LRRC3 gene | |
| KR102158722B1 (en) | SNP marker for diagnosis of intracranial aneurysm comprising SNP of FLJ45964 gene | |
| KR102158714B1 (en) | SNP marker for diagnosis of intracranial aneurysm comprising SNP of TCF24 gene |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20201014 |
|
| PA0201 | Request for examination | ||
| PA0302 | Request for accelerated examination |
Patent event date: 20201014 Patent event code: PA03022R01D Comment text: Request for Accelerated Examination |
|
| PN2301 | Change of applicant |
Patent event date: 20201120 Comment text: Notification of Change of Applicant Patent event code: PN23011R01D |
|
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20201211 Patent event code: PE09021S01D |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20210426 |
|
| GRNT | Written decision to grant | ||
| PR0702 | Registration of establishment of national patent |
Patent event code: PR07021E01D Comment text: Registration of Establishment of National Patent Patent event date: 20210514 |
|
| PR1002 | Payment of registration fee |
Payment date: 20210514 End annual number: 20 Start annual number: 1 |
|
| PG1601 | Publication of registration |


