CN113035354A - 一种诊断多囊卵巢综合征的系统和方法 - Google Patents
一种诊断多囊卵巢综合征的系统和方法 Download PDFInfo
- Publication number
- CN113035354A CN113035354A CN202110574591.3A CN202110574591A CN113035354A CN 113035354 A CN113035354 A CN 113035354A CN 202110574591 A CN202110574591 A CN 202110574591A CN 113035354 A CN113035354 A CN 113035354A
- Authority
- CN
- China
- Prior art keywords
- subject
- days
- amh
- level
- menstrual cycle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 201000010065 polycystic ovary syndrome Diseases 0.000 title claims abstract description 193
- 206010036049 Polycystic ovaries Diseases 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title description 29
- AEMFNILZOJDQLW-QAGGRKNESA-N androst-4-ene-3,17-dione Chemical compound O=C1CC[C@]2(C)[C@H]3CC[C@](C)(C(CC4)=O)[C@@H]4[C@@H]3CCC2=C1 AEMFNILZOJDQLW-QAGGRKNESA-N 0.000 claims abstract description 243
- 229960005471 androstenedione Drugs 0.000 claims abstract description 243
- AEMFNILZOJDQLW-UHFFFAOYSA-N androstenedione Natural products O=C1CCC2(C)C3CCC(C)(C(CC4)=O)C4C3CCC2=C1 AEMFNILZOJDQLW-UHFFFAOYSA-N 0.000 claims abstract description 243
- 108010005853 Anti-Mullerian Hormone Proteins 0.000 claims abstract description 231
- 102100030173 Muellerian-inhibiting factor Human genes 0.000 claims abstract description 231
- 239000000868 anti-mullerian hormone Substances 0.000 claims abstract description 231
- 230000027758 ovulation cycle Effects 0.000 claims abstract description 151
- 210000004369 blood Anatomy 0.000 claims description 13
- 239000008280 blood Substances 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 10
- 208000006011 Stroke Diseases 0.000 claims description 5
- MUMGGOZAMZWBJJ-DYKIIFRCSA-N Testostosterone Chemical compound O=C1CC[C@]2(C)[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 MUMGGOZAMZWBJJ-DYKIIFRCSA-N 0.000 description 36
- 229960003604 testosterone Drugs 0.000 description 18
- 238000004458 analytical method Methods 0.000 description 15
- 238000007477 logistic regression Methods 0.000 description 15
- 210000002966 serum Anatomy 0.000 description 13
- 230000000694 effects Effects 0.000 description 12
- 102000009151 Luteinizing Hormone Human genes 0.000 description 11
- 108010073521 Luteinizing Hormone Proteins 0.000 description 11
- 238000003745 diagnosis Methods 0.000 description 11
- 229940040129 luteinizing hormone Drugs 0.000 description 11
- 238000002790 cross-validation Methods 0.000 description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 102000003946 Prolactin Human genes 0.000 description 7
- 108010057464 Prolactin Proteins 0.000 description 7
- 239000003098 androgen Substances 0.000 description 7
- 201000010066 hyperandrogenism Diseases 0.000 description 7
- 210000001672 ovary Anatomy 0.000 description 7
- 229940097325 prolactin Drugs 0.000 description 7
- 238000002604 ultrasonography Methods 0.000 description 7
- 238000010200 validation analysis Methods 0.000 description 7
- 201000010099 disease Diseases 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 206010002659 Anovulatory cycle Diseases 0.000 description 5
- 102000001554 Hemoglobins Human genes 0.000 description 5
- 108010054147 Hemoglobins Proteins 0.000 description 5
- 208000005718 Stomach Neoplasms Diseases 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 206010017758 gastric cancer Diseases 0.000 description 5
- 230000016087 ovulation Effects 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 201000011549 stomach cancer Diseases 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 206010020112 Hirsutism Diseases 0.000 description 4
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000003821 menstrual periods Effects 0.000 description 4
- 230000005906 menstruation Effects 0.000 description 4
- 230000035935 pregnancy Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000002124 endocrine Effects 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 230000008376 long-term health Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 238000013178 mathematical model Methods 0.000 description 3
- 208000030159 metabolic disease Diseases 0.000 description 3
- 230000002611 ovarian Effects 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 230000001850 reproductive effect Effects 0.000 description 3
- 230000003248 secreting effect Effects 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 208000011580 syndromic disease Diseases 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 208000002874 Acne Vulgaris Diseases 0.000 description 2
- 201000004384 Alopecia Diseases 0.000 description 2
- 201000005670 Anovulation Diseases 0.000 description 2
- 206010058314 Dysplasia Diseases 0.000 description 2
- 239000000579 Gonadotropin-Releasing Hormone Substances 0.000 description 2
- 101001011645 Homo sapiens Muellerian-inhibiting factor Proteins 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 101000857870 Squalus acanthias Gonadoliberin Proteins 0.000 description 2
- 206010000496 acne Diseases 0.000 description 2
- 229940030486 androgens Drugs 0.000 description 2
- 208000007502 anemia Diseases 0.000 description 2
- 231100000552 anovulation Toxicity 0.000 description 2
- 108010083586 anti-Mullerian hormone receptor Proteins 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 229960005309 estradiol Drugs 0.000 description 2
- 229930182833 estradiol Natural products 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- XLXSAKCOAKORKW-AQJXLSMYSA-N gonadorelin Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 XLXSAKCOAKORKW-AQJXLSMYSA-N 0.000 description 2
- 229940035638 gonadotropin-releasing hormone Drugs 0.000 description 2
- 230000003779 hair growth Effects 0.000 description 2
- 208000031424 hyperprolactinemia Diseases 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 210000004914 menses Anatomy 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 230000008506 pathogenesis Effects 0.000 description 2
- 230000009290 primary effect Effects 0.000 description 2
- 239000000186 progesterone Substances 0.000 description 2
- 229960003387 progesterone Drugs 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- HFVMLYAGWXSTQI-QYXZOKGRSA-N 5alpha-androst-16-en-3-one Chemical compound C1C(=O)CC[C@]2(C)[C@H]3CC[C@](C)(C=CC4)[C@@H]4[C@@H]3CC[C@H]21 HFVMLYAGWXSTQI-QYXZOKGRSA-N 0.000 description 1
- 208000005676 Adrenogenital syndrome Diseases 0.000 description 1
- 201000000736 Amenorrhea Diseases 0.000 description 1
- 206010001928 Amenorrhoea Diseases 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 208000008448 Congenital adrenal hyperplasia Diseases 0.000 description 1
- 208000014311 Cushing syndrome Diseases 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 208000017701 Endocrine disease Diseases 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 206010019375 Helicobacter infections Diseases 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 231100000360 alopecia Toxicity 0.000 description 1
- 231100000540 amenorrhea Toxicity 0.000 description 1
- 201000002996 androgenic alopecia Diseases 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000003433 contraceptive agent Substances 0.000 description 1
- 230000002254 contraceptive effect Effects 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000004064 dysfunction Effects 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 230000003325 follicular Effects 0.000 description 1
- 230000008217 follicular development Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 229940121381 gonadotrophin releasing hormone (gnrh) antagonists Drugs 0.000 description 1
- 210000002503 granulosa cell Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000003016 hypothalamus Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000000509 infertility Diseases 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 231100000535 infertility Toxicity 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009245 menopause Effects 0.000 description 1
- 230000006371 metabolic abnormality Effects 0.000 description 1
- 208000010555 moderate anemia Diseases 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 210000002394 ovarian follicle Anatomy 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 201000009395 primary hyperaldosteronism Diseases 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000011808 rodent model Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000006016 thyroid dysfunction Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000007473 univariate analysis Methods 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明涉及一种诊断多囊卵巢综合征的系统,其包括:数据采集模块,其用于获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、收集受试者的BMI、以及获取受试者的雄烯二酮(AND)水平的数据;以及计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。利用本发明的系统,可以计算出受试者罹患多囊卵巢综合征的概率(p),并依据系统预存的默认的多囊卵巢综合征分组参数,对该受试者罹患多囊卵巢综合征的概率(p)进行分组,从而判断受试者罹患多囊卵巢综合征的风险。
Description
技术领域
本发明涉及一种用于评估受试者罹患多囊卵巢综合征的概率的系统方法,以及涉及一种协助辅助诊断多囊卵巢综合征的系统和方法,利用本发明的系统和方法可以评估受试者罹患多囊卵巢综合征的概率,从而辅助诊断是否罹患多囊卵巢综合征,以及评估受试者在经过了相应的治疗之后罹患卵巢综合征的情况是否得到了改善。
背景技术
育龄妇女中多囊卵巢综合征(PCOS)的发病率在5%至20%之间,是最常见的内分泌和代谢疾病之一,需特别关注这一类人群的长期健康问题。PCOS患者只有一小部分因为不孕不育因素就诊,相当比例的PCOS患者未就诊,因此,相当多的PCOS患者不能对其未来的潜在代谢疾病发生风险进行有效管理。另外,由于PCOS发病机制未知,目前国际上常用的诊断标准也备受争议。
基于上述背景,在本领域中亟需与PCOS发病机制相关的新的诊断标准。另外,当前用于筛查和诊断PCOS的临床实践,对于普通妇科医生和初级保健医师而言并非易事,常常会造成漏诊。因此,研发出一套方便快捷、易于推广的PCOS诊断系统意义重大。
发明内容
PCOS主要是一种高雄激素性疾病,这一点已通过雄激素诱导的PCOS的各种啮齿类动物模型得到了验证。然而,目前患者是如何产生过量的雄激素仍然是未知的。最近使用小鼠模型进行的研究表明,AMH参与调节下丘脑-垂体-卵巢(H-P-O)轴,并可能刺激过量雄激素的产生。在小鼠的妊娠第16.5、17.5和18.5天施用重组人AMH可激活促性腺激素释放激素(GnRH)分泌神经元中的AMH受体,并增加促黄体生成激素(LH)脉冲的频率,从而导致血清LH和睾丸激素水平升高;在妊娠第19.5天降低了雌性小鼠的雌二醇(E2)和孕酮的水平。高水平的AMH诱导血清LH和睾丸激素升高,导致母亲和女性后代的排卵或无排卵以及卵母细胞发育不良。因此,AMH被越来越多地认为是诊断这种疾病的潜在标志。
在本申请中,本申请的发明人尝试建立使用AMH水平和其他指标诊断和预测PCOS的系统和方法,这可能有助于用于在临床上筛查和诊断PCOS,并且有可能进一步阐明PCOS的病因。
具体来说,本发明涉及如下内容:
1. 一种诊断多囊卵巢综合征的系统,其包括:
数据采集模块,其用于获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、收集受试者的BMI、以及获取受试者的雄烯二酮(AND)水平的数据;以及
计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。
2.根据项1所述的系统,其还包括:
分组模块,在所述分组模块中预存有默认的多囊卵巢综合征分组参数,并且依据该分组参数,对所述计算得到的罹患多囊卵巢综合征的概率(p)进行分组,从而对受试者罹患多囊卵巢综合征的风险进行分组。
3. 根据项1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,利用将受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据转换成的多分类变量来计算受试者罹患多囊卵巢综合征的概率(p)。
4. 根据项1~3中任一项所述的系统,其中,
所述抗缪勒氏管激素(AMH)水平是指女性受试者月经周期任何一天的静脉血中的抗缪勒氏管激素浓度,
所述雄烯二酮(AND)水平是指受试者月经期中任一天所检测的受试者的雄烯二酮浓度。
5. 根据项1~4中任一项所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将所述抗缪勒氏管激素(AMH)水平转换成五分类变量,
即将所述抗缪勒氏管激素(AMH)水平分为五组,分别为:受试者的抗缪勒氏管激素(AMH)水平小于2.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在2.5 ng/ml及以上且小于5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在5 ng/ml及以上且小于7.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在7.5 ng/ml及以上且小于10 ng/ml,以及受试者的抗缪勒氏管激素(AMH)水平大于等于10 ng/ml。
6. 根据项1~5中任一项所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将所述受试者的月经周期天数上限转换成五分类变量,
即将受试者的月经周期天数上限分为五组,分别为受试者的月经周期天数上限小于35天,受试者的月经周期天数上限在35天及以上且小于45天,受试者的月经周期天数上限在45天及以上且小于60天,受试者的月经周期天数上限在60天及以上且小于90天,以及受试者的月经周期天数上限在90天及以上。
7. 根据项1~6中任一项所述的系统,其中,
在计算罹患多囊卵巢综合征概率的模块中,将受试者的BMI转换成四分类变量,
即将受试者的BMI分为四组,分别为受试者的BMI小于18.5,受试者的BMI在18.5及以上且小于24,受试者的BMI在24及以上且小于28,以及受试者的BMI在28及以上。
8. 根据项1~7中任一项所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将受试者的雄烯二酮(AND)水平转换成三分类变量,
即将受试者的雄烯二酮(AND)水平范围三组,分别为:受试者的雄烯二酮(AND)水平小于5nmol/L,受试者的雄烯二酮(AND)水平在5 nmol/L及以上且小于10 nmol/L,以及受试者的雄烯二酮(AND)水平在10 nmol/L及以上。
9. 根据项1~8中任一项所述的系统,其中,
在计算罹患多囊卵巢综合征概率的模块中,预先存储有基于现有数据库中受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据转换成的多分类变量拟合而成的用于计算罹患多囊卵巢综合征的概率(p)的公式。
10. 根据项9所述的系统,其中,
所述公式为如下公式一:
p=1/[1+e-(i+a*AMH+b*月经周期天数上限+c*BMI+d*AND) ](公式一)
其中,p为计算出的受试者罹患多囊卵巢综合征的概率,a、b、c、d、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的模块中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平来获取a、b、c、d的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、BMI或AND取值为0或1。
11. 根据项10所述的系统,其中,
i为选自-4.91525~-4.081495中的任意数值,i优选为-4.498372;
当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;
当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3883373~0.8463509中的任意数值,a优选为0.6173441;
当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.2694194~1.7629597中的任意数值,a优选为1.5161895;
当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自1.8891674~2.4887798中的任意数值,a优选为2.1889736;
当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.1935842~2.8082163中的任意数值,a优选为2.5009002;
当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;
当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1669412~1.6485894中的任意数值,b优选为1.4077653;
当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.5889245~2.0947343中的任意数值,b优选为1.8418294;
当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.6497983~2.3668561中的任意数值,b优选为2.0083272;
当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自1.8809757~2.5707838中的任意数值,b优选为2.2258797;
当受试者的BMI小于18.5时,BMI取值为0;
当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.085964~0.6550568中的任意数值,c优选为0.2845466;
当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.3957758~1.1728099中的任意数值,c优选为0.7842928;
当受试者的BMI在28及以上时,BMI取值为1,c为选自0.7922476~1.6382346中的任意数值,c优选为1.2152411;
当受试者的AND水平小于5nmol/L时,AND取值为0;
当受试者的AND水平在5 nmol/L及以上且小于10 nmol/L时,AND取值为1,d为选自0.269652~0.6809945中的任意数值,d优选为0.4753233;
当受试者的AND水平在10 nmol/L及以上时,AND取值为1,d为选自0.7579538~1.252042中的任意数值,d优选为1.0049979。
12. 根据项1~11中任一项所述的系统,其中,
在所述分组模块中预存的分组依据为:
当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低危;
当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;
当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
13. 一种诊断多囊卵巢综合征的方法,其包括:
数据采集步骤,其获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、收集受试者的BMI、以及获取受试者的雄烯二酮(AND)水平的数据;以及
计算罹患多囊卵巢综合征的概率的步骤,其将数据采集步骤中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。
14.根据项13所述的方法,其还包括:
分组步骤,在所述分组步骤中预存有默认的多囊卵巢综合征分组参数,并且依据该分组参数,对所述计算得到的罹患多囊卵巢综合征的概率(p)进行分组,从而对受试者罹患多囊卵巢综合征的风险进行分组。
15. 根据项13或14所述的方法,其中,
在计算罹患多囊卵巢综合征的概率的步骤中,利用将受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据转换成的多分类变量来计算受试者罹患多囊卵巢综合征的概率(p)。
16. 根据项13~15中任一项所述的方法,其中,
所述抗缪勒氏管激素(AMH)水平是指女性受试者月经周期任何一天的静脉血中的抗缪勒氏管激素浓度,
所述雄烯二酮(AND)水平是指受试者月经期中任一天所检测的受试者的雄烯二酮浓度。
17. 根据项13~16中任一项所述的方法,其中,
在计算罹患多囊卵巢综合征的概率的步骤中,将所述抗缪勒氏管激素(AMH)水平转换成五分类变量,
即将所述抗缪勒氏管激素(AMH)水平分为五组,分别为:受试者的抗缪勒氏管激素(AMH)水平小于2.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在2.5 ng/ml及以上且小于5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在5 ng/ml及以上且小于7.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在7.5 ng/ml及以上且小于10 ng/ml,以及受试者的抗缪勒氏管激素(AMH)水平大于等于10 ng/ml。
18. 根据项13~17中任一项所述的方法,其中,
在计算罹患多囊卵巢综合征的概率的步骤中,将所述受试者的月经周期天数上限转换成五分类变量,
即将受试者的月经周期天数上限分为五组,分别为受试者的月经周期天数上限小于35天,受试者的月经周期天数上限在35天及以上且小于45天,受试者的月经周期天数上限在45天及以上且小于60天,受试者的月经周期天数上限在60天及以上且小于90天,以及受试者的月经周期天数上限在90天及以上。
19. 根据项13~18中任一项所述的方法,其中,
在计算罹患多囊卵巢综合征概率的步骤中,将受试者的BMI转换成四分类变量,
即将受试者的BMI分为四组,分别为受试者的BMI小于18.5,受试者的BMI在18.5及以上且小于24,受试者的BMI在24及以上且小于28,以及受试者的BMI在28及以上。
20. 根据项13~19中任一项所述的方法,其中,
在计算罹患多囊卵巢综合征的概率的步骤中,将受试者的雄烯二酮(AND)水平转换成三分类变量,
即将受试者的雄烯二酮(AND)水平范围三组,分别为:受试者的雄烯二酮(AND)水平小于5nmol/L,受试者的雄烯二酮(AND)水平在5 nmol/L及以上且小于10 nmol/L,以及受试者的雄烯二酮(AND)水平在10 nmol/L及以上。
21. 根据项13~20中任一项所述的方法,其中,
在计算罹患多囊卵巢综合征概率的步骤中,预先存储有基于现有数据库中受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据转换成的多分类变量拟合而成的用于计算罹患多囊卵巢综合征的概率(p)的公式。
22. 根据项21所述的方法,其中,
所述公式为如下公式一:
p=1/1+e-(i+a*AMH+b*月经周期天数上限+c*BMI+d*AND) (公式一)
其中,p为计算出的受试者罹患多囊卵巢综合征的概率,a、b、c、d、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的步骤中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平来获取a、b、c、d的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、BMI或AND取值为0或1。
23. 根据项22所述的方法,其中,
i为选自-4.91525~-4.081495中的任意数值,i优选为-4.498372;
当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;
当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3883373~0.8463509中的任意数值,a优选为0.6173441;
当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.2694194~1.7629597中的任意数值,a优选为1.5161895;
当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自1.8891674~2.4887798中的任意数值,a优选为2.1889736;
当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.1935842~2.8082163中的任意数值,a优选为2.5009002;
当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;
当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1669412~1.6485894中的任意数值,b优选为1.4077653;
当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.5889245~2.0947343中的任意数值,b优选为1.8418294;
当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.6497983~2.3668561中的任意数值,b优选为2.0083272;
当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自1.8809757~2.5707838中的任意数值,b优选为2.2258797;
当受试者的BMI小于18.5时,BMI取值为0;
当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.085964~0.6550568中的任意数值,c优选为0.2845466;
当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.3957758~1.1728099中的任意数值,c优选为0.7842928;
当受试者的BMI在28及以上时,BMI取值为1,c为选自0.7922476~1.6382346中的任意数值,c优选为1.2152411;
当受试者的AND水平小于5nmol/L时,AND取值为0;
当受试者的AND水平在5 nmol/L及以上且小于10 nmol/L时,AND取值为1,d为选自0.269652~0.6809945中的任意数值,d优选为0.4753233;
当受试者的AND水平在10 nmol/L及以上时,AND取值为1,d为选自0.7579538~1.252042中的任意数值,d优选为1.0049979。
24. 根据项13~23中任一项所述的方法,其中,
在所述分组步骤中预存的分组依据为:
当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低危;
当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;
当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
发明效果
本发明建立了一个具有4个参数的数学模型,即考虑AMH、月经周期天数、BMI和雄烯二酮水平的模型,从而代替了现有技术中简单采用AMH临界值来诊断多囊卵巢综合征的情况。与现有技术相比,本发明具有以下有益效果:首先,本发明构建的系统没有强调固定参数,而是着重于从多个变量中筛选预测参数从而用于构建本发明的预测系统,并深入地验证了其构建系统的预测准确性。其次,本发明的申请人采用的样本量较大,并经过外部验证,表明其稳定性。可见本发明人建立的多囊卵巢综合征诊断模型可能有助于在临床上筛查和诊断多囊卵巢综合征,并且有可能进一步阐明多囊卵巢综合征的病因。利用本发明的系统,可以计算出受试者罹患多囊卵巢综合征的概率(p),并依据系统预存的默认的多囊卵巢综合征分组参数,对该受试者罹患多囊卵巢综合征的概率(p)进行分组,从而判断受试者罹患多囊卵巢综合征的风险。
具体实施方式
在本文中,月经期是指每次月经持续的天数,一般为3~7天。在本文中,雄烯二酮(AND)水平是指受试者月经期中任一天所检测的受试者的雄烯二酮浓度,例如可以是月经期第一天、第二天、第三天、第四天、第五天、第六天或第七天等所检测到的受试者的雄烯二酮浓度。通常雄烯二酮数据在月经期比较稳定。
在本文中,月经周期是指两次月经第1日的时间间隔,受试者月经周期天数上限是由受试者主动提供的,例如受试者基于过往的经验提供的其月经周期通常是30-90天,那么在本发明中获取的月经周期天数上限为90天。
抗缪勒氏管激素(AMH)是一种由卵巢小卵泡的颗粒层细胞所分泌的荷尔蒙,胎儿时期的女宝宝从36周开始制造AMH,卵巢内的小卵泡数量越多,AMH的浓度便越高;反之,当卵泡随着年龄及各种因素逐渐消耗,AMH浓度也会随之降低,越接近更年期,AMH便渐趋于0。
BMI(Body Mass Index)是体质指数又称体重指数的简称,是用体重公斤数除以身高米数平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准。主要用于统计用途,当我们需要比较及分析一个人的体重对于不同高度的人所带来的健康影响时,BMI值是一个中立而可靠的指标。
雄烯二酮(AND)是女性血循环中的四种雄性激素之一,雄烯二酮是睾酮的主要前体物质,循环中的雄烯二酮由卵巢和肾上腺的分泌各占一半,雄烯二酮水平和睾酮水平存在动态平衡的关系,循环血中雄烯二酮浓度过高提示高雄激素血症。
连续变量:在统计学中,变量按变量值是否连续可分为连续变量与分类变量两种。在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。例如,生产零件的规格尺寸,人体测量的身高、体重、胸围等为连续变量,其数值只能用测量或计量的方法取得。反之,其数值只能用自然数或整数单位计算的则为离散变量。例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。
分类变量是指地理位置、人口统计等方面的变量,其作用是将调查响应者分群。描述变量是描述某一个客户群与其他客户群的区别。大部分分类变量也就是描述变量。分类变量可以分为无序分类变量和有序分类变量两大类。其中,无序分类变量(unorderedcategorical variable)是指所分类别或属性之间无程度和顺序的差别。其又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。而有序分类变量(ordinal categorical variable)各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。
变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。
逻辑回归(logistics regression),是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过逻辑回归回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素。同时根据该权值可以根据危险因素预测一个人患癌症的可能性。逻辑回归的因变量可以是二分类的,也可以是多分类的。
在本文中使用的数据拟合模型是一个逻辑回归模型,它基于λ的值对回归模型的系数的绝对大小进行惩罚。惩罚越大,对较弱因素的估计就趋近于零,因此只有最强的预测变量保留在模型中。
最小绝对收缩和选择算子回归(通常简单地称为Lasso回归),是以缩小变量集(降阶)为思想的压缩估计方法。它通过构造一个惩罚函数,可以将变量的系数进行压缩并使某些回归系数变为0,进而达到变量选择的目的。它是一种利用罚函数来提高模型预测能力的算法, 该算法使用1-范数约束不仅能够解决高维度和共线性问题,还能使建立的模型具有“稀疏性”,即算法在建模中具有自动进行波长选择的效果。
10倍交叉验证(10-fold cross-validation),或称十折交叉验证,是常用的测试方法,用来测试算法准确性。在验证时将数据集分成十份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证(例如10次10折交叉验证),再求其均值,作为对算法准确性的估计。十折交叉验证之所以选择将数据集分为10份,是因为通过利用大量数据集、使用不同学习技术进行的大量试验,表明10折是获得最好误差估计的恰当选择,而且也有一些理论根据可以证明这一点。
共线性,即同线性或同线型。统计学中,共线性即多重共线性。多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。
过度拟合是“过于紧密或精确地对应于特定数据集的分析结果,因此可能无法拟合其他数据或可靠地预测未来的观察结果”。一种过度拟合模型是一个统计模型包含多个参数比可以由数据是合理的。过度拟合的本质是在不知不觉中提取了一些残余变化(即噪声),好像该变化代表了基础模型结构一样。换句话说,该模型记住了大量示例,而不是学习注意特征。过度拟合的可能性不仅取决于参数和数据的数量,还取决于模型结构与数据形状的一致性,以及与预期的噪声或数据误差水平相比模型误差的大小。即使拟合模型没有过多的参数,也可以预期,拟合关系在新数据集上的表现将比在拟合数据集上的表现差(有时会出现这种现象称为收缩)。
接收者操作特征曲线(receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚惊概率为横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。
本发明提供一种诊断多囊卵巢综合征的系统,其包括:
数据采集模块,其用于获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、收集受试者的BMI、以及获取受试者的雄烯二酮(AND)水平的数据;以及
计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。在计算罹患多囊卵巢综合征的概率的模块中,利用将受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据转换成的多分类变量来计算受试者罹患多囊卵巢综合征的概率(p)。其中,所述抗缪勒氏管激素(AMH)水平是指女性受试者月经周期任何一天的静脉血中的抗缪勒氏管激素浓度。比如受试者的月经周期为28天,则所述抗缪勒氏管激素(AMH)水平可以是月经周期第1天的静脉血中的抗缪勒氏管激素浓度,可以是月经周期第10天的静脉血中的抗缪勒氏管激素浓度,也可以是月经周期第28天的静脉血中的抗缪勒氏管激素浓度。
所述雄烯二酮(AND)水平是指受试者月经期中任一天所检测的受试者的雄烯二酮浓度。比如受试者的月经周期为25天,则所述雄烯二酮(AND)水平可以是受试者月经期中第1天所检测的受试者的雄烯二酮浓度,可以是受试者月经期中第3天所检测的受试者的雄烯二酮浓度,也可以是受试者月经期中第25天所检测的受试者的雄烯二酮浓度。
在计算罹患多囊卵巢综合征的概率的模块中,本申请的发明人经过深入研究,通过探索自变量与结局变量的分布情况,将所述抗缪勒氏管激素(AMH)水平转换成五分类变量,即将所述抗缪勒氏管激素(AMH)水平分为五组,分别为:受试者的抗缪勒氏管激素(AMH)水平小于2.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在2.5 ng/ml及以上且小于5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在5 ng/ml及以上且小于7.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在7.5 ng/ml及以上且小于10 ng/ml,以及受试者的抗缪勒氏管激素(AMH)水平大于等于10 ng/ml。
在计算罹患多囊卵巢综合征的概率的模块中,本申请的发明人经过深入研究,通过探索自变量与结局变量的分布情况,将所述受试者的月经周期天数上限转换成五分类变量,即将受试者的月经周期天数上限分为五组,分别为受试者的月经周期天数上限小于35天,受试者的月经周期天数上限在35天及以上且小于45天,受试者的月经周期天数上限在45天及以上且小于60天,受试者的月经周期天数上限在60天及以上且小于90天,以及受试者的月经周期天数上限在90天及以上。
在计算罹患多囊卵巢综合征概率的模块中,本申请的发明人经过深入研究,通过探索自变量与结局变量的分布情况,将受试者的BMI转换成四分类变量,即将受试者的BMI分为四组,分别为受试者的BMI小于18.5,受试者的BMI在18.5及以上且小于24,受试者的BMI在24及以上且小于28,以及受试者的BMI在28及以上。
在计算罹患多囊卵巢综合征的概率的模块中,本申请的发明人经过深入研究,通过探索自变量与结局变量的分布情况,将受试者的雄烯二酮(AND)水平转换成三分类变量,即将受试者的雄烯二酮(AND)水平范围三组,分别为:受试者的雄烯二酮(AND)水平小于5nmol/L,受试者的雄烯二酮(AND)水平在5 nmol/L及以上且小于10 nmol/L,以及受试者的雄烯二酮(AND)水平在10 nmol/L及以上。
通过将上述四个变量变换成不同的多分类变量,利用这样的多分类变量来进行数据分析可以将自变量与结局变量的非线性关系转换为线性关系,更为准确地计算出受试者罹患多囊卵巢综合征的概率,且模型稳定性更好。
在计算罹患多囊卵巢综合征概率的模块中,预先存储有基于现有数据库中受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据转换成的多分类变量拟合而成的用于计算罹患多囊卵巢综合征的概率(p)的公式。并根据分组标准对受试者罹患多囊卵巢综合征的概率(p)进行分组。
在本发明中,现有数据库是指能够获取的正在接受治疗或以前接受治疗满足下述纳入和排除标准的受试者组成的数据库,对于数据库的样本量没有任何约定,当然数据库的样本量越大越好,例如可以是利用100个受试者,200个受试者,300个受试者,优选为400个受试者以上,更优选为500个受试者以上。在一个具体的实施例中,采用的11720个样本组成的现有数据库。
分析数据:所有2019年一月至十二月来北京大学第三医院生殖医学中心就诊的合计21219个促排卵治疗周期,排除月经周期、BMI、睾酮、雄烯二酮、窦卵泡计数(AFC)等记录不全的周期,共11720个周期纳入最后的分析。本研究中的月经周期天数是指月经周期持续时间的上限。 例如,如果患者的月经周期为30-90天,则使用90天进行分析。 对于我们分析中不明身份的数据,无需患者知情同意,这符合赫尔辛基的声明。
计算罹患多囊卵巢综合征概率的模块利用如下公式(一)计算出受试者罹患多囊卵巢综合征的概率(p):
p=1/1+e-(i+a*AMH+b*月经周期天数上限+c*BMI+d*AND) (公式一)
其中,p为计算出的受试者罹患多囊卵巢综合征的概率,a、b、c、d、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的模块中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平来获取a、b、c、d的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、BMI或AND取值为0或1。
进一步地,i为选自-4.91525~-4.081495中的任意数值,i优选为-4.498372;当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3883373~0.8463509中的任意数值,a优选为0.6173441;当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.2694194~1.7629597中的任意数值,a优选为1.5161895;当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自1.8891674~2.4887798中的任意数值,a优选为2.1889736;当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.1935842~2.8082163中的任意数值,a优选为2.5009002;当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1669412~1.6485894中的任意数值,b优选为1.4077653;当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.5889245~2.0947343中的任意数值,b优选为1.8418294;当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.6497983~2.3668561中的任意数值,b优选为2.0083272;当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自1.8809757~2.5707838中的任意数值,b优选为2.2258797;当受试者的BMI小于18.5时,BMI取值为0;当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.085964~0.6550568中的任意数值,c优选为0.2845466;当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.3957758~1.1728099中的任意数值,c优选为0.7842928;当受试者的BMI在28及以上时,BMI取值为1,c为选自0.7922476~1.6382346中的任意数值,c优选为1.2152411;当受试者的AND水平小于5nmol/L时,AND取值为0;当受试者的AND水平在5 nmol/L及以上且小于10 nmol/L时,AND取值为1,d为选自0.269652~0.6809945中的任意数值,d优选为0.4753233;当受试者的AND水平在10 nmol/L及以上时,AND取值为1,d为选自0.7579538~1.252042中的任意数值,d优选为1.0049979。
在本申请的分组模块中预存有默认的多囊卵巢综合征分组参数,在所述分组模块中预存的分组依据为:当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低危;当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
在本申请的另外的一个具体的实施方式中,本申请还涉及一种诊断多囊卵巢综合征的方法,其包括:数据采集步骤,其获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、收集受试者的BMI、以及获取受试者的雄烯二酮(AND)水平的数据;以及计算罹患多囊卵巢综合征的概率的步骤,其将数据采集步骤中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。
如上所述,本申请的方法中所进行的步骤中的具体内容,对于受试者的抗缪勒氏管激素(AMH)水平、受试者主动提供的月经周期天数上限、受试者的BMI和受试者的雄烯二酮(AND)水平的数据的获取,分组以及处理方式均可以参照上述本申请涉及的系统的各模块进行的步骤。
实施例
实验数据的选定
在本实施例中采用了北京大学第三医院的病例数据,本申请的申请人收集在2019年1月至12月之间的21219个进行了促排卵周期的受试者的记录,并且经过筛选从中排除了无月经周期数据的3289个受试者的周期数据,无体重指数(BMI)信息的150个受试者的周期数据,无睾丸激素水平的3180个受试者的周期数据,无雄烯二酮水平的31个受试者的周期数据,以及无窦卵泡计数(AFC)信息的3849个受试者的周期数据。最后选定了11720个受试者的周期数据进行统计分析,并用于在本实施例中构建本发明的系统。
在本实施例中,月经周期天数上限是指月经周期持续时间的上限。例如,如果受试者在治疗期间提供的其过往的月经周期为30-90天,则使用90天作为月经周期天数上限。
对于本实施例进行的分析中不涉及患者身份信息,无需患者知情同意,这符合赫尔辛基声明。
PCOS的临床诊断
根据2003年鹿特丹标准(2003 Rotterdam criteria,Group, R.E.A.-S.P.c.w.Revised 2003 consensus on diagnostic criteria and long-term health risksrelated to polycystic ovary syndrome. Fertil Steril81, 19-25 (2004))诊断受试者是否罹患PCOS,该标准要求至少存在以下中的两项:(1)排卵功能障碍(即稀发排卵和/或无排卵);(2)高雄激素血症(血液测试中睾丸激素或雄烯二酮水平高)或雄激素过多的临床表现;(3)超声检查确定的多囊卵巢。同时排除表型相似的雄激素过多疾病(如先天性肾上腺增生,分泌雄激素的肿瘤、库欣综合征、甲状腺功能障碍和高泌乳素血症)之后,最终诊断是否罹患PCOS。
高雄激素临床表现是指痤疮、雄激素性脱发或多毛症;高雄激素血症指血清总睾丸激素或雄烯酮含量升高。在本实施例中,对多毛症的诊断采取如下标准,采用改良的Ferriman-Galwey评分> 4,或涉及上唇,大腿和小腹的毛发生长,且毛发生长评分> 2来诊断多毛症。在怀疑有雄激素分泌性肿瘤的罕见情况下(例如,当受试者出现明显的病毒感染或与PCOS有关的症状迅速发作时),测量雄激素水平会有所帮助。
其中,月经周期持续超过35天但少于6个月的月经周期诊断为月经稀发。闭经是指在形成周期性模式后超过6个月内没有月经。超声检查中的多囊卵巢定义为至少一侧卵巢包含12个或更多直径为2-9 mm的卵泡或卵巢体积大于10 mL。单个卵巢满足以上两个定义之一或全部两个定义即可以被诊断为多囊卵巢。高泌乳素血症是两次血清催乳素(PRL)含量超过25 ng/mL来诊断的。
窦卵泡计数和内分泌测定
在本实施例中,在月经周期或月经期第2天,通过经阴道超声扫描计数受试者两个卵巢中直径为2-10 mm的窦卵泡的数量。在同一天,收集受试者静脉血以测量催乳素(PRL)、促黄体生成素(LH)、睾丸激素、雄烯二酮和血清雌二醇(E2)的浓度。在月经期的任何一天都采集用于测量AMH的血样。收集血样并立即倒转五次并离心以进行进一步的内分泌评估。
使用Siemens Immulite 2000免疫测定系统(Siemens Healthcare Diagnostics,上海,中国)测试PRL、LH、睾丸激素,雄烯二酮和E2的血清水平。PRL、LH、睾丸激素、雄烯二酮和E2的质量控制由Bio-RAD实验室提供(美国加利福尼亚州赫尔克里士;Lyphochek免疫测定Plus对照,三级,目录号370,批号40370)。使用试剂盒随附的质量控制,使用超灵敏两点ELISA(Ansh Labs LLC; Webster,TX,USA)测量血清AMH浓度。对于三级质控、AMH、PRL和LH的测定变异系数小于6%,E2、雄烯二酮和睾丸激素的变异系数小于10%。
数据分析
本实施例中的所有分析均使用SAS JMP Pro(版本14.2;SAS Institute,Cary,NC,美国)来进行,并且在分析中如果p<0.05则被认为是具有统计学意义的。正态分布的变量显示为均值和标准差,而非正态分布的变量显示为中位数和四分位数。对于变量选择,将七个或八个变量输入到选择过程中。应用最小绝对收缩和选择算子回归(LASSO)来最小化从同一受试者测量的变量的潜在共线性和变量的过度拟合。
在本实施例中,发明人对多变量分析使用了L1最小化的最小绝对收缩和选择回归(L1-penalized least absolute shrinkage and selection regression),并使用10倍交叉验证进行了内部验证。这是一个逻辑回归模型,它基于λ的值对回归模型的系数的绝对大小进行惩罚。惩罚越大,对较弱因素的估计就趋近于零,因此只有最强的预测变量保留在模型中。预测性最强的协变量由最小值(λmin)选择。随后,将通过LASSO回归分析确定的变量输入到逻辑回归模型中,并将始终具有统计学意义的变量用于构建PCOS诊断模型。
在本实施例中,发明人使用接收者-操作者特征曲线(AUC),采用灵敏度和特异性下的面积评估了PCOS模型的性能。
变量选择
首先如下表1列出了实施例中收集的变量的基本特征。这些指标在诊断PCOS时在单变量分析中均具有重要意义。为了分析变量之间的相关性,将连续变量转换为分类变量。自变量的分组标准主要基于分析前的数据探索并结合本申请发明人的临床经验。在三个不同模型中,每个自变量的分组标准保持不变。
表1 变量特征
其中,表1中BMI表示体重指数;AMH表示抗缪勒氏管激素水平;TES表示睾丸激素水平;AND表示雄烯二酮水平;AFC表示窦卵泡计数。
为了建立更好的模型,分别使用了逻辑回归和LASSO 逻辑回归,再进行10倍交叉验证,其中两种回归和10倍交叉验证的结果示于表2中。具有10倍交叉验证的LASSO 逻辑回归使用较小的校正后的Akaike信息准则(AIC)和贝叶斯信息准则(BIC),表明采用LASSO 逻辑回归来进行数据分析和拟合的稳定性更高,因此基于实施例的结果,本申请的发明人选择在以下分析和构建系统中使用LASSO 逻辑回归。
表2两种数学模型构建方法的比较
其中,AIC表示校正后的Akaike信息准则;BIC表示贝叶斯信息准则
本申请的发明人研究的过程中注意到有文献报道称AMH水平有望替代AFC。因此在进一步分析中,在本实施例中发明人使用具有10倍交叉验证的LASSO逻辑回归分别建立有或没有AFC的PCOS诊断模型,从而确认后续构建分析系统是否需要使用AFC数据。下表3中显示了在有无AFC的情况下,训练组和验证组中的AUC数据的比较结果。
表3的结果显示模型中包含AFC时并不能改善构建的模型的性能。其中每个变量的贡献如表4所示。模型1(不使用AFC)中AMH的主要影响为35.1%,模型2(使用AFC)中AMH和AFC的主要影响分别为18.3%和17.2%,基于上述分析结果提示可以不再使用AFC来进行建模。
另外,由于窦卵泡计数(AFC)是早期Gn依赖性卵泡生长中直径小于8mm的卵泡数。众所周知,卵巢中的原始卵泡池与正在生长的窦状卵泡的数量有关,因此,从理论上讲,AFC能够尽可能反映出剩余卵巢卵泡池的精确度。然而,要获得良好的AFC结果,需要熟练的经阴道超声(TVS)专家进行超声波检查,这既耗时又耗资源。而且AFC测量中缺乏标准,AFC会随着月经周期、避孕药的使用、以及TVS设备的灵敏度和分辨率等因素而发生变化,所有这些现有的混杂因素会使得对AFC的可靠评估更加困难。
因此,在本实施例中,首先经过发明人的深入研究验证了现有技术中提出的AMH水平有望替代AFC,从而为构建方便检测的系统和方法提供了初步的依据。
表3 两个模型的AUC比较结果
表4 在模型1和模型2中每个变量主要影响的比较结果
随后,在不使用AFC的模型1中,本申请的发明人进一步考察每个变量的变化趋势,数据显示年龄和睾丸激素水平并未随PCOS的发生而变化。由于年龄和睾丸激素在模型构建中的贡献很小,在后续的实施例系统构建中,发明人排除了这两个变量的使用。
综上,确认在整个模型的构建中,使用受试者的月经周期天数上限、AMH水平、BMI和雄烯二酮水平来作为变量。
为此,首先发明人将所有11720个受试者的数据按80%:20%的比例分为内部验证组和外部验证数据组。在内部验证组中,将LASSO回归与10倍逻辑回归相结合来确定最佳模型(即模型3)。计算了受试者罹患PCOS的概率的原始数据及其相应的预测数据。
表5中显示了模型3中每个变量的估计参数值和p值。每种预测因子对模型3的主要影响是AMH 41.2%,月经周期天数上限35.2%,BMI 4.3%和雄烯二酮3.7%。表6显示了建模数据、内部验证数据和外部验证数据和中的AUC、敏感性和特异性。
表5 实施例构建的模型3中每个预测变量对PCOS的影响进行多重分析
表中, BMI表示体重指数;AND表示雄烯二酮水平。
表6 实施例构建的模型3的表现
综上,基于本实施例中确认的模型3,可以获得用于计算罹患多囊卵巢综合征的概率(p)的公式,即公式一,其能够基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据来计算受试者罹患PCOS的概率(p)。
公式一:p=1/1+e-(i+a*AMH+b*月经周期天数上限+c*BMI+d*AND)
其中,p为计算出的受试者罹患PCOS的概率,a、b、c、d、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的模块中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平来获取a、b、c、d的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、BMI或AND取值为0或1。
i为选自-4.91525~-4.081495中的任意数值,i优选为-4.498372;
当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;
当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3883373~0.8463509中的任意数值,a优选为0.6173441;
当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.2694194~1.7629597中的任意数值,a优选为1.5161895;
当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自1.8891674~2.4887798中的任意数值,a优选为2.1889736;
当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.1935842~2.8082163中的任意数值,a优选为2.5009002;
当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0,
当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1669412~1.6485894中的任意数值,b优选为1.4077653;
当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.5889245~2.0947343中的任意数值,b优选为1.8418294;
当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.6497983~2.3668561中的任意数值,b优选为2.0083272;
当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自1.8809757~2.5707838中的任意数值,b优选为2.2258797;
当受试者的BMI小于18.5时,BMI取值为0;
当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.085964~0.6550568中的任意数值,c优选为0.2845466;
当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.3957758~1.1728099中的任意数值,c优选为0.7842928;
当受试者的BMI在28及以上时,BMI取值为1,c为选自0.7922476~1.6382346中的任意数值,c优选为1.2152411;
当受试者的AND水平小于5nmol/L时,AND取值为0;
当受试者的AND水平在5 nmol/L及以上且小于10 nmol/L时,AND取值为1,d为选自0.269652~0.6809945中的任意数值,d优选为0.4753233;
当受试者的AND水平在10 nmol/L及以上时,AND取值为1,d为选自0.7579538~1.252042中的任意数值,d优选为1.0049979。
利用上述公式一计算出的预测概率与PCOS实际发生率之间的关系为,PCOS的实际发生率随着预测概率的增加而增加。表7显示了最容易预测患有PCOS的前十大女性群体。详细信息包括月经周期天数上限、AMH、BMI和雄烯二酮水平,实际是否PCOS的病例数,预测PCOS的发生概率以及PCOS的实际发生率。当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低危;当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
表7 高度预测患有PCOS的十大女性群体
基于上表7可以看出,利用本申请所构建的系统或方法,可以非常好地对受试者是否罹患PCOS进行预测,在表7中显示的预测PCOS发生概率最高的10类群体中,PCOS的预测概率均与PCOS的实际发生率非常接近,因此,预计在未来的临床诊断中,本申请所构建的模型可以有效地帮助临床医生来对受试者是否罹患PCOS进行辅助诊断。
虽然在本发明之前的研究已经建立了AMH水平与多囊卵巢形态之间的良好相关性。血清AMH已被越来越多地视为诊断PCOS的替代指标。此前的许多研究发现了诊断PCOS的不同AMH临界值。但是,由于在先的研究样本量小,对照不适当以及AMH检测不均一,因此AMH临界值在PCOS诊断中的应用受到了限制。这也是将AMH引入PCOS诊断中引起争议的原因。另外,尽管AMH可以作为PCOS的潜在诊断标志物,但是《2018年国际基于证据的多囊卵巢综合症评估和管理指南》不建议将其作为PCOS诊断的单一测试参数。其他的研究人员还结合AMH和其他参数,例如Vagios等人使用AMH和BMI来构建预测PCOS的诊断模型(Vagios, S.,James, K.E., Sacha, C.R., et al. A patient-specific model combiningantimullerian hormone and body mass index as a predictor of polycystic ovarysyndrome and other oligo-anovulation disorders. Fertil Steril 115, 229-237(2021). 10.1016/j.fertnstert.2020.07.023)。可见在现有技术中是否应该使用AMH来预测PCOS存在了很大的争议。
如上所述,鉴于现有技术中存在的问题,本申请的发明人经过深入研究建立了一个具有4个参数的数学模型(即包括AMH水平、月经周期天数上限、BMI和雄烯二酮水平的模型)并构建了基于该模型的系统和方法,从而代替了现有技术中简单采用AMH临界值来诊断PCOS的现状。此外,现有技术中有研究者采用小鼠模型显示过量的AMH还会导致雄激素过多和排卵障碍。
最近使用雌性动物模型进行的研究揭示了AMH作用的关键潜在机制。因此,在下丘脑中可以找到AMH的受体,并在妊娠第16.5、17.5和18.5天施用重组人AMH激活了GnRH-中的AMH受体。在妊娠第19.5天,怀孕小鼠的神经元分泌增多并导致LH脉冲频率增加,导致血清LH和睾丸激素水平升高,以及E2和孕酮水平下降。高AMH诱导的血清LH和睾丸激素水平升高导致寡聚排卵或无排卵,以及母体和雌性后代的卵母细胞发育不良。这些表型被母亲或后代施用GnRH拮抗剂所抑制。这些结果表明,AMH通过H-P-O轴调节卵泡发育,而过多的AMH会促进PCOS的发作。
在实施例采用的建模数据集、内部验证数据集和外部验证集中,AUC分别为0.852、0.857、0.838,由此可以看出本发明构建的模型中每个预测因子对模型的主要作用是AMH41.2%,月经周期天数上限35.2%,BMI 4.3%和雄烯二酮3.7%。基于这部分的结果也可以看出,月经周期天数上限的作用仅次于AMH水平,因此现有技术中仅仅考虑AMH的预测方法难以实现良好的效果。而本申请的发明人经过深入研究构建的系统揭示了AMH和BMI在诊断PCOS中的均起到重要作用。
本申请的发明人考虑了月经周期天数上限超过35天表明慢性无排卵,月经周期越长,排卵障碍越严重。BMI用于评估肥胖的严重程度,因为肥胖者面临长期不良代谢紊乱的风险增加。因此,本发明构建的系统的参数可以涵盖鹿特丹标准的所有三个方面以及代谢异常。从实施例的结果可以看出考虑了AMH、月经周期天数上限,同时还进一步结合了BMI和雄烯二酮,更进一步提高了预测PCOS的准确性。
可见,基于本申请发明人深入地研究,在本发明中建立的罹患PCOS的预测模型可能会成为将来诊断亚洲人群罹患PCOS的潜在定量工具,并且也支持过量的AMH分泌作为PCOS的潜在治疗目标。
此外,虽然如上所述,在本申请之前,Vagios等人使用AMH和BMI来构建预测PCOS的诊断模型,其也使用了逻辑回归来进行。但本发明人构建的系统和Vagios等人构建的模型仍然存在很大的差异。首先,本发明构建的系统没有强调固定参数,而是着重于从多个变量中筛选预测参数从而用于构建本发明的预测系统,并深入地验证了其构建系统的预测准确性。Vagios等人的研究使用BMI分层分析,仅关注AMH和BMI参数。其次,本发明的申请人采用的样本量较大,并经过外部验证,表明其稳定性;但是Vagios等人的研究没有外部验证,因此在不同人群中的诊断性能尚无定论。
至于年龄在预测PCOS中的作用,本发明的结果在表4中的显示,调整月经周期天数上限、血清AMH水平、AFC、BMI、血清雄烯二酮水平和血清睾丸激素水平时,年龄的贡献很小,只有0.2%,因此对于年龄这个在妇科或妇产科诊断领域中非常关键的参数,本发明最终构建的系统和方法中却不再考虑年龄,也进一步说明在预测PCOS与其它妇科或妇产科相关疾病相比的独特之处。
预计AMH含量的测量将替代AFC(超声检查获得的标准之一)。使用超声检测需要昂贵的设备和训练有素的人员,这会导致成本增加,准确性和可重复性差。在某些女性中,经阴道超声是不可接受的或侵入性的。此外,将简单的临界值应用于PCOS的诊断也有其缺点。本发明构建的模型的预测结果表明,AMH对模型1(不含AFC)的贡献为35.1%,而AMH和AFC组合在模型2(含AFC)中的贡献为35.5%,这表明AMH可以替代模型1中的AFC。未来将在全球范围内提供PCOS诊断标准。
由于PCOS与肥胖关系密切,因此,患有PCOS的苗条女性常常难以诊断,高达30%的PCOS生殖女性保持正常体重,这些瘦型PCOS患者经常被漏诊。在本发明人的研究数据中,BMI小于18.5 kg/m2的人PCOS的实际发病率为64/1071。 当将此措施与AMH>10ng/mL结合使用时,PCOS的发生率增加到21/49。 当BMI <18.5kg/m2和AMH>10 ng/mL且月经周期持续时间> 90天时,PCOS的发生率增加到10/13。这些体重正常或瘦的女性仍然面临着生育挑战,雄激素水平升高以及由此产生的症状(例如痤疮,多毛症,脱发)以及罹患糖尿病和心血管疾病的风险增加。
基于本实施例中构建的模型在训练组、内部验证组和外部验证组的良好的预测效果,可见本发明人建立的PCOS诊断模型可能有助于诊断这些患者,并提示她们需要及时治疗,并希望能促进他们的长期健康管理。
上述的具体实施方案仅仅是示意性的、指导性的,而不是限制性的。本领域的普通技术人员在本说明书的启示下和在不脱离本发明权利要求所保护的范围的情况下,还可以做出很多种的形式,这些均属于本发明保护之列。
Claims (12)
1.一种诊断多囊卵巢综合征的系统,其包括:
数据采集模块,其用于获取受试者的抗缪勒氏管激素(AMH)水平、收集受试者主动提供的月经周期天数上限、收集受试者的BMI、以及获取受试者的雄烯二酮(AND)水平的数据;以及
计算罹患多囊卵巢综合征的概率的模块,其用于将数据采集模块中获取的上述数据信息进行计算,从而计算出受试者罹患多囊卵巢综合征的概率(p)。
2.根据权利要求1所述的系统,其还包括:
分组模块,在所述分组模块中预存有默认的多囊卵巢综合征分组参数,并且依据该分组参数,对所述计算得到的罹患多囊卵巢综合征的概率(p)进行分组,从而对受试者罹患多囊卵巢综合征的风险进行分组。
3.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,利用将受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据转换成的多分类变量来计算受试者罹患多囊卵巢综合征的概率(p)。
4.根据权利要求1或2所述的系统,其中,
所述抗缪勒氏管激素(AMH)水平是指女性受试者月经周期任何一天的静脉血中的抗缪勒氏管激素浓度,
所述雄烯二酮(AND)水平是指受试者月经期中任一天所检测的受试者的雄烯二酮浓度。
5.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将所述抗缪勒氏管激素(AMH)水平转换成五分类变量,
即将所述抗缪勒氏管激素(AMH)水平分为五组,分别为:受试者的抗缪勒氏管激素(AMH)水平小于2.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在2.5 ng/ml及以上且小于5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在5 ng/ml及以上且小于7.5 ng/ml,受试者的抗缪勒氏管激素(AMH)水平在7.5 ng/ml及以上且小于10 ng/ml,以及受试者的抗缪勒氏管激素(AMH)水平大于等于10 ng/ml。
6.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将所述受试者的月经周期天数上限转换成五分类变量,
即将受试者的月经周期天数上限分为五组,分别为受试者的月经周期天数上限小于35天,受试者的月经周期天数上限在35天及以上且小于45天,受试者的月经周期天数上限在45天及以上且小于60天,受试者的月经周期天数上限在60天及以上且小于90天,以及受试者的月经周期天数上限在90天及以上。
7.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征概率的模块中,将受试者的BMI转换成四分类变量,
即将受试者的BMI分为四组,分别为受试者的BMI小于18.5,受试者的BMI在18.5及以上且小于24,受试者的BMI在24及以上且小于28,以及受试者的BMI在28及以上。
8.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征的概率的模块中,将受试者的雄烯二酮(AND)水平转换成三分类变量,
即将受试者的雄烯二酮(AND)水平范围三组,分别为:受试者的雄烯二酮(AND)水平小于5nmol/L,受试者的雄烯二酮(AND)水平在5 nmol/L及以上且小于10 nmol/L,以及受试者的雄烯二酮(AND)水平在10 nmol/L及以上。
9.根据权利要求1或2所述的系统,其中,
在计算罹患多囊卵巢综合征概率的模块中,预先存储有基于现有数据库中受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平的数据转换成的多分类变量拟合而成的用于计算罹患多囊卵巢综合征的概率(p)的公式。
10.根据权利要求9所述的系统,其中,
所述公式为如下公式一:
p=1/[1+e-(i+a*AMH+b*月经周期天数上限+c*BMI+d*AND) ](公式一)
其中,p为计算出的受试者罹患多囊卵巢综合征的概率,a、b、c、d、i为无单位参数;
在计算罹患多囊卵巢综合征的概率的模块中,基于受试者的抗缪勒氏管激素(AMH)水平、月经周期天数上限、BMI、以及雄烯二酮(AND)水平来获取a、b、c、d的取值并带入公式一进行计算,
在计算中,AMH、月经周期天数上限、BMI或AND取值为0或1。
11.根据权利要求10所述的系统,其中,
i为选自-4.91525~-4.081495中的任意数值;
当受试者的AMH水平小于2.5 ng/ml时,AMH取值为0;
当受试者的AMH水平在2.5 ng/ml及以上且小于5 ng/ml时,AMH取值为1,a为选自0.3883373~0.8463509中的任意数值;
当受试者的AMH水平在5 ng/ml及以上且小于7.5 ng/ml时,AMH取值为1,a为选自1.2694194~1.7629597中的任意数值;
当受试者的AMH水平在7.5 ng/ml及以上且小于10 ng/ml时,AMH取值为1,a为选自1.8891674~2.4887798中的任意数值;
当受试者的AMH水平大于等于10 ng/ml时,AMH取值为1,a为选自2.1935842~2.8082163中的任意数值;
当受试者的月经周期天数上限小于35天时,月经周期天数上限取值为0;
当受试者的月经周期天数上限在35天及以上且小于45天时,月经周期天数上限取值为1,b为选自1.1669412~1.6485894中的任意数值;
当受试者的月经周期天数上限在45天及以上且小于60天时,月经周期天数上限取值为1,b为选自1.5889245~2.0947343中的任意数值;
当受试者的月经周期天数上限在60天及以上且小于90天时,月经周期天数上限取值为1,b为选自1.6497983~2.3668561中的任意数值-;
当受试者的月经周期天数上限在90天及以上时,月经周期天数上限取值为1,b为选自1.8809757~2.5707838中的任意数值,;
当受试者的BMI小于18.5时,BMI取值为0;
当受试者的BMI在18.5及以上且小于24时,BMI取值为1,c为选自-0.085964~0.6550568中的任意数值,;
当受试者的BMI在24及以上且小于28时,BMI取值为1,c为选自0.3957758~1.1728099中的任意数值;
当受试者的BMI在28及以上时,BMI取值为1,c为选自0.7922476~1.6382346中的任意数值;
当受试者的AND水平小于5nmol/L时,AND取值为0;
当受试者的AND水平在5 nmol/L及以上且小于10 nmol/L时,AND取值为1,d为选自0.269652~0.6809945中的任意数值;
当受试者的AND水平在10 nmol/L及以上时,AND取值为1,d为选自0.7579538~1.252042中的任意数值。
12.根据权利要求2所述的系统,其中,
在所述分组模块中预存的分组依据为:
当计算出的受试者罹患多囊卵巢综合征的概率(p)<10%时,受试者罹患多囊卵巢综合征的风险是低危;
当10%≤计算出的受试者罹患多囊卵巢综合征的概率(p)<50%时,受试者罹患多囊卵巢综合征的风险是中风险;
当计算出的受试者罹患多囊卵巢综合征的概率(p)≥50%时,受试者罹患多囊卵巢综合征的风险是高风险。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110574591.3A CN113035354B (zh) | 2021-05-25 | 2021-05-25 | 一种诊断多囊卵巢综合征的系统和方法 |
PCT/CN2021/097896 WO2022246882A1 (zh) | 2021-05-25 | 2021-06-02 | 一种诊断多囊卵巢综合征的系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110574591.3A CN113035354B (zh) | 2021-05-25 | 2021-05-25 | 一种诊断多囊卵巢综合征的系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113035354A true CN113035354A (zh) | 2021-06-25 |
CN113035354B CN113035354B (zh) | 2022-07-12 |
Family
ID=76455870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110574591.3A Active CN113035354B (zh) | 2021-05-25 | 2021-05-25 | 一种诊断多囊卵巢综合征的系统和方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113035354B (zh) |
WO (1) | WO2022246882A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115620900A (zh) * | 2022-12-13 | 2023-01-17 | 北京大学第三医院(北京大学第三临床医学院) | 一种筛查多囊卵巢综合征的系统和方法 |
CN116543905A (zh) * | 2023-05-09 | 2023-08-04 | 北京大学第三医院(北京大学第三临床医学院) | 预测卵巢多囊样改变(pcom)的系统和方法 |
CN118883960A (zh) * | 2023-04-20 | 2024-11-01 | 北京大学第三医院(北京大学第三临床医学院) | 用于确定多囊卵巢综合征fsh起始剂量的标记物、试剂盒及其应用 |
WO2024229876A1 (zh) * | 2023-05-09 | 2024-11-14 | 北京大学第三医院(北京大学第三临床医学院) | 预测月经周期延长的系统和方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100036192A1 (en) * | 2008-07-01 | 2010-02-11 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and systems for assessment of clinical infertility |
CN109602394A (zh) * | 2018-12-12 | 2019-04-12 | 北京大学第三医院 | 评估受试者卵巢储备功能的系统 |
CN110570952A (zh) * | 2018-06-05 | 2019-12-13 | 北京大学第三医院 | 预测拮抗剂方案下受试者卵巢低反应概率的系统及指导促性腺激素起始用药剂量选择的系统 |
CN111524604A (zh) * | 2020-04-07 | 2020-08-11 | 北京大学第三医院(北京大学第三临床医学院) | 评估受试者卵巢储备功能的系统 |
CN111785389A (zh) * | 2020-07-10 | 2020-10-16 | 北京大学第三医院(北京大学第三临床医学院) | 预测受试者出现卵巢储备新变化年限的系统和方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2016341281A1 (en) * | 2015-10-19 | 2018-06-07 | Celmatix Inc. | Methods and systems for assessing infertility as a result of declining ovarian reserve and function |
-
2021
- 2021-05-25 CN CN202110574591.3A patent/CN113035354B/zh active Active
- 2021-06-02 WO PCT/CN2021/097896 patent/WO2022246882A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100036192A1 (en) * | 2008-07-01 | 2010-02-11 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and systems for assessment of clinical infertility |
CN110570952A (zh) * | 2018-06-05 | 2019-12-13 | 北京大学第三医院 | 预测拮抗剂方案下受试者卵巢低反应概率的系统及指导促性腺激素起始用药剂量选择的系统 |
CN109602394A (zh) * | 2018-12-12 | 2019-04-12 | 北京大学第三医院 | 评估受试者卵巢储备功能的系统 |
CN111524604A (zh) * | 2020-04-07 | 2020-08-11 | 北京大学第三医院(北京大学第三临床医学院) | 评估受试者卵巢储备功能的系统 |
CN111785389A (zh) * | 2020-07-10 | 2020-10-16 | 北京大学第三医院(北京大学第三临床医学院) | 预测受试者出现卵巢储备新变化年限的系统和方法 |
Non-Patent Citations (3)
Title |
---|
帕孜力亚·牙生: "育龄期多囊卵巢综合征风险预测模型的构建", 《新疆医科大学学报》 * |
曾绮卿: "青少年多囊卵巢综合征的临床、超声和生化特征及其诊断意义", 《基因组学与应用生物学》 * |
田景明等: "抗缪勒管激素在多囊卵巢综合征诊断中的应用价值", 《医学食疗与健康》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115620900A (zh) * | 2022-12-13 | 2023-01-17 | 北京大学第三医院(北京大学第三临床医学院) | 一种筛查多囊卵巢综合征的系统和方法 |
WO2024124677A1 (zh) * | 2022-12-13 | 2024-06-20 | 北京大学第三医院(北京大学第三临床医学院) | 一种筛查多囊卵巢综合征的系统和方法 |
CN118883960A (zh) * | 2023-04-20 | 2024-11-01 | 北京大学第三医院(北京大学第三临床医学院) | 用于确定多囊卵巢综合征fsh起始剂量的标记物、试剂盒及其应用 |
CN116543905A (zh) * | 2023-05-09 | 2023-08-04 | 北京大学第三医院(北京大学第三临床医学院) | 预测卵巢多囊样改变(pcom)的系统和方法 |
CN116543905B (zh) * | 2023-05-09 | 2024-08-06 | 北京大学第三医院(北京大学第三临床医学院) | 预测卵巢多囊样改变(pcom)的系统和方法 |
WO2024229877A1 (zh) * | 2023-05-09 | 2024-11-14 | 北京大学第三医院(北京大学第三临床医学院) | 预测卵巢多囊样改变(pcom)的系统和方法 |
WO2024229876A1 (zh) * | 2023-05-09 | 2024-11-14 | 北京大学第三医院(北京大学第三临床医学院) | 预测月经周期延长的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2022246882A1 (zh) | 2022-12-01 |
CN113035354B (zh) | 2022-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113035354B (zh) | 一种诊断多囊卵巢综合征的系统和方法 | |
Thul et al. | Oxytocin and postpartum depression: A systematic review | |
CN110570952B (zh) | 预测拮抗剂方案下受试者卵巢低反应概率的系统及指导促性腺激素起始用药剂量选择的系统 | |
Morse et al. | Performance of human chorionic gonadotropin curves in women at risk for ectopic pregnancy: exceptions to the rules | |
Tanase‐Nakao et al. | Potential protective effect of lactation against incidence of type 2 diabetes mellitus in women with previous gestational diabetes mellitus: A systematic review and meta‐analysis | |
CN109602394B (zh) | 评估受试者卵巢储备功能的系统 | |
WO2021031605A1 (zh) | 预测受试者卵巢刺激过程中获得的卵母细胞数量的系统 | |
Aghajafari et al. | Association between maternal serum 25-hydroxyvitamin D level and pregnancy and neonatal outcomes: systematic review and meta-analysis of observational studies | |
Nidhi et al. | Prevalence of polycystic ovarian syndrome in Indian adolescents | |
CN114913972B (zh) | 预测受试者卵巢刺激过程中获得的卵母细胞数量的系统 | |
CN114464322A (zh) | 女性盆底功能障碍性疾病风险预警模型及其构建方法和系统 | |
CN115620900B (zh) | 一种筛查多囊卵巢综合征的系统和方法 | |
Haq et al. | Clinical, biochemical and ultrasonographic features of infertile women with polycystic ovarian syndrome | |
Bahreiny et al. | Autoimmune thyroid disorders and polycystic ovary syndrome: Tracing links through systematic review and meta-analysis | |
Bradbury et al. | Elevated anti‐Mullerian hormone in lean women may not indicate polycystic ovarian syndrome | |
Youssefzadeh et al. | Pregnancy characteristics and outcomes after bariatric surgery: national-level analysis in the United States | |
US20230015833A1 (en) | Apparatus and method for personalized hormonal diagnostics and therapy | |
Pernoud et al. | A systematic review and meta-analysis investigating differences in chronic inflammation and adiposity before and after menopause | |
CN111524604B (zh) | 评估受试者卵巢储备功能的系统 | |
HK40047424A (zh) | 一種診斷多囊卵巢綜合征的系統和方法 | |
CN116543905B (zh) | 预测卵巢多囊样改变(pcom)的系统和方法 | |
CN114936662B (zh) | 一种用于预测受试者的卵巢高反应的系统 | |
CN112908475A (zh) | 用于评估受试者卵巢储备功能的系统 | |
Obure et al. | Assessing hospital differences in low-risk cesarean delivery metrics in Florida | |
Ferreira et al. | The impact of echocardiographic indexation to evaluate cardiac reverse remodeling throughout pregnancy and postpartum |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40047424 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |