CN104178572B - 测序数据的处理方法及装置 - Google Patents
测序数据的处理方法及装置 Download PDFInfo
- Publication number
- CN104178572B CN104178572B CN201410416250.3A CN201410416250A CN104178572B CN 104178572 B CN104178572 B CN 104178572B CN 201410416250 A CN201410416250 A CN 201410416250A CN 104178572 B CN104178572 B CN 104178572B
- Authority
- CN
- China
- Prior art keywords
- window
- chromosomoid
- chromosome
- base positions
- correspondence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 69
- 238000003672 processing method Methods 0.000 title abstract description 5
- 210000000349 chromosome Anatomy 0.000 claims abstract description 797
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 146
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 104
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 104
- 238000000034 method Methods 0.000 claims abstract description 77
- 208000036878 aneuploidy Diseases 0.000 claims abstract description 50
- 231100001075 aneuploidy Toxicity 0.000 claims abstract description 41
- 238000001514 detection method Methods 0.000 claims abstract description 20
- 235000007164 Oryza sativa Nutrition 0.000 claims description 42
- 235000009566 rice Nutrition 0.000 claims description 42
- 230000002759 chromosomal effect Effects 0.000 claims description 32
- 210000003754 fetus Anatomy 0.000 claims description 18
- 239000012634 fragment Substances 0.000 claims description 16
- 208000007502 anemia Diseases 0.000 claims description 15
- 210000002381 plasma Anatomy 0.000 claims description 15
- 210000004369 blood Anatomy 0.000 claims description 10
- 239000008280 blood Substances 0.000 claims description 10
- 238000011160 research Methods 0.000 claims description 9
- 210000004027 cell Anatomy 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 239000007787 solid Substances 0.000 claims description 5
- 238000002405 diagnostic procedure Methods 0.000 claims description 4
- 230000007547 defect Effects 0.000 claims description 3
- 241000209094 Oryza Species 0.000 claims 41
- 210000003679 cervix uteri Anatomy 0.000 claims 2
- 238000011010 flushing procedure Methods 0.000 claims 1
- 210000003296 saliva Anatomy 0.000 claims 1
- 210000002700 urine Anatomy 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 8
- 238000003745 diagnosis Methods 0.000 abstract description 5
- 239000000523 sample Substances 0.000 description 200
- 230000006399 behavior Effects 0.000 description 66
- 238000002474 experimental method Methods 0.000 description 28
- 230000001605 fetal effect Effects 0.000 description 14
- 230000008774 maternal effect Effects 0.000 description 13
- 238000005520 cutting process Methods 0.000 description 11
- 230000003322 aneuploid effect Effects 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 6
- 230000002159 abnormal effect Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010219 correlation analysis Methods 0.000 description 5
- 230000000977 initiatory effect Effects 0.000 description 5
- 101100240528 Caenorhabditis elegans nhr-23 gene Proteins 0.000 description 4
- 208000037280 Trisomy Diseases 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000013178 mathematical model Methods 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 238000003793 prenatal diagnosis Methods 0.000 description 4
- 239000002253 acid Substances 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 238000004043 dyeing Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012268 genome sequencing Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 208000031404 Chromosome Aberrations Diseases 0.000 description 2
- 230000004087 circulation Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 208000036830 Normal foetus Diseases 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 206010044688 Trisomy 21 Diseases 0.000 description 1
- 208000026928 Turner syndrome Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000002669 amniocentesis Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004252 chorionic villi Anatomy 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000003426 interchromosomal effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Pathology (AREA)
- Microscoopes, Condenser (AREA)
- Optical Modulation, Optical Deflection, Nonlinear Optics, Optical Demodulation, Optical Logic Elements (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了测序数据的处理方法及装置、个体染色体非整倍体性的非诊断检测方法,通过第一类染色体窗口组合的核酸分子量的值与其在第二类染色体上的对应窗口的核酸分子的量,及其间的函数关系来处理第一染色体测序数据、非诊断性检测个体染色体非整倍性。
Description
相关申请
本申请是申请日为2010年4月23日,名称为“胎儿染色体非整倍性的检测方法”的中国专利申请201080032859.0的分案。
技术领域
本发明涉及医疗检测领域,具体地涉及胎儿染色体非整倍体性的检测方法,通过第一类染色体窗口组合的核酸分子量的值与其在第二类染色体上的对应窗口的核酸分子的量,及其间的函数关系来检测产前胎儿染色体非整倍性。
背景技术
胎儿非整倍体染色体是指染色体或染色体的某一区域的量的异常。这个异常的量可以是异常的高,如胎儿21号三体,即是比正常的二倍体胎儿多了一条21号染色体;或者异常低,如特纳综合征患者就是缺了一条或部分X染色体。
传统中使用如绒毛膜绒毛取样(CVS)或羊膜穿刺术的方法,获得从胎儿处分离得到细胞,可以使用这些细胞进行常规产前诊断。虽然用这种方法来诊断胎儿非整倍体的准确性较高,然而,这些方法是侵入性的,对母亲和胎儿具有明显的危险性。(Tabor A,etal.Randomised controlled trial of genetic amniocentesis in4606low-riskwomen.Lancet1986,1:1287-1293)。
在母体血浆和血清中发现有非细胞的循环胎儿DNA,这为非侵入性产前诊断提供了无限可能性。Rossa W.K.Chiu等人在PNAS2008,105:20458-20463,杂志上的文章“利用大规模高通量测序的方法来进行非整倍体染色体的无创产前诊断”详细介绍了利用这种方法来进行无创胎儿非整倍体的诊断,并且指出通过测序的手段可以最大程度的获得外周血里面核酸分子的信息,特别是在提取的母体样本里所含的来源于胎儿染色体的核酸分子相对于背景母体核酸分子的量来说是相当少的情况下(Rossa W.K.Chiu,et al.Noninvasiveprenatal diagnosis of fetal chromosomal aneuploidy by massively parallelgenomic sequencing of DNA in maternalplasma.PNAS,2008,105:20458-20463)。所述的方法为:先提取出孕妇外周血血浆中的核酸分子,再经过大规模高通量第二代测序仪进行测序,得到DNA片断的序列信息及序列落在哪一条染色体上的位置信息。Dennis Lo等人基于这一基本信息,然后统计来源于有医学意义的染色体(如21号,18号,13号染色体)上的核酸分子的量及来源于作为背景染色体的核酸分子的量,通过这两个量,可以得到一个参数,然后将这一参数与由正常样本所建得的一个或多个域值做比照,进而发现在有医学意义染色体上有异常的样本的这个参数与多种域值存在着较大的差异(Dennis Lo,etal.Presence of fetal DNA in maternal plasma and serum.Lancet 1997,350:485-487)。由此,这种方法可用来检测胎儿的非整倍体。
然而,这一方法存在着自身的局限性。首先它对于每一个样本的检测都依赖于通过N个(N大于20个)标准阴性对照样本的序列分布数量所建立的正常对照值,即上面所提到的域值。基于这些正常对照值,才可能分析出所检测样本的情况。也就是说为了做出正确判断,所测得的各样本的值之间的相互依赖性比较明显,因为要通过比较样本与样本之间的值的差别才有可能做出正确的判断。
因此,由于样本间需要相互比较的关系,这种方法所要求的各批次样本所采用的实验条件较为严格,若实验条件差距较大,将很难得到较为可信的正常对照值或是样本值。这个实验条件包括前期的样本制备,所用试剂的批次及种类,测序GC偏向,体系温度等,也就是说,各种实验条件的变化都应控制在相当小的范围内,否则会导致各阴性对照样本间的值的方差增大,或者各阴性对照样本的值的相互之间的较大偏差,有些阴性样本的值甚至可能脱离正常值范围内,成为离群值。同理,这一方法也依赖于待检测样本的值的准确性,为获得准确值,制备该样本及所用的试剂及测序条件,包括测序GC偏向,体系温度等,都应该与实施阴性对照样本的尽量保持一致。只有这样,才能较为理想并可信的统计出异常样本在所研究的染色体上的分布数量的异常,并且保证其值为可信的。
但是,要保证实验及测序条件下各微观体系条件的一致性不是太简单的事情,因为实验过程中会有其它干扰因素,所以往往会导致实验数据不太理想,或者各样本之间数据差异较大,一方面,一旦数据缺乏一致性,其检测结果的可信度也随之降低,而产生假阳性或假阴性的结果;另一方面,如若数据由于实验条件的变化因素所致差距较大,更会使之成为离群值而被抛弃不用。众所周知,测序成本目前还是较高的,这样把离群值抛弃不用理所当然会造成相当的浪费。
正如前面所说的目前比较先进的通过测序方法来进行胎儿染色体非整倍性的诊断方法中,对样本制备或测序等的实验条件要求比较严格,因为在本质上来说,它依赖于样本与样本之间的比较。正常样本与异常样本在所要研究的值上是有显著差异的,然而一旦由于样本之间实验条件的不一样所引入的差异大于异常样本与正常样本间的差异的时候,就会出现判断错误的情况,降低检验的可信度。
发明内容
本发明所要解决的技术问题
针对这一情况,发明人进行了多方面深入的研究,终于研发出一种样本自身比照的方法,即不再通过样本之间的对比来做出决定,而是通过比较来源于样本本身的相关值来做出判断。这样消除了对实验条件的依赖性,这样提供了可用于胎儿染色体非整倍性的无创检测新方法,其消除了对实验条件的依赖性。
本发明所采用的技术手段
具体而言,发明人基于测序数据,发现染色体间具有相互对应的核酸量的相关性,根据这种相关性提供了下述方法,依据本发明的数据采集和处理方法检测胎儿染色体的非整倍性。
具体地,发明人的方法包括:
1.测序数据处理方法,所述方法应用于测序数据处理装置,所述测序数据处理装置包括测序单元和建模单元,所述方法包括:
(1)所述建模单元接收来自所述测序单元的测序数据,所述测序数据包括多个正常个体样本的全基因组测序数据,将作为研究对象的待研究染色体定义为第一类染色体,全基因组中其余染色体定义为第二类染色体;
(2)将(1)中所有染色体分别切割成相互重叠或者不重叠的片段,每个片段定义为一个窗口;
(3)统计(2)中多个正常个体样本染色体各窗口的核酸分子的量,将该量定义为行为值;
(4)依据(3)中的行为值,通过数学统计法寻找(1)中的第二类染色体上的与(1)中的第一类染色体有强相关性的窗口或其组合,建立第一类染色体的窗口和所找到的有强相关性窗口或其组合的函数关系式A;
(5)利用(4)中的函数关系式和(4)中的与第一类染色体或者第一类染色体的部分有强相关性的第二类染色体的窗口或窗口组合的行为值,确定(1)中的第一类染色体或者(1)中的第一类染色体的部分的正常行为值的范围。
2.测序数据处理装置,包括:
测序单元,所述测序单元用于样本的全基因组测序,产生测序数据,所述测序数据包括多个正常个体样本的全基因组测序数据,将作为研究对象的待研究染色体定义为第一类染色体,全基因组中其余染色体定义为第二类染色体;
建模单元,所述建模单元用于接收来自测序单元的测序数据;将所有染色体分别切割成相互重叠或者不重叠的片段,每个片段定义为一个窗口;统计所述多个正常个体样本染色体各窗口的核酸分子的量,将该量定义为行为值;依据所述行为值,通过数学统计法寻找所述第二类染色体上的与所述第一类染色体有强相关性的窗口或其组合,建立第一类染色体的窗口和所找到的有强相关性窗口或其组合的函数关系式A;利用所述函数关系式A和所述与第一类染色体或者第一类染色体的部分有强相关性的第二染色体的窗口或窗口组合的行为值,确定所述第一类染色体或者所述第一类染色体的部分的正常行为值的范围。
3.检测个体染色体非整倍性或者染色体部分非整倍性的非诊断方法,包括:
a.预先或者同时对多个正常个体样本进行全基因组测序,将作为研究对象的待研究染色体定义为第一类染色体,全基因组中其余染色体定义为第二类染色体;
b.预先或同时利用项目1所述的方法对获自a的测序数据进行处理,获得第一类染色体的窗口和与所述第一类染色体窗口有强相关性的第二类染色体的窗口或窗口组合的函数关系 式以及,所述第一类染色体或者所述第一类染色体的部分的正常行为值的范围;
c.对待测个体进行测序,进而得到待检测个体本身的第二类染色体的行为值,如果依据b中的函数关系式计算得的待检测个体的第一类染色体的核酸分子的量不在b中的正常行为值范围内,则可以确定待测个体的第一类染色体是非整倍性的。
4.检测个体染色体非整倍性的非诊断方法,包括:
对全基因组进行测序,将作为研究对象的待研究染色体定义为第一类染色体,全基因组中其余染色体定义为第二类染色体;依据第二类染色体片段与第一类染色体片段的行为值的相关性,在全基因组上建立数学模型;
对待测个体进行全基因组测序,进而得到待检测个体本身的的第一类染色体和第二类染色体的行为值,如果在一定的置信水平上的行为值不满足前述数学模型,则可以确定待测个体的染色体是非整倍性的。
5.项目4的方法,所述方法包括:
将全部染色体分别切割成相互重叠或者不重叠的片段,每个片段定义为一个窗口;
通过测序统计来自无染色体缺陷的正常个体样本的染色体各窗口的核酸分子的量,将该量定义为行为值;
依据行为值,通过数学统计方法寻找第二类染色体上的与第一类染色体有强相关性的窗口或其组合,建立函数关系式;
依据函数关系式和待检测样本中第二类染色体各窗口中真实的核酸分子的量,在一定置信水平下,得到待研究第一类染色体的行为值的模拟值置信区间;
通过判断检测样本的第一类染色体的行为值与其模拟值置信区间的关系,判定第一类染色体是否异常。
6.项目4的方法,包括建模步骤(1)-(4)和检测步骤(5)-(8),具体如下:
(1)选择来自无染色体缺陷的正常个体的全基因组进行测序,将作为研究对象的待研究染色体定义为第一类染色体,其余染色体定义为第二类染色体;
(2)将(1)中的所有染色体切割成相互重叠或者不重叠的片段,每个片段定义为一个窗口;
(3)统计在多个不同实验条件下多个样本染色体各窗口的核酸分子的量,定义为行为值;
(4)依据(3)中的行为值,通过数学统计法寻找(1)中的第二类染色体上的与(1)中的第一类染色体有强相关性的窗口或其组合,建立第一类染色体的窗口和所找到的有强相关性窗口或其组合的函数关系式A,由此完成建模步骤;
(5)对待检测个体的样本的全基因组的所有染色体进行测序,其中作为研究对象的待研究染色体同样被定义为第一类染色体,其是与(1)中的第一类染色体对应相同编号的染色体,其余染色体作为第二类染色体;
(6)按照(2)中同样的窗口规格切割(5)中待检测样本的染色体,统计第一类染色体和第二类染色体的行为值;
(7)将(6)中的第二类染色体各窗口的行为值引入到关系式A中,设定置信水平,计算得到第一类染色体行为值的理论区间;
(8)如果(6)中统计的第一类染色体的行为值不在(7)中的行为值的理论区间范围内,则认为待研究的第一类染色体异常。
7.项目6的方法,其中将步骤(1)-(4)的关系式在不同待测样本的检测中重复使用,不需要每次样本检测时都重复测定,通过进行步骤(5)-(8)测定染色体的非整倍性。
上述的“正常行为值的范围”意同“行为值的理论区间”,是通过设定置信水平、将与第一类染色体强相关性的第二类染色体的窗口的行为值代入函数关系式计算获得的。
上述的“置信区间”包括各窗口的置信区间和整条染色体的置信区间。
上述的“不同实验条件”主要包括测序GC含量不一致,试剂条件不一样,实验制备方法有差别等情况。
本发明提供了一种方法,该方法使用来源于孕妇的单一样本,并根据其染色体数据,判断胎儿染色体是否为非整倍性。由此方法,发明最终获得了一组第一类染色体窗口组合,和在第二类染色体中与其呈现强相关性的模拟窗口组合,以及在一定置信水平下校正后的函数关系式。通过这些窗口和函数关系式,可以判断具体样本的第一类染色体是否为非整倍性。
本发明的建模过程一旦确定,即不再需要大量的正常样本进行建模,只需将每次待检测样本的自身的第二类染色体的行为值代入在建模过程确定的关系式A中,即可判断第一类染色体是否正常。
本发明的技术效果
本发明的方法可以用于非整倍体检测。本发明的方法摆脱了原方法对于严格控制实验条件的较强依赖,可适用于修正由于实验条件变动所导致的离群值样本,从而减小浪费。本发明的方法可以通过样本自身对照,而不依赖于其它样本的值,给判断胎儿染色体是否为非整倍性提供重要依据;本发明的方法同时也避免侵入性方法而导致的风险。本发明方法基于测序不但可以用来诊断染色体是否为非整倍性,更能够用于未知实验条件下或实验条件控制不好的情况下所获得的孤立样本的染色体非整倍性诊断,而且可与背景技术中的方法结合一起使用,互为验证,从而进一步提高检验的准确度,从大的影响上来看,可以有效地控制包括21号三体在内的非整倍体染色体胎儿的出生率。另外本发明的方法建立了一种数据处理方法,灵活多变,可模拟21号染色体,即找出与21号染色体的最优行为值一致内对照窗口组合,也可以推广到所有感兴趣的染色体,如18号染色体,13号染色体等第一类染色体,甚至一些感兴趣的染色体片断,从而增加该方法的应用范围。
附图说明
图1:用来演示本发明在全基因组(除待研究的第一类染色体)中寻找并确定与第一类染色体各窗口组合有极强相关性的模拟窗口组合的方法的流程图,记为方法100。
图2:用来演示本发明诊断孕妇所孕胎儿是否为染色体非整倍性的方法的流程图,记为方法200。
图3:显示窗口间线性相关性的散点图。通过对表3所统计的来自于基因组窗口标号为(chr4,642)窗口区域上的核酸分子的量值(89个行为值xi),与来自基因组窗口标号为(chr21,180)窗口区域上的核酸分子的量值(89个行为值yi),利用统计学上的相关性分析,计算两窗口间的相关系数,及关系函数。图上显示的R2为0.9724,说明两窗口相关性很好。
图4:显示窗口间线性相关关系的散点图。通过对表3所统计的来自基因组窗口标号为(chr1,256)窗口区域上的核酸分子的量值(89个行为值xi),与来自基因组窗口标号为(chr21,180)窗口区域上的核酸分子的量值(89个行为值yi),利用统计学上的相关性分析,计算两窗口间的相关关系系数R,由于相关系数R2仅仅只有0.6,由图可以看出两窗口线性关系不好。
图5:显示窗口间线性相关性的散点图。通过对表7所统计的来自基因组窗口标号为(chr8,710)窗口区域上的核酸分子的量值(89个行为值xi),与来自基因组窗口标号为(chr18,259)窗口区域上的核酸分子的量值(53个行为值yi),利用统计学上的相关性分析,计算两窗口间的相关系数,及关系函数。图上显示的R2为0.9816,说明两窗口相关性很好。
图6:显示窗口间线性相关关系的散点图。通过对表7所统计的来自基因组窗口标号为(chr1,8)窗口区域上的核酸分子的量值(53个行为值xi),与来自基因组窗口标号为(chr18,259)窗口区域上的核酸分子的量值(53个行为值yi),利用统计学上的相关性分析,计算两窗口间的相关关系系数R,由于相关系数R2仅仅只有0.0043,由图可以看出两窗口线性关系不好。
图7:显示正常样本与异常样本的真实值与各自的模拟值置信区间的关系的图。具体显示4个来自孕妇外周血核酸样本,样本1与样本2的真实值在各自的模拟值置信区间之外,样本为21号染色体非整倍性;而样本5与样本6的真实值在各自的模拟值置信区间之内,样本正常。
图8:显示正常样本与异常样本的真实值与各自的模拟值置信区间的关系的图。显示4个来自孕妇外周血核酸样本,样本3与样本4的真实值在各自的模拟值置信区间之外,样本为21号染色体非整倍性;而样本7与样本8的真实值在各自的模拟值置信区间之内,样本正常。
图9:显示正常样本与异常样本的真实值与各自的模拟值置信区间的关系的图。具体显示4个来自孕妇外周血核酸样本,样本1,样本2与样本3的真实值在各自的模拟值置信区间之内,样本为18号染色体正常;而样本4的真实值在各自的模拟值置信区间之外,为18号染色体非整倍性。
图10:显示正常样本与异常样本的真实值与各自的模拟值置信区间的关系的图。显示2个来自孕妇外周血核酸样本,样本5与样本6的真实值在各自的模拟值置信区间之外,样本为18号染色体非整倍性。
具体实施方式
定义
为了更清楚地阐述本发明,在本发明中使用的术语定义如下。
“非整倍体染色体”或“染色体非整倍性”是指某条染色体相对于正常的二倍体基因组上的这条染色体存在着整条或部分缺失或冗余。通常情况是,有额外的一条染色体或其中的一条染色体丢失。染色体非整倍性的最常见情况是三体,即有一条额外的染色体。例如,21号染色体三体就是在细胞中发现第三条21号染色体的一种染色体异常。
“生物样本”是指来源于对象(如孕妇)的包含感兴趣的核酸分子的样本,如血浆,血清或其它含有核酸分子的生物样本。
“正常样本”是指没有出现任何染色体有非整倍体异常的孕妇外周血样本。
“核酸分子”是指提取的生物样本里所含有的脱氧核糖核苷酸分子,在这里是指生物样本里含有的,来源于人的3亿基因组碱基对的核酸分子。
“核酸片段分子”是指生物样本经过制备等步骤后,能够通过测序手段获得其序列信息及其在基因组上的位置信息并可以代表与其相对应的核酸分子的片段核酸分子。
“Unique核酸分子”是指测序后信息分析表明该核酸分子在人类基因组上有且仅有一个分布的位置。
“窗口”是指可以将染色体或染色体区域根据人为定义的单位核酸序列长度分割成有重叠区域或没有重叠区域的片段,而每个窗口都对应着这条染色体或染色体区域上唯一的一段,位置信息唯一。
“核酸分子的量”,也称行为值,依据核酸片段分子基于测序定位到各染色体具体位置后,统计而得的定位在这个区域的核酸片段分子的条数或者是能够反映有多少核酸分子分布于这个区域的值,比如说将统计所得的可以定位在这个区域的核酸片段分子的条数,或者来自这个区域核酸分子的条数除以所有被统计或部分被统计的核酸分子的条数所获得的一个比值或者核酸片段分子长度的累积值等,总之,对于一次实验样本来说,在某一窗口区域里,只要这个值能够反映核酸分子在这个窗口的分布的量的情况,这个值就可以称为行为值或者来源于该窗口的核酸分子的量。
“来源于某一窗口的核酸分子的量”(窗口的行为值)是指依据核酸片段分子基于测序定位到各染色体具体位置后,统计所得的可以定位在这个区域的核酸片段分子的条数或者是能够反映到底有多少核酸分子分布于这个区域的值,比如说将统计所得的可以定位在这个区域的核酸片段分子的条数,或者来自同一区域核酸分子的条数除以所有被统计或部分被统计的核酸分子的条数所获得的一个比值或者核酸片段分子长度的累积量等,总之,对于一次实验样本来说,只要这个值能够反映核酸分子在这个窗口的分布的量的情况,这个值就可以称为行为值或者来源于该窗口的核酸分子的量。
“行为值一致”是指两行为值,其中的一个行为值发生变化,另一行为值同时发生可以用函数关系式近似表达的变化。
“真实值”指来源于第一类染色体的窗口的核酸分子的量。
“第一类染色体”是指有临床研究价值的全部或部分核酸序列,或者说在医学上,经常用这些染色体的不平衡来检测某些不正常的症状。例如21号染色体序列,18号染色体序列,13号染色体序列,X染色体序列或Y染色体序列等。
“第二类染色体”是指基因组上除去第一类染色体的其他染色体,本发明中指具体实施中除去待研究第一类染色体的其他染色体。
“第一类染色体窗口组合”是指由若干个有重叠或无重叠窗口所构成的窗口组合,这一窗口组合可以覆盖整个或部分第一类染色体。
“与第一类染色体的窗口有极强相关性的模拟窗口(模拟窗口组合)”是指在研究基因组中,存在于除当前研究的第一类染色体外其它染色体上的特定模拟窗口,该特定模拟窗口与当前研究下的第一类染色体窗口存在着强相关性,其表现为:对于其中的每一个正常生物样本来说,总是存在着这样一种关系,即在这个样本中来源于第一类染色体窗口的核酸分子的量若发生变化,则来源于与第一类染色体窗口有极相关性的模拟窗口(模拟窗口组合)的核酸分子量也发生相应的变化,而且这种一个量发生变化另一量也发生变化的相关关系可以通过相关函数表达式近似表达出来。模拟窗口(模拟窗口组合)的选定见方法100。
“待研究染色体行为值的置信区间”是指通过来源于第一类染色体的窗口组合的核酸分子的量和与其对应的函数关系式算得的在一定置信水平下,该第一类染色体(染色体窗口)的置信区间。若两窗口间表达关系式为y=ax+b,则此时统计所得的来源于与第一类染色体窗口有极相关关系模拟窗口的核酸分子的量为x,根据函数关系式可以算得模拟值y,再根据统计学知识可以获得相应的置信区间。
“不平衡”在这里是指通过比较真实值不在根据模拟窗口和函数关系式计算得到的置信区间内,认为此时检测的生物样本在所研究的第一类染色体或第一类染色体区域存在着不平衡。
本发明中的“Chr”是“染色体”的缩写,例如“Chr18”代表第18号染色体。染色体双螺旋链包括一正链,一反链,正反链是互补的,即一条链碱基序列确定,另外一条互补链的碱基序列也确定。因此,其中的每一个位置碱基成对出现,且碱基对是互补的:A与T互补,C与G互补。在人类的染色体上,以正链的碱基位置为基准,任何一个位置都是指一对碱基对,既包含了正链上的碱基,同时也包含了反链上的互补碱基,在本发明中的定位位置,都是以bp为单位的,即base pair缩写(碱基对)。例如chr21:150-450kbp,代表21号染色体上处于150000碱基对到450000碱基对的窗口。若要区分方向的话,正链是指5’-3’的那条链,反链是与其互补的那条链,而方向应该是3’-5’。我们通常都是以正链碱基位置为基准,这里处于chr21:150bp的碱基是指,从正链,方向5’-3’,第1个碱基开始数,处于150号的那个碱基对;从负链,方向3’-5’,第1个碱基开始数,处于150号的那个碱基对。
在本发明的实施方案中,提供一种寻找与第一类染色体窗口组合有极相关性的模拟窗口或窗口组合的方法。所述的“寻找模拟窗口或窗口组合”的方法的本质是通过创新性的各窗口间行 为值的相关性分析找出与第一类染色体窗口或窗口组合有极强相关性的模拟窗口或模拟窗口组合。例如,所选的可以称为是第一类染色体窗口组合的模拟窗口组合里的窗口与其所对应的第一类染色体窗口之间的行为值相关系数接近于1,且能够获得一个普遍的函数关系式,用来表述两窗口行为值之间的相关关系。
当第一类染色体的窗口只找到一个第二类染色体窗口与之有强相关性时,函数关系式为二者之间的一元函数关系式,如果找到了多个强相关性窗口时,函数关系式为拟合优化后的多元函数关系式。
本发明的实施方案,提供了下述的诊断方法,通过判断来源于同一样本的第一类染色体窗口组合的核酸分子的量是否在置信区间内来诊断非整倍体染色体,置信区间由来源于前述寻找确定的模拟窗口组合的行为值及各相应窗口间的相关关系共同决定。
实施例
以下的实施例仅用来解释本发明,而不是用来限制本发明的保护范围,任何与本发明的方法等价的变体都包括在本发明当中。
实施例一
步骤1:获得建模所需测序数据
选择89个正常样本,对这些样本在有差异的实验条件下制备并测序。
简要地说,先制备DNA文库,再将核酸片段分子连接到Solexa测序接头上,然后分离纯化核酸片段长度在150到300碱基对的核酸分子。连上接头的核酸分子可以与flowcell表面互补接头杂交,在一定条件下,核酸分子成簇生长,然后在Illumina GenomeAnalyzer上通过36轮测序循环,即相当于每个核酸分子测得了35个碱基对的核酸片段。接下来测得的序列信息经过一个Pipeline过程,最终可以获得以NCBI里的人类基因组序列为参照序列的ELAND比对结果。
在研究中,为避免一些重复序列的干扰,发明人将那些处于基因组串联重复及转座重复的核酸分子片段剔除,只统计那些可以定位到基因组唯一位置的核酸片段分子。这样说来,在所有测出来的核酸分子中,大概只有四分之一到三分之一的核酸分子是可以定位到基因组唯一位置。此时这些被统计的核酸分子称为Unique核酸分子,而这个统计所得的Unique核酸分子的量依然代表分布在基因组特定区域的核酸分子的量。
该步骤对应于图1的110,120步。
步骤2:建立21号染色体检测模型
根据图1的流程图进行,数学模型建立的过程由计算机程序优化完成。计算机程序通过不同的参数选择,完成相关性窗口的寻找,寻找最优参数,建立第一类染色体窗口与第二类染色体窗口的函数关系式。
在130步中,基于测序,可以通过生物信息分析的手段将所测得的每条核酸片段分子定位到基因组的确切位置上。
在140步中,对每个样本进行切割窗口。将构成基因组的每条染色体分割成若干窗口序列。将整个基因组切割成合适大小的窗口,相当于将每条染色体看成由一些有重叠区域或无重叠区域的窗口的组合。如21号染色体总共有约47Mega的碱基对,如果以10Mega大小为一个窗口,而每次窗口开始的位置向后滑动1Mega大小的话,则21号染色体对应着47个有重叠的10Mega大小的窗口。可以人为定义想要的窗口长度大小及窗口重叠区序列的长度,并也为窗口编号,产生一对窗口编号到窗口在基因组上各染色体上的真实坐标的映射。
实施例中以300k为窗口大小,150k为overlap切分窗口(即每个窗口的起始端为前一个窗口起始端向后滑动150k),表1显示了切割21号染色体后的40个窗口。若一个窗口对应的窗口标号为chr21,2,则其对应的在基因组上的位置为chr21:150-450kbp。
表1
表1展示了通过人为切割21号染色体所获得的窗口的标号及窗口在基因组上的位置坐标,表里仅显示40个窗口。如窗口标号为(chr21,180),表示它是切割21号染色体后的第180个窗口,在21号染色体上的具体位置即坐标为(chr21:26850-27150kbp),即处于21号染色体的26850000碱基对及27150000碱基对之间。由此,每一个窗口标号都代表着所对应染色体的映射位置,即一段人为切割的染色体区域。
实施例中,4号染色体是一条非第一类染色体,若以300k碱基对大小为一个窗口,而每 次窗口开始的位置向后滑动150k碱基对的方式同理可以切割成若干窗口,表2列出二十个窗口标号及在染色体上的位置信息即窗口坐标。如一个窗口对应的窗口标号为chr4,2,则其对应的在基因组上的位置为chr4:150-450kbp。
表2
表2中展示了通过人为切割第4号染色体所获得的窗口的标号及代表其在基因组上的位置的窗口坐标,仅显示其中的20个窗口。如窗口标号为(chr4,643),表示它是切割4号染色体后在其上第180个窗口,在4号染色体上的具体位置即坐标为(chr4:96300-96600kbp),即处于4号染色体的96330000碱基对及96600000碱基对之间。
在150步,对这些在有差异的条件下制备及测序的样本,基于测序所得信息,分别统计各样本来源于各窗口序列的核酸片段分子的量。
如21号染色体的窗口,如前所述是指有临床研究价值的染色体的窗口组合。假设这一窗口组合中某一窗口的坐标为(chr21:89000-89200bp),说明它处于21号染色体上,并且这个窗口区域从第89000个碱基对开始到第89200个碱基对结束,而此时,测得的某一核酸片段分子的起始坐标为chr21:89100,而所测得的分子片段长度为35个碱基对,那么,这个核酸片段分子的序列位置刚好在这个窗口坐标之内,则说明这一条核酸片段分子来源于此窗口区域,如可以统计一个样本的所有序列位置处于这一窗口的核酸分子的条数,那么这个条数可以称为来源于这一窗口的核酸分子的量。然后将构成这个第一类染色体窗口组合的窗口的核酸片段分子的量合起来,就可以得到来源于第一类染色体窗口组合的核酸分子量,这里要强调的是这个第一类染色体窗口组合可以根据情况部分或整体地覆盖第一类染色体一次或多次。
在160步,对于21号染色体的每一个窗口,在整个基因组(除21号染色体)上的窗口分析与这一窗口的相关性,选择极强相关性的窗口组保留,并确定其间的函数关系式,这时,21号染色体的单个窗口可能会对应多个相关窗口,组成相关窗口组合。设统计所得的来源于第二类染色体窗口的核酸分子量为Xi,统计所得来源于第一类染色体窗口的核酸分子量为Yi,i代 表样本编号,则观测样本为(X1,Y1),(X2,Y2),…(Xn,Yn).此时,根据这些数据,可以算得这两组数据的相关系数的平方。相关系数的平方越接近1,截距接近于0,说明相关性越高。每一个21号染色体与其单个相关窗口都能确定一个函数关系式。
实施例中,准备了89个在有差异的实验条件及测序条件下进行样本制备及测序的生物样本,分别统计各样本来源于各窗口区域序列的核酸片段的量,即对每个样本,其在基因组上切割的每个窗口都对应着一个行为值。对于89个样本来说,每个窗口里有89个行为值。
在这个实施例中,对于21号染色体的每一个窗口,同时在基因组(除21号染色体)上搜索与这一个窗口相关性极高的一个窗口。为方便说明,在这里仅取三个窗口用来说明,见表5,一个来源于第一类染色体窗口组合的窗口,编号为(chr21,180),两个来源于非第一类染色体的窗口,编号分别为窗口(chr1,256),窗口(chr4,642)。见表3,所示第一行,显示样本编号,即本方法所研究的89个样本的编号;第二行展示了样本编号对应的89个样本中的每个样本的来自基因组窗口标号为(chr1,256)窗口上的核酸分子的量值,即89个行为值,记为X'i,i值从1取到89。第三行展示了样本编号对应的89个样本中的每个样本的来自基因组窗口标号为(chr4,642)窗口上的核酸分子的量值,也是89个行为值,记为xi,i值从1取到89。第四行展示样本编号对应的89个样本中的每个样本的来自基因组窗口标号为(chr21,180)窗口上的核酸分子的量值,也是89个行为值,记为yi,i值从1取到89。
表3
首先研究窗口(chr4,642)与窗口(chr21,180)的相关关系,此时观测样本为(X1,Y1),(X2,Y2),…(Xn,Yn),在这个实施例中,n可以取到89,研究两列数值的相关系数,相关系数的平方越接近1,说明相关性越高,即当一个窗口的行为值变动时,另一个窗口也会发生相应的变动。当相关系数接近1时,可以根据观测样本研究两窗口的行为是否服从线性关系, 表3表示出的窗口(chr4,642)与窗口(chr21,180)的行为值服从线性关系,并且可以获得其线性方程的表达式和相关系数R的平方。见图3,在这个实施例中,可以看出两窗口,窗口(chr4,642)与窗口(chr21,180),的行为值存在着极强的线性相关性,且相关表达式为:y=0.7564-0.6487,R2=0.9724。显然R还是比较接近1的,则这个窗口(chr4,642)可以选定作为与实施例窗口(chr21,180)相对应的有极强相关性的模拟窗口。再来研究窗口(chr1,256)与窗口(chr21,180),见图4,其R2=0.6214,则认为两窗口行为值不是很相关,以后可以不考虑该窗口。就这样,对于第一类染色体窗口组合中的窗口都可以用这样的方法去寻得一个或多个相关性极强的模拟窗口。以后就只需要己知一个X值,即只需要统计好来源于这个与实施例窗口相对应的有极强相关性的模拟窗口的量,就可以通过关系式计算出一个模拟值或模拟值置信区间。
如表4公布了通过方法100流程步骤所选得的与第一类窗口组合有极强相关性的散布在基因组其它位置的模拟窗口组合,表中仅显示由20个窗口所组成的组合。第一列显示位于第一类染色体上的窗口标号,第二列显示其窗口坐标;第三列显示与相应的第一类染色体有极强相关性的模拟窗口的窗口标号,第四列显示对应的模拟窗口坐标;第五列显示窗口与相关模拟窗口的关系表达式;第六列显示相关系数的平方值,即R方值,R平方值越接近1,说明两窗口间相关性越高,即其中来源于一个窗口的核酸分子量发生变化,则来源于另一窗口核酸分子量会发生相应的变化。
表4
窗口标号 | 窗口坐标 | 相关窗口标号 | 相关窗口坐标 | 关系表达式 | R平方 |
chr21,180 | chr21:26850k~27150k | chr4,642 | chr4:96150k~96450k | y=-0.64869+0.75641x | 0.9724 |
chr21,181 | chr21:27000k~27300k | chr7,782 | chr7:117150k~117450k | y=3.567+0.99173x | 0.9823 |
chr21,182 | chr21:27150k~27450k | chr8,430 | chr8:64350k~64650k | y=-1.22256+0.99396x | 0.985 |
chr21,183 | chr21:27300k~27600k | chr4,1047 | chr4:156900k~157200k | y=2.39720+1.10153x | 0.9874 |
chr21,184 | chr21:27450k~27750k | chr11,150 | chr11:22350k~22650k | y=3.17063+0.96416x | 0.987 |
chr21,185 | chr21:27600k~27900k | chr3,142 | chr3:21150k~21450k | y=4.58025+0.97502x | 0.9843 |
chr21,186 | chr21:27750k~28050k | chr3,509 | chr3:76200k~76500k | y=3.88257+0.78812x | 0.9828 |
chr21,187 | chr21:27900k~28200k | chr12,396 | chr12:59250k~59550k | y=-0.17406+0.95561x | 0.9776 |
chr21,188 | chr21:28050k~28350k | chr2,870 | chr2:130350k~130650k | y=0.01040+0.80918x | 0.9804 |
chr21,189 | chr21:28200k~28500k | chr4,324 | chr4:48450k~48750k | y=-3.521250.87993+x | 0.9702 |
chr21,190 | chr21:28350k~28650k | chr13,386 | chr13:57750k~58050k | y=4.73997+1.02240x | 0.9856 |
chr21,191 | chr21:28500k28800k | chr3,1134 | chr3:169950k~170250k | y=-2.48579+0.88400x | 0.9827 |
chr21,192 | chr21:28650k~28950k | chr3,1140 | chr3:170850k~171150k | y=-1.85926+0.99063x | 0.983 |
chr21,193 | chr21:28800k~29100k | chr7,259 | chr7:38700k~39000k | y=-8.27537+0.77680x | 0.9844 |
chr21,194 | chr21:28950k~29250k | chr15,320 | chr15:47850k~48150k | y=-2.12127+0.96872x | 0.9793 |
chr21,195 | chr21:29100k~29400k | chr4,654 | chr4:97950k~98250k | y=-1.65001+0.8842x | 0.9773 |
chr21,196 | chr21:29250k~29550k | chr6,648 | chr6:97050k~97350k | y=-1.40945+0.87820x | 0.9785 |
chr21,197 | chr21:29400k~29700k | chr7,144 | chr7:21450k~21750k | y=-5.49623+0.83878x | 0.9809 |
chr21,198 | chr21:29550k~29850k | chr9,27 | chr9:3900k~4200k | y=-0.06492+0.86796x | 0.9849 |
chr21,199 | chr21:29700k~30000k | chr2,1072 | chr2:160650k~160950k | y=0.08203+0.98155x | 0.9859 |
接着可以将与21号染色体窗口组合有极强相关性的模拟窗口组合起来,共同构成模拟窗口组合,再根据来源于模拟窗口或模拟窗口组合的核酸分子的量算得一个修正过的置信区间,用于方法200对染色体非整倍性的判断。
在170步,由于21号染色体上的每个窗口可能有多个窗口与之相关,所以为充分使用测 序数据,提高检测准确性,将这些窗口的相关函数关系式进行拟合,并根据实际数据,进行校正,最终确定21号染色体中,能在基因组上找到强相关性的每个窗口的函数关系式。
步骤3:对待检测样本测序
8个孕妇志愿者参与本项检测,所获得的样本编号分别为样本1-8。四个孕妇怀有21号染色体三体胎儿,四个孕妇怀有21号染色体正常胎儿。收集每个孕妇外周血,并对进行离心,取血浆,然后再从血浆中提取核酸分子,通过Illumina公司的测序仪对这些核酸分子进行大规模高通量测序。
根据图2的200方法的流程图进行,具体地,在210步,从孕妇处获得生物样本。这个生物样本可以是血浆或其它合适的样本。这种生物样本包含着来源于孕妇以及胎儿的核酸分子。
在220步,对样本中的核酸分子进行随机测序。被测序的核酸片段分子代表着整个基因组的一部分,可以定位在各条染色体上。样本中的核酸分子可以只测一端(如测一端35个碱基对)或测两端,或者将整条核酸分子都测出来。
测序可以通过大规模高通量平行测序仪测序,如454,Solexa,SOLiD系统,以及单分子测序或纳米孔测序等。在一个实施例中我们通过Illumina公司的solexa测序仪来对核酸分子进行一端测序。
虽然样本制备以及实验的大概流程相同,为了验证本发明方法适合实验条件不太一致的情况,即具有对实验条件要求不是很严格的优势,所述的实验条件包括使用不同的试剂,测序GC偏向不一致等。特分为两组,样本1,样本2,样本5,样本6为一组实验条件(A组);样本3,样本4,样本7,样本8为另一组实验条件(B组)。A组为抽取5ml孕妇血浆,使用QIAamp DNA Micro kit(QIAGEN,56304)提取游离DNA,按照Illumina/Solexa建库流程使用NEB试剂构建SE文库,上SE36测序,B组抽取600ul孕妇血浆使用TIANamp Micro DNA Kit(Tiangen DP316)提取游离DNA,按照Illumina/Solexa建库流程使用Enzymatics试剂构建PEI文库,上SE36+7测序。
此步骤如图2的210,220步。
步骤四:检测样本,根据图2的流程图进行。
在230步中,基于测序,可以通过生物信息分析的手段将所测得的每条核酸片段分子定位到基因组的确切位置上。如表1其显示了通过测序所测得的可以定位到各条染色体的核酸片段分子其在该染色体上的起始位置坐标。
表5显示了生物样本样本1和样本2测序后所得到的一些核酸分子定位到4号染色体和21号染色体上的前十个起始位点的位置信息。
由表5可以看出,对于样本1而言,其可以定位到21号染色体上的第一条核酸片段分子的起始点位置为9797443,即这条核酸片段分子的起始点位于21号染色体的第9797443碱基对位置。同理,其可以定位到4号染色体上的第一条核酸片段分子的起始点位置为19219,即这条核酸片段分子的起始点位于4号染色体的第19219碱基对位置。
表5
在240步中,和建立模型中一样,用300k为窗口大小,150k为overlap对8个待检测样本的所有染色体分别切割窗口。在250步中,基于核酸片段位置信息,统计来源于21号染色体各窗口的核酸片段分子的量。在260步中,基于核酸片段位置信息,统计来源于每个样本的与21号染色体窗口有强相关性的模拟窗口组合的核酸分子的量,并依据函数关系式算出置信区间。在270步中,通过判定每个样本的第250步所获得的来源于21号染色体窗口的核酸片段分子的量是否在同一样本的第260步中所获得的置信区间内,可以判断胎儿是否在21号染色体存在非整倍性的高风险。
表6:用本发明方法检测实施例中的八个样本所得到的结果
表6中的真实值Y列,是统计所得的来源于各样本21号染色体窗口组合的核酸分子量;统计该样本中与21号染色体窗口组合有强相关性的模拟窗口组合的核酸分子量及相关关系表达式(如表4所示),再通过统计学知识所得到的一个置信区间(置信水平:95%)。对于一个研究的样本来说,当它的真实值存在于计算得到的置信区间内时,可以认为所研究的样本是正常的可能性很大,反之,若真实值存在于模拟值置信区间之外,则说明该样本是正常的可能性很小。如样本1,样本2,样本3,样本4,它们的真实值即来源于21号染色体组合的核酸分子量都在置信区间范围之外,则用本方法所获得的结论为它们为21三体胎儿样本,该结果得到了核型 分析结果的证明。
通过比较上述的各样本来源于第一类染色体窗口组合的核酸片段分子的量的值(真实值)与所获得的模拟值置信区间,判断是否存在着在第一类染色体上的胎儿非整倍体染色体或非整倍体染色体区域。如表6所示,可以看到21号染色体三体的真实值在模拟值置信区间之外,而正常两倍体样本其真实值在模拟值置信区间范围之内。图7,显示四个来自孕妇外周血核酸样本,样本1与样本2的真实值在各自的模拟值置信区间之上,可以确定为21号染色体非整倍性;而样本5与样本6的真实值在各自的模拟值置信区间之内,可以认为样本正常。图8,图示正常样本与异常样本的真实值与各自的模拟值置信区间的关系。显示四个来自孕妇外周血核酸样本,样本3与样本4的真实值在各自的模拟值置信区间之上,可以确定为21号染色体非整倍性;而样本7与样本8的真实值在各自的模拟值置信区间之内,可以认为样本正常。
实施例二
步骤1:获得建模所需测序数据
选择53个正常样本,对这些样本在有差异的实验条件下制备并测序。
该步骤对应于图1的110,120步。
步骤2:建立21号染色体检测模型
根据图1的流程图进行,数学模型建立的过程由计算机程序优化完成。计算机程序通过不同的参数选择,完成相关性窗口的寻找,寻找最优参数,建立第一类染色体窗口与第二类染色体窗口的函数关系式。
在130步中,基于测序,可以通过生物信息分析的手段将所测得的每条核酸片段分子定位到基因组的确切位置上。
在140步中,对每个样本进行切割窗口。将构成基因组的每条染色体分割成若干窗口序列。实施例中以300k为窗口大小,150k为overlap切分窗口(即每个窗口的起始端为前一个窗口起始端向后滑动150k)。
在150步,对这些在有差异的条件下制备及测序的样本,基于测序所得信息,分别统计各样本来源于各窗口序列的核酸片段分子的量。
在160步,对于18号染色体的每一个窗口,在整个基因组(除21号染色体)上的窗口分析与这一窗口的相关性,选择极强相关性的窗口组保留,并确定其间的函数关系式,这时,18号染色体的单个窗口若对应多个相关窗口,组成相关窗口组合。
实施例二中,准备了53个在有差异的实验条件及测序条件下进行样本制备及测序的生物样本,分别统计各样本来源于各窗口区域序列的核酸片段的量,即对每个样本,其在基因组上切割的每个窗口都对应着一个行为值。对于53个样本来说,每个窗口里有53个行为值。如表7所示,选取3个窗口,分别来自于(chr18,259),(chr1,8),(chr8,710)。所示第一行,显示样本编号,即本实施例中所研究的53个样本的编号;第二行展示了样本编号对应的53个样本中的每个样本的来自基因组窗口标号为(chr1,8)窗口上的核酸分子的量值,即53个行为值,记为X'i,i 值从1取到53。第三行展示了样本编号对应的53个样本中的每个样本的来自基因组窗口标号为(chr18,259)核酸分子的量(53个行为值),记为xi,i值从1取到53。第四行展示样本编号对应的53个样本中的每个样本的来自基因组窗口标号为(chr18,259)核酸分子的量(53个行为值),记为yi,i值从1取到53。
表7
首先研究窗口(chr8,710)与窗口(chr18,259)的相关关系,此时观测样本为(X1,Y1),(X2,Y2),…(Xn,Yn),在这个实施例中,n可以取到53,研究两列数值的相关系数,得到窗口(chr8,710)与窗口(chr18,259)的行为值存在着强相关性,且相关表达式为:y=-9.18452+0.98295x,R2=0.9816,见图5。显然R2还是比较接近1的,则这个窗口(chr8,710)可以选定作为与实施例窗口(chr18,259)相对应的有强相关性的窗口。再研究窗口(chr1,8)与窗口(chr8,259),见图6,其R2=0.004344,则认为两窗口行为值不相关,以后可以不考虑该窗口。如此,可以在基因组(除18号染色体)上选定一个或多个与18号染色体相关性强的窗口。以后就只需要已知一个X值,即只需要统计好来源于这个与实施例窗口相对应的有极强相关性的模拟窗口的量,就可以通过函数关系式计算出一个置信区间。
如表8公布了通过方法100流程所选得上面步骤所选得的与18号染色体有极强相关性的散布在基因组其它位置的窗口组合,图中仅显示其中20个窗口。第一列显示位于18号染色体上的窗口标号,第二列显示其窗口坐标;第三列显示与相应的18号染色体有强相关性的窗口的标号,第四列显示对应的窗口坐标;第五列显示窗口与相关窗口的关系表达式;第六列显示相关系数的平方值,即R2。
表8
窗口标号 | 窗口坐标 | 相关窗口 | 相关窗口坐标 | 关系表达式 | R平 |
标号 | 方 | ||||
chr18,161 | chr18:24000k-24300k | chr4:839 | chr4:125700k-126000k | y=7.30271+0.85427x | 0.9743 |
chr18,162 | chr18:24150k-24450k | chr12:535 | chr12:80100k-80400k | y=9.31993+0.74859x | 0.9761 |
chr18,163 | chr18:24300k-24600k | chr17:322 | chr17:48150k-48450k | y=6.97596+1.02492x | 0.9766 |
chr18,164 | chr18:24450k-24750k | chr11:176 | chr11:26250k-26550k | y=9.80116+0.95142x | 0.9798 |
chr18,165 | chr18:24600k-24900k | chr6:418 | chr6:62550k-62850k | y=9.77007+0.84016x | 0.9801 |
chr18,166 | chr18:24750k-25050k | chr14:318 | chr14:47550k-47850k | y=9.75245+1.28307x | 0.9764 |
chr18,167 | chr18:24900k-25200k | chr9:68 | chr9:10050k-10350k | y=7.68479+0.76466x | 0.9742 |
chr18,168 | chr18:25050k-25350k | chr3:563 | chr3:84300k-84600k | y=6.40314+1.04416x | 0.9747 |
chr18,169 | chr18:25200k-25500k | chr4:473 | chr4:70800k-71100k | y=5.29067+0.75633x | 0.9787 |
chr18,170 | chr18:25350k-25650k | chr7:795 | chr7:119100k-119400k | y=9.60467+0.83662x | 0.9545 |
chr18,171 | chr18:25500k-25800k | chr7:795 | chr7:119100k-119400k | y=8.01835+0.87421x | 0.959 |
chr18,172 | chr18:25650k-25950k | chr2:243 | chr2:36300k-36600k | y=7.85285+1.00613x | 0.9755 |
chr18,173 | chr18:25800k-26100k | chr7:969 | chr7:145200k-145500k | y=7.75868+0.98071x | 0.9757 |
chr18,174 | chr18:25950k-26250k | chr2:838 | chr2:125550k-125850k | y=7.97381+1.17329x | 0.9697 |
chr18,175 | chr18:26100k-26400k | chr21:111 | chr21:24000k-24314k | y=9.34115+0.77231x | 0.9811 |
chr18,176 | chr18:26250k-26550k | chr3:641 | chr3:96000k-96300k | y=8.868+1.098x | 0.9762 |
chr18,177 | chr18:26400k-26700k | chr3:640 | chr3:95850k-96150k | y=8.18252+1.09904x | 0.9746 |
chr18,178 | chr18:26550k-26850k | chr4:410 | chr4:61350k-61650k | y=8.84273+0.94808x | 0.9779 |
chr18,179 | chr18:26700k-27000k | chr13:620 | chr13:92850k-93150k | y=9.99595+0.87685x | 0.9745 |
chr18,180 | chr18:26850k-27150k | chr5:599 | chr5:89700k-90000k | y=9.27220+1.14163x | 0.976 |
接着可以将与18号染色体窗口组合有极强相关性的窗口组合起来,再根据来源于各窗口的核酸分子的量算得一个修正过的置信区间,用于方法200对染色体非整倍性的判断。
步骤3:对待检测样本测序
6个孕妇志愿者参与本项检测,所获得的样本编号分别为样本1-6。收集每个孕妇外周血,并对进行离心,取血浆,然后再从血浆中提取核酸分子,通过Illumina公司的测序仪对这些核酸分子进行大规模高通量测序。
根据图2的200方法的流程图进行,具体地,在210步,从孕妇处获得生物样本。这个生物样本可以是血浆或其它合适的样本。这种生物样本包含着来源于孕妇以及胎儿的核酸分子。
在220步,对样本中的核酸分子进行随机测序。被测序的核酸片段分子代表着整个基因组的一部分,可以定位在各条染色体上。实施例中我们通过Illumina公司的solexa测序仪来对核酸分子进行一端测序。
特分为两组,样本1,样本2,样本4为一组实验条件(A组);样本3,样本5,样本6为另一组实验条件(B组)。A组为抽取5ml孕妇血浆,使用QIAamp DNA Micro kit(QIAGEN,56304)提取游离DNA,按照Illumina/Solexa建库流程使用NEB试剂构建SE文库,上SE36测序,B组抽取600ul孕妇血浆使用TIANamp Micro DNA Kit(Tiangen DP316)提取游离DNA,按照Illumina/Solexa建库流程使用Enzymatics试剂构建PEI文库,上SE36+7测序。
此步骤如图2的210,220步。
步骤4:检测样本
根据图2的流程图进行。
在230步中,基于测序,可以通过生物信息分析的手段将所测得的每条核酸片段分子定位到基因组的确切位置上。如表1其显示了通过测序所测得的可以定位到各条染色体的核酸片段分子其在该染色体上的起始位置坐标。
在240步中,和建立模型中一样,用300k为窗口大小,150k为overlap对6个待检测样本的所有染色体分别切割窗口。
在250步中,基于核酸片段位置信息,统计来源于18号染色体各窗口的核酸片段分子的量。
在260步中,基于核酸片段位置信息,统计来源于每个样本的与18号染色体窗口有强相关性的窗口组合的核酸分子的量,并依据函数关系式算出置信区间。
在270步中,通过判定每个样本的第250步所获得的来源于21号染色体窗口的核酸片段分子的量是否在同一样本的第260步中所获得的置信区间内,可以判断胎儿是否在18号染色体存在非整倍性的高风险。
表9:用本发明方法检测实施例中的八个样本所得到的结果
表9中的真实值(第二列),是统计所得的来源于各样本18号染色体窗口组合的核酸分子量;统计该样本中与18号染色体窗口组合有强相关性的模拟窗口组合的核酸分子量及相关函数表达式(如表8所示),再通过统计学知识所得到的一个置信区间(置信水平:95%)。对于一个研究的样本来说,当它的真实值存在于计算得到的置信区间内时,可以认为所研究的样本是正常的可能性很大,反之,若真实值存在于模拟值置信区间之外,则说明该样本是非整倍体的风险很大。如样本4,样本5,样本6,它们的真实值即来源于21号染色体组合的核酸分子量都在置信区间范围之外,则用本方法所获得的结论为它们为18号染色体非整倍性胎儿样本,该结果得到了核型分析结果的证明。
通过比较上述的各样本来源于第一类染色体窗口组合的核酸片段分子的量的值(真实值)与所获得的模拟值置信区间,判断是否存在着在第一类染色体上的胎儿非整倍体染色体或非整倍体染色体区域。如表9所示,可以看到18号染色体三体的真实值在模拟值置信区间之外,而正常两倍体样本其真实值在模拟值置信区间范围之内。图9和图10,显示了6个来自孕妇外周血核酸样本,样本1,样本2与样本3的真实值在各自的模拟值置信区间之内,可以认为样本正常,而样本4,样本5与样本6的真实值在各自的置信区间之外,认为18号染色体非整倍性风险很高。
Claims (6)
1.应用于检测个体染色体非整倍性的测序数据处理系统,包括:
(1)对来自无染色体缺陷的正常个体样本的全基因组进行测序,将作为研究对象的待研究染色体定义为第一类染色体,其余染色体定义为第二类染色体;
(2)将(1)中所有染色体分别切割成相互重叠或者不重叠的片段,每个片段定义为一个窗口;
(3)统计在多个不同实验条件下多个正常个体样本染色体各窗口的核酸分子的量,将该量定义为行为值;
(4)依据(3)中的行为值,通过数学统计法寻找所述第二类染色体上的与所述第一类染色体有强相关性的窗口或其组合,建立第一类染色体的窗口和所找到的有强相关性窗口或其组合的函数关系式A;
(5)对待检测个体的样本的全基因组的所有染色体进行测序,其中作为研究对象的待研究染色体同样被定义为第一类染色体,其是与测序单元1中的第一类染色体对应相同编号的染色体,其余染色体作为第二类染色体;
(6)按照(2)中同样的窗口规格切割所述待检测样本的染色体,统计第一类染色体和第二类染色体的行为值;
(7)将所述待检测样本的第二类染色体各窗口的行为值引入到函数关系式A中,设定置信水平,计算得到所述待检测样本的第一类染色体行为值的理论区间。
2.检测个体染色体非整倍性或者染色体部分非整倍性的非诊断方法,包括:
a.利用权利要求1所述的系统获得待检测个体的第一类染色体的行为值以及待检测个体的第一类染色体行为值的理论区间;
b.比较所述待检测个体的第一类染色体的行为值和所述待检测个体的第一类染色体行为值的理论区间,如果所述待检测个体的第一类染色体的行为值不在所述待检测个体的第一类染色体的行为值的理论区间内,则确定待检测个体的第一类染色体是非整倍性的。
3.权利要求2的方法,当窗口为300kb时,overlap为150kb,其中有极强相关性窗口组合选自下述窗口组合:
当第一类染色体的窗口是第21号染色体的碱基位置为14400k-14700k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为37050k-37350k的窗口;
当第一类染色体的窗口是第21号染色体的碱基位置为14550k-14850k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为88050k-88350k的窗口;
当第一类染色体的窗口是第21号染色体的碱基位置为14700k-15000k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为16500k-16800k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为14850k-15150k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为16500k-16800k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为15000k-15300k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为144300k-144600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为15150k-15450k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为144300k-144600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为15300k-15600k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为145050k-145350k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为15450k-15750k的窗口时,其对应的第二类染色体窗口是第17号染色体的碱基位置为56400k-56700k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为15600k-15900k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为21750k-22050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为15750k-16050k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为105150k-105450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为15900k-16200k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为50850k-51150k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为16050k-16350k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为77850k-78150k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为16200k-16500k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为112800k-113100k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为16350k-16650k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为83250k-83550k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为16500k-16800k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为76200k-76500k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为16650k-16950k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为74850k-75150k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为16800k-17100k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为50700k-51000k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为16950k-17250k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为138600k-138900k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为17100k-17400k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为77100k-77400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为17250k-17550k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为138450k-138750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为17700k-18000k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为111750k-112050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为18000k-18300k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为36150k-36450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为18150k-18450k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为119250k-119550k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为18300k-18600k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为450k-750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为18450k-18750k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为69300k-69600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为18600k-18900k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为69450k-69750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为18750k-19050k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为62400k-62700k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为18900k-19200k的窗口时,
其对应的第二类染色体窗口是第4号染色体的碱基位置为62250k-62550k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为19050k-19350k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为135300k-135600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为19200k-19500k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为103350k-103650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为19350k-19650k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为125550k-125850k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为19500k-19800k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为85350k-85650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为19650k-19950k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为166650k-166950k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为19800k-20100k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为67350k-67650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为19950k-20250k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为167250k-167550k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为20100k-20400k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为62400k-62700k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为20250k-20550k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为62400k-62700k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为20400k-20700k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为12150k-12450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为20550k-20850k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为125550k-125850k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为20700k-21000k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为118050k-118350k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为20850k-21150k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为81750k-82050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为21000k-21300k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为112650k-112950k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为21150k-21450k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为81750k-82050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为21300k-21600k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为83250k-83550k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为21450k-21750k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为84450k-84750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为21600k-21900k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为84450k-84750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为21750k-22050k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为82650k-82950k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为21900k-22200k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为141150k-141450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为22050k-22350k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为51450k-51750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为22200k-22500k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为51450k-51750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为22500k-22800k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为135150k-135450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为22650k-22950k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为105300k-105600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为22800k-23100k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为184950k-185250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为22950k-23250k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为141000k-141300k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为23100k-23400k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为141600k-141900k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为23250k-23550k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为82350k-82650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为26700k-27000k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为93450k-93750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为26850k-27150k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为46800k-47100k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为31200k-31500k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为47100k-47400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为31350k-31650k的窗口时,其对应的第二类染色体窗口是第18号染色体的碱基位置为41100k-41400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为31500k-31800k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为87600k-87900k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为31650k-31950k的窗口时,其对应的第二类染色体窗口是第15号染色体的碱基位置为60300k-60600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为31950k-32250k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为38850k-39150k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为32100k-32400k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为97650k-97950k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为32250k-32550k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为169500k-169800k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为32400k-32700k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为20850k-21150k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为32550k-32850k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为1500k-1800k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为33000k-33300k的窗口时,其对应的第二类染色体窗口是第18号染色体的碱基位置为71550k-71850k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为33150k-33450k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为52350k-52650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为33300k-33600k的窗口时,其对应的第二类染色体窗口是第18号染色体的碱基位置为52350k-52650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为33600k-33900k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为24600k-24900k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为33750k-34050k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为84900k-85200k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为33900k-34200k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为120300k-120600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为34050k-34350k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为165450k-165750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为34200k-34500k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为45600k-45900k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为34350k-34650k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为105300k-105600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为34500k-34800k的窗口时,其对应的第二类染色体窗口是第21号染色体的碱基位置为24750k-25050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为34650k-34950k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为60450k-60750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为34800k-35100k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为157950k-158250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为34950k-35250k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为157950k-158250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为35100k-35400k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为8100k-8400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为35250k-35550k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为72600k-72900k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为35400k-35700k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为83550k-83850k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为35550k-35850k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为73500k-73800k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为35700k-36000k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为56100k-56400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为35850k-36150k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为174150k-174450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为36000k-36300k的窗口时,其对应的第二类染色体窗口是第15号染色体的碱基位置为58950k-59250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为36150k-36450k的窗口时,其对应的第二类染色体窗口是第17号染色体的碱基位置为15000k-15300k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为36300k-36600k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为157950k-158250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为36600k-36900k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为12150k-12450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为36750k-37050k的窗口时,其对应的第二类染色体窗口是第15号染色体的碱基位置为77100k-77400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为36900k-37200k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为120150k-120450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为37050k-37350k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为37500k-37800k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为37200k-37500k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为42600k-42900k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为37350k-37650k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为186150k-186450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为37500k-37800k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为20100k-20400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为37650k-37950k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为54900k-55200k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为37800k-38100k的窗口时,其对应的第二类染色体窗口是第15号染色体的碱基位置为78750k-79050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为37950k-38250k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为118350k-118650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为38100k-38400k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为93450k-93750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为38250k-38550k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为66150k-66450k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为38400k-38700k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为30300k-30600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为38550k-38850k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为100800k-101100k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为38700k-39000k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为96600k-96900k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为38850k-39150k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为130650k-130950k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为39000k-39300k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为1050k-1350k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为39150k-39450k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为169800k-170100k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为39300k-39600k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为43200k-43500k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为39450k-39750k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为25650k-25950k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为39750k-40050k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为173700k-174000k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为39900k-40200k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为29550k-29850k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为40200k-40500k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为104700k-105000k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为40350k-40650k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为92100k-92400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为40500k-40800k的窗口时,其对应的第二类染色体窗口是第18号染色体的碱基位置为70650k-70950k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为40650k-40950k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为13950k-14250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为40800k-41100k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为9900k-10200k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为40950k-41250k的窗口时,其对应的第二类染色体窗口是第18号染色体的碱基位置为40650k-40950k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为41100k-41400k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为9750k-10050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为41250k-41550k的窗口时,其对应的第二类染色体窗口是第20号染色体的碱基位置为22350k-22650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为41400k-41700k的窗口时,其对应的第二类染色体窗口是第16号染色体的碱基位置为55350k-55650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为41550k-41850k的窗口时,其对应的第二类染色体窗口是第15号染色体的碱基位置为99750k-100050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为41700k-42000k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为170700k-171000k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为41850k-42150k的窗口时,其对应的第二类染色体窗口是第16号染色体的碱基位置为48000k-48300k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为42000k-42300k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为0k-300k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为42150k-42450k的窗口时,其对应的第二类染色体窗口是第16号染色体的碱基位置为48000k-48300k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为42300k-42600k的窗口时,其对应的第二类染色体窗口是第17号染色体的碱基位置为73200k-73500k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为42450k-42750k的窗口时,其对应的第二类染色体窗口是第17号染色体的碱基位置为73050k-73350k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为42600k-42900k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为17550k-17850k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为42750k-43050k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为120750k-121050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为42900k-43200k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为69300k-69600k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为43200k-43500k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为240450k-240750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为43350k-43650k的窗口时,其对应的第二类染色体窗口是第21号染色体的碱基位置为38100k-38400k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为43500k-43800k的窗口时,其对应的第二类染色体窗口是第16号染色体的碱基位置为83850k-84150k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为43650k-43950k的窗口时,其对应的第二类染色体窗口是第16号染色体的碱基位置为3450k-3750k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为43800k-44100k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为46800k-47100k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为43950k-44250k的窗口时,其对应的第二类染色体窗口是第17号染色体的碱基位置为70950k-71250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为44100k-44400k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为156900k-157200k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为44250k-44550k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为1350k-1650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为44400k-44700k的窗口时,其对应的第二类染色体窗口是第19号染色体的碱基位置为1950k-2250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为44550k-44850k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为136350k-136650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为44700k-45000k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为219900k-220200k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为44850k-45150k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为219900k-220200k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为45000k-45300k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为750k-1050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为45150k-45450k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为239550k-239850k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为45300k-45600k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为238950k-239250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为45450k-45750k的窗口时,其对应的第二类染色体窗口是第20号染色体的碱基位置为61050k-61350k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为45600k-45900k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为1950k-2250k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为45750k-46050k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为135000k-135300k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为45900k-46200k的窗口时,其对应的第二类染色体窗口是第19号染色体的碱基位置为38700k-39000k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为46050k-46350k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为139800k-140100k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为46200k-46500k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为750k-1050k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为46350k-46650k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为1350k-1650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为46500k-46800k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为46350k-46650k的窗口;
第一类染色体的窗口是第21号染色体的碱基位置为46650k-46950k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为1650k-1950k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为1050k-1350k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为178050k-178350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为1200k-1500k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为6450k-6750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为1350k-1650k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为125700k-126000k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为1500k-1800k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为53550k-53850k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为1650k-1950k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为177450k-177750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为1800k-2100k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为122250k-122550k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为1950k-2250k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为18900k-19200k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为2100k-2400k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为32400k-32700k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为2250k-2550k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为9600k-9900k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为2400k-2700k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为130650k-130950k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为2550k-2850k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为48000k-48300k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为4200k-4500k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为192450k-192750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为4350k-4650k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为145800k-146100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为4650k-4950k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为107550k-107850k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为4800k-5100k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为38100k-38400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为4950k-5250k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为39000k-39300k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为5100k-5400k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为164550k-164850k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为9000k-9300k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为91050k-91350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为16800k-17100k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为39150k-39450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为16950k-17250k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为32850k-33150k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为17100k-17400k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为19950k-20250k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为17250k-17550k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为39600k-39900k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为17400k-17700k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为80850k-81150k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为18450k-18750k的窗口时,其对应的第二类染色体窗口是第17号染色体的碱基位置为64350k-64650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为18600k-18900k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为19500k-19800k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为21750k-22050k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为148350k-148650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为21900k-22200k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为13800k-14100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为22800k-23100k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为120150k-120450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为23250k-23550k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为153450k-153750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为23550k-23850k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为15450k-15750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为24000k-24300k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为125700k-126000k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为24150k-2450k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为80100k-80400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为24300k-24600k的窗口时,其对应的第二类染色体窗口是第17号染色体的碱基位置为48150k-48450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为24450k-24750k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为26250k-26550k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为24600k-24900k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为62550k-62850k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为24750k-25050k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为47550k-47850k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为24900k-25200k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为10050k-10350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为25050k-25350k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为84300k-84600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为25200k-25500k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为70800k-71100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为25350k-25650k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为119100k-119400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为25500k-25800k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为119100k-119400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为25650k-25950k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为51300k-51600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为25800k-26100k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为145200k-145500k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为25950k-26250k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为125550k-125850k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为26100k-26400k的窗口时,其对应的第二类染色体窗口是第21号染色体的碱基位置为16500k-16800k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为26250k-26550k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为96000k-96300k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为26400k-26700k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为95850k-96150k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为26550k-26850k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为61350k-61650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为26700k-27000k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为92850k-93150k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为26850k-27150k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为89700k-90000k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为27000k-27300k的窗口时,其对应的第二类染色体窗口是第17号染色体的碱基位置为25050k-25350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为27150k-27450k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为88050k-88350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为28650k-28950k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为92400k-92700k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为28800k-29100k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为52050k-52350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为28950k-29250k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为138300k-138600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为29100k-29400k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为144450k-144750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为29250k-29550k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为115200k-115500k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为29550k-29850k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为92250k-92550k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为29700k-30000k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为62250k-62550k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为29850k-30150k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为84900k-85200k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为30000k-30300k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为82650k-82950k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为30150k-30450k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为93600k-93900k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为30300k-30600k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为103950k-104250k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为32700k-33000k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为77100k-77400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为33900k-34200k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为76200k-76500k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为34800k-35100k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为106350k-106650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为35550k-35850k的窗口时,其对应的第二类染色体窗口是第15号染色体的碱基位置为35400k-35700k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为36450k-36750k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为145050k-145350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为36600k-36900k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为103050k-103350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为36750k-37050k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为83250k-83550k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为36900k-37200k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为34650k-34950k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为37800k-38100k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为93300k-93600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为38400k-38700k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为50100k-50400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为38550k-38850k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为83100k-83400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为38700k-39000k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为106350k-106650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为38850k-39150k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为141000k-141300k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为39000k-39300k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为64050k-64350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为39150k-39450k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为69450k-69750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为39300k-39600k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为105150k-105450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为39450k-39750k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为29400k-29700k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为39600k-39900k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为88950k-89250k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为39750k-40050k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为71550k-71850k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为39900k-40200k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为163200k-163500k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为44850k-45150k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为112950k-113250k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为45000k-45300k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为32850k-33150k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为48600k-48900k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为76800k-77100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为48750k-49050k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为40800k-41100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为49350k-49650k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为38850k-39150k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为49650k-49950k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为39900k-40200k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为49800k-50100k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为130350k-130650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为49950k-50250k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为106350k-106650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为50100k-50400k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为87150k-87450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为50250k-50550k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为79350k-79650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为52350k-52650k的窗口时,其对应的第二类染色体窗口是第16号染色体的碱基位置为70950k-71250k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为55950k-56250k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为103800k-104100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为56100k-56400k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为172650k-172950k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为56250k-56550k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为10050k-10350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为56400k-56700k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为90150k-90450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为56550k-56850k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为126750k-127050k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为57750k-58050k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为79350k-79650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为57900k-58200k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为101700k-102000k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为60000k-60300k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为77700k-78000k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为60150k-60450k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为126450k-126750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为60300k-60600k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为167100k-167400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为60450k-60750k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为123300k-123600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为60600k-60900k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为34800k-35100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为60750k-61050k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为145950k-146250k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为60900k-61200k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为93900k-94200k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为61050k-61350k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为116550k-116850k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为61200k-61500k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为27000k-27300k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为61350k-61650k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为85950k-86250k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为61500k-61800k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为81600k-81900k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为61650k-61950k的窗口时,其对应的第二类染色体窗口是第11号染色体的碱基位置为89700k-90000k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为61800k-62100k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为83700k-84000k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为61950k-62250k的窗口时,其对应的第二类染色体窗口是第13号染色体的碱基位置为81600k-81900k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为62100k-62400k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为78450k-78750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为62250k-62550k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为96150k-96450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为62400k-62700k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为91050k-91350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为62550k-62850k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为72900k-73200k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为62700k-63000k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为73650k-73950k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为62850k-63150k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为193200k-193500k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为63000k-63300k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为181350k-181650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为63150k-63450k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为84150k-84450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为63300k-63600k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为157500k-157800k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为63450k-63750k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为21750k-22050k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为63600k-63900k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为80850k-81150k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为63750k-64050k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为110250k-110550k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为63900k-64200k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为110250k-110550k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为64050k-64350k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为87150k-87450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为64200k-64500k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为12300k-12600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为64350k-64650k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为111600k-111900k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为64500k-64800k的窗口时,其对应的第二类染色体窗口是第9号染色体的碱基位置为9900k-10200k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为64650k-64950k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为85050k-85350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为64800k-65100k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为72600k-72900k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为64950k-65250k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为92100k-92400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为65100k-65400k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为117450k-117750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为65250k-65550k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为113400k-113700k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为65400k-65700k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为181500k-181800k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为65700k-66000k的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为137100k-137400k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为65850k-66150k的窗口时,其对应的第二类染色体窗口是第3号染色体的碱基位置为174600k-174900k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为66450k-66750k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为145800k-146100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为66600k-66900k的窗口时,其对应的第二类染色体窗口是第21号染色体的碱基位置为27300k-27600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为66750k-67050k的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为123300k-123600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为66900k-67200k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为181950k-182250k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为67050k-67350k的窗口时,其对应的第二类染色体窗口是第8号染色体的碱基位置为13800k-14100k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为67200k-67500k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为81000k-81300k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为67350k-67650k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为162150k-162450k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为67500k-67800k的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为85050k-85350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为67650k-67950k的窗口时,其对应的第二类染色体窗口是第2号染色体的碱基位置为52050k-52350k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为67800k-68100k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为30900k-31200k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为67950k-68250k的窗口时,其对应的第二类染色体窗口是第12号染色体的碱基位置为39450k-39750k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为68100k-68400k的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为68400k-68700k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为68550k-68850的窗口时,其对应的第二类染色体窗口是第5号染色体的碱基位置为88350k-88650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为68700k-69000的窗口时,其对应的第二类染色体窗口是第4号染色体的碱基位置为87300k-87600k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为68850k-69150的窗口时,其对应的第二类染色体窗口是第6号染色体的碱基位置为70350k-70650k的窗口;
当第一类染色体的窗口是第18号染色体的碱基位置为69000k-69300的窗口时,其对应的第二类染色体窗口是第7号染色体的碱基位置为85950k-86250k的窗口。
4.权利要求2的方法,其中所述待检测个体的样本是来自孕妇的含有胎儿的DNA的生物样本。
5.权利要求4的方法,其中所述的来自孕妇的含有胎儿的DNA的生物样本选自血浆、血清、尿液和唾液。
6.权利要求4的方法,其中所述的来自孕妇的含有胎儿的DNA的生物样本选自子宫颈脱落细胞和子宫颈冲洗液。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410416250.3A CN104178572B (zh) | 2010-04-23 | 2010-04-23 | 测序数据的处理方法及装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201080032859.0A CN102753703B (zh) | 2010-04-23 | 2010-04-23 | 胎儿染色体非整倍性的检测方法 |
CN201410416250.3A CN104178572B (zh) | 2010-04-23 | 2010-04-23 | 测序数据的处理方法及装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080032859.0A Division CN102753703B (zh) | 2010-04-23 | 2010-04-23 | 胎儿染色体非整倍性的检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104178572A CN104178572A (zh) | 2014-12-03 |
CN104178572B true CN104178572B (zh) | 2017-01-18 |
Family
ID=51959913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410416250.3A Active CN104178572B (zh) | 2010-04-23 | 2010-04-23 | 测序数据的处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104178572B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104789466B (zh) * | 2015-05-06 | 2018-03-13 | 安诺优达基因科技(北京)有限公司 | 检测染色体非整倍性的试剂盒和装置 |
CN105316420A (zh) * | 2015-12-01 | 2016-02-10 | 钦州市妇幼保健院 | 一种单管四色双重相对荧光定量pcr技术快速检测人13号和18号染色体数目的试剂盒 |
CN108920899B (zh) * | 2018-06-10 | 2022-02-08 | 杭州迈迪科生物科技有限公司 | 一种基于目标区域测序的单个外显子拷贝数变异预测方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1930303B (zh) * | 2003-10-08 | 2013-11-20 | 波士顿大学信托人 | 染色体异常的产前诊断试剂盒 |
CA2601221C (en) * | 2005-03-18 | 2013-08-06 | The Chinese University Of Hong Kong | A method for the detection of chromosomal aneuploidies |
-
2010
- 2010-04-23 CN CN201410416250.3A patent/CN104178572B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN104178572A (zh) | 2014-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102753703B (zh) | 胎儿染色体非整倍性的检测方法 | |
CN106544407B (zh) | 确定受体cfDNA样本中供体来源cfDNA比例的方法 | |
CN104120181B (zh) | 对染色体测序结果进行gc校正的方法及装置 | |
CN103403183B (zh) | 胎儿遗传异常的无创性检测 | |
CN104221022B (zh) | 一种拷贝数变异检测方法和系统 | |
CN104232777B (zh) | 同时确定胎儿核酸含量和染色体非整倍性的方法及装置 | |
CN107077537A (zh) | 用短读测序数据检测重复扩增 | |
CN108604258B (zh) | 染色体异常判断方法 | |
CN108138227A (zh) | 使用具有独特分子索引(umi)的冗余读段在测序dna片段中抑制误差 | |
HUE030510T2 (hu) | Magzati kromoszómális aneuploidia diagnosztizálása genomszekvenálás alkalmazásával | |
CN105722994A (zh) | 用于确定性染色体中的拷贝数变异的方法 | |
CN104169929B (zh) | 用于确定胎儿是否存在性染色体数目异常的系统和装置 | |
CN105830077A (zh) | 用于在确定拷贝数变异中改善检测的灵敏度的方法 | |
CN104830986B (zh) | 一种检测胎儿基因信息的方法、装置和系统 | |
CN105844116B (zh) | 测序数据的处理方法和处理装置 | |
CN104619858B (zh) | 胎儿健康状态的无创性检测 | |
CN105555970A (zh) | 同时进行单体型分析和染色体非整倍性检测的方法和系统 | |
CN115989544A (zh) | 用于在基因组的重复区域中可视化短读段的方法和系统 | |
CN104178572B (zh) | 测序数据的处理方法及装置 | |
Leontyev et al. | The phylogeny of myxomycetes | |
CN105765076B (zh) | 一种染色体非整倍性检测方法及装置 | |
WO2023164017A2 (en) | Intra-individual analysis for presence of health conditions | |
WO2018149114A1 (zh) | 确定胎儿染色体中微缺失微重复的方法及设备 | |
CN103397089B (zh) | 一种用于染色体数目异常快速检测的半特异性扩增引物组、方法及试剂盒 | |
Cornejo et al. | Are species-pairs diverging lineages? A nine-locus analysis uncovers speciation among species-pairs of the Lobaria meridionalis-group (Ascomycota) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20150922 Address after: Yantian District of Shenzhen City, Guangdong province 518083 Hongan street No. 21 China Comprehensive Park 7 Building 7 layer -14 layer Applicant after: BGI SHENZHEN CO LTD Address before: North Road No. 146, building 11F-3 Industrial Zone in Yantian District of Shenzhen city of Guangdong Province in 518083 Applicant before: BGI-Shenzhen Co., Ltd. |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |