CN112921078B - 一种测定待测者的hla-i分型的方法和一种锚序列组 - Google Patents
一种测定待测者的hla-i分型的方法和一种锚序列组 Download PDFInfo
- Publication number
- CN112921078B CN112921078B CN202110172484.8A CN202110172484A CN112921078B CN 112921078 B CN112921078 B CN 112921078B CN 202110172484 A CN202110172484 A CN 202110172484A CN 112921078 B CN112921078 B CN 112921078B
- Authority
- CN
- China
- Prior art keywords
- sequence
- anchor
- dna
- hla
- rna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title abstract description 23
- 238000012163 sequencing technique Methods 0.000 abstract description 72
- 108700028369 Alleles Proteins 0.000 abstract description 64
- 230000003321 amplification Effects 0.000 abstract description 12
- 238000003199 nucleic acid amplification method Methods 0.000 abstract description 12
- 238000012216 screening Methods 0.000 abstract description 3
- 108020004414 DNA Proteins 0.000 description 231
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 18
- 108010075704 HLA-A Antigens Proteins 0.000 description 18
- 108091036078 conserved sequence Proteins 0.000 description 12
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 10
- 108010058607 HLA-B Antigens Proteins 0.000 description 10
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 description 9
- 108010052199 HLA-C Antigens Proteins 0.000 description 9
- 108700024394 Exon Proteins 0.000 description 8
- 108090000623 proteins and genes Proteins 0.000 description 6
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000012634 fragment Substances 0.000 description 5
- 238000007480 sanger sequencing Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000035772 mutation Effects 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 101150118346 HLA-A gene Proteins 0.000 description 1
- 101150000578 HLA-B gene Proteins 0.000 description 1
- 101150035071 HLA-C gene Proteins 0.000 description 1
- 101000666730 Homo sapiens T-complex protein 1 subunit alpha Proteins 0.000 description 1
- 108700005089 MHC Class I Genes Proteins 0.000 description 1
- 101100107522 Mus musculus Slc1a5 gene Proteins 0.000 description 1
- 102100038410 T-complex protein 1 subunit alpha Human genes 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 230000002902 bimodal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000432 density-gradient centrifugation Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Organic Chemistry (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Cell Biology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开涉及一种测定HLA分型的方法:该方法包括如下步骤:S1、筛选出锚序列;S2、获取待测者的DNA样本;得到扩增产物;S3、得到测序结果序列;S4、将所述测序结果序列与锚序列进行比对;S5、如果所述测序结果序列能够匹配上同一个锚序列组中的至少两条锚序列,则判定所述测序结果序列为可用序列;S6、将所述可用序列与所述分型库中的所有等位基因进行逐一比对,将比对成功的等位基因作为所述待测者在所述给定的HLA基因座位上的分型。上述技术方案是一种兼顾快速,准确和经济的HLA分型方法。
Description
技术领域
本公开涉及生物医药领域,具体地,涉及一种测定待测者的HLA分型的方法。
背景技术
HLA(Human leucocyte antigen,人类白细胞抗原)基因系统是人类多态性最丰富的遗传系统,定位于6号染色体短臂上,长3600kb,其中有224个基因座位。其中,I类HLA基因指最早发现的3个功能基因,即HLA-A、HLA-B和HLA-C,均编码HLA I类分子重链(α链)。HLA-A、HLA-B和HLA-C在人群中存在大量的变异体(allele,等位基因),截止2018年10月,已经发现,HLA-A基因有4340个等位基因,HLA-B基因有5212个等位基因,HLA-C基因有3930个等位基因。人群中除同卵双生子以外,几乎不存在HLA相同者,从而HLA可视作个体的“身份证”。在全人类中,已经有几万种HLA亚型被鉴定出来。HLA的分型鉴定的重要意义包括:(1)能够通过合适的HLA配型降低器官移植的排斥反应;(2)HLA配型能够作为某些疾病的遗传标志;(3)HLA配型能够作为亲子鉴定或法医鉴定的重要手段。目前,实现高分辨的HLA分型所需的测序数据较多,相应的测序数据处理也较为复杂,因此具有成本较高的缺陷,限制了高分辨的HLA分型的应用。
发明内容
本公开的目的是提供一种利用较少测序数据和简便的数据处理就能得到高分辨的HLA分型的方法。为了实现上述目的,本公开提供了一种测定待测者的HLA-I分型的方法,该方法包括如下步骤:S1、在HLA-I分型库中确定多个锚序列,所述锚序列在同一个等位基因中仅出现一次且在不同等位基因之间保守;S2、获取待测者的DNA样本并进行PCR扩增,得到扩增产物,并且对所述扩增产物进行Sanger测序,得到测序结果序列;S3、将所述测序结果序列与所述多个锚序列进行比对,得到多个比对到的锚序列;S4、在所述多个比对到的锚序列中选取序列位置保守的锚序列,并将所述序列位置保守的锚序列两两配对构成锚序列对;S5、所述测序结果序列中,选取处于所述锚序列对之间的序列的最长者,得到可用序列;S6、将所有所述可用序列与所述分型库中的所有等位基因进行逐一比对,得到候选等位基因;S7、将所述候选等位基因进行两两配对和自身配对,得到候选配对;S8、将测序结果中的可用序列中的双峰与所述候选配对中的双峰进行比对,比对成功的候选配对即为测序结果的HLA-I分型。本公开还提供了一种锚序列组,所述锚序列组包括SEQ ID NO.1~188的序列。
上述技术方案,能够基于一轮或多轮一代测序结果,有效读取外显子和内含子的信息,减少序列比对的工作量,因而可以利用较少测序数据和简便的数据处理就能得到高分辨的HLA分型,是一种兼顾快速,准确和经济的HLA分型方法。
具体实施方式
一方面,本公开提供了一种测定待测者的HLA分型的方法,该方法包括如下步骤:S1、在HLA-I分型库中确定多个锚序列,所述锚序列在同一个等位基因中仅出现一次且在不同等位基因之间保守;S2、获取待测者的DNA样本并进行PCR扩增,得到扩增产物,并且对所述扩增产物进行Sanger测序,得到测序结果序列;S3、将所述测序结果序列与所述多个锚序列进行比对,得到多个比对到的锚序列;S4、在所述多个比对到的锚序列中选取序列位置保守的锚序列,并将所述序列位置保守的锚序列两两配对构成锚序列对;S5、所述测序结果序列中,选取处于所述锚序列对之间的序列的最长者,得到可用序列;S6、将所有所述可用序列与所述分型库中的所有等位基因进行逐一比对,得到候选等位基因;S7、将所述候选等位基因进行两两配对和自身配对,得到候选配对;S8、将测序结果中的可用序列中的双峰与所述候选配对中的双峰进行比对,比对成功的候选配对即为测序结果的HLA-I分型。本公开的测定待测者的HLA-I分型的方法,可以用于非诊断目的,所获得的HLA-I分型属于中间信息,不属于疾病诊断结果。
其中,所述锚序列主要作用在于定位测序序列及其片段在等位基因中的位置,避免碱基插入与碱基删除带来的序列比对错误。所述锚序列的长度可以在较大的范围内变化,例如可以为8-20bp,优选为10-15bp。
其中,为了方便选取所述序列位置保守的锚序列,将HLA-I分型库中的所有等位基因的DNA序列划分为多个扩展外显子,每个所述扩展外显子由一个被翻译的外显子和该外显子两侧的序列组成。可选地,可以在每个所述扩展外显子中确定3-10条所述锚序列。例如,所述锚序列包括SEQ ID NO.1~188的序列。
其中,所述比对到的锚序列是指在所述测序结果序列中比对成功的锚序列。其中,所述候选等位基因是指所述分型库中与所述可用序列比对成功的等位基因。
其中,通过扩增引物的选择和测序引物的选择,使得所述测序结果序列包含至少一个所述扩展外显子全长或片段的序列;具体地,可以先使用HLA-I位点特异性的扩增引物对所述DNA样本进行PCR扩增,得到含有HLA-I序列的扩增产物,然后使用测序引物得到包含至少一个所述扩展外显子的序列的测序结果序列。为了得到更高的分辨率,可以使用更多的测序引物来得到更多的测序结果序列,继而可以基于更多的测序结果序列来得到更加精确的分型。
例如,步骤S2中,所述HLA-I包括HLA-A、HLA-B和HLA-C。HLA-A的扩展引物为SEQ IDNO.189~190,测序引物选自SEQ ID NO.195~197中的至少一者;HLA-A的锚序列选自SEQID NO.1~59;HLA-B的扩增引物为SEQ ID NO.191~192,测序引物选自SEQ ID NO.198~199中的至少一者;HLA-B的锚序列选自SEQ ID NO.60~111;HLA-C的扩增引物为SEQ IDNO.193~194,测序引物选自SEQ ID NO.200~201中的至少一者;HLA-C的锚序列选自SEQID NO.112~188。
本公开还提供了一种锚序列组,所述锚序列组包括SEQ ID NO.1~188的序列。该锚序列组可以用于HLA-I分型。
其中,步骤S3中将所述测序结果序列与所述多个锚序列进行比对的操作包括:在所述测序结果序列中,搜索锚序列,搜索标准为允许一个碱基突变且不允许碱基插入或碱基删除;如果在测序全序列中有且仅有一次地搜索到某个锚序列,则该锚序列为所述比对到的锚序列。
其中,步骤S4中,选取所述序列位置保守的锚序列的操作包括:对于任意一条锚序列,计算它的第一个碱基和它所在的扩展外显子中的外显子的第一个碱基之间的碱基数,记为n0’,取在所有等位基因中出现频率最高的n0’记为该锚序列的n0;在所述测序结果序列中,计算每一个比对到的锚序列的起始碱基与测序结果序列的起始碱基之间的碱基数,记为n1;对每一个比对到的锚序列,用n1减去n0,记为n2,n2相同的锚序列即为序列位置保守的锚序列。
其中,步骤S6中,将所述可用序列与所述分型库中的所有等位基因进行逐一比对时,采用碱基权重算法进行打分,如果某等位基因打分高于临界分值,则判定该等位基因为候选等位基因;所述临界分值为允许0-3个错误的碱基匹配的分值。
其中,步骤S8中,将测序结果中的可用序列中的双峰记为可用双峰;对每一个可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3;在等位基因中,寻找上述可用序列的第一个锚序列,将在等位基因中寻找到的所述第一个锚序列的第一个碱基的n3个碱基后的位置上的碱基,作为可比对碱基;对于每一个候选配对,对应于每一个可用双峰,得到一个可比对碱基对;如该候选配对的所有可比对碱基对的碱基与其各自对应的可用双峰的碱基完全相同,则该候选配对即为测序结果的HLA-I分型。
下面通过实施例来进一步说明本公开,但是本公开并不因此而受到任何限制。
实施例1本实施例用于说明从分型库中选定锚序列以及确定锚序列的相对位置。对于给定的分型库,这一步骤只需完成一次,不需在每次分型工作中反复完成。可以根据IMGT-HLA数据库的更新来更新HLA的分型库。
使用IMGT-HLA提供的HLA-A,HLA-B和HLA-C的DNA序列(从https:// www.ebi.ac.uk/ipd/imgt/hla/下载)作为数据库,具体使用的版本为Release 3.42.0,2020-10(Robinson J,Barker DJ,Georgiou X,Cooper MA,Flicek P,Marsh SGE.IPD-IMGT/HLA Database.Nucleic Acids Research(2020)48:D948-55)。
使用R语言编程并运行。首先去除掉无效序列,即命名中含字母N(Null)的序列。将剩余的HLA-I等位基因在分型库中的全长序列,以每一个被翻译的外显子为核心包含其前后少量内含子片段作为一个扩展外显子,每个所述扩展外显子由一个被翻译的外显子和该外显子两侧的序列组成,由此将每个HLA-I基因分段为7个扩展外显子片段,如果该HLA-I基因有8个外显子,则第七外显子和第八外显子合并至同一个扩展外显子片段中。针对每一个等位基因,将其分段为扩展外显子的方法包括:在HLA-A的2890条等位基因中,寻找15-20bp的保守序列,再在这些保守序列中选取位于内含子中的保守序列,为每一个内含子选定位于其中的一个保守序列,称为分割序列。对于每一个等位基因,搜索这些分割序列(允许不超过3个碱基突变),并以这些分割序列的最后一个碱基作为一个扩展外显子的末尾。如在2890条HLA-A等位基因中,搜索分割序列GGTGAGTGCGGGGTCG(SEQ ID NO.209,位于内含子1中),以这段分割序列作为扩展外显子一的末尾,这段序列的下一个碱基作为扩展外显子二的起始碱基。同样地,用于分割其他扩展外显子的分割序列为:扩展外显子二和扩展外显子三之间的分割序列:TTTCAGTTTAGGCCAAAA(SEQ ID NO.210);扩展外显子三和扩展外显子四之间的分割序列:TGGTTCCCTTTGACAC(SEQ ID NO.211);扩展外显子四和扩展外显子五之间的分割序列:CACCCTGAGATGGGGTAA(SEQ ID NO.212);扩展外显子五和扩展外显子六之间的分割序列:GAGGAAGAGCTCAGGT(SEQ ID NO.213);扩展外显子六和扩展外显子七之间的分割序列:CTTCTGTGGGATCTGACC(SEQ ID NO.214);同理,用于分割HLA-B的分割序列为:扩展外显子一和扩展外显子二之间的分割序列:CCGGTGAGTGCGGG(SEQ ID NO.215);扩展外显子二和扩展外显子三之间的分割序列:CGGCCCGGGTCGCC(SEQ ID NO.216);扩展外显子三和扩展外显子四之间的分割序列:TGAGGGCCCCCTCT(SEQ ID NO.217);扩展外显子四和扩展外显子五之间的分割序列:AGCAGGAGCCCTTC(SEQ ID NO.218);扩展外显子五和扩展外显子六之间的分割序列:GGACCCTGTGTGCC(SEQ ID NO.219);扩展外显子六和扩展外显子七之间的分割序列:GTGTGGAGGAGCTC(SEQ ID NO.220);用于分割HLA-C的分割序列为:扩展外显子一和扩展外显子二之间的分割序列:CCCGGCGAGGGCGC(SEQ ID NO.221);扩展外显子二和扩展外显子三之间的分割序列:CTGAGATCCACCCC(SEQ ID NO.222);扩展外显子三和扩展外显子四之间的分割序列:TCAGGCCTTGTTCTC(SEQ ID NO.223);扩展外显子四和扩展外显子五之间的分割序列:GAAAGCAGAAG(SEQ ID NO.224);扩展外显子五和扩展外显子六之间的分割序列:CCTGGGACCCTGTG(SEQ ID NO.225);扩展外显子六和扩展外显子七之间的分割序列:GGCGTGTGGAGGAGC(SEQ ID NO.226);针对HLA-A,对于2890个等位基因的每个扩展外显子,计算该扩展外显子所含外显子的第一个碱基在该扩展外显子中的相对位置;然后在每一扩展外显子中尽可能多地(3-10条)筛选出长度为10-15bp且在同一个等位基因中仅出现一次且在不同等位基因之间保守的保守序列,记为锚序列;将来自同一扩展外显子的所有锚序列组成一个锚序列组。对于每条锚序列,计算它的第一个碱基和它所在的扩展外显子中的外显子的第一个碱基之间的碱基数,记为n0’,取在所有等位基因中出现频率最高的n0’记为该锚序列的n0。其中,锚序列在外显子的第一个碱基上游二位以上的,n0为负数,锚序列在外显子的第一个碱基上游一位的,n0为0,锚序列的第一个碱基与外显子的第一个碱基重叠的,n0为1,锚序列在外显子的第一个碱基下游的,n0为大于1的正数。如HLA-A锚序列A4,序列为GGGGAGAAGCAA(SEQ ID NO.4),属于扩展外显子二,其与外显子二的第一碱基之间的碱基数,于2890条等位基因而言,有1条是外显子二的第一碱基上游的,并且与外显子二的第一个碱基之间的碱基数为88(n0’为-87)(A*03:01:01:21),有3条是外显子二的第一碱基上游的,并且与外显子二的第一个碱基之间的碱基数为95(n0’为-94)(A*03:01:01:06,A*24:02:01:62和A*31:01:02:21),余下2886条为外显子二的第一碱基上游的,并且与外显子二的第一个碱基之间的碱基数为96(n0’为-95),于是该条锚序列的第一个碱基和它所在的扩展外显子中的外显子的第一个碱基之间的碱基数n0记为-95。如果某一锚序列在所有等位基因中的所出现的不同的n0’的数量小于10个,则优选使用该条锚序列。如锚序列在所有等位基因中的所出现的不同的n0’的数量超过10个,会导致后续步骤难以进行,则优选不使用该条锚序列。如果一条锚序列在10个或以上等位基因上无法匹配,也优选不使用该条锚序列。HLA-B和HLA-C中的锚序列筛选参照上述方法进行。筛选出的一组示例性的HLA-A、HLA-B和HLA-C锚序列如表1所示。
表1
实施例2本实施例用于说明待测者的DNA扩增及测序结果
(1)按照标准抽血操作流程抽取受试者少量新鲜血液,采用Ficoll密度梯度离心法,分离PBMC。然后,选用DNA小量抽提试剂盒(碧云天D0063号),按说明书操作进行DNA提取。(2)选用位点特异性引物进行PCR扩增(扩增引物序列如表2所示),获得扩增后的PCR产物。(3)扩增后的PCR产物再选用特定的测序引物(测序引物如表3所示),进行Sanger测序(测序公司为:杭州擎科生物医疗有限公司)。Sanger测序结束后,获得该样本的测序结果。
表2 PCR扩增引物
表3测序引物
编号 | 测序引物名称 | 序列 | SEQ ID NO. |
HLA-A-1 | Seqing-AF930 | TTTCAGTTTAGGCCAAAAAT | 195 |
HLA-A-2 | Seqing-AF1775 | GGTGTCCTGTCCATTCTCAAGAT | 196 |
HLA-A-3 | Seqing-AR841 | ATCTCGGACCCGGAGACTG | 197 |
HLA-B-1 | Seqing-BF375 | AGGGAAATGGCCTCTG | 198 |
HLA-B-2 | Seqing-BR1363 | AGGGCGACATTCTAGCGC | 199 |
HLA-C-1 | Seqing-CF1986 | ACCCCAGGTGTCCTGTCC | 200 |
HLA-C-2 | Seqing-CR1598 | ATTCTCCATTCAAGGGAGGGC | 201 |
选取一个特定的受试者的DNA样本作为1号样本,以下简称sample-1;最终sample-1的测序结果的可清晰读取部分,其序列如表4所示。
表4测序结果
测序引物的编号 | 测序得到的序列 |
HLA-A-1 | SEQ ID NO.202 |
HLA-A-2 | SEQ ID NO.203 |
HLA-A-3 | SEQ ID NO.204 |
HLA-B-1 | SEQ ID NO.205 |
HLA-B-2 | SEQ ID NO.206 |
HLA-C-1 | SEQ ID NO.207 |
HLA-C-2 | SEQ ID NO.208 |
实施例3本实施例用于说明sample-1的测序结果的比对分析过程
将实施例2获得的Sanger测序结果与该给定的HLA-I基因的所有锚序列组(即表1所示的锚序列组)进行比对,比对操作通过在测序全序列中搜索锚序列来进行,搜索标准为允许一个碱基突变且不允许碱基插入或碱基删除;如果在测序全序列中有且仅有一次地搜索到某个锚序列,则判定对比成功。选取在所述测序结果序列中比对成功的,记为一个比对到的锚序列,并且来自同一所述扩展外显子的多个比对到的锚序列,记为一个比对到的锚序列组。在所述测序结果序列中,计算每一个比对到的锚序列与测序结果序列的起始碱基之间的碱基数,记为n1。
例如,锚序列A20,序列为GCTGACCGCGGGGT,属于第三扩展外显子,锚序列A20的n0为-24,其比对在测序序列的第3位(表4,HLA-A-1),也就是n1是3,则用n1减去n0,记为n2(相对位置差)为27。如多条锚序列具有相同的n2,可判定,它们两两之间构成锚序列对,也就是说它们两两之间在测序序列上覆盖的部分,和在HLA数据库中覆盖的部分,没有碱基的插入或删除,可进行逐一碱基对比。处于所述锚序列对之间的序列的最长者为可用序列。Sample-1的可用序列见表5。
表5测序比对结果
将上述可用序列与所述分型库中的所有等位基因进行逐一比对。如表4中HLA-A-1的测序结果,锚序列A20至A35与之对比成功,也就是得到了16条比对到的锚序列。经过计算,这16条比对到的锚序列的n2均为27,且A20与A35之间覆盖的567个碱基的序列为最长者,也就为可用序列。该可用序列和数据库中的2890个HLA-A等位基因的第三扩展外显子中,锚序列A20与A35之间覆盖的567个碱基的序列进行逐一碱基对比。对比过程中,每出现一个错配碱基,该等位基因的比对得分减一分(每个等位基因比对得分的初始值为0)。由此,针对HLA-A-1的测序结果,得到2890个HLA-A等位基因的各自的比对得分。同样地,测序结果HLA-A-2和HLA-A-3也经上述处理,由此,针对HLA-A-2的测序结果,得到2890个HLA-A等位基因的各自的比对得分,并且由此,针对HLA-A-3的测序结果,得到2890个HLA-A等位基因的各自的比对得分。针对每一个HLA-A等位基因,将它的针对HLA-A-1的测序结果的比对得分、针对HLA-A-2的测序结果的比对得分和针对HLA-A-3的测序结果的比对得分相加,得到该HLA-A等位基因针对sample-1的测序结果的比对得分。选取比对得分在-3分至0分范围内的HLA-A等位基因(共540条,如表5-1所示)作为比对成功的等位基因,作为sample-1的HLA-A分型候选等位基因。
表5-1
将HLA-A分型候选等位基因两两配对(得到145530个两两配对),并且将HLA-A分型候选等位基因自身配对(得到540个自身配对),将两两配对与自身配对合并,得到146070个候选配对。
将测序结果中的可用序列中的双峰,记为可用双峰,对每一个可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3。在等位基因中,寻找上述可用序列的第一个锚序列,将在等位基因中寻找到的所述第一个锚序列的第一个碱基的n3个碱基后的位置上的碱基,作为可比对碱基。由此,对于每一个候选配对,对应于每一个可用双峰,得到一个可比对碱基对。如该候选配对的所有可比对碱基对的碱基与其各自对应的可用双峰的碱基完全相同,则该候选配对即为测序结果的HLA-I分型。
例如,sample-1的HLA-B-1的测序结果中,可用序列中的双峰有9个N(T/A)、N(C/G)、N(A/C)、N(A/C)、N(G/C)、N(C/A)、N(C/G)、N(G/T)、N(A/T),分别记为第一可用双峰、第二可用双峰、第三可用双峰、第四可用双峰、第五可用双峰、第六可用双峰、第七可用双峰、第八可用双峰、第九可用双峰。
对第一可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-1(具体为223);对第二可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-2(具体为224);对第三可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-3(具体为226);对第四可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-4(具体为231);对第五可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-5(具体为232);对第六可用双峰计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-6(具体为234);对第七可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-7(具体为236);对第八可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-8(具体为246);对第九可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3-9(具体为253)。
在候选配对的两个等位基因中,分别寻找上述可用序列的第一个锚序列(也就是锚序列9),将在等位基因中寻找到的所述第一个锚序列的第一个碱基的n3个碱基后的位置上的碱基,作为可比对碱基,例如在B*46:01:01:01,B*15:01:01:01的配对中,B46:01:01:01的第682位碱基为第一可用双峰对应的可比对碱基,是A,B15:01:01:01的第682位碱基为第一可用双峰对应的可比对碱基,是T,与第一可用双峰N(A/T)的碱基选择完全一致,因此B*46:01:01:01,B*15:01:01:01的配对在该可比对碱基上与第一可用双峰测序结果相同,同样地,B*46:01:01:01,B*15:01:01:01的配对在其余可比对碱基上与对应的可用双峰测序结果也分别相同,由此认为下述结果为正确分型结果。但是,对于另外一个配对,B*15:65和B15:01:01:01来说,B*15:65的第682位碱基为第一可用双峰对应的可比对碱基,是T,B15:01:01:01的第682位碱基为第一可用双峰对应的可比对碱基,是T,与第一可用双峰N(A/T)的碱基选择不一致,因此删除该配对。
对sample-1的HLA-B-2的测序结果也进行上述操作,在HLA-B-1剩余的候选配对中继续进行删除,最终剩余的候选配对即为sample-1的HLA-B的分型结果,如表6所示。
表6
通过表6的数据可见,本申请的方法能够基于一轮或多轮一代测序结果(通常情况下一轮即可),利用较少测序数据和简便的数据处理就能得到高分辨的HLA分型。
以上详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
序列表
<110> 田野
<120> 一种测定待测者的HLA-I分型的方法和一种锚序列组
<130> 16537TY
<160> 226
<170> SIPOSequenceListing 1.0
<210> 1
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 1
atggccgtca tgg 13
<210> 2
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 2
gccctgaccc agac 14
<210> 3
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 3
ggtgagtgcg gggtcg 16
<210> 4
<211> 12
<212> DNA/RNA
<213> Artificial Sequence
<400> 4
ggggagaagc aa 12
<210> 5
<211> 17
<212> DNA/RNA
<213> Artificial Sequence
<400> 5
ggcgggggcg caggacc 17
<210> 6
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 6
ccgcgccggg aggagggt 18
<210> 7
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 7
cactccatga ggtatttc 18
<210> 8
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 8
cgtgtcccgg cccg 14
<210> 9
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 9
ggggagcccc gcttcatc 18
<210> 10
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 10
gttcgtgcgg ttcgacag 18
<210> 11
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 11
ccgcgggcgc cgtggata 18
<210> 12
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 12
ctactacaac cagagcga 18
<210> 13
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 13
cggtgagtga cccc 14
<210> 14
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 14
catcccccac ggacgggc 18
<210> 15
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 15
cacagtctcc gggtccga 18
<210> 16
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 16
cccgaagccg cggg 14
<210> 17
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 17
cgggagaggc ccaggcgc 18
<210> 18
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 18
tttcagttta ggccaaaa 18
<210> 19
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 19
ggttggtcgg ggc 13
<210> 20
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 20
gctgaccgcg gggt 14
<210> 21
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 21
gggccaggtt ctca 14
<210> 22
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 22
gctgcgacgt gggg 14
<210> 23
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 23
gcgcttcctc cgcgggta 18
<210> 24
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 24
cggcaaggat tacatcgc 18
<210> 25
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 25
tcttggaccg cggcggac 18
<210> 26
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 26
gagagcctac ctgg 14
<210> 27
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 27
atacctggag aacgggaa 18
<210> 28
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 28
accaggggcc acggggcg 18
<210> 29
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 29
tctcccgggc tggc 14
<210> 30
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 30
tcccacaagg aggggaga 18
<210> 31
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 31
cctgagggag aggaatcc 18
<210> 32
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 32
agagagtgac tctgaggt 18
<210> 33
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 33
aattaaggga taaa 14
<210> 34
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 34
gacgatccct cgaatact 18
<210> 35
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 35
tggttccctt tgacac 16
<210> 36
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 36
atcccaggtg cctgtgtc 18
<210> 37
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 37
tgtcctgtcc attctcaa 18
<210> 38
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 38
acagatgcaa aatgcctg 18
<210> 39
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 39
tctctgacca tgaggcca 18
<210> 40
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 40
taccctgcgg agatcaca 18
<210> 41
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 41
gaccagaccc aggacacg 18
<210> 42
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 42
aggggatgga accttcca 18
<210> 43
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 43
agatacacct gccatgtg 18
<210> 44
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 44
caccctgaga tggggtaa 18
<210> 45
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 45
tagcagggtc agggcccc 18
<210> 46
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 46
tcccctcttt tcc 13
<210> 47
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 47
tcttcccagc cca 13
<210> 48
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 48
cgtgggcatc attgctgg 18
<210> 49
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 49
ctggagctgt ggtcgctg 18
<210> 50
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 50
gaggaagagc tcaggt 16
<210> 51
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 51
tcacaggaca tttt 14
<210> 52
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 52
atagaaaagg agg 13
<210> 53
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 53
ctgcaagtaa gtatg 15
<210> 54
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 54
ggatattgtg tttgg 15
<210> 55
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 55
acaattcctc ctc 13
<210> 56
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 56
cttctgtggg atctgacc 18
<210> 57
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 57
ctaccccagg cagt 14
<210> 58
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 58
cccagggctc tga 13
<210> 59
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 59
gcttgtaaag gtga 14
<210> 60
<211> 10
<212> DNA/RNA
<213> Artificial Sequence
<400> 60
atgcgggtca 10
<210> 61
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 61
ggcgccccga acc 13
<210> 62
<211> 12
<212> DNA/RNA
<213> Artificial Sequence
<400> 62
tcctgctgct ct 12
<210> 63
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 63
tggccctgac cgaga 15
<210> 64
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 64
ccggtgagtg cggg 14
<210> 65
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 65
agggaaatgg cctctg 16
<210> 66
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 66
aggggaccgc aggcgg 16
<210> 67
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 67
ggagccgcgc cgg 13
<210> 68
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 68
gggtctcagc ccct 14
<210> 69
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 69
gctcccactc catgag 16
<210> 70
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 70
cccggcccgg ccgc 14
<210> 71
<211> 12
<212> DNA/RNA
<213> Artificial Sequence
<400> 71
gtgggctacg tg 12
<210> 72
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 72
ttcgacagcg acgcc 15
<210> 73
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 73
accagagcga ggccg 15
<210> 74
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 74
ggggcgcagg tcacg 15
<210> 75
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 75
cggcccgggt cgcc 14
<210> 76
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 76
gccagggtct caca 14
<210> 77
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 77
cgcctcctcc gcgg 14
<210> 78
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 78
attacatcgc cctg 14
<210> 79
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 79
ggaggcggcc cgtg 14
<210> 80
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 80
gagcctacct ggag 14
<210> 81
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 81
gagaacggga agga 14
<210> 82
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 82
ggcagtgggg agcc 14
<210> 83
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 83
gatggcctcc cacg 14
<210> 84
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 84
tagaatgtcg ccct 14
<210> 85
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 85
tgagggcccc ctct 14
<210> 86
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 86
tcccaggtgc ctgc 14
<210> 87
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 87
gggttctgtg cccc 14
<210> 88
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 88
ggtggtccta gggt 14
<210> 89
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 89
agcgcctgaa tttt 14
<210> 90
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 90
atcagacccc ccaa 14
<210> 91
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 91
tgacccacca cccc 14
<210> 92
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 92
ggtgctgggc cctg 14
<210> 93
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 93
accaaactca ggac 14
<210> 94
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 94
cagaagtggg cagc 14
<210> 95
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 95
accctgagat gggg 14
<210> 96
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 96
agcaggagcc cttc 14
<210> 97
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 97
agcagggtca gggc 14
<210> 98
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 98
tcctttccca gagc 14
<210> 99
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 99
gcctggctgt ccta 14
<210> 100
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 100
gatgtgtagg agga 14
<210> 101
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 101
gccccaggta gaag 14
<210> 102
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 102
ggaccctgtg tgcc 14
<210> 103
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 103
atacttctgg aaat 14
<210> 104
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 104
ttcctctaag atct 14
<210> 105
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 105
tgcttcctcc cagt 14
<210> 106
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 106
ttcccacagg tgga 14
<210> 107
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 107
tcaggctgcg tgta 14
<210> 108
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 108
gtgtggagga gctc 14
<210> 109
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 109
accaggtcct gttt 14
<210> 110
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 110
cagcgacagt gccc 14
<210> 111
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 111
ctctcacagc ttga 14
<210> 112
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 112
atgcgggtca tggcg 15
<210> 113
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 113
ctgctgctct cgg 13
<210> 114
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 114
cgagacctgg gcc 13
<210> 115
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 115
cccggcgagg gcgc 14
<210> 116
<211> 12
<212> DNA/RNA
<213> Artificial Sequence
<400> 116
gccgcgcagg ga 12
<210> 117
<211> 12
<212> DNA/RNA
<213> Artificial Sequence
<400> 117
cgggtctcag cc 12
<210> 118
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 118
cccaggctcc cactcc 16
<210> 119
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 119
cagtgggcta cgtg 14
<210> 120
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 120
acgccgcgag tcc 13
<210> 121
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 121
aggaggggcc gga 13
<210> 122
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 122
gcgccaggca cag 13
<210> 123
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 123
ctgcgcggct act 13
<210> 124
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 124
aaccagagcg agg 13
<210> 125
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 125
tgagtgaccc cgg 13
<210> 126
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 126
cggggcgcag gtc 13
<210> 127
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 127
catcccccac gga 13
<210> 128
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 128
gcccgggtcg ccc 13
<210> 129
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 129
ctgagatcca cccc 14
<210> 130
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 130
ggggctcggg ggac 14
<210> 131
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 131
ggccagggtc tcac 14
<210> 132
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 132
acgggcgcct cctc 14
<210> 133
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 133
gcctacgacg gcaa 14
<210> 134
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 134
tacatcgccc tgaa 14
<210> 135
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 135
ctgcgctcct ggac 14
<210> 136
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 136
ctcagatcac ccag 14
<210> 137
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 137
ggaggcggcc cgt 13
<210> 138
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 138
gagcctacct ggagg 15
<210> 139
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 139
gtgcgtggag tggc 14
<210> 140
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 140
agacgctgca gcg 13
<210> 141
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 141
gggagccttc ccc 13
<210> 142
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 142
aaatgggatc agc 13
<210> 143
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 143
cctcccttga atgg 14
<210> 144
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 144
ctgagtttcc tct 13
<210> 145
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 145
aagggatgaa gtc 13
<210> 146
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 146
tggaggggaa gac 13
<210> 147
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 147
tgcagcagct gtggt 15
<210> 148
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 148
tcaggccttg ttctc 15
<210> 149
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 149
tgattccagc ttttc 15
<210> 150
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 150
gcctccactc aggt 14
<210> 151
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 151
tcctccctca gagac 15
<210> 152
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 152
caggctggcg tctgg 15
<210> 153
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 153
caggtgtcct gtcc 14
<210> 154
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 154
ggatggtcac atggg 15
<210> 155
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 155
aattttctga ctctt 15
<210> 156
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 156
agacacacgt gacc 14
<210> 157
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 157
atgaggccac cctg 14
<210> 158
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 158
ggccctgggc ttct 14
<210> 159
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 159
cactgacctg gcag 14
<210> 160
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 160
agcttgtgga gacca 15
<210> 161
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 161
aagtgggcag ctgt 14
<210> 162
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 162
ggtgccttct gga 13
<210> 163
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 163
agagatacac gtgc 14
<210> 164
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 164
agcacgaggg gct 13
<210> 165
<211> 11
<212> DNA/RNA
<213> Artificial Sequence
<400> 165
gtaaggaggg g 11
<210> 166
<211> 11
<212> DNA/RNA
<213> Artificial Sequence
<400> 166
gaaagcagaa g 11
<210> 167
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 167
tcagggcccc tcac 14
<210> 168
<211> 12
<212> DNA/RNA
<213> Artificial Sequence
<400> 168
cagcccacca tc 12
<210> 169
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 169
gggcatcgtt gctg 14
<210> 170
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 170
taggaggaag agct 14
<210> 171
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 171
ggtctgggtt ttct 14
<210> 172
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 172
tcaagcccca ggt 13
<210> 173
<211> 13
<212> DNA/RNA
<213> Artificial Sequence
<400> 173
gcaccatcca cac 13
<210> 174
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 174
cctgggaccc tgtg 14
<210> 175
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 175
ggggaaggtc cctg 14
<210> 176
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 176
taggagggca gttg 14
<210> 177
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 177
gatcctgccc tggg 14
<210> 178
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 178
ttctggaaac ttct 14
<210> 179
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 179
gaggttcccc taaga 15
<210> 180
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 180
agggcatttt cttcc 15
<210> 181
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 181
gtggaaaagg aggga 15
<210> 182
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 182
ggctgcgtgt aagt 14
<210> 183
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 183
ggcgtgtgga ggagc 15
<210> 184
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 184
ccataattcc tctt 14
<210> 185
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 185
tcctgcgggc tctg 14
<210> 186
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 186
tttgttctac ccca 14
<210> 187
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 187
agcaacagtg cccag 15
<210> 188
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 188
atgagtctct catc 14
<210> 189
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 189
ccccaactcc gcagtttctt ttc 23
<210> 190
<211> 22
<212> DNA/RNA
<213> Artificial Sequence
<400> 190
acaaagggaa gggcaggaac aa 22
<210> 191
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 191
gggtccttct tccaggatac tcgt 24
<210> 192
<211> 24
<212> DNA/RNA
<213> Artificial Sequence
<400> 192
cccactctag accccaagaa tctc 24
<210> 193
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 193
actcatgacg cgtccccaat t 21
<210> 194
<211> 20
<212> DNA/RNA
<213> Artificial Sequence
<400> 194
tcacggtgga cacgggggtg 20
<210> 195
<211> 20
<212> DNA/RNA
<213> Artificial Sequence
<400> 195
tttcagttta ggccaaaaat 20
<210> 196
<211> 23
<212> DNA/RNA
<213> Artificial Sequence
<400> 196
ggtgtcctgt ccattctcaa gat 23
<210> 197
<211> 19
<212> DNA/RNA
<213> Artificial Sequence
<400> 197
atctcggacc cggagactg 19
<210> 198
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 198
agggaaatgg cctctg 16
<210> 199
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 199
agggcgacat tctagcgc 18
<210> 200
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 200
accccaggtg tcctgtcc 18
<210> 201
<211> 21
<212> DNA/RNA
<213> Artificial Sequence
<400> 201
attctccatt caagggaggg c 21
<210> 202
<211> 771
<212> DNA/RNA
<213> Artificial Sequence
<220>
<221> misc_feature
<222> (50)..(50)
<223> n为g或a
<400> 202
gggctgaccg cggggtccgg gccaggttct cacaccgtcc agaggatgtn tggctgcgac 60
gtggggtcgg actggcgctt cctccgcggg taccaccagt acgcctacga cggcaaggat 120
tacatcgccc tgaaagagga cctgcgctct tggaccgcgg cggacatggc agctcagacc 180
accaagcaca agtgggaggc ggcccatgtg gcggagcagt tgagagccta cctggagggc 240
acgtgcgtgg agtggctccg cagatacctg gagaacggga aggagacgct gcagcgcacg 300
ggtaccaggg gccacggggc gcctccctga tcgcctgtag atctcccggg ctggcctccc 360
acaaggaggg gagacaattg ggaccaacac tagaatatcg ccctccctct ggtcctgagg 420
gagaggaatc ctcctgggtt tccagatcct gtaccagaga gtgactctga ggttccgccc 480
tgctctctga cacaattaag ggataaaatc tctgaaggaa tgacgggaag acgatccctc 540
gaatactgat gagtggttcc ctttgacaca cacaggcagc agccttgggc ccgtgacttt 600
tcctctcagg ccttgttctc tgcttcacac tcaatgtgtg tgggggtctg agtccagcac 660
ttctgagtcc ttcagcctcc actcaggtca ggaccagaag tcgctgttcc ctcttcaggg 720
actagaattt tccacggaat aggagattat cccaggtgcc tgtgtccagg c 771
<210> 203
<211> 751
<212> DNA/RNA
<213> Artificial Sequence
<400> 203
ctgactcttc ctgacagacg cccccaaaac gcatatgact caccacgctg tctctgacca 60
tgaagccacc ctgaggtgct gggccctgag cttctaccct gcggagatca cactgacctg 120
gcagcgggat ggggaggacc agacccagga cacggagctc gtggagacca ggcctgcagg 180
ggatggaacc ttccagaagt gggcggctgt ggtggtgcct tctggacagg agcagagata 240
cacctgccat gtgcagcatg agggtttgcc caagcccctc accctgagat ggggtaagga 300
gggagacggg ggtgtcatgt cttttaggga aagcaggagc ctctctgacc tttagcaggg 360
tcagggcccc tcaccttccc ctcttttccc agagccgtct tcccagccca ccatccccat 420
cgtgggcatc attgctggcc tggttctctt tggagctgtg atcactggag ctgtggtcgc 480
tgctgtgatg tggaggagga agagctcagg tggggaaggg gtgaagggtg ggtctgagat 540
ttcttgtctc actgagggtt ccaagaccca ggtagaagtg tgccctgcct cgttactggg 600
aagcaccacc cacaattatg ggcctaccca gcctgggccc tgtgtgccag cacttactct 660
tttgtaaagc acctgttaaa atgaaggaca gatttatcac cttgattaca gcggtgatgg 720
gacctgatcc cagcagtcac aagtcacagg g 751
<210> 204
<211> 641
<212> DNA/RNA
<213> Artificial Sequence
<400> 204
tcaccggcct cgctctggtt gtagtagccg cgcagggtcc ccaggtccac tcggtgagtc 60
tgtgagtggg ccttcacttt ccgtgtctcc ccgtcccaat actccggacc ctcctgctct 120
atccacggcg cccgcggctc catcctctgg ctcgcggcgt cgctgtcgaa ccgcacgaac 180
tgcgtgtcgt ccacgtagcc cactgcgatg aagcggggct ccccgcggcc gggccgggac 240
acggatgtga agaaatacct catggagtga gagcctgggg acgaggagtg gctgagaccc 300
gcccgaccct cctcccggcg cggcttcccg ggtcctgcgc ccccgccagg cgggcccgtt 360
gcttctcccc acagaggccg tttccctccc gaccccgcac tcacccgccc aggtctgggt 420
cagggccaga gcccccgaga gtagcaggac gagggttcgg ggcgccatga cggccatcct 480
cggcgtctgg ggagaatctg agtcccggtg ggtgcgtgcg gactttagaa ccgcgaccgc 540
gacgacactg attggcttct ctggaaaccc gacacccaat gggagtgaga actgggtccg 600
cgtcgtgagt atccaggaag aaggacccta cataggttgg g 641
<210> 205
<211> 751
<212> DNA/RNA
<213> Artificial Sequence
<220>
<221> misc_feature
<222> (228)..(228)
<223> n为a或t
<220>
<221> misc_feature
<222> (229)..(229)
<223> n为c或g
<220>
<221> misc_feature
<222> (231)..(231)
<223> n为a或c
<220>
<221> misc_feature
<222> (236)..(236)
<223> n为a或c
<220>
<221> misc_feature
<222> (237)..(237)
<223> n为c或g
<220>
<221> misc_feature
<222> (239)..(239)
<223> n为a或c
<220>
<221> misc_feature
<222> (241)..(241)
<223> n为c或g
<220>
<221> misc_feature
<222> (242)..(242)
<223> n为a或g
<220>
<221> misc_feature
<222> (251)..(251)
<223> n为g或t
<220>
<221> misc_feature
<222> (258)..(258)
<223> n为a或t
<400> 205
tcgggcgggt ctcagcccct cctcgccccc aggctcccac tccatgaggt atttctacac 60
cgccatgtcc cggcccggcc gcggggagcc ccgcttcatc gcagtgggct acgtggacga 120
cacccagttc gtgaggttcg acagcgacgc cgcgagtccg aggatggcgc cccgggcgcc 180
atggatagag caggaggggc cggagtattg ggaccgggag acacagannt ncaagnncna 240
nncacagact naccgagnga gcctgcggaa cctgcgcggc tactacaacc agagcgaggc 300
cggtgagtga ccccggcctg gggcgcaggt cacgactccc catcccccac gtacggcccg 360
ggtcgccccg agtctccggg tccgagatcc gcccccctga ggccgcggga cccgcccaaa 420
ccctcgaccg gcgagagccc caggcgcgtt tacccggttt cattttcagt tgaggccaaa 480
atccccgcgg gttggtcggg gcggggcggg gctcggggga cggggctgac cgcggggcct 540
gggccagggt ctcacaccct ccagaggatg tacggctgcg acgtggggcc ggacgggcgc 600
ctcctccgcg ggcatgacca gtccgcctac gacggcaagg attacatcgc cctgaacgag 660
gacctgagct cctggaccgc ggcggacacg gcggctcaga tcacccagcg caagtgggag 720
gcggcccgtg aggcggagca gtggagagcc t 751
<210> 206
<211> 631
<212> DNA/RNA
<213> Artificial Sequence
<400> 206
tcgggcgggt ctcagcccct cctcgccccc aggctcccac tccatgaggt atttctacac 60
actgcccctg gtacccgcgc gctgcagcgt ctccttcccg ttctccaggt atctgcggag 120
ccactccacg cacaggccct ccaggtaggc tctccactgc tccgcctcac gggccgcctc 180
ccacttgcgc tgggtgatct gagccgccgt gtccgccgcg gtccaggagc tcaggtcctc 240
gttcagggcg atgtaatcct tgccgtcgta ggcggactgg tcatgcccgc ggaggaggcg 300
cccgtccggc cccacgtcgc agccgtacat cctctggagg gtgtgagacc ctggcccagg 360
ccccgcggtc agccccgtcc cccgagcccc gccccgcccc gaccaacccg cggggatttt 420
ggcctcaact gaaaatgaaa ccgggtaaac gcgcctgggg ctctcgccgg tcgagggttt 480
gggcgggtcc cgcggcctca ggggggcgga tctcggaccc ggagactcgg ggcgacccgg 540
gccgtacgtg ggggatgggg agtcgtgacc tgcgccccag gccggggtca ctcaccggcc 600
tcgctctggt tgtagtagcc gcgcaggttc c 631
<210> 207
<211> 721
<212> DNA/RNA
<213> Artificial Sequence
<220>
<221> misc_feature
<222> (126)..(126)
<223> n为c或t
<220>
<221> misc_feature
<222> (184)..(184)
<223> n为a或g
<220>
<221> misc_feature
<222> (332)..(332)
<223> n为a或g
<400> 207
acacacgtga cccaccatcc cgtctctgac catgaggcca ccctgaggtg ctgggccctg 60
ggcttctacc ctgcggagat cacactgacc tggcagtggg atggggagga ccaaactcag 120
gacacngagc ttgtggagac caggccagca ggagatggaa ccttccagaa gtgggcagct 180
gtgntggtgc cttctggaga agagcagaga tacacgtgcc atgtgcagca cgaggggctg 240
ccggagcccc tcaccctgag atggggtaag gagggggatg aggggtgatg tgtcttctca 300
gggaaagcag aagtcctgga gcccttcagc cnggtcaggg ctgaggcttg gaggtcaggg 360
cccctcacct tcccctcctt tcccagagcc gtcttcccag cccaccatcc ccatcgtggg 420
catcgttgct ggcctggctg tcctggctgt cctagctgtc ctaggagctg tggtggctgt 480
tgtgatgtgt aggaggaaga gctcaggtag ggaaggggtg aggagtgggg tctgggtttt 540
cttgttccac tgggagtttc aagccccagg tagaagtgtg ccccacctcg ttactggaag 600
caccatccac acatgggcca tcccagcctg ggaccctgtg tgccagcact tactctgttg 660
tgaagcacat gacaatgaag gacagatgta tcaccttgat gattatggtg ttggggtcct 720
t 721
<210> 208
<211> 291
<212> DNA/RNA
<213> Artificial Sequence
<220>
<221> misc_feature
<222> (163)..(163)
<223> n为c或g
<220>
<221> misc_feature
<222> (190)..(190)
<223> n为a或g
<220>
<221> misc_feature
<222> (281)..(281)
<223> n为t或c
<220>
<221> misc_feature
<222> (288)..(288)
<223> n为a或t
<400> 208
tggggaaggc tccccactgc ccctggtacc cgcgcgctgc agcgtctcct tcccgttctc 60
caggtatctg cggagccact ccacgcacgt gccctccagg taggctctcc gctgctccgc 120
ctcacgggcc gcctcccact tgcgctgggt gatctgagcc gcngtgtccg cggcggtcca 180
ggagcgcagn tcctcgttca gggcgatgta atccttgccg tcgtaggcgt actggtcata 240
cccgcggagg aggcgcccgt cgggccccac gtcgcagcca nacatccnct g 291
<210> 209
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 209
ggtgagtgcg gggtcg 16
<210> 210
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 210
tttcagttta ggccaaaa 18
<210> 211
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 211
tggttccctt tgacac 16
<210> 212
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 212
caccctgaga tggggtaa 18
<210> 213
<211> 16
<212> DNA/RNA
<213> Artificial Sequence
<400> 213
gaggaagagc tcaggt 16
<210> 214
<211> 18
<212> DNA/RNA
<213> Artificial Sequence
<400> 214
cttctgtggg atctgacc 18
<210> 215
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 215
ccggtgagtg cggg 14
<210> 216
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 216
cggcccgggt cgcc 14
<210> 217
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 217
tgagggcccc ctct 14
<210> 218
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 218
agcaggagcc cttc 14
<210> 219
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 219
ggaccctgtg tgcc 14
<210> 220
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 220
gtgtggagga gctc 14
<210> 221
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 221
cccggcgagg gcgc 14
<210> 222
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 222
ctgagatcca cccc 14
<210> 223
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 223
tcaggccttg ttctc 15
<210> 224
<211> 11
<212> DNA/RNA
<213> Artificial Sequence
<400> 224
gaaagcagaa g 11
<210> 225
<211> 14
<212> DNA/RNA
<213> Artificial Sequence
<400> 225
cctgggaccc tgtg 14
<210> 226
<211> 15
<212> DNA/RNA
<213> Artificial Sequence
<400> 226
ggcgtgtgga ggagc 15
Claims (9)
1.一种测定待测者的HLA-I分型的方法,该方法包括如下步骤:
S1、在HLA-I分型库中确定多个锚序列,所述锚序列在同一个等位基因中仅出现一次且在不同等位基因之间保守;
S2、获取待测者的DNA样本并进行PCR扩增,得到扩增产物,并且对所述扩增产物进行Sanger测序,得到测序结果序列;
S3、将所述测序结果序列与所述多个锚序列进行比对,得到多个比对到的锚序列;
S4、在所述多个比对到的锚序列中选取序列位置保守的锚序列,并将所述序列位置保守的锚序列两两配对构成锚序列对;
S5、所述测序结果序列中,选取处于所述锚序列对之间的序列的最长者,得到可用序列;
S6、将所有所述可用序列与所述分型库中的所有等位基因进行逐一比对,得到候选等位基因;
S7、将所述候选等位基因进行两两配对和自身配对,得到候选配对;
S8、将测序结果中的可用序列中的双峰与所述候选配对中的双峰进行比对,比对成功的候选配对即为测序结果的HLA-I分型;
其中,步骤S4中,选取所述序列位置保守的锚序列的操作包括:
对于任意一条锚序列,计算它的第一个碱基和它所在的扩展外显子中的外显子的第一个碱基之间的碱基数,记为n0’,取在所有等位基因中出现频率最高的n0’记为该锚序列的n0;
在所述测序结果序列中,计算每一个比对到的锚序列的起始碱基与测序结果序列的起始碱基之间的碱基数,记为n1;
对每一个比对到的锚序列,用n1减去n0,记为n2,n2相同的锚序列即为序列位置保守的锚序列。
2.根据权利要求1所述的方法,其中,
所述锚序列的长度为10-15bp;
将HLA-I分型库中的所有等位基因的DNA序列划分为多个扩展外显子,每个所述扩展外显子由一个被翻译的外显子和该外显子两侧的序列组成;
在每个所述扩展外显子中确定3-10条所述锚序列。
3.根据权利要求1所述的方法,其中,
所述比对到的锚序列是指在所述测序结果序列中比对成功的锚序列;
所述候选等位基因是指所述分型库中与所述可用序列比对成功的等位基因;
所述锚序列包括SEQ ID NO. 1~188的序列。
4.根据权利要求2所述的方法,其中,所述测序结果序列包含至少一个所述扩展外显子全长或片段的序列。
5.根据权利要求4所述的方法,其中,步骤S2中,所述HLA-I包括HLA-A、HLA-B和HLA-C;
HLA-A的扩增引物为SEQ ID NO. 189~190,测序引物选自SEQ ID NO. 195~197中的至少一者;
HLA-A的锚序列选自SEQ ID NO.1~59;
HLA-B的扩增引物为SEQ ID NO. 191~192,测序引物选自SEQ ID NO. 198~199中的至少一者;
HLA-B的锚序列选自SEQ ID NO.60~111;
HLA-C的扩增引物为SEQ ID NO. 193~194,测序引物选自SEQ ID NO. 200~201中的至少一者;
HLA-C的锚序列选自SEQ ID NO.112~188。
6.根据权利要求1~3中任意一项所述的方法,其中,步骤S3中将所述测序结果序列与所述多个锚序列进行比对的操作包括:在所述测序结果序列中,搜索锚序列,搜索标准为允许一个碱基突变且不允许碱基插入或碱基删除;如果在测序全序列中有且仅有一次地搜索到某个锚序列,则该锚序列为所述比对到的锚序列。
7.根据权利要求1所述的方法,其中,步骤S6中,将所述可用序列与所述分型库中的所有等位基因进行逐一比对时,采用碱基权重算法进行打分,如果某等位基因打分高于临界分值,则判定该等位基因为候选等位基因;所述临界分值为允许0-3个错误的碱基匹配的分值。
8.根据权利要求1所述的方法,其中,步骤S8中,将测序结果中的可用序列中的双峰记为可用双峰;对每一个可用双峰,计算该可用双峰与其所在的可用序列的第一个碱基之间的碱基数,记为n3;在等位基因中,寻找上述可用序列的第一个锚序列,将在等位基因中寻找到的所述第一个锚序列的第一个碱基的n3个碱基后的位置上的碱基,作为可比对碱基;对于每一个候选配对,对应于每一个可用双峰,得到一个可比对碱基对;如该候选配对的所有可比对碱基对的碱基与其各自对应的可用双峰的碱基完全相同,则该候选配对即为测序结果的HLA-I分型。
9.一种锚序列组,其特征在于,所述锚序列组包括SEQ ID NO. 1~188的序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110172484.8A CN112921078B (zh) | 2021-02-08 | 2021-02-08 | 一种测定待测者的hla-i分型的方法和一种锚序列组 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110172484.8A CN112921078B (zh) | 2021-02-08 | 2021-02-08 | 一种测定待测者的hla-i分型的方法和一种锚序列组 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112921078A CN112921078A (zh) | 2021-06-08 |
CN112921078B true CN112921078B (zh) | 2022-07-08 |
Family
ID=76171217
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110172484.8A Active CN112921078B (zh) | 2021-02-08 | 2021-02-08 | 一种测定待测者的hla-i分型的方法和一种锚序列组 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112921078B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1997031126A1 (en) * | 1996-02-20 | 1997-08-28 | The Perkin-Elmer Corporation | Methods and reagents for typing hla class i genes |
US6103465A (en) * | 1995-02-14 | 2000-08-15 | The Perkin-Elmer Corporation | Methods and reagents for typing HLA class I genes |
CN101892317A (zh) * | 2010-07-29 | 2010-11-24 | 苏州大学 | Hla高分辨基因测序试剂盒 |
CN101921842A (zh) * | 2010-06-30 | 2010-12-22 | 深圳华大基因科技有限公司 | Hla-a,b基因分型用pcr引物及其使用方法 |
-
2021
- 2021-02-08 CN CN202110172484.8A patent/CN112921078B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6103465A (en) * | 1995-02-14 | 2000-08-15 | The Perkin-Elmer Corporation | Methods and reagents for typing HLA class I genes |
WO1997031126A1 (en) * | 1996-02-20 | 1997-08-28 | The Perkin-Elmer Corporation | Methods and reagents for typing hla class i genes |
CN101921842A (zh) * | 2010-06-30 | 2010-12-22 | 深圳华大基因科技有限公司 | Hla-a,b基因分型用pcr引物及其使用方法 |
CN101892317A (zh) * | 2010-07-29 | 2010-11-24 | 苏州大学 | Hla高分辨基因测序试剂盒 |
Non-Patent Citations (2)
Title |
---|
SOAPTyping: an open-source and crossplatform tool for sequence-based typing for HLA class I and II alleles;Yong Zhang等;《BMC Bioinformatics》;20200708;第1-9页 * |
两种HLA分型方法对比;原应博等;《现代畜牧科技》;20191231;第1-6页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112921078A (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105339508B (zh) | Hla基因的多重dna分型方法和试剂盒 | |
CN106103738B (zh) | 利用超大规模平行测序仪进行简便的hla基因的dna分型方法和试剂盒 | |
JPH09503921A (ja) | 遺伝子転写産物の比較解析 | |
Yaspo et al. | Model for a transcript map of human chromosome 21: isolation of new coding sequences from exon and enriched cDNA libraries | |
CN108531615A (zh) | 一种鸡HS6ST3基因43bp indel多态性标记及其应用、检测引物、试剂盒 | |
CN115074450A (zh) | 检测与白山羊体尺性状关联的snp分子标记的试剂、试剂盒和应用 | |
US20190153528A1 (en) | Method for target specific rna transcription of dna sequences | |
Lahbib-Mansais et al. | Contribution to high-resolution mapping in pigs with 101 type I markers and progress in comparative map between humans and pigs | |
Romanov et al. | Construction of a California condor BAC library and first-generation chicken–condor comparative physical map as an endangered species conservation genomics resource | |
CN112921078B (zh) | 一种测定待测者的hla-i分型的方法和一种锚序列组 | |
CN100591692C (zh) | 一种猪脂肪沉积相关蛋白及其编码基因与应用 | |
Wang et al. | A chromosome-level genome of Chenghua pig provides new insights into the domestication and local adaptation of pigs | |
Cormio et al. | Mitochondrial DNA mutations in RRF of healthy subjects of different age | |
Le Provost et al. | A survey of the goat genome transcribed in the lactating mammary gland | |
Luo et al. | Telomere-to-telomere sheep genome assembly reveals new variants associated with wool fineness trait | |
CN117051126A (zh) | 检测天祝白牦牛fgf5基因snp标记的方法及其应用 | |
CN116004841B (zh) | Fhl3基因中与白山羊体尺性状关联的snp分子标记、检测试剂、试剂盒和应用 | |
CN113430284B (zh) | 与鸡胸肌质量和胸肌率相关的分子标记、试剂盒及应用 | |
Christian et al. | An evaluation of the assembly of an approximately 15-Mb region on human chromosome 13q32–q33 linked to bipolar disorder and schizophrenia | |
Weikard et al. | Targeted construction of a high-resolution, integrated, comprehensive, and comparative map for a region specific to bovine chromosome 6 based on radiation hybrid mapping | |
Alföldi | Sequence of the mouse Y chromosome | |
Chua et al. | Molecular genetic approaches to obesity | |
CN109628611B (zh) | 一种影响肉牛肌内脂肪含量的arid5b基因突变位点及其应用 | |
Iwata et al. | Aging-related occurrence in Ashkenazi Jews of leukocyte heteroplasmic mtDNA mutation adjacent to replication origin frequently remodeled in Italian centenarians | |
Zlojutro et al. | The origins of the Yakut people: evidence from mitochondrial DNA diversity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220606 Address after: 310020 room 103-10, building 7, Chuangzhi Green Valley Development Center, 788 HONGPU Road, Jianggan District, Hangzhou City, Zhejiang Province Applicant after: Hangzhou Huben biomedical Co.,Ltd. Address before: 3 / F, building 4, Zhejiang agricultural science and Technology Innovation Park, 298 Desheng Middle Road, Jianggan District, Hangzhou City, Zhejiang Province, 310000 Applicant before: Tian Ye |
|
GR01 | Patent grant | ||
GR01 | Patent grant |