CN111161795A - 肠道微生物测序数据处理方法、装置、存储介质及处理器 - Google Patents
肠道微生物测序数据处理方法、装置、存储介质及处理器 Download PDFInfo
- Publication number
- CN111161795A CN111161795A CN201910038192.8A CN201910038192A CN111161795A CN 111161795 A CN111161795 A CN 111161795A CN 201910038192 A CN201910038192 A CN 201910038192A CN 111161795 A CN111161795 A CN 111161795A
- Authority
- CN
- China
- Prior art keywords
- intestinal
- antibiotic resistance
- genes
- gene
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000968 intestinal effect Effects 0.000 title abstract description 198
- 244000005700 microbiome Species 0.000 title abstract description 146
- 238000012163 sequencing technique Methods 0.000 title abstract description 115
- 238000003672 processing method Methods 0.000 title abstract description 15
- 108090000623 proteins and genes Proteins 0.000 abstract description 317
- 238000004458 analytical method Methods 0.000 abstract description 124
- 238000000034 method Methods 0.000 abstract description 54
- 230000000813 microbial effect Effects 0.000 abstract description 54
- 210000001035 gastrointestinal tract Anatomy 0.000 abstract description 31
- 230000003115 biocidal effect Effects 0.000 description 144
- 230000003871 intestinal function Effects 0.000 description 96
- 230000006870 function Effects 0.000 description 73
- 238000012545 processing Methods 0.000 description 44
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 32
- 230000008827 biological function Effects 0.000 description 18
- 239000003242 anti bacterial agent Substances 0.000 description 17
- 229960000808 netilmicin Drugs 0.000 description 17
- ZBGPYVZLYBDXKO-HILBYHGXSA-N netilmycin Chemical compound O([C@@H]1[C@@H](N)C[C@H]([C@@H]([C@H]1O)O[C@@H]1[C@]([C@H](NC)[C@@H](O)CO1)(C)O)NCC)[C@H]1OC(CN)=CC[C@H]1N ZBGPYVZLYBDXKO-HILBYHGXSA-N 0.000 description 17
- 230000037149 energy metabolism Effects 0.000 description 16
- 229960003276 erythromycin Drugs 0.000 description 16
- GNWUOVJNSFPWDD-XMZRARIVSA-M Cefoxitin sodium Chemical compound [Na+].N([C@]1(OC)C(N2C(=C(COC(N)=O)CS[C@@H]21)C([O-])=O)=O)C(=O)CC1=CC=CS1 GNWUOVJNSFPWDD-XMZRARIVSA-M 0.000 description 15
- 229960002682 cefoxitin Drugs 0.000 description 15
- 150000004666 short chain fatty acids Chemical class 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 14
- 241000282414 Homo sapiens Species 0.000 description 13
- 244000005709 gut microbiome Species 0.000 description 13
- 238000011160 research Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 239000003833 bile salt Substances 0.000 description 10
- 238000004590 computer program Methods 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 238000012360 testing method Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 8
- 230000004136 fatty acid synthesis Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000007062 hydrolysis Effects 0.000 description 7
- 238000006460 hydrolysis reaction Methods 0.000 description 7
- 238000007405 data analysis Methods 0.000 description 6
- -1 i.e. Proteins 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 229940088710 antibiotic agent Drugs 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000037213 diet Effects 0.000 description 4
- 235000005911 diet Nutrition 0.000 description 4
- 210000000936 intestine Anatomy 0.000 description 4
- VMGAPWLDMVPYIA-HIDZBRGKSA-N n'-amino-n-iminomethanimidamide Chemical compound N\N=C\N=N VMGAPWLDMVPYIA-HIDZBRGKSA-N 0.000 description 4
- BOLDJAUMGUJJKM-LSDHHAIUSA-N renifolin D Natural products CC(=C)[C@@H]1Cc2c(O)c(O)ccc2[C@H]1CC(=O)c3ccc(O)cc3O BOLDJAUMGUJJKM-LSDHHAIUSA-N 0.000 description 4
- 108020004465 16S ribosomal RNA Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 241000254173 Coleoptera Species 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000003301 hydrolyzing effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 108010000231 Choloylglycine hydrolase Proteins 0.000 description 2
- 108090000604 Hydrolases Proteins 0.000 description 2
- 102000004157 Hydrolases Human genes 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 102000004867 Hydro-Lyases Human genes 0.000 description 1
- 108090001042 Hydro-Lyases Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 244000005702 human microbiome Species 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 235000021391 short chain fatty acids Nutrition 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本申请公开了一种肠道微生物测序数据的处理方法、装置、处理器及存储器。该方法包括:获取目标对象的肠道微生物菌群的测序数据;根据标准基因数据库对测序数据进行注释,得到注释结果;根据注释结果,对目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息。通过本申请实现了采用宏基因组基因分析方法对个体肠道微生物进行相对全面、多元的分析,相比现有方法更能满足个性化分析的需求。
Description
技术领域
本申请涉及基因测序数据分析领域,具体而言,涉及一种肠道微生物测序数据处理方法、装置、存储介质及处理器。
背景技术
随着人类微生物组计划(HMP)和人类肠道宏基因组学(MateHIT)项目的开展,越来越多的研究表明,人体的生理代谢和生长发育不仅受自身基因控制,有许多现象,如对疾病的易感性、药物反应等,无法全部用人体基因的差异来解释。这是因为,人体内生活着大量微生物,它们的组成和活动与人的生长发育、生老病死息息相关。
16S rRNA(Small subunit ribosomal RNA)基因是对原核微生物进行系统进化分类研究时最常用的分子标记物(Biomarker),广泛应用于微生物生态学研究中。近些年来随着高通量测序技术及数据分析方法等的不断进步,大量基于16S rRNA基因的研究使得微生物生态学研究得到了快速的发展,在肠道微生物研究方面也得到广泛的应用,然而使用16SrRNA基因数据分析法也存在诸多问题,比如水平基因转移、多拷贝的异质性、基因扩增效率的差异、数据分析方法的选择等,这些问题都影响了微生物群落组成和多样性分析时的准确性。
宏基因组(Metagenome),又称“元基因组”,是指某个特定环境中全部微小生物遗传物质的总和。宏基因组的测序方法以特定环境中的整个微生物群落作为研究的对象,不需要对微生物进行分离培养,而是提取环境微生物总DNA进行研究,采用新一代高通量测序技术对环境微生物样本的DNA直接测序。由于基因宏基因组研究微生物生态的优越性,越来越多的研究采用宏基因组基因分析方法研究微生物生态。
然而,目前通过采用宏基因组的基因分析方法仅进行基因相对丰度分析,分析结果单一,因而提供的信息有限,不能满足个性化分析的需求。
发明内容
本申请提供一种肠道微生物测序数据处理方法、装置、存储介质及处理器,以解决相关技术中采用宏基因组基因数据分析方法的分析结果单一,提供的信息有限,不能满足个性化分析的需求的问题。
根据本申请的一个方面,提供了一种肠道微生物测序数据的处理方法。该方法包括:获取目标对象的肠道微生物菌群的测序数据;根据标准基因数据库对所述测序数据进行注释,得到注释结果;根据所述注释结果,对所述目标对象的肠道微生物菌群进行评估,获得所述目标对象的肠道微生物的功能信息。
根据本申请的另一方面,提供了一种肠道微生物测序数据的处理装置。该装置包括:第一获取模块,用于获取目标对象的肠道微生物菌群的测序数据;注释模块,用于根据标准基因数据库对所述测序数据进行注释,得到注释结果;第二获取模块,根据所述注释结果,对所述目标对象的肠道微生物菌群进行评估,获得所述目标对象的肠道微生物的功能信息。
根据本申请的另一方面,提供了一种存储介质,所述存储介质包括存储的程序,其中,所述程序执行上述任意一项所述的肠道微生物测序数据处理方法。
根据本申请的另一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的肠道微生物测序数据处理方法。
通过本申请,采用以下步骤:获取目标对象的肠道微生物菌群的测序数据;根据标准基因数据库对所述测序数据进行注释,得到注释结果;根据所述注释结果,对所述目标对象的肠道微生物菌群进行评估,获得所述目标对象的肠道微生物的功能信息。与相关现有技术相比,本申请的上述方法不仅能够对基因的相对丰度进行分析,而且能够根据各基因的相对丰度信息对目标对象的肠道微生物的菌群及菌群的状态进行评估,进而相对完整地获得目标对象的肠道微生物的功能信息。即,本申请的上述方法所提供的信息相对更全面,更多元化,能够满足个性化的需求。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的肠道微生物测序数据的处理方法的流程图一;
图2是根据本申请实施例提供的肠道微生物测序数据的处理方法的流程图二;
图3是根据本申请实施例提供的肠道微生物测序数据的处理装置的示意图;
图4是本申请一实施例中的基因丰度文件示意图;
图5是本申请一实施例中的IGC的KO注释文件示意图;
图6是本申请一实施例中的KO的相对丰度文件示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
标准基因数据库,即含有大量的基因序列以及各基因序列对应的基因和该基因相关的功能信息的数据库,标准基因数据库包括但不限于IGC(Integrated Gene Catalog)、KEGG(Kyoto Encyclopedia of Genes and Genomes)、GO(Gene Ontology)、EggNOG:(evolutionary genealogy of genes:Non-supervised Orthologous Groups)、CAZy(carbohydrate-active enzymes database),ARDB(Antibiotic Resistance GenesDatabase)等数据库。
目标基因:指所属微生物的特异基因,该特异基因仅在该微生物中存在,或该特异基因的序列经人工矫正后仅与该物种的序列对应上。
注释,即将获取的序列信息在标准基因数据库中进行比对,得到各序列信息对应的基因,以及该基因的功能和生物来源信息。
抗生素抗性基因,是指使细菌对抗生素产生抗药性有关的基因。这类基因往往通过基因突变产生,即在人类使用抗生素杀灭细菌的同时,会诱导细菌进化出抗药性基因,并在细菌群落中转移扩散。
KEGG,简称京都基因组百科全书,包含了许多的数据库,对于研究基因功能来说,KEGG orthology数据库是最基本的一个数据库。
KEGG Orthology简称KO,对于每个功能已知的基因,会把和其同源的基因所有基因都归为一类,就是每一个KO,并赋予一个K number。用该基因的功能作为这个KO的功能。基于同源基因具有相似功能的假设,把每个基因的功能进行了扩充,对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个orthology,用该基因的功能作为该orthology的功能;这样就将对于不同物种基因功能的研究都利用起来,提供了一个全面的研究基因功能的数据库。
根据本申请的实施例,提供了一种肠道微生物测序数据的处理方法。
图1是根据本申请实施例的肠道微生物测序数据的处理方法的流程图一。如图1所示,该方法包括以下步骤:
步骤S102,获取目标对象的肠道微生物菌群的测序数据。
步骤S104,根据标准基因数据库对测序数据进行注释,得到注释结果。
步骤S106,根据注释结果,对目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息。
本申请实施例提供的肠道微生物测序数据的处理方法,通过获取目标对象的肠道微生物菌群的测序数据;根据标准基因数据库对测序数据进行注释,得到注释结果;根据注释结果,对目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息。也即,通过标准基因数据库对测序数据进行注释,并依据注释结果对目标对象的肠道微生物菌群进行评估,以获得目标对象的肠道微生物的功能信息,进而能够实现对肠道微生物菌群和对菌群的状态进行有效分析。
因而,与相关技术相比,本申请的上述方法不仅能够对基因的相对丰度进行分析,而且能够根据各基因的相对丰度信息对目标对象的肠道微生物的菌群及菌群的状态进行评估,进而相对完整地获得目标对象的肠道微生物的功能信息。即,本申请的上述方法所提供的信息相对更全面,更多元化,能够满足个性化的需求。
需要说明的是:上述所获得目标对象的肠道微生物的功能信息包括肠道微生物的功能基因及各功能基因的相对丰度,其中,功能基因的相对丰度为测序数据中属于同一功能的相关的基因的相对丰度的加和与测序数据中各功能的相关的基因的相对丰度的加和的比值,属于同一功能的相关的基因的相对丰度根据注释结果获得。
上述“功能基因”指的是与某一特定生物学功能相关的基因的集合,此处基因的数量可能是1个或多个,根据具体生物学功能的不同而不同。上述“各功能的相关的基因的相对丰度的加和”指的是测序数据中所涵盖的所有功能相关的基因的相对丰度之和。
进一步地,在获得目标对象的肠道微生物的功能信息之后,本申请实施例提供的肠道微生物测序数据的处理方法还包括:基于功能信息对目标对象的肠道微生物的进行性能分析,性能分析涉及如下至少之一:抗生素抗性基因分析及肠道功能基因分析。
也即,本申请实施例提供的肠道微生物测序数据的处理方法,通过在获得目标对象的肠道微生物的功能信息之后,还基于功能信息对目标对象的肠道微生物的进行抗生素抗性基因分析和/或肠道功能基因分析等性能分析,实现了对个体肠道微生物进行全面、多元的分析,并满足个性化分析需求的技术效果,从而解决了现有技术中所存在的分析结果单一、信息有限,无法满足个性化分析需求的技术问题。
针对上述性能分析涉及抗生素抗性基因分析的情况,基于功能信息对目标对象的肠道微生物的进行性能分析可以通过以下步骤得以实现:计算目标对象的肠道微生物的抗生素抗性指数,确定抗生素抗性指数在参考人群中的位置,其中,将抗生素抗性基因的相对丰度作为该种抗生素抗性的抗生素抗性指数。
其中,在一个可选的示例中,抗生素抗性指数按照如下方法计算:计算目标对象的肠道微生物的同一种抗生素抗性基因的相对丰度之和;将同一种抗生素抗性基因的相对丰度之和除以所有抗生素抗性基因的相对丰度之和,得到该种抗生素抗性基因的相对丰度。
针对“对目标对象的肠道微生物的进行抗生素抗性基因分析”举例示意:
首先,计算目标对象的肠道微生物的每种抗生素的抗生素抗性指数。
其次,确定每种抗生素的抗生素抗性指数在参考人群中的位置,以红霉素为例,将参考人群的红霉素抗性指数(比如100、200、300、1000或更多个人群(如健康人群)的肠道微生物检测结果的红霉素抗性指数)按照从小到大的顺序进行排序,确定参考人群中红霉素抗性指数小于目标对象的红霉素抗性指数的人数(ia),通过计算ia与参考人群总人数(sa)的比例确定目标对象的红霉素抗性指数在参考人群中的位置
以某种预设的测试标准为例,若a(例如:0)≤ca<b(例如:0.25),则认为目标对象的肠道微生物菌群的红霉素抗性指数处于较低水平;若b(例如:0.25)≤ca<c(例如:0.75),则认为目标对象的肠道微生物菌群的红霉素抗性指数处于中等水平;若c(例如:0.75)≤ca<d(例如:1),则认为目标对象的肠道微生物菌群的红霉素抗性指数处于较高水平。
此外,基于功能信息对目标对象的肠道微生物的进行性能分析还可以包括:基于目标对象的抗生素抗性指数和该抗生素抗性指数在参考人群中的位置,确定目标对象的肠道微生物的抗生素抗性得分,其抗生素抗性得分可以按照如下方法计算:
在目标对象的肠道微生物菌群的抗生素抗性指数处于较低水平的情况下,抗生素抗性得分=第一参数(例如:80)*抗生素抗性指数+第二参数(例如:40);
在目标对象的肠道微生物菌群的抗生素抗性指数处于中等水平的情况下,抗生素抗性得分=第三参数(例如:40)*抗生素抗性指数+第四参数(例如:50);
在目标对象的肠道微生物菌群的抗生素抗性指数处于较高水平的情况下,抗生素抗性得分=第五参数(例如:80)*抗生素抗性指数+第六参数(例如:20)。
需要说明的是:上述预设的测试标准中的第一参数、第二参数、第三参数、第四参数、第五参数和第六参数等参数数据,可以基于应用场景适应性替换,本申请不做具体限定。
还需要说明的是,抗生素抗性基因,即为抗生素抗性相关的基因,每个抗生素的抗性与一个以上的基因相关。上述“对目标对象的肠道微生物的进行抗生素抗性基因分析”中,下表列举了16种抗生素及其分别对应的部分基因ID(编号),每个基因ID对应一段基因序列,详情见表1。
表1抗生素类型
需要说明的是,上表中的16种抗生素及各抗生素相关的基因仅为示例,在具体的实施过程中可根据需要选择其中的一种或多种,也可选择其他相关的基因。
针对上述性能分析涉及肠道功能基因分析的情况,基于功能信息对目标对象的肠道微生物的进行性能分析可以通过以下步骤得以实施:计算目标对象的肠道微生物的肠道功能指数,确定肠道功能指数在参考人群中的位置,其中,在一个可选的示例中,将属于同一种功能的功能基因的相对丰度的加和作为该肠道功能的肠道功能指数。
针对“对目标对象的肠道微生物的进行肠道功能基因分析”举例示意:
首先,计算目标对象的肠道微生物每种功能的肠道功能指数,即将属于同一种功能相关的功能基因的相对丰度的加和作为该种功能对应的肠道功能指数。
其次,确定每种功能对应的肠道功能指数在参考人群中的位置,以能量代谢能力为例,将参考人群肠道能量代谢能力的肠道功能指数(比如,100、200、300、1000或更多个人群(如健康人群)在肠道微生物检测结果中的能量代谢能力的肠道功能指数)按照从小到大顺序进行排序,确定参考人群中肠道功能指数小于目标对象肠道能量代谢能力的肠道功能指数的人数(io),通过计算io与参考人群总人数(so)的比例确定目标对象肠道能量代谢能力的肠道功能指数在参考人群中的位置
以某种预设的测试标准为例,若a(例如:0)≤co<b(例如:0.25),则认为目标对象肠道能量代谢能力的肠道功能指数处于较低水平;若b(例如:0.25)≤co<c(例如:0.75),则认为目标对象肠道能量代谢能力的肠道功能指数处于中等水平。若c(例如:0.75)≤co<d(例如:1),则认为目标对象肠道能量代谢能力的肠道功能指数处于较高水平。
此外,基于功能信息对目标对象的肠道微生物的进行性能分析还可以包括:基于目标对象的肠道功能指数和该肠道功能指数在参考人群中的位置,确定目标对象的肠道微生物的肠道功能得分,其肠道功能得分可以按照如下方法计算:
在目标对象的肠道微生物菌群的肠道功能指数处于较低水平的情况下,肠道功能得分=第七参数(例如:80)*肠道功能指数+第八参数(例如:40);
在目标对象的肠道微生物菌群的肠道功能指数处于适中水平的情况下,肠道功能得分=第九参数(例如:40)*肠道功能指数+第十参数(例如:50);
在目标对象的肠道微生物菌群的肠道功能指数处于较高水平的情况下,肠道功能得分=第十一参数(例如:80)*肠道功能指数+第十二参数(例如:20)。
需要说明的是:上述预设的测试标准中的第七参数、第八参数、第九参数、第十参数、第十一参数和第十二参数等参数数据,可以基于应用场景适应性替换,本申请不做具体限定。
还需要说明的是,KEGG Orthology简称KO,对于每个功能已知的基因,会把和其同源的所有基因都归为一类,就是每一个KO,并赋予一个K number。用该基因的功能作为这个KO的功能。基于同源基因具有相似功能的假设,把每个基因的功能进行了扩充,对于某个物种中功能研究的很清楚的基因,在不同的物种间搜寻该基因的同源基因,将这些同源基因定义为一个orthology,用该基因的功能作为该orthology的功能;这样就将对于不同物种基因功能的研究都利用起来,提供了一个全面的研究基因功能的数据库。对上述“对目标对象的肠道微生物的进行肠道功能分析”中,下表列举了9种肠道功能分析的肠道功能及其分别对应的部分KO集合和每个KO对应的部分基因编号(Gene ID),每个基因编号对应一段基因序列,详情见表2。
表2:
需要说明的是,上表中的9种功能仅为示例,在具体的实施过程中可根据需要选择其中的一种或多种,也可选择其他感兴趣的功能及其相关基因。
进一步地,图2是根据本申请实施例的肠道微生物测序数据的处理方法的流程图二。如图2所示,该肠道微生物测序数据的处理方法还包括以下步骤:
步骤S108a,在性能分析涉及抗生素抗性基因分析,且基于功能信息对目标对象的肠道微生物的进行性能分析,计算得到目标对象的肠道微生物的抗生素抗性指数的情况下,还包括将目标对象的肠道微生物的抗生素抗性指数导入参考人群的数据库以用于下一次性能分析步骤中。
步骤S108b,在性能分析涉及肠道功能基因分析,且基于功能信息对目标对象的肠道微生物的进行性能分析,计算得到目标对象的肠道微生物的肠道功能指数的情况下,还包括将目标对象的肠道微生物的肠道功能指数导入参考人群的数据库以用于下一次性能分析步骤中。
步骤S108c,在根据标准基因数据库对测序数据进行注释,得到注释结果的情况下,将目标对象的功能信息(肠道微生物的功能基因及各功能基因的相对丰度)导入参考人群的数据库以用于下一次性能分析步骤中。
也即,在对每个目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息之后,还会将其评估结果(目标对象的肠道微生物的功能信息,该功能信息包括肠道微生物的功能基因及各功能基因的相对丰度)添加至参考人群的数据库中,以便对每项指标的参考范围进行实时更新。
需要说明的是,本申请中的“参考人群的数据库”是指收录了多个个体的肠道微生物基因信息的数据库,其中的肠道微生物基因信息包括肠道微生物的功能基因(功能基因包括抗生素抗性基因、肠道功能基因等),各功能基因的相对丰度、抗生素抗性指数、肠道功能指数等,该数据库还可以包含如志愿者的性别、年龄、身高、体重、生活习惯及地域等信息。
随着使用本申请肠道微生物测序数据的处理方法,进行肠道微生物菌群评估的参与个体越来越多,数据库中存储的参考人群的规模将不断的扩大,进而使得肠道微生物菌群评估的结果也会越来越准确,基于肠道微生物测序数据处理方法的肠道微生物菌群评估的参考价值也越来越大。
最后,当数据库中存储的参考人群数达到一定的丰富程度的时候,本申请肠道微生物测序数据的处理方法还会根据待测个体的表型特征(包括性别,年龄,人种,身高、体重、饮食、居住区域等)选取相应的参考人群进行具体肠道微生物菌群评估分析,进而使得评估结果更加精准、可靠。
还需要说明的是:数据库中最初存储有目标数量个初始参考对象,其数据库具体记录有每个初始参考对象的表型信息(包括性别、年龄、人种、身高、体重、饮食、居住区域等)和肠道微生物菌群的评估信息(包括抗生素抗性基因分析及肠道功能基因分析等,还可以进一步包括各肠道微生物的物种相对丰度信息等)。
此外,还需要针对本申请肠道微生物测序数据的处理方法的步骤S102进行说明:
在一个可选的示例中,步骤S102获取目标对象的肠道微生物菌群的测序数据可以通过如下方式实现:
步骤A1,对目标对象的肠道微生物进行基因测序,获取目标对象的肠道微生物菌群的原始测序数据(raw reads,通常为fasq格式,fastq文件中含有测序序列中所有碱基的质量信息);
步骤A2,对该原始测序数据进行质量监控,即,将原始测序数据中模糊碱基N的数量大于预设数值(该预设数值可以是3个、4个、5个或更多个,具体可以根据实际应用情况而进行合理调整)的reads剔除,以及将原始测序数据中的低质量reads剔除(比如,可以根据reads中的质量信息将reads末尾质量值小于特定值的连续碱基剔除,此处的特定值可以是20、25、30或其他更高的数值,具体可根据实际需求合理调整;进一步地,在剔除上述连续碱基后的reads长度小于特定长度的reads剔除,此处的特定长度可以是30bp、35bp或者更长,具体可基于应用场景适应性调整。去除低质量reads可以选用现有具有上述功能的软件,比如可以是fastx软件);
步骤A3,将原始基因数据中的寄主基因序列剔除,得到目标对象的肠道微生物菌群的测序数据,其中,寄主基因序列为目标对象的基因序列。该步骤所采用的软件可以使用soap软件。
此外,还需要针对本申请肠道微生物测序数据的处理方法的步骤S104进行说明:
在一个可选的示例中,步骤S104根据标准基因数据库对测序数据进行注释,得到注释结果可以通过如下方式实现:
步骤B1,将测序数据中的reads(即基因序列)对比到标准基因数据库(例如:人肠道微生物宏基因组的整合基因集IGC),确定测序数据中包含的每种基因序列的相对丰度(例如:确定测序数据对应的基因丰度文件,其中,该文件包含两列数据,右侧一列数据为基因ID,左侧一列数据为右侧基因ID依次对应的基因相对丰度);
步骤B2,基于标准基因数据库中记载的每种基因序列的注释信息(注释信息包含:每种抗生素对应的抗性基因信息,可形成抗生素抗性基因注释文件),和测序数据中包含的每种基因序列的相对丰度,确定测序数据中包含的每种抗生素抗性基因序列的相对丰度,(例如:确定测序数据中对应的抗生素抗性基因丰度文件,其中该文件包含两列数据,该文件左侧一列数据为各种抗生素抗性基因信息,右侧一列数据为左侧抗性基因依次对应的相对丰度,具体计算方法比如可以是:按照步骤B1的基因丰度文件和步骤B2中产生的抗生素抗性基因注释文件,将属于同一个抗生素抗性基因的基因相对丰度进行加和,然后除以样本中所有抗生素抗性基因的相对丰度之和,得到的结果即为这个抗生素抗性基因的相对丰度);
步骤B3,基于标准基因数据库中记载的每种基因序列的注释信息(注释信息包含:每种生物学功能对应的基因信息,其中,每种生物学功能对应基因的数量为1个或多个,根据具体生物学功能的不同,基因的数量也存在差异),和测序数据中包含的每种基因序列的相对丰度,确定测序数据中包含的每种生物学功能基因的相对丰度,(例如:确定测序数据对应的生物学功能基因丰度文件,其中该文件包含两列数据,该文件左侧一列数据为各种生物学功能所对应的基因信息,右侧一列数据为左侧各种生物学功能所对应的基因依次对应的相对丰度,具体计算方法比如,可以是将属于同一种功能的基因的相对丰度进行加和,然后将每一种功能相关的基因的相对丰度除以样本所有功能所对应的相关的基因的相对丰度之和,即为每一种功能基因的相对丰度)。
实施例一
(一)获取目标对象甲的肠道微生物的测序数据(reads),并对测序数据做如下处理:
1.1 Filter reads(过滤数据),将fastq格式的测序数据reads序列含有模糊碱基“N”的个数大于等于3个剔除。
1.2 Trim reads(去除低质量的reads),用Fastx软件将1.1处理后的测序数据reads末尾质量值小于20的连续剔除;再将剔除低质量连续碱基后reads长度小于30bp的reads剔除。
1.3 Remove host reads(去除宿主序列),用soap软件比对reads和宿主序列,将reads序列能比对到host序列的reads剔除。
1.4 Mapped to IGC(与IGC比对)和Function annotation(功能注释),用soap软件将上述处理后的reads序列与IGC序列进行比对,并得到目标对象的肠道微生物基因丰度(gene abundance)文件和IGC的KO注释文件,基因丰度文件(如图4所示)由两列数据组成,其中左边一列为基因ID,右边一列为基因ID对应的基因丰度;IGC的KO注释文件(如图5所示)由两列数据组成,左边一列为基因ID,右边一列为基因ID对应的KO信息。对于能注释到同一个KO的gene abundance(基因丰度)进行加和计算,然后归一化即可算出每个KO的abundance(相对丰度),输出各个KO的相对丰度文件(如图6所示),该文件由两列数据组成,左边一列为KO编号(每个KO编号对应一个KO相关信息),右边一列为KO编号对应的KO的相对丰度值。即按照输入的基因丰度文件和KO注释文件,将属于同一个KO的基因的相对丰度进行加和,然后除以样本所有的KO基因丰度之和进行归一化,得到的结果即为KO的相对丰度。
(二)肠道微生物功能分析
2.1抗生素抗性基因分析
2.1.1抗生素抗性指数(抗生素抗性基因的相对丰度)分析
本次抗生素抗性指数分析分析目标对象甲的肠道微生物的Cefoxintin(头孢西丁)和Netilmicin(奈替米星)的抗性指数,其中,Cefoxintin(头孢西丁)和Netilmicin(奈替米星)在IGC中对应的Gene ID如下表3所示:
表3:
通过上述1.4Mapped to IGC(与IGC比对)和Function annotation(功能注释)获得该目标对象甲所有抗生素抗性基因相对丰度之和为0.354,和表3中各Gene ID对应的相对丰度,如下表4。
表4:
2.1.2计算Cefoxintin(头孢西丁)和Netilmicin(奈替米星)的抗性指数:
Cefoxintin(头孢西丁)的抗性指数=0+0+0+0+0=0
Netilmicin(奈替米星)的抗性指数=0.0000601
2.1.3确定该目标对象甲的Cefoxintin(头孢西丁)和Netilmicin(奈替米星)的抗性指数在参考人群中的位置:
该参考人群目前已收录了346个人抗生素抗性指数,Cefoxintin(头孢西丁)的抗性指数0在参考人群中的按照从小到大的顺序进行排序,排在第0位,Netilmicin(奈替米星)的抗性指数0.0000601在参考人群中按照从小到大的顺序进行排序,排在第13位。所以,该目标对象甲的Cefoxintin(头孢西丁)指数在参考人群中的位置(ca)0/346=0;该目标对象甲的Netilmicin(奈替米星)的抗性指数在参考人群中的位置(ca)=13/346=0.0376。
2.1.4确认该目标对象甲的肠道微生物的Cefoxintin(头孢西丁)和Netilmicin(奈替米星)抗性得分:
根据预设的测试标准,检测水平确定为:
①若0≤ca<0.25,被检测人肠道菌群抗生素抗性基因处于较低水平:
②若0.25≤ca<0.75,检测人肠道菌群抗生素抗性基因处于中等水平:
③若0.75≤ca<1,被检测人肠道菌群抗生素抗性基因处于较高水平。
计算抗生素抗性基因水平得分计算:
①若0≤ca<0.25,score=40+(ca-0)*(60-40)/(0.25-0)=80*ca+40;
②若0.25≤ca<0.75,score=60+(ca-0.25)*(80-60)/(0.75-0.25)=40*ca+50;
③若0.75≤ca<1,score=80+(ca-0.75)*(100-80)/(1-0.75)=80*ca+20。
所以,该目标对象甲的Cefoxintin(头孢西丁)指数在参考人群中的位置(ca)=0,0≤0<0.25,认为目标对象甲的肠道微生物菌群的Cefoxintin(头孢西丁)抗性指数处于较低水平;该目标对象甲的Netilmicin(奈替米星)的抗性指数在参考人群中的位置(ca)=0.0376,0≤0.0376<0.25,认为目标对象甲的肠道微生物菌群的Netilmicin(奈替米星)抗性指数处于较低水平。
该目标对象甲的Cefoxintin(头孢西丁)抗性基因水平得分:
Score=40*0+50=50
该目标对象甲的Netilmicin(奈替米星)抗性基因水平得分:
Score=40*0.0376+40=43.008
2.2肠道功能基因分析
2.2.1肠道功能指数分析
本次肠道功能分析分析目标对象甲的肠道微生物的Short-chain fatty acids(短链脂肪酸合成能力)和Bile Salt Hydrolase(胆盐水解能力),Short-chain fattyacids(短链脂肪酸合成能力)和Bile Salt Hydrolase(胆盐水解能力)在IGC中对应的KO和Gene ID如下表5所示:
表5:
通过上述1.4Mapped to IGC(与IGC比对)和Function annotation(功能注释)获得该目标对象甲所有KO的相对丰度,并计算Short-chain fatty acids(短链脂肪酸合成能力)和Bile Salt Hydrolase(胆盐水解能力)涉及到的KO的相对丰度加和,如下表6。
表6
每个功能所涉及到的KO的相对丰度的加和为该功能的指数,所以Short-chainfatty acids(短链脂肪酸合成能力)的指数为0.00198,Bile Salt Hydrolase(胆盐水解能力)的指数为0.000588。
2.2.2确定该目标对象甲肠道Short-chain fatty acids(短链脂肪酸合成能力)和Bile Salt Hydrolase(胆盐水解能力)指数在参考人群中的位置:
该参考人群目前已收录了346个人抗生素抗性指数,Short-chain fatty acids(短链脂肪酸合成能力)指数0.00198在参考人群中的按照从小到大的顺序进行排序,排在第66位,Bile Salt Hydrolase(胆盐水解能力)指数0.000588在参考人群中按照从小到大的顺序进行排序,排在第269位。所以,该目标对象甲的Short-chain fatty acids(短链脂肪酸合成能力)指数在参考人群中的位置(ck)=66/346=0.191;该目标对象甲的BileSalt Hydrolase(胆盐水解能力)指数在参考人群中的位置(ck)=269/346=0.777。
2.2.3确定该目标对象甲肠道Short-chain fatty acids(短链脂肪酸合成能力)和Bile Salt Hydrolase(胆盐水解能力)功能得分:
设定的检测值水平评价为:
①若0≤ck<0.25,被检测人肠道菌群某功能处于较低水平:
②若0.25≤ck<0.75,检测人肠道菌群某功能处于中等水平:
③若0.75≤ck<1,被检测人肠道菌群某功能处于较高水平。
预定计算肠道微生物功能得分规则:
①若0≤ck<0.25,score=40+(c-0)*(60-40)/(0.25-0)=80*c+40;
②若0.25≤ck<0.75,score=60+(c-0.25)*(80-60)/(0.75-0.25)=40*c+50;
③若0.75≤ck<1,score=80+(c-0.75)*(100-80)/(1-0.75)=80*c+20。
所以,该目标对象甲的Short-chain fatty acids(短链脂肪酸合成能力)指数在参考人群中的位置(ck)=0.191,0≤0.191<0.25,认为目标对象甲的肠道微生物菌群的Short-chain fatty acids(短链脂肪酸合成能力)功能指数处于较低水平;该目标对象甲的Bile Salt Hydrolase(胆盐水解能力)的抗性指数在参考人群中的位置(ck)=0.777,0.75≤0.777<1,认为目标对象甲的肠道微生物菌群的Bile Salt Hydrolase(胆盐水解能力)的功能指数处于较高水平。
该目标对象甲的Short-chain fatty acids(短链脂肪酸合成能力)功能水平得分:
Score=80*0.191+40=55.3
该目标对象甲的Bile Salt Hydrolase(胆盐水解能力)功能水平得分:
Score=80*0.777+20=82.16
综上,本申请实施提供的肠道微生物测序数据的处理方法实现了以下技术效果:
1、本申请通过宏基因组测序产出的数据进行分析,相比于传统的16SrRNA基因数据分析方法,能够检测出人体肠道微生物菌群更为全面的内容,其中,该检测内容不仅包含肠道微生物的物种,同时还包含肠道微生物的功能信息。
2、本技术方案中对检测人的16种抗生素抗性相关的基因进行了全面检测,通过抗生素抗性相关的基因的检测情况可以评估被检测人肠道菌群中各种抗生素抗性基因的水平。
3、本技术方案能够获得被检测目标对象的肠道微生物功能信息,包括:肠道微生物的功能基因,各具体功能基因的相对丰度,和各具体功能基因的相对丰度在参考人群中的位置(抗生素抗性基因的相对丰度、肠道功能基因的相对丰度,及它们的相对丰度分别在参考人群中的位置),从而能够在肠道微生物整体和特定微生物进行全部评估被检人肠道微生物的状况,实现能够对肠道微生物进行全面、多元的分析,实现个性化分析。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种肠道微生物测序数据的处理装置,需要说明的是,本申请实施例的肠道微生物测序数据的处理装置可以用于执行本申请实施例所提供的用于肠道微生物测序数据的处理方法。以下对该处理装置进行介绍。
图3是根据本申请实施例的肠道微生物测序数据的处理装置的示意图。如图3所示,该装置包括:第一获取模块31、注释模块33以及第二获取模块35。
第一获取模块31,用于获取目标对象的肠道微生物菌群的测序数据;
注释模块33,用于根据标准基因数据库对测序数据进行注释,得到注释结果;
第二获取模块35,根据注释结果,对目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息。
本申请实施例提供的肠道微生物测序数据的处理装置,通过第一获取模块31获取目标对象的肠道微生物菌群的测序数据;然后执行注释模块33根据标准基因数据库对测序数据进行注释,得到注释结果;最后执行第二获取模块35,根据注释结果,对目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息,该处理装置通过注释结果对目标对象的肠道微生物菌群进行评估,从而能够获得目标对象的肠道微生物的菌群信息,进而能够实现对肠道微生物菌群和对菌群的状态进行有效的分析的技术效果。与现有技术的处理装置仅能提供单一结果、信息有限的缺陷相比,本实施例的处理装置所提供的信息相对更全面、更多元化,因而能够满足个性化的需求。
需要说明的是:在本申请实施例提供的肠道微生物测序数据的处理装置中,目标对象的肠道微生物的功能信息包括肠道微生物的功能基因及各功能基因的相对丰度,其中,功能基因的相对丰度为测序数据中属于同一功能的基因的相对丰度的加和与测序数据中所有功能的基因的相对丰度的加和的比值,属于同一功能的基因的相对丰度根据注释结果获得。
上述“功能基因”指的是与某一特定生物学功能相关的基因的集合,此处基因的数量可能是1个或多个,根据具体生物学功能的不同而不同。上述“各功能的相关的基因的相对丰度的加和”指的是测序数据中所涵盖的所有功能相关的基因的相对丰度之和。
进一步地,在本申请实施例提供的肠道微生物测序数据的处理装置还包括:性能分析模块,用于基于功能信息对目标对象的肠道微生物的进行性能分析,性能分析涉及如下至少之一:抗生素抗性基因分析及肠道功能基因分析。
包含上述分析模块的处理装置,在通过第二获取模块获得目标对象的肠道微生物的功能信息之后,还能够通过执行性能分析模块基于功能信息对目标对象的肠道微生物的进行抗生素抗性基因分析和/或肠道功能基因分析等性能分析,实现了对个体肠道微生物进行全面、多元的分析,并满足个性化分析需求的技术效果,从而解决了现有技术中所存在的分析结果单一、信息有限,无法满足个性化分析需求的技术问题。
可选地,在本申请实施例提供的肠道微生物测序数据的处理装置中,在性能分析涉及抗生素抗性基因分析的情况下,性能分析模块包括:第一计算模块,用于计算目标对象的肠道微生物的抗生素抗性指数,第一位置确定模块,用于确定抗生素抗性指数在参考人群中的位置;在性能分析涉及肠道功能基因分析的情况下,性能分析模块包括:第二计算模块,用于计算目标对象的肠道微生物的肠道功能指数,第二位置确定模块,用于确定肠道功能指数在参考人群中的位置。
其中,在一个可选的示例中,针对性能分析模块执行“对目标对象的肠道微生物的进行抗生素抗性基因分析”的步骤举例示意:
首先,第一计算模块计算目标对象的肠道微生物的每种抗生素的抗生素抗性指数。
其次,第一位置确定模块确定每种抗生素的抗生素抗性指数在参考人群中的位置,以红霉素为例,将参考人群的红霉素抗性指数(比如100、200、300、1000或更多个人群(如健康人群)的肠道微生物检测结果的红霉素抗性指数)按照从小到大的顺序进行排序,确定参考人群中红霉素抗性指数小于目标对象的红霉素抗性指数的人数(ia),通过计算ia与参考人群总人数(sa)的比例确定目标对象的红霉素抗性指数在参考人群中的位置
以某种预设的测试标准为例,若(1)(例如:0)≤ca<b(例如:0.25),则认为目标对象的肠道微生物菌群的红霉素抗性指数处于较低水平;若(2)(例如:0.25)≤ca<c(例如:0.75),则认为目标对象的肠道微生物菌群的红霉素抗性指数处于中等水平;若(3)(例如:0.75)≤ca<d(例如:1),则认为目标对象的肠道微生物菌群的红霉素抗性指数处于较高水平。
此外,性能分析模块在基于第一位置确定模块确定了目标对象的抗生素抗性指数和该抗生素抗性指数在参考人群中的位置后,还可以包括抗生素抗性得分模块:抗生素抗性得分模块用于确定目标对象的肠道微生物的抗生素抗性得分,抗生素抗性得分模块通过执行如下方法计算得到抗生素抗性得分:
在目标对象的肠道微生物菌群的抗生素抗性指数处于较低水平的情况下,抗生素抗性得分=第一参数(例如:80)*抗生素抗性指数+第二参数(例如:40);
在目标对象的肠道微生物菌群的抗生素抗性指数处于中等水平的情况下,抗生素抗性得分=第三参数(例如:40)*抗生素抗性指数+第四参数(例如:50);
在目标对象的肠道微生物菌群的抗生素抗性指数处于较高水平的情况下,抗生素抗性得分=第五参数(例如:80)*抗生素抗性指数+第六参数(例如:20)。
需要说明的是:上述预设的测试标准中的第一参数、第二参数、第三参数、第四参数、第五参数和第六参数等参数数据,可以基于应用场景适应性替换,本申请不做具体限定。
还需要说明的是,前述表1示例性地列举了16种抗生素及其分别对应的部分基因ID(编号),每个基因ID对应一段基因序列。在实际研究应用中,根据不同的研究方向或目的,可以选择其中的一种或多种,也可以选择其他相关的基因。
在一个可选的示例中,针对性能分析模块执行“对目标对象的肠道微生物的进行肠道功能基因分析”举例示意:
首先,第二计算模块计算目标对象的肠道微生物每种功能的肠道功能指数,即将属于同一种功能相关的功能基因的相对丰度的加和作为该种功能对应的肠道功能指数。
其次,第二位置确定模块确定每种功能对应的肠道功能指数在参考人群中的位置,以能量代谢能力为例,将参考人群肠道能量代谢能力的肠道功能指数(比如,100、200、300、1000或更多个人群(如健康人群)在肠道微生物检测结果中的能量代谢能力的肠道功能指数)按照从小到大顺序进行排序,确定参考人群中肠道功能指数小于目标对象肠道能量代谢能力的肠道功能指数的人数(io),通过计算io与参考人群总人数(so)的比例确定目标对象肠道能量代谢能力的肠道功能指数在参考人群中的位置
以某种预设的测试标准为例,若(1)(例如:0)≤co<b(例如:0.25),则认为目标对象肠道能量代谢能力的肠道功能指数处于较低水平;若(2)(例如:0.25)≤co<c(例如:0.75),则认为目标对象肠道能量代谢能力的肠道功能指数处于中等水平。若(3)(例如:0.75)≤co<d(例如:1),则认为目标对象肠道能量代谢能力的肠道功能指数处于较高水平。
此外,性能分析模块在基于第二计算模块和第二位置确定模块分别确定目标对象的肠道功能指数和该肠道功能指数在参考人群中的位置后,还可以进一步包括肠道功能得分模块,肠道功能得分模块用于确定目标对象的肠道微生物的肠道功能得分,肠道功能得分模块可以通过执行如下方法计算得到肠道功能得分:
在目标对象的肠道微生物菌群的肠道功能指数处于较低水平的情况下,肠道功能得分=第七参数(例如:80)*肠道功能指数+第八参数(例如:40);
在目标对象的肠道微生物菌群的肠道功能指数处于适中水平的情况下,肠道功能得分=第九参数(例如:40)*肠道功能指数+第十参数(例如:50);
在目标对象的肠道微生物菌群的肠道功能指数处于较高水平的情况下,肠道功能得分=第十一参数(例如:80)*肠道功能指数+第十二参数(例如:20)。
需要说明的是:上述预设的测试标准中的第七参数、第八参数、第九参数、第十参数、第十一参数和第十二参数等参数数据,可以基于应用场景适应性替换,本申请不做具体限定。
还需要说明的是,前述表2示例性地列出了9种功能,在具体的应用中可根据需要选择其中的一种或多种,也可选择其他感兴趣的功能及其相关基因。
可选地,在本申请实施例提供的肠道微生物测序数据的处理装置中,第一计算模块包括:第一加和单元,用于在抗生素抗性指数为抗生素抗性基因的相对丰度的情况下,第一加和单元用于计算目标对象的肠道微生物的同一种抗生素抗性基因的相对丰度之和;相除单元,用于将同一种抗生素抗性基因的相对丰度之和除以所有抗生素抗性基因的相对丰度之和,得到抗生素抗性基因的相对丰度;第二计算模块包括:第二加和单元,用于将属于同一种肠道功能的功能基因的相对丰度的加和,得到肠道功能指数。
可选地,在本申请实施例提供的肠道微生物测序数据的处理装置中,性能分析模块还包括:第一导入模块,用于在性能分析涉及抗生素抗性基因分析,且第一计算模块计算得到目标对象的肠道微生物的抗生素抗性指数的情况下,将目标对象的肠道微生物的抗生素抗性指数导入参考人群的数据库以用于下一次性能分析步骤中;第二导入模块,用于在性能分析涉及肠道功能基因分析,且第二计算模块计算得到目标对象的肠道微生物的肠道功能指数的情况下,将目标对象的肠道微生物的肠道功能指数导入参考人群的数据库以用于下一次性能分析步骤中。
上述性能分析模块在还包括第一导入模块及第二导入模块的情况下,该处理装置能够在对每个目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息之后,还能够将其评估结果(目标对象的肠道微生物的功能信息,该功能信息包括肠道微生物的功能基因及各功能基因的相对丰度)添加至该处理装置已存储的参考人群的数据库中,以便对每项指标的参考范围进行实时更新。
随着使用本申请肠道微生物测序数据的处理装置,进行肠道微生物菌群评估的参与个体越来越多,数据库中存储的参考人群的规模将不断的扩大,进而使得该处理装置对肠道微生物菌群评估的结果也会越来越准确,该处理装置对肠道微生物菌群评估的参考价值也越来越大。
最后,当数据库中存储的参考人群数达到一定的丰富程度的时候,本申请的处理装置还会根据待测个体的表型特征(包括性别,年龄,人种,身高、体重、饮食、居住区域等)选取相应的参考人群进行具体肠道微生物菌群评估分析,进而使得评估结果更加精准、可靠。
还需要说明的是:该处理装置的数据库中最初存储有目标数量个初始参考对象,其数据库具体记录有每个初始参考对象的表型信息(包括性别、年龄、人种、身高、体重、饮食、居住区域等)和肠道微生物菌群的评估信息(包括抗生素抗性基因分析及肠道功能基因分析等,还可以进一步包括各肠道微生物的物种相对丰度信息等)。
此外,还需要针对本申请肠道微生物测序数据的处理装置的第一获取模块31进行说明:
在一个可选的示例中,第一获取模块31获取目标对象的肠道微生物菌群的测序数据可以通过执行如下步骤实现:
步骤A1,对目标对象的肠道微生物进行基因测序,获取目标对象的肠道微生物菌群的原始测序数据(raw reads,通常为fasq格式,fastq文件中含有测序序列中所有碱基的质量信息);
步骤A2,对该原始测序数据进行质量监控,即,将原始测序数据中模糊碱基N的数量大于预设数值(该预设数值可以是3个、4个、5个或更多个,具体可以根据实际应用情况而进行合理调整)的reads剔除,以及将原始测序数据中的低质量reads剔除(比如,可以根据reads中的质量信息将reads末尾质量值小于特定值的连续碱基剔除,此处的特定值可以是20、25、30或其他更高的数值,具体可根据实际需求合理调整;进一步地,在剔除上述连续碱基后的reads长度小于特定长度的reads剔除,此处的特定长度可以是30bp、35bp或者更长,具体可基于应用场景适应性调整。去除低质量reads可以选用现有具有上述功能的软件,比如可以是fastx软件);
步骤A3,将原始基因数据中的寄主基因序列剔除,得到目标对象的肠道微生物菌群的测序数据,其中,寄主基因序列为目标对象的基因序列。该步骤所采用的软件可以使用soap软件。
此外,还需要针对本申请处理装置中的注释模块33进行说明:
在一个可选的示例中,注释模块33可以通过执行如下步骤实现:
步骤B1,将测序数据中的reads(即基因序列)对比到标准基因数据库(例如:人肠道微生物宏基因组的整合基因集IGC),确定测序数据中包含的每种基因序列的相对丰度(例如:确定测序数据对应的基因丰度文件,其中,该文件包含两列数据,右侧一列数据为基因ID,左侧一列数据为右侧基因ID依次对应的基因相对丰度);
步骤B2,基于标准基因数据库中记载的每种基因序列的注释信息(注释信息包含:每种抗生素对应的抗性基因信息,可形成抗生素抗性基因注释文件),和测序数据中包含的每种基因序列的相对丰度,确定测序数据中包含的每种抗生素抗性基因序列的相对丰度,(例如:确定测序数据中对应的抗生素抗性基因丰度文件,其中,该文件包含两列数据,左侧一列数据为各种抗生素抗性基因信息,右侧一列数据为左侧抗性基因依次对应的相对丰度,具体计算方法比如可以是:按照步骤B1的基因丰度文件和B2中产生的抗生素抗性基因注释文件,将属于同一个抗生素抗性基因的基因相对丰度进行加和,然后除以样本中所有抗生素抗性基因的相对丰度之和,得到的结果即为这个抗生素抗性基因的相对丰度);
步骤B3,基于标准基因数据库中记载的每种基因序列的注释信息(注释信息包含:每种生物学功能对应的基因信息,其中,每种生物学功能对应的基因的数量为1个或多个,根据具体生物学功能的不同,基因的数量也存在差异),和测序数据中包含的每种基因序列的相对丰度,确定测序数据中包含的每种生物学功能基因的相对丰度,(例如:确定测序数据对应的生物学功能基因丰度文件,其中,该文件包含两列数据,左侧一列数据为各种生物学功能所对应的基因信息,右侧一列数据为左侧各种生物学功能所对应的基因依次对应的相对丰度,具体计算方法比如,可以是将属于同一种功能的基因的相对丰度进行加和,然后将每一种功能相关的基因的相对丰度除以样本所有功能所对应的相关的基因的相对丰度之和,即为每一种功能基因的相对丰度)。
本申请的肠道微生物测序数据的处理装置包括处理器和存储器,上述第一获取模块31、注释模块33以及第二获取模块35等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来对肠道微生物菌群和对菌群的状态进行有效全面的分析。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现肠道微生物测序数据的处理方法。
本申请实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行肠道微生物测序数据的处理方法。
本申请实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取目标对象的肠道微生物菌群的测序数据;根据标准基因数据库对测序数据进行注释,得到注释结果;根据注释结果,对目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息。
可选的,目标对象的肠道微生物的功能信息包括肠道微生物的功能基因及各功能基因的相对丰度,其中,功能基因的相对丰度为测序数据中属于同一功能的基因的相对丰度的加和与测序数据中所有功能的基因的相对丰度的加和的比值,属于同一功能的基因的相对丰度根据注释结果获得。
可选的,在获得目标对象的肠道微生物的功能信息之后,方法还包括:基于功能信息对目标对象的肠道微生物的进行性能分析,性能分析涉及如下至少之一:抗生素抗性基因分析及肠道功能基因分析。
可选的,在性能分析涉及抗生素抗性基因分析的情况下,基于功能信息对目标对象的肠道微生物的进行性能分析包括:计算目标对象的肠道微生物的抗生素抗性指数,确定抗生素抗性指数在参考人群中的位置;在性能分析涉及肠道功能基因分析的情况下,基于功能信息对目标对象的肠道微生物的进行性能分析包括:计算目标对象的肠道微生物的肠道功能指数,确定肠道功能指数在参考人群中的位置。
可选的,抗生素抗性指数为抗生素抗性基因的相对丰度,抗生素抗性基因的相对丰度按照如下方法计算:计算目标对象的肠道微生物的同一种抗生素抗性基因的相对丰度之和;将同一种抗生素抗性基因的相对丰度之和除以所有抗生素抗性基因的相对丰度之和,得到抗生素抗性基因的相对丰度;肠道功能指数通过以下方法计算:属于同一种肠道功能的功能基因的相对丰度的加和即为肠道功能指数。
可选的,在性能分析涉及抗生素抗性基因分析,且基于功能信息对目标对象的肠道微生物的进行性能分析,计算得到目标对象的肠道微生物的抗生素抗性指数的情况下,还包括将目标对象的肠道微生物的抗生素抗性指数导入参考人群的数据库以用于下一次性能分析步骤中;在性能分析涉及肠道功能基因分析,且基于功能信息对目标对象的肠道微生物的进行性能分析,计算得到目标对象的肠道微生物的肠道功能指数的情况下,还包括将目标对象的肠道微生物的肠道功能指数导入参考人群的数据库以用于下一次性能分析步骤中。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取目标对象的肠道微生物菌群的测序数据;根据标准基因数据库对测序数据进行注释,得到注释结果;根据注释结果,对目标对象的肠道微生物菌群进行评估,获得目标对象的肠道微生物的功能信息。
可选的,目标对象的肠道微生物的功能信息包括肠道微生物的功能基因及各功能基因的相对丰度,其中,功能基因的相对丰度为测序数据中属于同一功能的基因的相对丰度的加和与测序数据中所有功能的基因的相对丰度的加和的比值,属于同一功能的基因的相对丰度根据注释结果获得。
可选的,在获得目标对象的肠道微生物的功能信息之后,方法还包括:基于功能信息对目标对象的肠道微生物的进行性能分析,性能分析涉及如下至少之一:抗生素抗性基因分析及肠道功能基因分析。
可选的,在性能分析涉及抗生素抗性基因分析的情况下,基于功能信息对目标对象的肠道微生物的进行性能分析包括:计算目标对象的肠道微生物的抗生素抗性指数,确定抗生素抗性指数在参考人群中的位置;在性能分析涉及肠道功能基因分析的情况下,基于功能信息对目标对象的肠道微生物的进行性能分析包括:计算目标对象的肠道微生物的肠道功能指数,确定肠道功能指数在参考人群中的位置。
可选的,抗生素抗性指数为抗生素抗性基因的相对丰度,抗生素抗性基因的相对丰度按照如下方法计算:计算目标对象的肠道微生物的同一种抗生素抗性基因的相对丰度之和;将同一种抗生素抗性基因的相对丰度之和除以所有抗生素抗性基因的相对丰度之和,得到抗生素抗性基因的相对丰度;肠道功能指数通过以下方法计算:属于同一种肠道功能的功能基因的相对丰度的加和即为肠道功能指数。
可选的,在性能分析涉及抗生素抗性基因分析,且基于功能信息对目标对象的肠道微生物的进行性能分析,计算得到目标对象的肠道微生物的抗生素抗性指数的情况下,还包括将目标对象的肠道微生物的抗生素抗性指数导入参考人群的数据库以用于下一次性能分析步骤中;在性能分析涉及肠道功能基因分析,且基于功能信息对目标对象的肠道微生物进行性能分析,计算得到目标对象的肠道微生物的肠道功能指数的情况下,还包括将目标对象的肠道微生物的肠道功能指数导入参考人群的数据库以用于下一次性能分析步骤中。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (14)
1.一种肠道微生物测序数据的处理方法,其特征在于,所述方法包括:
获取目标对象的肠道微生物菌群的测序数据;
根据标准基因数据库对所述测序数据进行注释,得到注释结果;
根据所述注释结果,对所述目标对象的肠道微生物菌群进行评估,获得所述目标对象的肠道微生物的功能信息。
2.根据权利要求1所述的方法,其特征在于,所述目标对象的肠道微生物的功能信息包括肠道微生物的功能基因及各所述功能基因的相对丰度,其中,所述功能基因的相对丰度为所述测序数据中属于同一功能相关的基因的相对丰度的加和与所述测序数据中各功能相关的基因的相对丰度的加和的比值,所述属于同一功能相关的基因的相对丰度根据所述注释结果获得。
3.根据权利要求1或2所述的方法,其特征在于,在获得所述目标对象的肠道微生物的功能信息之后,所述方法还包括:
基于所述功能信息对所述目标对象的肠道微生物进行性能分析,所述性能分析涉及如下至少之一:抗生素抗性基因分析及肠道功能基因分析。
4.根据权利要求3所述的方法,其特征在于,
在所述性能分析涉及抗生素抗性基因分析的情况下,基于所述功能信息对所述目标对象的肠道微生物的进行性能分析包括:计算所述目标对象的肠道微生物的抗生素抗性指数,确定所述抗生素抗性指数在参考人群中的位置;
在所述性能分析涉及肠道功能基因分析的情况下,基于所述功能信息对所述目标对象的肠道微生物的进行性能分析包括:计算所述目标对象的肠道微生物的肠道功能指数,确定所述肠道功能指数在参考人群中的位置。
5.根据权利要求4所述的方法,其特征在于,
所述抗生素抗性指数为抗生素抗性基因的相对丰度,所述抗生素抗性基因的相对丰度按照如下方法计算:计算所述目标对象的肠道微生物的同一种抗生素抗性相关的基因的相对丰度之和;将所述同一种抗生素抗性相关的基因的相对丰度之和除以所有抗生素抗性相关的基因的相对丰度之和,得到所述抗生素抗性基因的相对丰度;
所述肠道功能指数通过以下方法计算:属于同一功能相关的功能基因的相对丰度的加和,即为所述肠道功能指数。
6.根据权利要求4所述的方法,其特征在于,
在所述性能分析涉及抗生素抗性基因分析,且基于所述功能信息对所述目标对象的肠道微生物的进行性能分析,计算得到所述目标对象的肠道微生物的抗生素抗性指数的情况下,还包括将所述目标对象的肠道微生物的抗生素抗性指数导入参考人群的数据库以用于下一次性能分析步骤中;
在所述性能分析涉及肠道功能基因分析,且基于所述功能信息对所述目标对象的肠道微生物的进行性能分析,计算得到所述目标对象的肠道微生物的肠道功能指数的情况下,还包括将所述目标对象的肠道微生物的肠道功能指数导入参考人群的数据库以用于下一次性能分析步骤中。
7.一种肠道微生物测序数据的处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标对象的肠道微生物菌群的测序数据;
注释模块,用于根据标准基因数据库对所述测序数据进行注释,得到注释结果;
第二获取模块,根据所述注释结果,对所述目标对象的肠道微生物菌群进行评估,获得所述目标对象的肠道微生物的功能信息。
8.根据权利要求7所述的装置,其特征在于,所述目标对象的肠道微生物的功能信息包括肠道微生物的功能基因及各所述功能基因的相对丰度,其中,所述功能基因的相对丰度为所述测序数据中属于同一功能相关的基因的相对丰度的加和与所述测序数据中所有功能相关的基因的相对丰度的加和的比值,所述属于同一功能相关的基因的相对丰度根据所述注释结果获得。
9.根据权利要求7或8所述的装置,其特征在于,所述装置还包括:性能分析模块,用于基于所述功能信息对所述目标对象的肠道微生物的进行性能分析,所述性能分析涉及如下至少之一:抗生素抗性基因分析及肠道功能基因分析。
10.根据权利要求9所述的装置,其特征在于,
在所述性能分析涉及抗生素抗性基因分析的情况下,所述性能分析模块包括:第一计算模块,用于计算所述目标对象的肠道微生物的抗生素抗性指数,第一位置确定模块,用于确定所述抗生素抗性指数在参考人群中的位置;
在所述性能分析涉及肠道功能基因分析的情况下,所述性能分析模块包括:第二计算模块,用于计算所述目标对象的肠道微生物的肠道功能指数,第二位置确定模块,用于确定所述肠道功能指数在参考人群中的位置。
11.根据权利要求10所述的装置,其特征在于,
所述第一计算模块包括:第一加和单元,用于在所述抗生素抗性指数为抗生素抗性基因的相对丰度的情况下,所述第一加和单元用于计算所述目标对象的肠道微生物的同一种抗生素抗性相关的基因的相对丰度之和;相除单元,用于将所述同一种抗生素抗性相关的基因的相对丰度之和除以所有抗生素抗性相关的基因的相对丰度之和,得到所述抗生素抗性基因的相对丰度;
所述第二计算模块包括:第二加和单元,用于将属于同一功能相关的功能基因的相对丰度的加和,得到所述肠道功能指数。
12.根据权利要求10所述的装置,其特征在于,所述性能分析模块还包括:
第一导入模块,用于在所述性能分析涉及抗生素抗性基因分析,且所述第一计算模块计算得到所述目标对象的肠道微生物的抗生素抗性指数的情况下,将所述目标对象的肠道微生物的抗生素抗性指数导入参考人群的数据库以用于下一次性能分析步骤中;
第二导入模块,用于在所述性能分析涉及肠道功能基因分析,且所述第二计算模块计算得到所述目标对象的肠道微生物的肠道功能指数的情况下,将所述目标对象的肠道微生物的肠道功能指数导入参考人群的数据库以用于下一次性能分析步骤中。
13.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至6中任意一项所述的肠道微生物测序数据的处理方法。
14.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的肠道微生物测序数据的处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910038192.8A CN111161795A (zh) | 2019-01-15 | 2019-01-15 | 肠道微生物测序数据处理方法、装置、存储介质及处理器 |
PCT/CN2019/129426 WO2020147557A1 (zh) | 2019-01-15 | 2019-12-27 | 肠道微生物测序数据处理方法、装置、存储介质及处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910038192.8A CN111161795A (zh) | 2019-01-15 | 2019-01-15 | 肠道微生物测序数据处理方法、装置、存储介质及处理器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111161795A true CN111161795A (zh) | 2020-05-15 |
Family
ID=70555610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910038192.8A Pending CN111161795A (zh) | 2019-01-15 | 2019-01-15 | 肠道微生物测序数据处理方法、装置、存储介质及处理器 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111161795A (zh) |
WO (1) | WO2020147557A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111870617A (zh) * | 2019-11-04 | 2020-11-03 | 深圳碳云智能数字生命健康管理有限公司 | 肠道益生菌补剂配方的确定方法、装置、存储介质及处理器 |
CN112037847A (zh) * | 2020-09-15 | 2020-12-04 | 中国科学院微生物研究所 | 微生物菌株基因组分析方法、装置及电子设备 |
CN113611357A (zh) * | 2020-11-17 | 2021-11-05 | 上海美吉生物医药科技有限公司 | 基于宏基因组的抗性基因分析方法、装置、介质及终端 |
CN118800336A (zh) * | 2024-06-13 | 2024-10-18 | 广东弘元普康医疗科技有限公司 | 年龄评估方法、装置、电子设备及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046094A (zh) * | 2015-08-26 | 2015-11-11 | 深圳谱元科技有限公司 | 肠道菌群的检测系统及其方法和动态式数据库 |
CN107254518A (zh) * | 2017-05-24 | 2017-10-17 | 中山大学 | 肠道细菌抗生素抗性基因的定量检测方法 |
CN108064263A (zh) * | 2014-09-30 | 2018-05-22 | 深圳华大基因研究院 | 用于类风湿性关节炎的生物标记物及其用途 |
CN108138219A (zh) * | 2014-09-25 | 2018-06-08 | 阿雷斯遗传学有限公司 | 用于预测克雷伯菌属物种对抗微生物剂抗性的遗传测试 |
CN108804875A (zh) * | 2018-06-21 | 2018-11-13 | 中国科学院北京基因组研究所 | 一种利用宏基因组数据分析微生物群体功能的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040142325A1 (en) * | 2001-09-14 | 2004-07-22 | Liat Mintz | Methods and systems for annotating biomolecular sequences |
CN102517392A (zh) * | 2011-12-26 | 2012-06-27 | 深圳华大基因研究院 | 基于宏基因组16s高可变区v3的分类方法和装置 |
CN107937582A (zh) * | 2017-12-29 | 2018-04-20 | 苏州普瑞森基因科技有限公司 | 一种用于分析肠道微生物的引物组及其应用 |
-
2019
- 2019-01-15 CN CN201910038192.8A patent/CN111161795A/zh active Pending
- 2019-12-27 WO PCT/CN2019/129426 patent/WO2020147557A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108138219A (zh) * | 2014-09-25 | 2018-06-08 | 阿雷斯遗传学有限公司 | 用于预测克雷伯菌属物种对抗微生物剂抗性的遗传测试 |
CN108064263A (zh) * | 2014-09-30 | 2018-05-22 | 深圳华大基因研究院 | 用于类风湿性关节炎的生物标记物及其用途 |
CN105046094A (zh) * | 2015-08-26 | 2015-11-11 | 深圳谱元科技有限公司 | 肠道菌群的检测系统及其方法和动态式数据库 |
CN107254518A (zh) * | 2017-05-24 | 2017-10-17 | 中山大学 | 肠道细菌抗生素抗性基因的定量检测方法 |
CN108804875A (zh) * | 2018-06-21 | 2018-11-13 | 中国科学院北京基因组研究所 | 一种利用宏基因组数据分析微生物群体功能的方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111870617A (zh) * | 2019-11-04 | 2020-11-03 | 深圳碳云智能数字生命健康管理有限公司 | 肠道益生菌补剂配方的确定方法、装置、存储介质及处理器 |
CN111870617B (zh) * | 2019-11-04 | 2022-06-10 | 深圳碳云智能数字生命健康管理有限公司 | 肠道益生菌补剂配方的确定方法、装置、存储介质及处理器 |
CN112037847A (zh) * | 2020-09-15 | 2020-12-04 | 中国科学院微生物研究所 | 微生物菌株基因组分析方法、装置及电子设备 |
CN113611357A (zh) * | 2020-11-17 | 2021-11-05 | 上海美吉生物医药科技有限公司 | 基于宏基因组的抗性基因分析方法、装置、介质及终端 |
CN118800336A (zh) * | 2024-06-13 | 2024-10-18 | 广东弘元普康医疗科技有限公司 | 年龄评估方法、装置、电子设备及计算机可读存储介质 |
CN118800336B (zh) * | 2024-06-13 | 2025-01-17 | 广东弘元普康医疗科技有限公司 | 年龄评估方法、装置、电子设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2020147557A1 (zh) | 2020-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804875B (zh) | 一种利用宏基因组数据分析微生物群体功能的方法 | |
Li | Microbiome, metagenomics, and high-dimensional compositional data analysis | |
Kraal et al. | The prevalence of species and strains in the human microbiome: a resource for experimental efforts | |
CN111161795A (zh) | 肠道微生物测序数据处理方法、装置、存储介质及处理器 | |
CN111161794B (zh) | 肠道微生物测序数据处理方法、装置、存储介质及处理器 | |
US20150242565A1 (en) | Method and device for analyzing microbial community composition | |
Acuña-Amador et al. | Genomic repeats, misassembly and reannotation: a case study with long-read resequencing of Porphyromonas gingivalis reference strains | |
Ricke et al. | Unraveling food production microbiomes: concepts and future directions | |
Zheng et al. | Identifying individual-specific microbial DNA fingerprints from skin microbiomes | |
Ioerger | Analysis of gene essentiality from TnSeq data using transit | |
Vezina et al. | Bactabolize is a tool for high-throughput generation of bacterial strain-specific metabolic models | |
Chouhan et al. | Metagenomic analysis of soybean endosphere microbiome to reveal signatures of microbes for health and disease | |
Hu et al. | Multiscale footprints reveal the organization of cis-regulatory elements | |
Heintz-Buschart et al. | A beginner’s guide to integrating multi-omics data from microbial communities | |
CN109997193A (zh) | 一种对特定群中的亚群进行定量分析的方法 | |
CN113793647A (zh) | 一种基于二代测序宏基因组数据分析装置及方法 | |
CN106326689A (zh) | 确定群体中受到选择作用的位点的方法和装置 | |
Park et al. | Metagenomic association analysis of gut symbiont Limosilactobacillus reuteri without host-specific genome isolation | |
Liu et al. | Statistical models for biological sequence motif discovery | |
Harrison et al. | Analytical approaches for microbiome research | |
Park et al. | Metagenomic association analysis of gut symbiont lactobacillus reuteri without host-specific genome isolation | |
Biswa et al. | Tameness selection pressure affects gut virome diversity in mice | |
Maistrenko | Pangenome analysis of bacteria and its application in metagenomics | |
Lee | Big Data for Microorganisms: Computational Approaches Leveraging Large-Scale Microbial Transcriptomic Compendia | |
Song | Bioinformatics and Machine Learning in Human Microbiome Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200515 |
|
RJ01 | Rejection of invention patent application after publication |