JP7373843B2 - 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 - Google Patents
感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 Download PDFInfo
- Publication number
- JP7373843B2 JP7373843B2 JP2019229363A JP2019229363A JP7373843B2 JP 7373843 B2 JP7373843 B2 JP 7373843B2 JP 2019229363 A JP2019229363 A JP 2019229363A JP 2019229363 A JP2019229363 A JP 2019229363A JP 7373843 B2 JP7373843 B2 JP 7373843B2
- Authority
- JP
- Japan
- Prior art keywords
- organism
- sequence information
- infection
- indicating
- biological species
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000015181 infectious disease Diseases 0.000 title claims description 121
- 238000000034 method Methods 0.000 title claims description 65
- 238000004458 analytical method Methods 0.000 claims description 46
- 238000012360 testing method Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 38
- 108091033319 polynucleotide Proteins 0.000 claims description 32
- 102000040430 polynucleotide Human genes 0.000 claims description 32
- 239000002157 polynucleotide Substances 0.000 claims description 32
- 238000013507 mapping Methods 0.000 claims description 24
- 238000007477 logistic regression Methods 0.000 claims description 23
- 108090000623 proteins and genes Proteins 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 7
- 239000003242 anti bacterial agent Substances 0.000 claims description 6
- 229940088710 antibiotic agent Drugs 0.000 claims description 5
- 238000010586 diagram Methods 0.000 claims description 4
- 241000894007 species Species 0.000 description 178
- 239000000523 sample Substances 0.000 description 36
- 239000002609 medium Substances 0.000 description 16
- 238000007781 pre-processing Methods 0.000 description 12
- 241000894006 Bacteria Species 0.000 description 10
- 210000004369 blood Anatomy 0.000 description 9
- 239000008280 blood Substances 0.000 description 9
- 102000039446 nucleic acids Human genes 0.000 description 7
- 108020004707 nucleic acids Proteins 0.000 description 7
- 150000007523 nucleic acids Chemical class 0.000 description 7
- 238000012163 sequencing technique Methods 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 6
- 238000002869 basic local alignment search tool Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000003115 biocidal effect Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 231100000676 disease causative agent Toxicity 0.000 description 5
- 210000002381 plasma Anatomy 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 206010037660 Pyrexia Diseases 0.000 description 4
- 241000589262 Tatlockia micdadei Species 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 244000005700 microbiome Species 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 238000002054 transplantation Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 208000010370 Adenoviridae Infections Diseases 0.000 description 3
- 206010060931 Adenovirus infection Diseases 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 206010040047 Sepsis Diseases 0.000 description 3
- 208000011589 adenoviridae infectious disease Diseases 0.000 description 3
- 230000000845 anti-microbial effect Effects 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 238000009640 blood culture Methods 0.000 description 3
- QDUIJCOKQCCXQY-WHJQOFBOSA-N cefozopran Chemical compound N([C@@H]1C(N2C(=C(CN3C4=CC=CN=[N+]4C=C3)CS[C@@H]21)C([O-])=O)=O)C(=O)\C(=N/OC)C1=NSC(N)=N1 QDUIJCOKQCCXQY-WHJQOFBOSA-N 0.000 description 3
- 229960002642 cefozopran Drugs 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 244000052769 pathogen Species 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 229930186147 Cephalosporin Natural products 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 206010029260 Neuroblastoma Diseases 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 241000736110 Sphingomonas paucimobilis Species 0.000 description 2
- 241000122973 Stenotrophomonas maltophilia Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 208000037815 bloodstream infection Diseases 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 229940124587 cephalosporin Drugs 0.000 description 2
- 150000001780 cephalosporins Chemical class 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 210000000416 exudates and transudate Anatomy 0.000 description 2
- 210000004700 fetal blood Anatomy 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 150000002500 ions Chemical group 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 240000001817 Cereus hexagonus Species 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000191823 Cynomys Species 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588921 Enterobacteriaceae Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 208000002633 Febrile Neutropenia Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 206010016952 Food poisoning Diseases 0.000 description 1
- 208000019331 Foodborne disease Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000428198 Lutrinae Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- 208000031662 Noncommunicable disease Diseases 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 241000555745 Sciuridae Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241001501942 Suricata suricatta Species 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 241000607447 Yersinia enterocolitica Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241000607477 Yersinia pseudotuberculosis Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 239000002647 aminoglycoside antibiotic agent Substances 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 229960000484 ceftazidime Drugs 0.000 description 1
- NMVPEQXCMGEDNH-TZVUEUGBSA-N ceftazidime pentahydrate Chemical compound O.O.O.O.O.S([C@@H]1[C@@H](C(N1C=1C([O-])=O)=O)NC(=O)\C(=N/OC(C)(C)C(O)=O)C=2N=C(N)SC=2)CC=1C[N+]1=CC=CC=C1 NMVPEQXCMGEDNH-TZVUEUGBSA-N 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 210000002726 cyst fluid Anatomy 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000011304 droplet digital PCR Methods 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 208000006750 hematuria Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003908 liver function Effects 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000000010 microbial pathogen Species 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000012488 sample solution Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 229940098232 yersinia enterocolitica Drugs 0.000 description 1
Images
Landscapes
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応するリード数とホスト以外に検出された異種生物の種の多様性指数とを算出するステップと、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成するステップと、前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルと決定するステップと、予測結果を出力するステップと、をコンピュータに実行させる、前記ホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測プログラムに関する。
1-1.概要
第1の実施形態は、ホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測方法に関する。
本明細書において、ホストは、検査対象となる生物である。生物には、動物、及び植物を含み得る。また生物には個体、組織、細胞等を含み得る。動物には、哺乳類、は虫類、両生類、魚類、鳥類等を含み得る。哺乳類には、ヒト、マウス、ラット、ウサギ、イヌ、ネコ、フェレット、ハムスター、モルモット、リス、ブタ、ウシ、ウマ、ヒツジ、カワウソ、プレリードック、ミーアキャット等を含み得る。ホストとして好ましくは哺乳類である。
ポリヌクレオチドの配列情報は、ヌクレオチドの配列を意図する。本明細書においてシークエンシングによって得られた1つの配列情報を有するデータの単位を「リード」と呼ぶことがある。配列情報の解析方法は、配列情報を決定できる限り制限されない。本実施形態においては、メタゲノム解析を行うため、配列情報を解析するシークエンサーは、次世代シークエンサー等の数千万から数億のDNA断片の塩基配列を同時並行で解析できるシークエンサーであることが好ましい。次世代シークエンサーとしては、例えば、イルミナ社(サンディエゴ、CA)のMiSeq9(商標)、HiSeq(商標)、NextSeq(商標)、MiSeq(商標);サーモ・フィッシャー社(ウォルサム、MA)のIon Proton(商標)、Ion PGM(商標);ロシュ社(バーゼル、スイス)のGS FLX +(商標)、GS Junior(商標)等が挙げられる。
i.取得した配列情報の前処理
シークエンサーから取得した配列情報の群には、アダプター配列、ポリA配列、ポリT配列、重複配列、低品質リード等の解析に適さない不適切リードが含まれていることがある。異種生物由来配列情報への生物種を示すラベルを付与する前に、前記工程1で取得した配列情報の中からこのような不適切リードを除く前処理を行うことが好ましい。
通常取得した配列情報の群は、大多数がホストに存在するポリヌクレオチドをコードする配列情報(ホスト由来配列情報)である。このため、原因生物に存在するポリヌクレオチドの配列情報を検出するためには、上記i.において前処理が終わった配列情報の群から、ホスト由来配列情報を除去し、ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報を取得する必要がある。ホスト由来配列情報の除去は、例えば、系統推定及び/又はマッピングにより行うことができる。系統推定は、系統推定ソフトウエアKraken2を使用して行うことができる。系統推定を行うためのTaxonomyデータベースは、National Center for Biotechnology Information(NCBI)から提供されるTaxonomy Browser等の外部データベース500を使用することができる。マッピングは、例えば、マッピングソフトウエアBowtie2等を使用して行うことができる。マッピングを行うためのデータベースは、NCBI RefSeq(ウェブページ、www.ncbi.nlm.nih.gov/refseq/)、NCBI GenBank(ウェブページ、www.ncbi.nlm.nih.gov/genbank/)、UCSC Genome Browser等の外部データベース500を使用することができる。ホストがヒトである場合の代表的な参照配列は、GRCh37 reference primary assembly(NCBI提供)、JRGv2(東北大学提供)等である。
次に、上記ii.において、ホスト由来配列情報を除去した配列情報の群に含まれる各異種生物由来配列情報について、各配列情報が由来する生物種を推定し、その生物種を示すラベルを各異種生物由来配列情報に付与する。
次に上記iii.において、未知の生物種を示すラベルが付された異種生物由来配列情報について、その配列情報について相同性検索を行い生物種を推定することができる。例えばNCBIから提供されるBasic Local Alignment Search Tool(BLAST)を使用し、異種生物由来配列情報と相同性の高い既知ヌクレオチド配列を有する生物種を推定することができる。
上記工程2のiii及びivにおいて、生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、各生物種を示すラベルに対応する配列情報のリード数を算出する。リード数は、同じ生物種を示すラベルが付されたリードの数を計数することにより求めることができる。好ましくは、リード数は他の検査サンプルとの比較のため標準化する。具体的には、上記(2)で述べた前処理終了後の配列情報のリード数を1,000,000リードとした場合に、その中に含まれる同生物種のリード数(RPM:reads per million reads)を算出し、標準化されたリード数として用いることができる。各生物種を示すラベルに対応する、ホスト以外の生物種に由来するリード数を標準化した値をpRPMと呼ぶ。
次にロジスティック回帰式と、予測確率を用いて、感染の原因生物である可能性を示すデータを生成する。本実施形態では、はじめに、各生物種を示すラベルについて算出した、上記pRPMと、H’を目的変数として使用する下記式3で表される二項ロジスティック回帰式により値Zを算出する。
2) Genus rank:Zg=ag*log10(${pRPM})+bg*${Hg}+cg
3) Species rank:Zs= as*log10(${pRPM})+bs*${Hs}+cs
Taxonomic rankに対応する二項ロジスティック回帰式の具体例は下記のとおりである。
2) Genus rank:Zg =165.848*log10(${pRPM}) -33.201*${Hg} -367.08
3) Species rank:Zs=-0.368*log10(${pRPM}) -20.075*${Hs} +51.439
さらに、下式6により、感染の原因生物である可能性を示すデータYが導かれる。
感染の原因生物を示すラベルは、予測結果として、後述する出力デバイス112に、通信I/F105を介して他のコンピュータに、あるいはメディアI/F108を介してメディアドライブに出力され得る。予測結果は、解析レポートとして出力されてもよい。予測結果は、感染の原因生物を示すラベルに対応するリード数と共に出力されてもよい。
coverage percentage(%)=(参照配列にマップされた塩基数/参照配列の総塩基数)×100
average depth of mapped regions=
参照配列にマップされた配列の総塩基数/参照配列のうちマップされた領域の塩基数
a.図1では、生物種を示すラベルとして、生物種の科名、属名、種名を示すラベルを用いている。しかし、生物種を示すラベルは、NCBIに登録されている、Taxonomy ID、Reference sequence ID等であってもよい。
2) Genus rank:0=165.848*log10(${pRPM}) -33.201*${Hg} -367.08
3) Species rank:0=-0.368*log10(${pRPM}) -20.075*${Hs} +51.439
上記プロット領域に上記(4)工程3で求めた各値(Hf,log10(${pRPM})、(Hg,log10(${pRPM})、(Hs,log10(${pRPM})を座標としてプロットしている。
本実施形態は、上記1-1.の概要で述べた予測方法を実現するための予測装置1に関する。以下図4及び図5を用いて予測装置10のハードウエア構成及び機能構成について説明する。
図4に、予測装置10のハードウエア構成を示す。予測装置10は、汎用コンピュータであり得る。予測装置10は、入力デバイス111と、出力デバイス112と、メディアドライブ113と通信可能に接続されている。また予測装置10は、ネットワークを介して外部データベース(外部DB)500、外部コンピュータ(PC)600と通信可能である。予測装置10は、CPU101と、メモリ102と、ROM(read only memory)103と、記憶デバイス104と、通信インタフェース(I/F)105と、入力インタフェース(I/F)106と、出力インタフェース(I/F)107と、メディアインターフェース(I/F)108とを備える。予測装置10内の各構成はバス109によって互いにデータ通信可能に接続されている。
図5に、予測装置10の機能構成を示す。
図6から図9を用いて、予測プログラム1042がCPU101に実行させる処理を説明する。
予測プログラム1042は、記録媒体に記憶されていてもよい。すなわち、前記コンピュータプログラムは、ハードディスク、フラッシュメモリ等の半導体メモリ素子、光ディスク等の記録媒体に記憶される。また前記コンピュータプログラムは、クラウドサーバ等のネットワークで接続可能な記録媒体に記憶されていてもよい。コンピュータプログラムは、ダウンロード形式の、又は記録媒体に記録されたプログラム製品であってもよい。
第1の実施形態では、予測結果を最後に出力した。第2の実施形態では、はじめに系統推定のみで異種生物由来配列情報の群に含まれる各リードについて、各リードが由来する生物種を推定し、感染の原因生物を示すラベルを決定し、このラベルに基づく感染の原因生物の予測結果を第1の予測結果として出力する。次に、系統推定により生物種が特定されず、未知の生物種を示すラベルが付与された異種生物由来配列情報のリードについて相同性検索を行い対応する生物種を推定し、推定された生物種を示すラベルを検索対象となった異種生物由来配列情報に付与する。そして、先に系統推定により生物種を示すラベルが付与された異種生物由来配列情報の群と、相同性検索により生物種を示すラベルが付与された異種生物由来配列情報の群を用いて、感染の原因生物のラベルを決定し、その予測結果を第2の予測結果として出力する。
予測装置20のハードウエア構成及び機能構成は、基本的には予測装置10と同様である。ただし、図4に示す記憶デバイス104には、予測プログラム1042に替えて予測プログラム1043が格納される。
図10及び図11を用いて、予測プログラム1043がCPU101に実行させる処理を説明する。ここで、予測プログラム1042と同様に、上記1-1.(3)工程2で使用したFastQC、Trim galore!、Prinseq、CD-HIT、FastQC、及びMultiQC、系統推定ソフトウエアKraken2、及びマッピングソフトウエアBowtie2等は、予測プログラム1043の一部を構成しうる。また、必要に応じて、Samtools、及びBedtoolsも予測プログラム1043の一部を構成しうる。
予測プログラム1043は、記録媒体に記憶されていてもよい。すなわち、前記コンピュータプログラムは、ハードディスク、フラッシュメモリ等の半導体メモリ素子、光ディスク等の記録媒体に記憶される。また前記コンピュータプログラムは、クラウドサーバ等のネットワークで接続可能な記録媒体に記憶されていてもよい。コンピュータプログラムは、ダウンロード形式の、又は記録媒体に記憶されたプログラム製品であってもよい。
3-1.NGS解析
(1)実験室内(Wet)
1.サンプル調製と核酸抽出
臨床サンプルは液体の場合140μL、固体の場合、滅菌生理食塩水に溶解し液体として140μLを核酸抽出として使用した。溶解しない場合はサンプル溶液にビーズ破砕を加え破砕した。
QIAamp UCP Pathogen Mini Kit (Qiagen, Hilden, Germany)によりDNA抽出を行った。
Nucleospin RNA (Macherey-Nagel)によりRNA抽出を行った。Ovation RNA-Seq system v2(NuGen)によりRNAをcDNA化した。
ライブラリとは解析目的のサンプルに含まれていた核酸由来である挿入配列をシークエンス機器に認識されるアダプター配列によって挟み込んだ配列である。Nextera XT library Prep Kit (Illumina, San Diego, CA, USA)によって作成した。これは、サンプルに含まれていた核酸をtransposaseによりランダムに断片化、アダプター配列の付加を行うことでライブラリを作成する試薬である。なお、調製時にアダプター付加目的にPCR反応を行った。
ライブラリの品質評価のために以下の3ステップが行われる。
Qubit dsDNA BR Assay Kit (Thermo Fisher Scientific, Waltham, MA, USA)を使用し、調製したライブラリの核酸としての濃度を測定した。
QX200TM Droplet Digital PCR System (Bio-rad, Richmond, CA, USA)使用し、アダプター配列をプライマーとしてddPCRを行うことでアダプター配列が付加されているシークエンス可能なライブラリの濃度を測定した。
Bioanalyzer high sensitivity DNA assays (Agilent, Santa Clara, CA, USA)を使用し、ライブラリ長を測定した。
Illumina社のショートリードシークエンサーでシークエンスを行った。
非特許文献5に記載された、血液培養で微生物感染が陽性であり、かつ原因微生物が特定された患者の血漿を用いて、上記式1に示す二項ロジスティック回帰式の係数a、b、cを算出した。係数は、Taxonomic rankごとに算出した。
2) Genus rank:Zg =165.848*log10(${pRPM}) -33.201*${Hg} -367.08
3) Species rank:Zs=-0.368*log10(${pRPM}) -20.075*${Hs} +51.439
(1)臨床実施例1
発熱性好中球減少症と診断された患者97例について血液培養を行い、感染の原因生物を特定できなかった87例を抽出した。87例の患者の血漿を検査サンプルとして、上記予測方法を適用した結果、15例について原因微生物を特定できた。
培養で原因細菌が特定できなかった臨床嫉視例1には含まれない症例の予測結果を図1に示す。血液試料からTatlockia micdadeiが検出された。相対優占度、Coverage percentage及びaverage depth of mapped regionsを考慮すると感染の原因微生物として特定されたTatlockia micdadeiは、信頼性の高い結果であると考えられた。
主訴が発熱のみの患者から、血液試料を採取し本予測方法を適用した。その結果、アデノウイルスを検出した。採血時当該患者にはアデノウイルス感染症を疑う所見はなかった。しかし、その後、肝機能異常と血尿の症状等のアデノウイルス感染を疑う所見が現れ、PCR検査によってアデノウイルス感染症と診断された。本例は、本予測方法により迅速診断ができた例である。
本症例は、名古屋大学医学部附属病院にて、神経芽細胞腫を治療するために臍帯血移植を受けた10歳の患者であり、表1においてPatient_ID B07で示される。移植後、患者は、発熱と悪寒を発症し、血流感染症が疑われた。症状の発症直後から、患者は、セファロスポリン系抗生物質であるセフォゾプランを投与された。セフォゾプラン治療開始後も発熱が持続したため、セフタジジムが追加投与された。表1に示すように血液試料のNGS解析によりStenotrophomonas maltophiliaが感染の原因生物であると予測された。発症から4日後、カテーテルを除去しカテーテル先端の細菌培養検査を行ったところStenotrophomonas maltophiliaが検出された。患者はカテーテルを抜いた後に回復した。
本症例は、名古屋大学医学部附属病院にて、神経芽細胞腫を治療するために臍帯血移植を受けた8歳の患者であり、表1においてPatient_ID B10で示される。移植後、患者は、発熱と悪寒を発症し、血流感染症が疑われた。症状の発症直後から、患者は、セファロスポリン系抗生物質であるセフォゾプランを投与された。表1に示すように血液試料のNGS解析によりSphingomonas paucimobilisが感染の原因生物であると予測された。発症から4日後、カテーテルを除去しカテーテル先端の細菌培養検査を行ったところSphingomonas paucimobilisが検出された。患者はカテーテルを抜いた後に回復した。
101 処理部
Claims (13)
- 検査対象の生物であるホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測装置であって、
前記予測装置は、処理部を備え、
前記処理部は、
前記ホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得し、
前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与し、
前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応する配列情報のリード数とホスト以外に検出された異種生物の種の多様性指数とを算出し、
ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、
前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルとして決定し、
感染の原因生物の予測結果を出力する、
前記予測装置。 - 前記生物種を示すラベルが、生物種の科名、属名、及び種名のそれぞれを個別に示すラベルである、
請求項1に記載の予測装置。 - 前記処理部は、
系統推定、及び/又は参照配列へのマッピングによって、前記異種生物由来配列情報から生物種を示すラベルを推定する、請求項1又は2に記載の予測装置。 - 前記処理部は、
系統推定、及び/又は参照配列へのマッピングによって、生物種を示すラベルを推定できなかった前記異種生物由来配列情報について、既知ヌクレオチド配列との相同性検索を行い生物種を示すラベルを推定し、
系統推定、及び/又は参照配列へのマッピングによって、前記異種生物由来配列情報から推定した生物種を示すラベルと併せて、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成する、請求項1又は2に記載の予測装置。 - 前記処理部は、
系統推定によって、前記異種生物由来配列情報から生物種を示すラベルを推定し、予測結果を第1の予測結果として出力する、請求項1又は2に記載の予測装置。 - 前記処理部は、
系統推定によって、生物種を示すラベルを推定できなかった前記異種生物由来配列情報について、既知ヌクレオチド配列との相同性検索を行い生物種を示すラベルを推定し、
前記系統推定によって、前記異種生物由来配列情報から推定した生物種を示すラベルと併せて、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、予測結果を第2の予測結果として出力する、請求項1又は2に記載の予測装置。 - 前記予測結果が、前記感染の原因生物を示すラベルに対応するリード数及び相対優占度の組み合わせで示される、
請求項1から6のいずれか一項に記載の予測装置。 - 前記処理部は、
生物種の科名、属名、又は種名を示すラベルと、各ラベルに対応するリード数とがKronaチャートにより示される解析レポートを生成する、
請求項1から6のいずれか一項に記載の予測装置。 - 前記処理部は、
前記生物種を示すラベルに対応するリード数を示す第1の軸と、前記ホスト以外の生物種の多様性指数を示す第2の軸を有するプロット領域であって、前記ロジスティック回帰分析式を二次元回帰式に変換し求められる回帰直線を備えるプロット領域を生成し、
前記プロット領域に、前記感染の原因生物である可能性を示すデータを生成したときのリード数と多様性指数の座標を示した二次元プロット図を生成し、
前記二次元プロット図で示される解析レポートを生成する、
請求項1から6のいずれか一項に記載の予測装置。 - 前記処理部は、
前記感染の原因生物を示すラベルに対応する前記異種生物由来配列情報を含む参照配列を配列データベースから検索し、
前記検査サンプルから取得された、前記感染の原因生物を示すラベルに対応する配列情報の全てを前記参照配列にマッピングし、
前記検査サンプルから取得された、前記感染の原因生物を示すラベルに対応する参照配列のうちどれだけの配列長が前記感染の原因生物を示すラベルを付された配列情報から解読されたかを示すcoverage percentageを算出し、
さらに、前記解読された配列長が何回繰り返して解読されたかを示す値の平均値を示すaverage depth of mapped regionsを算出し、
前記感染の原因生物を示すラベルと共に、前記参照配列の識別子と、前記coverage percentageと、前記average depth of mapped regionsを出力する、
請求項1から9のいずれか一項に記載の予測装置。 - 前記処理部は、
さらに、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報の群から、抗生物薬に対する耐性遺伝子に由来するリードを検出し、検出されたリードに対応する耐性遺伝子を示すラベルを出力する、
請求項1から10のいずれか一項に記載の予測装置。 - 検査対象の生物であるホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測方法であって、
前記ホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得することと、
前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与することと、
前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応するリード数とホスト以外に検出された異種生物の種の多様性指数とを算出することと、
ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、
前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルとして決定すること、
を含む、
前記予測方法。 - コンピュータに実行させたときに、
コンピュータに、
検査対象の生物であるホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得するステップと、
前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与するステップと、
前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応するリード数とホスト以外に検出された異種生物の種の多様性指数とを算出するステップと、
ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成するステップと、
前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルと決定するステップと、
予測結果を出力するステップと、
を実行させる、
前記ホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019229363A JP7373843B2 (ja) | 2019-12-19 | 2019-12-19 | 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019229363A JP7373843B2 (ja) | 2019-12-19 | 2019-12-19 | 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021093999A JP2021093999A (ja) | 2021-06-24 |
JP7373843B2 true JP7373843B2 (ja) | 2023-11-06 |
Family
ID=76429693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019229363A Active JP7373843B2 (ja) | 2019-12-19 | 2019-12-19 | 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7373843B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007522819A (ja) | 2004-02-20 | 2007-08-16 | ザ レジェンツ オブ ザ ユニバーシティー オブ カリフォルニア | 唾液mRNAプロファイリング、バイオマーカーならびに関連した方法およびキット |
JP2010522554A (ja) | 2007-03-27 | 2010-07-08 | ロゼッタ ゲノミックス エルティーディー. | 癌の分類のための遺伝子発現サイン |
US20140257710A1 (en) | 2013-03-07 | 2014-09-11 | Ofek Eshkolot Research And Development Ltd. | Method and system for analyzing the taxonomic composition of a metagenome in a sample |
JP2016518822A (ja) | 2013-03-15 | 2016-06-30 | コスモシド インク.Cosmosid Inc. | アセンブルされていない配列情報、確率論的方法、及び形質固有(trait−specific)のデータベースカタログを用いた生物材料の特性解析 |
-
2019
- 2019-12-19 JP JP2019229363A patent/JP7373843B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007522819A (ja) | 2004-02-20 | 2007-08-16 | ザ レジェンツ オブ ザ ユニバーシティー オブ カリフォルニア | 唾液mRNAプロファイリング、バイオマーカーならびに関連した方法およびキット |
JP2010522554A (ja) | 2007-03-27 | 2010-07-08 | ロゼッタ ゲノミックス エルティーディー. | 癌の分類のための遺伝子発現サイン |
US20140257710A1 (en) | 2013-03-07 | 2014-09-11 | Ofek Eshkolot Research And Development Ltd. | Method and system for analyzing the taxonomic composition of a metagenome in a sample |
JP2016518822A (ja) | 2013-03-15 | 2016-06-30 | コスモシド インク.Cosmosid Inc. | アセンブルされていない配列情報、確率論的方法、及び形質固有(trait−specific)のデータベースカタログを用いた生物材料の特性解析 |
Non-Patent Citations (2)
Title |
---|
Horiba, K. et al.,Comprehensive detection of pathogens in immunocompromised children with bloodstream infections by next-generation sequencing,Scientific Reports,2018年02月28日,Vol. 8, No. 3784,pp. 1-9 |
Ondov, B.D. et al.,Interactive metagenomic visualization in a Web browser,BMC Bioinformatics,2011年09月30日,Vol. 12, No. 385,pp. 1-9 |
Also Published As
Publication number | Publication date |
---|---|
JP2021093999A (ja) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Understanding UCEs: a comprehensive primer on using ultraconserved elements for arthropod phylogenomics | |
Blauwkamp et al. | Analytical and clinical validation of a microbial cell-free DNA sequencing test for infectious disease | |
RU2704286C2 (ru) | Подавление ошибок в секвенированных фрагментах днк посредством применения избыточных прочтений с уникальными молекулярными индексами (umi) | |
Ghosh et al. | Transformation of animal genomics by next-generation sequencing technologies: a decade of challenges and their impact on genetic architecture | |
CN114898800B (zh) | 一种预测肺炎克雷伯菌对头孢曲松敏感性的方法及系统 | |
KR20020075265A (ko) | 임상 진단 서비스를 제공하는 방법 | |
CN114898808B (zh) | 一种预测肺炎克雷伯菌对头孢吡肟敏感性的方法及系统 | |
Sales et al. | KrillDB: A de novo transcriptome database for the Antarctic krill (Euphausia superba) | |
JP2020533688A (ja) | Hla組織照合およびそのための方法 | |
JP2019080501A (ja) | 品質評価方法、品質評価装置、プログラム、記録媒体、および品質管理試料 | |
CN113889187A (zh) | 单样本等位基因拷贝数变异检测方法、探针组和试剂盒 | |
Langsiri et al. | Targeted sequencing analysis pipeline for species identification of human pathogenic fungi using long-read nanopore sequencing | |
Hu et al. | The electronic tree of life (eToL): a net of long probes to characterize the microbiome from RNA-seq data | |
CN112331268B (zh) | 目标物种特有序列的获取方法及目标物种检测方法 | |
US6996477B2 (en) | Computational subtraction method | |
JP7373843B2 (ja) | 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 | |
Lerminiaux et al. | Do we still need Illumina sequencing data?: Evaluating Oxford Nanopore Technologies R10. 4.1 flow cells and v14 library prep kits for Gram negative bacteria whole genome assemblies | |
Madill-Thomsen et al. | Precision diagnostics in transplanted organs using microarray-assessed gene expression: Concepts and technical methods of the Molecular Microscope® Diagnostic System (MMDx) | |
Guo et al. | Identification of putative effector genes across the GWAS Catalog using molecular quantitative trait loci from 68 tissues and cell types | |
Srivastava et al. | Genome resources for the ex-type of Phytophthora citricola, and well-authenticated isolates of P. hibernalis, P. nicotianae, and P. syringae | |
JP2007535305A (ja) | 分子毒性モデリングのための方法 | |
JP6902258B2 (ja) | 被験者のhla遺伝子のアレルペアを判定する方法 | |
KR101853916B1 (ko) | 단백질 도메인의 생물경로 특이성 판단 방법, 및 이를 이용한 질병 유전자 발굴 방법 | |
Marić et al. | Approaches to metagenomic classification and assembly | |
JP2004113661A (ja) | 治療法の有効性を予測するためのプログラム、データベース、システム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230929 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231010 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231017 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7373843 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |