JP2023048811A - 疲労の検出方法 - Google Patents
疲労の検出方法 Download PDFInfo
- Publication number
- JP2023048811A JP2023048811A JP2021158338A JP2021158338A JP2023048811A JP 2023048811 A JP2023048811 A JP 2023048811A JP 2021158338 A JP2021158338 A JP 2021158338A JP 2021158338 A JP2021158338 A JP 2021158338A JP 2023048811 A JP2023048811 A JP 2023048811A
- Authority
- JP
- Japan
- Prior art keywords
- gene
- fatigue
- genes
- expression level
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
【課題】頭皮から採取されたSSL由来のバイオマーカーを用いた疲労の検出方法を提供する。【解決手段】被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における疲労の検出方法。【選択図】なし
Description
本発明は、バイオマーカーを用いた疲労の検出方法に関する。
疲労は、肉体的及び精神的活動、又は疾病によって生じた独特の不快感と休養の願望を伴う身体の活動能力の減退状態であり、生体が身体の状態や機能を保つための仕組みである。疲労の持続は、思考能力の低下、注意力の低下、作業効率の低下をもたらし、さらには体調不良や疾患の原因となる。
従来、疲労は、主に問診やアンケート(例えば、前述のチャルダー疲労質問票)に基づくスコアリングによって評価されているが、このような評価法は、客観性や定量性に劣ることがあり、また試験間での評価の比較を困難にする。
また、特許文献1~4には、疲労を評価するマーカーとして、翻訳開始因子2α(eIF-2α)リン酸化関連因子(特許文献1)、好酸球カチオン性タンパク質(ECP)及び好酸球由来ニューロトキシン(EDN)(特許文献2)、ならびに各種遺伝子マーカー(特許文献3、4)が開示されている。特許文献5~7には、慢性疲労症候群を評価するマーカーとして、アクチビンβB(特許文献5)、約30kDaのRNase L(特許文献6)、ならびに各種遺伝子マーカー(特許文献7)が開示されている。しかしながら、バイオマーカーによる疲労の客観的又は定量的な評価手法は未だ確立されていない。
また、特許文献1~4には、疲労を評価するマーカーとして、翻訳開始因子2α(eIF-2α)リン酸化関連因子(特許文献1)、好酸球カチオン性タンパク質(ECP)及び好酸球由来ニューロトキシン(EDN)(特許文献2)、ならびに各種遺伝子マーカー(特許文献3、4)が開示されている。特許文献5~7には、慢性疲労症候群を評価するマーカーとして、アクチビンβB(特許文献5)、約30kDaのRNase L(特許文献6)、ならびに各種遺伝子マーカー(特許文献7)が開示されている。しかしながら、バイオマーカーによる疲労の客観的又は定量的な評価手法は未だ確立されていない。
一方、生体試料中のDNAやRNA等の核酸の解析によりヒトの生体内の現在、さらには将来の生理状態を調べる技術が開発されている。生体由来の核酸は、血液等の組織、体液、分泌物などから抽出することができる。特許文献8には、皮膚表上脂質(SSL)から被験体の皮膚細胞に由来するRNA等の核酸を分離し、生体の解析用の試料として用いることが記載されている。
本発明は、頭皮から採取されたSSL由来のバイオマーカーを用いた疲労の検出方法を提供することに関する。
本発明者らは、健常な男女を疲労度の高い群と健常群に分け、それぞれの頭皮からSSLを採取し、SSL中に含まれるRNAの発現状態をシーケンス情報として網羅的に解析した結果、特定の遺伝子の発現レベルが両群間で有意に異なり、これを指標として被験者の疲労の存在を検出できることを見出した。
すなわち、本発明は、以下の1)~4)に係るものである。
1)被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における疲労の検出方法。
2)疲労に対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
3)SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、1)の方法に用いられる疲労検出用キット又は2)の方法に用いられる介入効果の評価用キット。
4)ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる疲労マーカー。
1)被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における疲労の検出方法。
2)疲労に対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
3)SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、1)の方法に用いられる疲労検出用キット又は2)の方法に用いられる介入効果の評価用キット。
4)ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる疲労マーカー。
本発明において用いられるSSLは、非侵襲的に採取可能である。したがって、本発明の方法によれば、検体採取の手間や、採取による被験者への負担をかけることなく、疲労の検出が可能となる。
本明細書中で引用された全ての特許文献、非特許文献、及びその他の刊行物は、その全体が本明細書中において参考として援用される。
本発明において、「核酸」又は「ポリヌクレオチド」と云う用語は、DNA又はRNAを意味する。DNAには、cDNA、ゲノムDNA、及び合成DNAのいずれもが含まれ、「RNA」には、total RNA、mRNA、rRNA、tRNA、non-coding RNA及び合成のRNAのいずれもが含まれる。
本発明において「遺伝子」とは、ヒトゲノムDNAを含む2本鎖DNAの他、cDNAを含む1本鎖DNA(正鎖)、当該正鎖と相補的な配列を有する1本鎖DNA(相補鎖)、及びこれらの断片を包含するものであって、DNAを構成する塩基の配列情報の中に、何らかの生物学的情報が含まれているものを意味する。
また、当該「遺伝子」は特定の塩基配列で表される「遺伝子」だけではなく、これらの同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体をコードする核酸が包含される。
また、当該「遺伝子」は特定の塩基配列で表される「遺伝子」だけではなく、これらの同族体(すなわち、ホモログもしくはオーソログ)、遺伝子多型等の変異体、及び誘導体をコードする核酸が包含される。
本発明において、遺伝子の名称は、NCBI([www.ncbi.nlm.nih.gov/])に記載のあるOfficial Symbolに従う。
本発明において、遺伝子の「発現産物」とは、遺伝子の転写産物及び翻訳産物を包含する概念である。「転写産物」とは、遺伝子(DNA)から転写されて生じるRNAであり、「翻訳産物」とは、RNAに基づき翻訳合成される、遺伝子にコードされたタンパク質を意味する。
本発明において、「疲労」とは、身体的倦怠感、精神的倦怠感、及び認知的倦怠感を含む倦怠感を有する状態を表す。例えば、「疲労」の程度は、米国疾病予防管理センター(CDC)が疲労の評価に用いることを推奨するチャルダー疲労質問票(CFS)のスコアに反映される。CFSは身体疲労および精神疲労に関する14項目の質問から構成されており、身体と精神の双方の疲労を総合的に評価することができる。CFSスコアが15点以上、好ましくは18点以上になると疲労している(疲労度が高い(高疲労))と判断される(Narumi D., et al. AIJ Journal of Technology and Design 54 (2017):563-566.)。一方、疲労度についての「健常」とは、CFSのスコアが15点未満、好ましくは11点以下、より好ましくは7点以下である場合、健常又は疲労度が低い(低疲労)と判断される。
本発明において、疲労の「検出」とは疲労の存在又は不存在を明らかにする意味であり、検査、測定、判定又は評価支援などの用語で言い換えることもできる。本明細書における疲労の「検出」、「検査」、「測定」、「判定」又は「評価」という用語は、医師による疲労を伴う疾患(例えば慢性疲労症候群)の診断を含むものではない。
後述する実施例に示すように、チャルダー疲労質問票に基づき判定された疲労群と健常群の間で、頭皮SSLにおいて発現レベルが異なっている遺伝子が見出された。すなわち、頭皮SSLから抽出されたRNAの発現量のデータ(リードカウント値)について、DESeq2(Love MI et al. Genome Biol. 2014)を用いて補正されたカウント値(Normalized count値)を用いて、健常群と疲労群で尤度比検定によるp値の補正値(FDR)が0.05未満である遺伝子を抽出することにより、疲労群で発現が上昇する遺伝子52種(後記表1の「UP」)、発現が低下する遺伝子33種(後記表1の「DOWN」)、計85遺伝子が同定された。
したがって、斯かる85種の遺伝子群より選択される遺伝子又はその発現産物は、疲労を検出するための疲労マーカーとなり得る。この場合、疲労群で発現が上昇する遺伝子又はその発現産物はポジティブマーカーであり、発現が低下する遺伝子又はその発現産物はネガティブマーカーである。
したがって、斯かる85種の遺伝子群より選択される遺伝子又はその発現産物は、疲労を検出するための疲労マーカーとなり得る。この場合、疲労群で発現が上昇する遺伝子又はその発現産物はポジティブマーカーであり、発現が低下する遺伝子又はその発現産物はネガティブマーカーである。
また、被験者から検出された全てのSSL由来RNAの発現量のデータ(7963遺伝子のLog2(RPM+1)値)を説明変数とし、疲労状態(健常群と疲労群)を目的変数とし、機械学習アルゴリズムとしてランダムフォレスト(Breiman L. Machine Learning (2001) 45;5-32)を用いて特徴量遺伝子の抽出及び予測モデルの構築を試みた。後述する実施例に示すように、ジニ係数に基づく変数重要度の上位69遺伝子(後記表2)を特徴量遺伝子として選択し、これを用いたモデルで疲労の検出が可能であることが示された。
したがって、斯かる69種の遺伝子群より選択される遺伝子又はその発現産物は、疲労を検出するための好適な疲労マーカーとなり得る。
したがって、斯かる69種の遺伝子群より選択される遺伝子又はその発現産物は、疲労を検出するための好適な疲労マーカーとなり得る。
また、機械学習アルゴリズムとしてBoruta法(Kursa et al. Fundamental Informaticae (2010) 101;271-286)を用いて特徴量遺伝子の抽出(最大試行回数1000回、p値0.01未満)を行ったところ、23遺伝子(後記表3)が特徴量遺伝子として抽出され、後述の実施例で示すように、これを用いたランダムフォレストによる予測モデルで疲労の検出が可能であることが示された。
したがって、斯かる23種の遺伝子群より選択される遺伝子又はその発現産物は、疲労を検出するための疲労マーカーとなり得る。
したがって、斯かる23種の遺伝子群より選択される遺伝子又はその発現産物は、疲労を検出するための疲労マーカーとなり得る。
上述した発現変動解析で抽出された後記表1で示される85種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された後記表2で示される69種の遺伝子群(B)及びBoruta法により特徴量遺伝子として選択された後記表3で示される23種の遺伝子群(C)の和(A∪B∪C)である164種の遺伝子(後記表4)はいずれも疲労マーカーとなり得る。斯かる164種の遺伝子は、これまでに疲労との関係が報告されていない新規な遺伝子である。
本発明のASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群のうち、ASS1、VMA21及びSMPD3の3遺伝子は、上述した発現変動解析で抽出された後記表1に記載の85種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された後記表2に記載の69種の遺伝子群(B)に共通する遺伝子(A∩B)であり、ANP32E、ARAP3及びTUBA1Cの3遺伝子は、ランダムフォレストにより特徴量遺伝子として選択された後記表2に記載の69種の遺伝子群(B)とBoruta法により特徴量遺伝子として選択された後記表3に記載の23種の遺伝子群(C)に共通する遺伝子(B∩C)であり、ANXA2、KRTAP10_8、SPRED1、SUPT7L及びZNF707の5遺伝子は、発現変動解析で抽出された後記表1に記載の85種の遺伝子群(A)とBoruta法により特徴量遺伝子として選択された後記表3に記載の23種の遺伝子群(C)に共通する遺伝子(A∩C)であり、RNF139は、発現変動解析で抽出された後記表1に記載の85種の遺伝子群(A)と、ランダムフォレストにより特徴量遺伝子として選択された後記表2に記載の69種の遺伝子群(B)とBoruta法により特徴量遺伝子として選択された後記表3に記載の23種の遺伝子群(C)の全てに共通する遺伝子(A∩B∩C)である。したがって、これらの遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物は、疲労を検出するための疲労マーカーとして特に有用である。
本発明の疲労の検出においては、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群から1種以上、2種以上、好ましくは5種以上、より好ましくは7種以上、より好ましくは10種以上を選択して用いることができ、12種全てを用いることもできる。
また、上記12種の遺伝子のうちASS1、VMA21、SMPD3、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる9種の遺伝子群から選択される遺伝子と、後記表1で示される85種のうち当該9種を除いた76種の遺伝子群(下記表1A)から選択される少なくとも1つの遺伝子を組み合わせて用いることができる。
また、上記12種の遺伝子のうちASS1、VMA21、SMPD3、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる9種の遺伝子群から選択される遺伝子と、後記表1で示される85種のうち当該9種を除いた76種の遺伝子群(下記表1A)から選択される少なくとも1つの遺伝子を組み合わせて用いることができる。
また、上記12種の遺伝子のうちASS1、VMA21、SMPD、ANP32E、ARAP3、TUBA1及びRNF139からなる7種の遺伝子群から選択される遺伝子と、後記表2で示される69種のうち当該7種を除いた62種の遺伝子群(下記表2A)から選択される少なくとも1つの遺伝子を組み合わせて用いることができる。
また、上記12種の遺伝子のうちANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707、ANP32E、ARAP3、TUBA1及びRNF139からなる9種の遺伝子群から選択される遺伝子と、後記表3で示される23種のうち当該9種を除いた14種の遺伝子群(下記表3A)から選択される少なくとも1つの遺伝子を組み合わせて用いることができる。
また、上記12種の遺伝子群から選択される遺伝子と、後記表4で示される164種のうち当該12種を除いた152種の遺伝子群(表4A)から選択される少なくとも1つの遺伝子又を組み合わせて用いることができる。
なお、上記の疲労マーカーとなり得る遺伝子(以下、「標的遺伝子」とも称す)には、疲労を検出するためのバイオマーカーとなり得る限り、当該遺伝子を構成するDNAの塩基配列と実質的に同一の塩基配列を有する遺伝子も包含される。ここで、実質的に同一の塩基配列とは、例えば、相同性計算アルゴリズムNCBI BLASTを用い、期待値=10;ギャップを許す;フィルタリング=ON;マッチスコア=1;ミスマッチスコア=-3の条件にて検索をした場合、当該遺伝子を構成するDNAの塩基配列と90%以上、好ましくは95%以上、さらにより好ましく98%以上の同一性があることを意味する。
本発明の疲労の検出方法は、被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む。
本発明の疲労の検出方法において用いられる生体試料は、被験者の頭皮から採取された皮膚表上脂質(SSL)が用いられる。なお、被験者は、性別や人種など特に限定されないが、疲労の検出を必要とするヒト又は疲労の検出を希望するヒトが好ましい。
ここで、「皮膚表上脂質(SSL)」とは、皮膚の表上に存在する脂溶性画分をいい、皮脂と呼ばれることもある。一般に、SSLは、皮膚にある皮脂腺等の外分泌腺から分泌された分泌物を主に含み、皮膚表面を覆う薄い層の形で皮膚表上に存在している。SSLは、皮膚細胞で発現したRNAを含む(前記特許文献5参照)。また、「皮膚」とは、特に限定しない限り、角層、表皮、真皮、毛包、ならびに汗腺、皮脂腺及びその他の腺等の組織を含む領域の総称である。本発明において、SSLが採取される皮膚は、頭部の毛髪が生える領域の皮膚、すなわち頭皮である。
被験者の頭皮からのSSLの採取には、皮膚からのSSLの回収又は除去に用いられているあらゆる手段を採用することができる。好ましくは、後述するSSL吸収性素材、SSL接着性素材、又は皮膚からSSLをこすり落とす器具を使用することができる。SSL吸収性素材又はSSL接着性素材としては、SSLに親和性を有する素材であれば特に限定されず、例えばポリプロピレン、パルプ等が挙げられる。皮膚からのSSLの採取手順のより詳細な例としては、あぶら取り紙、あぶら取りフィルム等のシート状素材へSSLを吸収させる方法、ガラス板、テープ等へSSLを接着させる方法、スパーテル、スクレイパー等によりSSLをこすり落として回収する方法、などが挙げられる。SSLの吸着性を向上させるため、脂溶性の高い溶媒を予め含ませたSSL吸収性素材を用いてもよい。一方、SSL吸収性素材は、水溶性の高い溶媒や水分を含んでいるとSSLの吸着が阻害されるため、水溶性の高い溶媒や水分の含有量が少ないことが好ましい。SSL吸収性素材は、乾燥した状態で用いることが好ましい。
被験者から採取されたRNA含有SSLは一定期間保存されてもよい。採取されたSSLは、含有するRNAの分解を極力抑えるために、採取後できるだけ速やかに低温条件で保存することが好ましい。本発明における該RNA含有SSLの保存の温度条件は、0℃以下であればよく、好ましくは-20±20℃~-80±20℃、より好ましくは-20±10℃~-80±10℃、さらに好ましくは-20±20℃~-40±20℃、さらに好ましくは-20±10℃~-40±10℃、さらに好ましくは-20±10℃、さらに好ましくは-20±5℃である。該RNA含有SSLの該低温条件での保存の期間は、特に限定されないが、好ましくは12か月以下、例えば6時間以上12ヶ月以下、より好ましくは6ヶ月以下、例えば1日間以上6ヶ月以下、さらに好ましくは3ヶ月以下、例えば3日間以上3ヶ月以下である。
本発明において、標的遺伝子又はその発現産物の発現レベルの測定対象としては、RNA、そのRNAをエンコードするDNA、そのRNAにコードされるタンパク質、該タンパク質と相互作用をする分子、そのRNAと相互作用する分子、又はそのDNAと相互作用する分子等が挙げられ、RNAが好ましく、より好ましくはmRNAである。ここで、RNA、DNA又はタンパク質と相互作用する分子としては、DNA、RNA、タンパク質、多糖、オリゴ糖、単糖、脂質、脂肪酸、及びこれらのリン酸化物、アルキル化物、糖付加物等、及び上記いずれかの複合体が挙げられる。また、発現レベルとは、当該遺伝子又は発現産物の発現量や活性を包括的に意味する。
本発明の方法においては、RNAを標的遺伝子又はその発現産物の発現レベルの測定対象とする場合、RNAの発現レベルが解析されてもよいが、好ましくはRNAを逆転写によりcDNAに変換した後、該cDNA又はその増幅産物が測定される。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate-phenol-chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
SSLからのRNAの抽出には、生体試料からのRNAの抽出又は精製に通常使用される方法、例えば、フェノール/クロロホルム法、AGPC(acid guanidinium thiocyanate-phenol-chloroform extraction)法、又はTRIzol(登録商標)、RNeasy(登録商標)、QIAzol(登録商標)等のカラムを用いた方法、シリカをコーティングした特殊な磁性体粒子を用いる方法、Solid Phase Reversible Immobilization磁性体粒子を用いる方法、ISOGEN等の市販のRNA抽出試薬による抽出等を用いることができる。
該逆転写には、解析したい特定のRNAを標的としたプライマーを用いてもよいが、より包括的な核酸の保存及び解析のためにはランダムプライマーを用いることが好ましい。該逆転写には、一般的な逆転写酵素又は逆転写試薬キットを使用することができる。好適には、正確性及び効率性の高い逆転写酵素又は逆転写試薬キットが用いられ、その例としては、M-MLV Reverse Transcriptase及びその改変体、あるいは市販の逆転写酵素又は逆転写試薬キット、例えばPrimeScript(登録商標)Reverse Transcriptaseシリーズ(タカラバイオ社)、SuperScript(登録商標)Reverse Transcriptaseシリーズ(Thermo Scientific社)等が挙げられる。SuperScript(登録商標)III Reverse Transcriptase、SuperScript(登録商標)VILO cDNA Synthesis kit(いずれもThermo Scientific社)等が好ましく用いられる。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80~120分間に調整するのが好ましい。
該逆転写における伸長反応は、温度を好ましくは42℃±1℃、より好ましくは42℃±0.5℃、さらに好ましくは42℃±0.25℃に調整し、一方、反応時間を好ましくは60分間以上、より好ましくは80~120分間に調整するのが好ましい。
発現レベルを測定する方法は、RNA、cDNA又はDNAを対象とする場合、これらにハイブリダイズするDNAをプライマーとしたPCR法、リアルタイムRT-PCR法、マルチプレックスPCR、SmartAmp法、LAMP法等に代表される核酸増幅法、これらにハイブリダイズする核酸をプローブとして用いるハイブリダイゼーション法(DNAチップ、DNAマイクロアレイ、ドットブロットハイブリダイゼーション、スロットブロットハイブリダイゼーション、ノーザンブロットハイブリダイゼーション等)、塩基配列を決定する方法(シーケンシング)、又はこれらを組み合わせた方法から選ぶことができる。
PCRでは、解析したい特定のDNAを標的としたプライマーペアを用いて該特定の1種のDNAのみを増幅してもよいが、複数のプライマーペアを用いて同時に複数の特定のDNAを増幅してもよい。好ましくは、該PCRはマルチプレックスPCRである。マルチプレックスPCRは、PCR反応系に複数のプライマー対を同時に使用することで、複数の遺伝子領域を同時に増幅する方法である。マルチプレックスPCRは、市販のキット(例えば、Ion AmpliSeqTranscriptome Human Gene Expression Kit;ライフテクノロジーズジャパン株式会社等)を用いて実施することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14~18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95~99℃で10~60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
該PCRにおけるアニーリング及び伸長反応の温度は、使用するプライマーに依存するため一概には言えないが、上記のマルチプレックスPCRキットは用いる場合、好ましくは62℃±1℃、より好ましくは62℃±0.5℃、さらに好ましくは62℃±0.25℃である。したがって、該PCRでは、好ましくはアニーリング及び伸長反応が1ステップで行われる。該アニーリング及び伸長反応のステップの時間は、増幅すべきDNAのサイズ等に依存して調整され得るが、好ましくは14~18分間である。該PCRにおける変性反応の条件は、増幅すべきDNAに依存して調整され得るが、好ましくは95~99℃で10~60秒間である。上記のような温度及び時間での逆転写及びPCRは、一般的にPCRに使用されるサーマルサイクラーを用いて実行することができる。
当該PCRで得られた反応産物の精製は、反応産物のサイズ分離によって行われることが好ましい。サイズ分離により、目的のPCR反応産物を、PCR反応液中に含まれるプライマーやその他の不純物から分離することができる。DNAのサイズ分離は、例えば、サイズ分離カラムや、サイズ分離チップ、サイズ分離に利用可能な磁気ビーズ等によって行うことができる。サイズ分離に利用可能な磁気ビーズの好ましい例としては、Ampure XP等のSolid Phase Reversible Immobilization(SPRI)磁性ビーズが挙げられる。
精製したPCR反応産物に対して、その後の定量解析を行うために必要なさらなる処理を施してもよい。例えば、DNAのシーケンシングのために、精製したPCR反応産物を、適切なバッファー溶液へと調製したり、PCR増幅されたDNAに含まれるPCRプライマー領域を切断したり、増幅されたDNAにアダプター配列をさらに付加したりしてもよい。例えば、精製したPCR反応産物をバッファー溶液へと調製し、増幅DNAに対してPCRプライマー配列の除去及びアダプターライゲーションを行い、得られた反応産物を、必要に応じて増幅して、定量解析のためのライブラリーを調製することができる。これらの操作は、例えば、SuperScript(登録商標)VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)に付属している5×VILO RT Reaction Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)に付属している5×Ion AmpliSeq HiFi Mix、及びIon AmpliSeq Transcriptome Human Gene Expression Core Panelを用いて、各キット付属のプロトコルに従って行うことができる。
ノーザンブロットハイブリダイゼーション法を利用して標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まずプローブDNAを放射性同位元素、蛍光物質等で標識し、次いで、得られた標識DNAを、常法に従ってナイロンメンブレン等にトランスファーした生体試料由来のRNAとハイブリダイズさせる。その後、形成された標識DNAとRNAとの二重鎖を、標識物に由来するシグナルを検出することにより測定する方法が挙げられる。
RT-PCR法を用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、まず生体試料由来のRNAから常法に従ってcDNAを調製し、これを鋳型として本発明の標的遺伝子が増幅できるように調製した一対のプライマー(上記cDNA(-鎖)に結合する正鎖、+鎖に結合する逆鎖)をこれとハイブリダイズさせる。その後、常法に従ってPCR法を行い、得られた増幅二本鎖DNAを検出する。増幅された二本鎖DNAの検出には、予めRI、蛍光物質等で標識しておいたプライマーを用いて上記PCRを行うことによって産生される標識二本鎖DNAを検出する方法等を用いることができる。
DNAマイクロアレイを用いて標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、支持体に本発明の標的遺伝子由来の核酸(cDNA又はDNA)の少なくとも1種を固定化したアレイを用い、mRNAから調製した標識化cDNA又はcRNAをマイクロアレイ上に結合させ、マイクロアレイ上の標識を検出することによって、mRNAの発現量を測定することができる。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15~25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
前記アレイに固定化される核酸としては、ストリンジェントな条件下に特異的(すなわち、実質的に目的の核酸のみに)にハイブリダイズする核酸であればよく、例えば、本発明の標的遺伝子の全配列を有する核酸であってもよく、部分配列からなる核酸であってもよい。ここで、「部分配列」とは、少なくとも15~25塩基からなる核酸が挙げられる。ここでストリンジェントな条件は、通常「1×SSC、0.1%SDS、37℃」程度の洗浄条件を挙げることができ、より厳しいハイブリダイズ条件としては「0.5×SSC、0.1%SDS、42℃」程度、さらに厳しいハイブリダイズ条件としては「0.1×SSC、0.1%SDS、65℃」程度の条件を挙げることができる。ハイブリダイズ条件は、J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Thrd Edition, Cold Spring Harbor Laboratory Press (2001)等に記載されている。
シーケンシングによって標的遺伝子又はそれに由来する核酸の発現量を測定する場合は、例えば、次世代シーケンサー(例えばIon S5/XLシステム、ライフテクノロジーズジャパン株式会社)が用いて解析することが挙げられる。シーケンシングで作成されたリードの数(リードカウント)に基づいて、RNA発現を定量することができる。
上記の測定に用いられるプローブ又はプライマー、すなわち、本発明の標的遺伝子又はそれに由来する核酸を特異的に認識し増幅するためのプライマー、又は該RNA又はそれに由来する核酸を特異的に検出するためのプローブがこれに該当するが、これらは、当該標的遺伝子を構成する塩基配列に基づいて設計することができる。ここで「特異的に認識する」とは、例えばノーザンブロット法において、実質的に本発明の標的遺伝子又はそれに由来する核酸のみを検出できること、また例えばRT-PCR法において、実質的に当該核酸のみが増幅される如く、当該検出物又は生成物が当該遺伝子又はそれに由来する核酸であると判断できることを意味する。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上、よりさらに好ましくは99%以上の塩基配列上の同一性を有すればよい。塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又はイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
具体的には、本発明の標的遺伝子を構成する塩基配列からなるDNA又はその相補鎖に相補的な一定数のヌクレオチドを含むオリゴヌクレオチドを利用することができる。ここで「相補鎖」とは、A:T(RNAの場合はU)、G:Cの塩基対からなる2本鎖DNAの一方の鎖に対する他方の鎖を指す。また、「相補的」とは、当該一定数の連続したヌクレオチド領域で完全に相補配列である場合に限られず、好ましくは80%以上、より好ましくは90%以上、さらに好ましくは95%以上、よりさらに好ましくは99%以上の塩基配列上の同一性を有すればよい。塩基配列の同一性は、前記BLAST等のアルゴリズムにより決定することができる。
斯かるオリゴヌクレオチドは、プライマーとして用いる場合には、特異的なアニーリング及び鎖伸長ができればよく、通常、例えば10塩基以上、好ましくは15塩基以上、より好ましくは20塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは35塩基以下の鎖長を有するものが挙げられる。また、プローブとして用いる場合には、特異的なハイブリダイゼーションができればよく、本発明の標的遺伝子を構成する塩基配列からなるDNA(又はその相補鎖)の少なくとも一部若しくは全部の配列を有し、例えば10塩基以上、好ましくは15塩基以上、かつ例えば100塩基以下、好ましくは50塩基以下、より好ましくは25塩基以下の鎖長のものが用いられる。
なお、ここで、「オリゴヌクレオチド」は、DNAあるいはRNAであることができ、合成されたものでも天然のものでもよい。又はイブリダイゼーションに用いるプローブは、通常標識したものが用いられる。
また、本発明の標的遺伝子の翻訳産物(タンパク質)、当該タンパク質と相互作用する分子、RNAと相互作用する分子、又はDNAと相互作用する分子を測定する場合は、プロテインチップ解析、免疫測定法(例えば、ELISA等)、質量分析(例えば、LC-MS/MS、MALDI-TOF/MS)、1-ハイブリッド法(PNAS 100, 12271-12276(2003))や2-ハイブリッド法(Biol. Reprod. 58, 302-311 (1998))のような方法を用いることができ、対象に応じて適宜選択できる。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物に対する抗体を生体試料と接触させ、当該抗体に結合した試料中のタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
例えば、測定対象としてタンパク質が用いられる場合は、本発明の発現産物に対する抗体を生体試料と接触させ、当該抗体に結合した試料中のタンパク質を検出し、そのレベルを測定することによって実施される。例えば、ウェスタンブロット法によれば、一次抗体として上記の抗体を用いた後、二次抗体として放射性同位元素、蛍光物質又は酵素等で標識した一次抗体に結合する抗体を用いて、その一次抗体を標識し、これら標識物質由来のシグナルを放射線測定器、蛍光検出器等で測定することが行われる。
尚、上記翻訳産物に対する抗体は、ポリクローナル抗体であっても、モノクローナル抗体であってもよい。これらの抗体は、公知の方法に従って製造することができる。具体的には、ポリクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質を用いて、あるいは常法に従って当該タンパク質の部分ポリペプチドを合成して、家兎等の非ヒト動物に免疫し、該免疫動物の血清から常法に従って得ることが可能である。
一方、モノクローナル抗体は、常法に従って大腸菌等で発現し精製したタンパク質又は該タンパク質の部分ポリペプチドをマウス等の非ヒト動物に免疫し、得られた脾臓細胞と骨髄腫細胞とを細胞融合させて調製したハイブリドーマ細胞から得ることができる。また、モノクローナル抗体は、ファージディスプレイを用いて作製してもよい(Griffiths, A.D.; Duncan, A.R., Current Opinion in Biotechnology, Volume 9, Number 1, February 1998 , pp. 102-108(7))。
斯くして、被験者の頭皮から採取されたSSL中の標的遺伝子又はその発現産物の発現レベルが測定され、当該発現レベルに基づいて疲労が検出される。
シーケンシングにより複数の標的遺伝子の発現レベルの解析を行う場合は、上記したように、発現量のデータであるリードカウント値、該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(Log2(RPM+1)値)、あるいはDESeq2を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(Log2(count+1)値)を指標として用いるのが好ましい。また、RNA-seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)などによって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT-PCRなどにより特定の標的遺伝子のみ発現レベルの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換(相対定量)して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
シーケンシングにより複数の標的遺伝子の発現レベルの解析を行う場合は、上記したように、発現量のデータであるリードカウント値、該リードカウント値をサンプル間の総リード数の違いを補正したRPM値、当該RPM値を底2の対数値に変換した値(Log2RPM値)又は整数1を加算した底2の対数値(Log2(RPM+1)値)、あるいはDESeq2を用いて補正されたカウント値(Normalized count値)又は整数1を加算した底2の対数値(Log2(count+1)値)を指標として用いるのが好ましい。また、RNA-seqの定量値として一般的な、fragments per kilobase of exon per million reads mapped (FPKM)、reads per kilobase of exon per million reads mapped (RPKM)、transcripts per million (TPM)などによって算出される値であってもよい。また、マイクロアレイ法によって得られるシグナル値、及びその補正値であってもよい。また、RT-PCRなどにより特定の標的遺伝子のみ発現レベルの解析を行う場合には、対象遺伝子の発現量をハウスキーピング遺伝子の発現量を基準とする相対的な発現量に変換(相対定量)して解析する方法、又は標的遺伝子の領域を含むプラスミドを用いて絶対的なコピー数を定量(絶対定量)して解析する方法が好ましい。デジタルPCR法によって得られるコピー数であってもよい。
本発明における疲労の検出は、本発明の標的遺伝子又はその発現産物の発現レベルを、各遺伝子又はその発現産物の参照値(カットオフ値)と比較することにより行われる。参照値としては、例えば、予め健常人(疲労度が健常範囲である人)における当該標的遺伝子又はその発現産物の発現レベルを基準データとして取得しておき、それに基づく発現レベルの平均値や標準偏差等の統計的数値に基づき、適宜決定すれば良い。
例えば、本発明の標的遺伝子又はその発現産物がポジティブマーカーとなる場合、該マーカーの発現レベルが参照値よりも高い場合、被験者には疲労が存在する(すなわち被験者の疲労度は高い)として検出され得、そうでない場合、被験者には疲労が存在しない(すなわち被験体の疲労度は健常)と検出され得る。例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値と比べて統計学的に有意に高ければ、該被験者には疲労が存在すると検出され得、そうでない場合、被験体に疲労が存在しないと検出され得る。また例えば、被験体における標的遺伝子又はその発現産物の発現レベルが参照値に対して、好ましくは110%以上、より好ましくは120%以上、さらに好ましくは150%以上であれば、該被験者には疲労が存在するとして検出され得、そうでない場合、被験者には疲労が存在しないと検出され得る。
一方、本発明の標的遺伝子又はその発現産物がネガティブマーカーとなる場合、該マーカーの発現レベルが参照値よりも低い場合、被験者には疲労が存在するとして検出され得、そうでない場合、被験者には疲労が存在しないと検出され得る。例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値と比べて統計学的に有意に低ければ、該被験者には疲労が存在するとして検出され得、そうでない場合、被験者には疲労が存在しないと検出され得る。また例えば、被験者における標的遺伝子又はその発現産物の発現レベルが参照値に対して、好ましくは90%以下、より好ましくは80%以下、さらに好ましくは75%以下であれば、該被験者には疲労が存在するとして検出され得、そうでない場合、被験者には疲労が存在しないと検出され得る。
あるいは、複数の標的遺伝子又はその発現産物を組み合わせて用いる場合には、それらの標的遺伝子又はその発現産物の一定割合、例えば50%以上、好ましくは70%以上、より好ましくは90%以上、さらに好ましくは100%が上述した発現レベルの基準を満たすか否かに基づいて、被験者の疲労を検出することができる。
別の一実施形態においては、一被験者から本発明の標的遺伝子又はその発現産物の発現レベルを定期的に(例えば毎月)測定し、参照値を対照レベルとして、その発現レベルの変動を追跡することで、該被験者の疲労の推移を検出することができる。この場合の参照値には、予め決定した値、例えば、同じ被験者から複数回測定した標的遺伝子又はその発現産物の発現レベルの統計値(例えば平均値)から該参照値を算出してもよい。あるいは、該参照値は、参照集団(疲労度が任意である個体からなる群)、又は健常群(疲労度が健常範囲[例えば前述したCFSのスコアが15点未満]である個体からなる群)、又は高疲労群(疲労度が高疲労範囲[例えば前述したCSFのスコアが15点以上又は18点以上]である個体からなる群)から測定した本発明の標的遺伝子又はその発現産物の発現レベルの統計値(例えば平均値など)に基づいて決定することができる。本発明の標的遺伝子又はその発現産物として複数種を用いる場合は、各々の標的遺伝子又はその発現産物について参照値を求めることが好ましい。
さらに、疲労度が高い個体(高疲労群)由来の標的遺伝子又はその発現産物の発現レベルと、疲労度が低い個体(低疲労群)由来の標的遺伝子又はその発現産物の発現レベルの測定値(発現プロファイル)を利用して、疲労が存在するか否かを分ける判別式(予測モデル)を構築し、当該判別式を利用して、疲労を検出することができる。
すなわち、高疲労群由来の標的遺伝子又はその発現産物の発現レベルと、健常又は低疲労群由来の標的遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高疲労群と健常又は低疲労群を分ける判別式(予測モデル)を構築し、当該判別式に基づいて疲労の存在又は不存在を判別する参照値(カットオフ値)を求める。なお、判別式の作成においては、主成分分析(PCA)により次元圧縮を行ない、主要成分を説明変数とすることができる。
そして、被験者の頭皮から採取されたSSLから標的遺伝子又はその発現産物のレベルを同様に測定し、得られた測定値を当該判別式に代入し、当該判別式から得られた結果を参照値と比較することによって、被検者における疲労の存在又は非存在を評価できる。
すなわち、高疲労群由来の標的遺伝子又はその発現産物の発現レベルと、健常又は低疲労群由来の標的遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高疲労群と健常又は低疲労群を分ける判別式(予測モデル)を構築し、当該判別式に基づいて疲労の存在又は不存在を判別する参照値(カットオフ値)を求める。なお、判別式の作成においては、主成分分析(PCA)により次元圧縮を行ない、主要成分を説明変数とすることができる。
そして、被験者の頭皮から採取されたSSLから標的遺伝子又はその発現産物のレベルを同様に測定し、得られた測定値を当該判別式に代入し、当該判別式から得られた結果を参照値と比較することによって、被検者における疲労の存在又は非存在を評価できる。
判別式の構築に用いる変数には説明変数と目的変数がある。説明変数としては、例えば、下記の方法で選択した標的遺伝子又はその発現産物の発現レベル(特徴量)を用いることができる。目的変数としては、例えば、そのサンプルに疲労が存在する(高疲労)かそうではない(健常又は低疲労)か、を用いることができる。
特徴量の選択には、判別する2群間の統計学的に有意な差異、例えば、発現レベルが2群間で有意に変動する遺伝子(発現変動遺伝子)又はその発現産物の発現レベルを用いることができる。また、機械学習に用いるアルゴリズムなどの公知のものを利用して特徴量遺伝子を抽出し、その発現レベルを用いたりすることができる。例えば、下記に示すランダムフォレストにおける変数重要度の高い遺伝子またはその発現産物の発現レベルを用いたり、R言語の“Boruta”パッケージなどを用いて特徴量遺伝子を抽出し、その発現レベルを用いたりすることができる。
判別式の構築におけるアルゴリズムは、機械学習に用いるアルゴリズムなどの公知のものを利用することができる。機械学習アルゴリズムの例としては、ランダムフォレスト(Random forest)、線形カーネルのサポートベクターマシン(SVM linear)、rbfカーネルのサポートベクターマシン(SVM rbf)ニューラルネットワーク(Nerural net)、一般線形モデル(Generalized linear model)、正則化線形判別分析(Regularized linear discriminant analysis)、正則化ロジスティック回帰(Regularized logistic regression)などが挙げられる。構築した予測モデルに検証用のデータを入力して予測値を算出し、該予測値が実測値と最も適合するモデル、例えば正解率(Accuracy)が最も大きいモデルを最適な予測モデルとして選抜することができる。また、予測値と実測値から検出率(Recall)、精度(Precision)、及びそれらの調和平均であるF値を計算し、そのF値が最も大きいモデルを最適な予測モデルとして選抜することができる。
判別式の構築においてランダムフォレストのアルゴリズムを使用する場合、予測モデルの精度の指標として、未知データに対する推定の誤答率(OOB error rate)を算出することができる(Breiman L. Machine Learning (2001) 45;5-32)。
ランダムフォレストにおいては、ブートストラップ法という手法に従い、全サンプル中から重複を許して、サンプル数の約3分の2のサンプルをランダムに抽出し、決定木と呼ばれる分類器を作成する。この時抽出されなかったサンプルはOut of bug(OOB)と呼ばれ、1本の決定木を用いて、OOBの目的変数の予測を行い、正解ラベルと比較することでその誤答率を算出することができる(決定木におけるOOB error rate)。同様の作業を500回繰り返し行い、500本の決定木におけるOOB error rateの平均値をとった値を、該ランダムフォレストのモデルのOOB error rateとすることができる。
なお、ランダムフォレストのモデルを構築する決定木の数(ntree値)は、デフォルトでは500本であるが、必要に応じて1本から任意の本数に変更することができる。さらに、1つの決定木においてサンプルの判別式の作成に用いる変数の数(mtry値)は、デフォルトでは説明変数の数の平方根をとった値であるが、必要に応じて1つから全説明変数の数までの値のいずれかに変更することができる。
mtry値の決定にはR言語の“caret”パッケージを用いることができる。“caret”パッケージのメソッドにランダムフォレストを指定し、8通りのmtry値を試行し、例えばAccuracyが最大となるmtry値を最適なmtry値として選択することができる。なお、mtry値の試行回数は、必要に応じて任意の試行回数に変更することができる。
判別式の構築においてランダムフォレストのアルゴリズムを使用する場合、モデルの構築に用いた説明変数の重要度を数値(変数重要度)化することができる。変数重要度の値には、例えば、ジニ係数の減少量(Mean Decrease Gini)を用いることができる。
カットオフ値(参照値)の決定方法は特に制限されず、公知の手法に従って決定することができる。例えば、判別式を使用して作成されたROC(Receiver Operating Characteristic Curve)曲線より求めることができる。ROC曲線では、縦軸に陽性被験者において陽性の結果がでる確率(感度)と、横軸に陰性被験者において陰性の結果がでる確率(特異度)を1から減算した値(偽陽性率)がプロットされる。ROC曲線に示される「真陽性(感度)」及び「偽陽性(1-特異度)」に関し、「真陽性(感度)」-「偽陽性(1-特異度)」が最大となる値(Youden index)をカットオフ値(参照値)とすることができる。
本発明の疲労の検出に用いられる予測モデルを構築するための特徴量遺伝子としては、例えば、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群、当該12種の遺伝子を全て含む後記表4で示される164遺伝子からなる遺伝子群、当該12種のうちのASS1、VMA21、SMPD3、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる9種を含む後記表1で示される85遺伝子からなる遺伝子群、当該12種のうちのASS1、VMA21、SMPD、ANP32E、ARAP3、TUBA1及びRNF139からなる7種を含む後記表2で示される69種の遺伝子からなる遺伝子群、当該12種のうちのANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707、ANP32E、ARAP3、TUBA1及びRNF139からなる9種を含む、後記表3で示される23種の遺伝子からなる遺伝子群が挙げられる。
また、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子のうちASS1、VMA21、SMPD3、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる9種の遺伝子群から選択される遺伝子と、後記表1で示される85種のうち当該9種を除いた76種の遺伝子群(前記表1A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。
また、上記12種の遺伝子のうちASS1、VMA21、SMPD、ANP32E、ARAP3、TUBA1及びRNF139からなる7種の遺伝子群から選択される遺伝子と、後記表2で示される69種のうち当該7種を除いた62種の遺伝子群(前記表2A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。ここで、前記表2Aで示される遺伝子群から選択される遺伝子は、変数重要度のより上位の遺伝子から順に、あるいは変数重要度が上位から50位以内、好ましくは30位以内の遺伝子から選択するのが好ましい。
また、上記10種の遺伝子のうち、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707、ANP32E、ARAP3、TUBA1及びRNF139からなる9種の遺伝子群から選択される遺伝子と、後記表3で示される23種のうち当該9種を除いた14種の遺伝子群(前記表3A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。
また、上記12種の遺伝子群から選択される遺伝子と、後記表4で示される164種のうち当該12種を除いた152種の遺伝子群(前記表4A)から選択される少なくとも1つの遺伝子又を組み合わせて特徴量遺伝子とすることができる。
また、上記12種の遺伝子のうちASS1、VMA21、SMPD、ANP32E、ARAP3、TUBA1及びRNF139からなる7種の遺伝子群から選択される遺伝子と、後記表2で示される69種のうち当該7種を除いた62種の遺伝子群(前記表2A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。ここで、前記表2Aで示される遺伝子群から選択される遺伝子は、変数重要度のより上位の遺伝子から順に、あるいは変数重要度が上位から50位以内、好ましくは30位以内の遺伝子から選択するのが好ましい。
また、上記10種の遺伝子のうち、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707、ANP32E、ARAP3、TUBA1及びRNF139からなる9種の遺伝子群から選択される遺伝子と、後記表3で示される23種のうち当該9種を除いた14種の遺伝子群(前記表3A)から選択される少なくとも1つの遺伝子を組み合わせて特徴量遺伝子とすることができる。
また、上記12種の遺伝子群から選択される遺伝子と、後記表4で示される164種のうち当該12種を除いた152種の遺伝子群(前記表4A)から選択される少なくとも1つの遺伝子又を組み合わせて特徴量遺伝子とすることができる。
上述した本発明の疲労の検出方法は、疲労に対する予防又は治療的介入の存在下で実施することにより当該介入の効果を評価することができる。
すなわち、本発明の介入効果の評価方法は、疲労に対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む。
すなわち、本発明の介入効果の評価方法は、疲労に対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む。
ここで、疲労に対する予防又は治療的介入とは、疲労に対して予防又は治療的効果を期待して実施される介入であり、化学的介入、物理的又は機械的介入が包含される。化学的介入としては、天然物質、合成物質、組成物等の物質の投与が挙げられ、物理的又は機械的介入としては、電磁波、光等の照射、温熱付与、マッサージなどの施術が挙げられる。
介入効果の評価は、介入によって生じる被験者の標的遺伝子又はその発現産物のレベル、更にはそれに基づく疲労の変化に基づいて評価することができる。
例えば、介入存在下における被験者の標的遺伝子又はその発現産物のレベル、更にはそれに基づく疲労状態を、対照(介入非存在下)と比較することで、その効果を評価することが挙げられる。そして、被験者の疲労状態を低下するような介入は、疲労の予防又は治療、すなわち抗疲労のために有効な介入と評価できる。
例えば、介入存在下における被験者の標的遺伝子又はその発現産物のレベル、更にはそれに基づく疲労状態を、対照(介入非存在下)と比較することで、その効果を評価することが挙げられる。そして、被験者の疲労状態を低下するような介入は、疲労の予防又は治療、すなわち抗疲労のために有効な介入と評価できる。
疲労検出用キット又は介入効果の評価用キットは、本発明による疲労の検出方法に従って被験者の疲労を検出するためのキット、及び本発明による介入効果の評価方法に従って介入効果を評価するためのキットである。
本発明のキットは、SSLの採取及び保存に必要な用具及び試薬、標的遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する。
SSLの採取及び保存に必要な用具及び試薬としては、例えば、SSLを採取するための脂取りフィルム、採取したSSLを保存するための試薬、保存用の容器等が挙げられる。
標的遺伝子又はその発現産物の発現レベルを測定するための試薬としては、例えば採取したSSLからRNAを抽出・精製するための試薬、標的遺伝子に由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー、シーケンシング用アダプター配列等)を含む、核酸増幅又はハイブリダイゼーションのための試薬、遺伝子発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤、ポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、試験に必要な器具の他、標的遺伝子又はその発現産物の発現レベルを検出するための指標又はガイダンス等が包含される。
本発明のキットは、SSLの採取及び保存に必要な用具及び試薬、標的遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する。
SSLの採取及び保存に必要な用具及び試薬としては、例えば、SSLを採取するための脂取りフィルム、採取したSSLを保存するための試薬、保存用の容器等が挙げられる。
標的遺伝子又はその発現産物の発現レベルを測定するための試薬としては、例えば採取したSSLからRNAを抽出・精製するための試薬、標的遺伝子に由来する核酸と特異的に結合(ハイブリダイズ)するオリゴヌクレオチド(例えば、PCR用のプライマー、シーケンシング用アダプター配列等)を含む、核酸増幅又はハイブリダイゼーションのための試薬、遺伝子発現産物(タンパク質)を認識する抗体を含む免疫学的測定のための試薬の他、標識試薬、緩衝液、発色基質、二次抗体、ブロッキング剤、ポジティブコントロールやネガティブコントロールとして使用するコントロール試薬、試験に必要な器具の他、標的遺伝子又はその発現産物の発現レベルを検出するための指標又はガイダンス等が包含される。
本発明においては上述した実施形態に関し、さらに以下の態様が開示される。
<1>被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における疲労の検出方法。
<2>前記12種の遺伝子のうちのASS1、VMA21、SMPD3、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる9種の遺伝子群から選択される遺伝子と、前記表1Aで示される76種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<3>前記12種の遺伝子のうちのASS1、VMA21、SMPD、ANP32E、ARAP3、TUBA1及びRNF139からなる7種の遺伝子群から選択される遺伝子と、前記表2Aで示される62種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<4>前記12種の遺伝子のうちのANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707、ANP32E、ARAP3、TUBA1及びRNF139からなる9種の遺伝子群から選択される遺伝子と、前記表3Aで示される14種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<5>前記12種の遺伝子群から選択される遺伝子と、前記表4Aで示される152種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<6>遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、<1>~<5>のいずれかの方法。
<7>発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、疲労の存在又は不存在を評価する、<1>~<6>のいずれかの方法。
<8>高疲労群由来の前記遺伝子又はその発現産物の発現レベルと、健常又は低疲労群由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高疲労群と健常又は低疲労群を分ける判別式を作成し、被験者の頭皮から採取された皮膚表上脂質から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者における疲労の存在又は不存在を評価する、<1>~<6>のいずれかの方法。
<9>疲労に対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
<10>SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、<1>~<8>のいずれかの方法に用いられる疲労検出用キット又は<9>の方法に用いられる介入効果の評価用キット。
<11>ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる疲労マーカー。
<12>ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の、疲労マーカーとしての使用。
<1>被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における疲労の検出方法。
<2>前記12種の遺伝子のうちのASS1、VMA21、SMPD3、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる9種の遺伝子群から選択される遺伝子と、前記表1Aで示される76種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<3>前記12種の遺伝子のうちのASS1、VMA21、SMPD、ANP32E、ARAP3、TUBA1及びRNF139からなる7種の遺伝子群から選択される遺伝子と、前記表2Aで示される62種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<4>前記12種の遺伝子のうちのANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707、ANP32E、ARAP3、TUBA1及びRNF139からなる9種の遺伝子群から選択される遺伝子と、前記表3Aで示される14種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<5>前記12種の遺伝子群から選択される遺伝子と、前記表4Aで示される152種の遺伝子群から選択される少なくとも1つの遺伝子又はその発現産物の発現レベルが測定される、<1>の方法。
<6>遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、<1>~<5>のいずれかの方法。
<7>発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、疲労の存在又は不存在を評価する、<1>~<6>のいずれかの方法。
<8>高疲労群由来の前記遺伝子又はその発現産物の発現レベルと、健常又は低疲労群由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高疲労群と健常又は低疲労群を分ける判別式を作成し、被験者の頭皮から採取された皮膚表上脂質から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者における疲労の存在又は不存在を評価する、<1>~<6>のいずれかの方法。
<9>疲労に対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
<10>SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、<1>~<8>のいずれかの方法に用いられる疲労検出用キット又は<9>の方法に用いられる介入効果の評価用キット。
<11>ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる疲労マーカー。
<12>ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の、疲労マーカーとしての使用。
以下、実施例に基づき本発明をさらに詳細に説明するが、本発明はこれに限定されるものではない。
実施例1 発現変動遺伝子を用いた疲労状態判別モデルの構築
1)被験者の選抜及びSSL採取
20~60歳代の健常な男女72名に、チャルダー疲労質問票に回答させ、そのスコアが18点以上の16名の疲労度の高い方々を疲労群の被験者として選抜し、7点以下の13名の疲労度の低い方々を健常群の被験者として選抜した。両群合わせて29名の各被験者の頭部からあぶら取りフィルム(5cm×8cm、ポリプロピレン製、3M社)を用いて皮脂を採取した。採取に当たっては当日の整髪料等の毛髪化粧料の使用を禁止した。皮脂は、毛髪をかき分けてからその根元の頭皮を擦るように採取し、これを頭部全体で数回繰り返して採取した。皮脂を採取したあぶら取りフィルムはガラスバイアルに移し、RNA抽出に使用するまで-80℃で保存した。
実施例1 発現変動遺伝子を用いた疲労状態判別モデルの構築
1)被験者の選抜及びSSL採取
20~60歳代の健常な男女72名に、チャルダー疲労質問票に回答させ、そのスコアが18点以上の16名の疲労度の高い方々を疲労群の被験者として選抜し、7点以下の13名の疲労度の低い方々を健常群の被験者として選抜した。両群合わせて29名の各被験者の頭部からあぶら取りフィルム(5cm×8cm、ポリプロピレン製、3M社)を用いて皮脂を採取した。採取に当たっては当日の整髪料等の毛髪化粧料の使用を禁止した。皮脂は、毛髪をかき分けてからその根元の頭皮を擦るように採取し、これを頭部全体で数回繰り返して採取した。皮脂を採取したあぶら取りフィルムはガラスバイアルに移し、RNA抽出に使用するまで-80℃で保存した。
2)RNA調製及びシーケンシング
上記1)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出したRNAは、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃で90分間逆転写し、cDNAを合成した。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、及び増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。シーケンシングで得られた各リード配列をヒトゲノムのリファレンス配列であるhg19 AmpliSeq Transcriptome ERCC v1を用いて遺伝子マッピングすることで各リード配列の由来する遺伝子を決定した。
上記1)のあぶら取りフィルムを適当な大きさに切断し、QIAzol Lysis Reagent(Qiagen)を用いて、付属のプロトコルに準じてRNAを抽出した。抽出したRNAは、SuperScript VILO cDNA Synthesis kit(ライフテクノロジーズジャパン株式会社)を用いて42℃で90分間逆転写し、cDNAを合成した。逆転写反応のプライマーには、キットに付属しているランダムプライマーを使用した。得られたcDNAから、マルチプレックスPCRにより20802遺伝子に由来するDNAを含むライブラリーを調製した。マルチプレックスPCRは、Ion AmpliSeqTranscriptome Human Gene Expression Kit(ライフテクノロジーズジャパン株式会社)を用いて、[99℃、2分→(99℃、15秒→62℃、16分)×20サイクル→4℃、Hold]の条件で行った。得られたPCR産物は、Ampure XP(ベックマン・コールター株式会社)で精製した後に、バッファーの再構成、プライマー配列の消化、アダプターライゲーションと精製、及び増幅を行い、ライブラリーを調製した。調製したライブラリーをIon 540 Chipにローディングし、Ion S5/XLシステム(ライフテクノロジーズジャパン株式会社)を用いてシーケンシングした。シーケンシングで得られた各リード配列をヒトゲノムのリファレンス配列であるhg19 AmpliSeq Transcriptome ERCC v1を用いて遺伝子マッピングすることで各リード配列の由来する遺伝子を決定した。
3)データ解析及び特徴量遺伝子の選択
上記2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、DESeq2という手法を用いて補正した。但し、全被験者の発現レベルデータのうち90%以上の被験者で欠損値ではない発現レベルデータが得られた7963遺伝子のみ以下の解析に使用した。解析では、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用い、群間(健常群及び疲労群)で尤度比検定によるp値の補正値(FDR)が0.05未満である遺伝子を抽出した。その結果、表1に示す、群間で統計学的に有意に発現レベルが変動する85種の遺伝子が得られた。表1のUPで示される52遺伝子は、疲労群で発現レベルがより高かったことから、疲労群でその発現レベルが高いマーカー(ポジティブマーカー)であった。表1のDOWNで示される33遺伝子は、疲労群で発現レベルがより低かったことから、疲労群でその発現レベルが低いマーカー(ネガティブマーカー)であった。これらの遺伝子を以下の予測モデル構築に用いる特徴量遺伝子として選択した。
上記2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、DESeq2という手法を用いて補正した。但し、全被験者の発現レベルデータのうち90%以上の被験者で欠損値ではない発現レベルデータが得られた7963遺伝子のみ以下の解析に使用した。解析では、DESeq2という手法を用いて補正されたカウント値(Normalized count値)を用い、群間(健常群及び疲労群)で尤度比検定によるp値の補正値(FDR)が0.05未満である遺伝子を抽出した。その結果、表1に示す、群間で統計学的に有意に発現レベルが変動する85種の遺伝子が得られた。表1のUPで示される52遺伝子は、疲労群で発現レベルがより高かったことから、疲労群でその発現レベルが高いマーカー(ポジティブマーカー)であった。表1のDOWNで示される33遺伝子は、疲労群で発現レベルがより低かったことから、疲労群でその発現レベルが低いマーカー(ネガティブマーカー)であった。これらの遺伝子を以下の予測モデル構築に用いる特徴量遺伝子として選択した。
4)モデル構築
3)で選択した85の特徴量遺伝子の発現レベルデータとして、2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。得られた85の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、健常群と疲労群を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rateを算出した。その結果、85遺伝子全ての発現レベルデータを変数に用いた場合のモデルではOOB error rateは20.7%であり、表1に示す遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
3)で選択した85の特徴量遺伝子の発現レベルデータとして、2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。得られた85の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、健常群と疲労群を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rateを算出した。その結果、85遺伝子全ての発現レベルデータを変数に用いた場合のモデルではOOB error rateは20.7%であり、表1に示す遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
実施例2 ランダムフォレスト変数重要度の高い遺伝子を用いた疲労状態判別モデルの構築
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた7963種の遺伝子を以下の解析に使用した。解析では、遺伝子の発現レベルデータとして、実施例1の2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた7963種の遺伝子を以下の解析に使用した。解析では、遺伝子の発現レベルデータとして、実施例1の2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
2)特徴量遺伝子の選択
ランダムフォレストのアルゴリズムを用いて、予測モデル構築に用いる特徴量遺伝子の選択を行った。1)で得られた7963遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、ジニ係数に基づく変数重要度の上位69遺伝子を算出した(表2)。これら69遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
ランダムフォレストのアルゴリズムを用いて、予測モデル構築に用いる特徴量遺伝子の選択を行った。1)で得られた7963遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、ジニ係数に基づく変数重要度の上位69遺伝子を算出した(表2)。これら69遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
3)モデル構築
2)で選択した69の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、69遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは27.6%であり、表2に示す遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
2)で選択した69の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、69遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは27.6%であり、表2に示す遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
実施例3 Boruta法により抽出した特徴量遺伝子を用いた疲労状態判別モデルの構築
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた7963種の遺伝子を以下の解析に使用した。解析では、遺伝子の発現レベルデータとして、実施例1の2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
1)使用データ
実施例1の3)で取得した90%以上の被験者で欠損値ではない発現レベルデータが得られた7963種の遺伝子を以下の解析に使用した。解析では、遺伝子の発現レベルデータとして、実施例1の2)で測定した被験者由来のRNAの発現レベルのデータ(リードカウント値)を、サンプル間の総リードカウントの違いを補正するため、各リードカウントをRPM(Reads per million mapped reads)値に変換したものを用い、負の二項分布に従うRPM値から正規分布に近似するため、整数1を加算した底2の対数値(Log2(RPM+1)値)に変換した。
2)特徴量遺伝子の選択
1)で得られた7963遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、R言語の“Boruta”パッケージのアルゴリズムを実行し、疲労状態を判別する予測モデルを構築した。最大試行回数を1000回とし、p値が0.01未満である23遺伝子を算出した(表3)。これら23遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
1)で得られた7963遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、R言語の“Boruta”パッケージのアルゴリズムを実行し、疲労状態を判別する予測モデルを構築した。最大試行回数を1000回とし、p値が0.01未満である23遺伝子を算出した(表3)。これら23遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
3)モデル構築
2)で選択した23の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、23遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは20.7%であり、表3に示す遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
2)で選択した23の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、23遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは20.7%であり、表3に示す遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
実施例4 実施例1~3で重複して用いられた特徴量遺伝子に基づく疲労状態判別モデルの構築
1)特徴量遺伝子の選択
実施例1~3で用いられた特徴量遺伝子のうち、実施例間で重複して用いられた遺伝子は、実施例1と2で重複して用いられたASS1、VMA21及びSMPD3の3遺伝子、実施例2と実施例3で重複して用いられたANP32E、ARAP3及びTUBA1Cの3遺伝子、実施例1と3で重複して用いられたANXA2、KRTAP10_8、SPRED1、SUPT7L及びZNF707の5遺伝子、実施例1~3の全てで重複して用いられたRNF139の計12遺伝子であった。これら12遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
1)特徴量遺伝子の選択
実施例1~3で用いられた特徴量遺伝子のうち、実施例間で重複して用いられた遺伝子は、実施例1と2で重複して用いられたASS1、VMA21及びSMPD3の3遺伝子、実施例2と実施例3で重複して用いられたANP32E、ARAP3及びTUBA1Cの3遺伝子、実施例1と3で重複して用いられたANXA2、KRTAP10_8、SPRED1、SUPT7L及びZNF707の5遺伝子、実施例1~3の全てで重複して用いられたRNF139の計12遺伝子であった。これら12遺伝子を予測モデル構築に用いる特徴量遺伝子として選択した。
2)モデル構築
1)で選択した12の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、12遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは24.1%であり、上記12遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
1)で選択した12の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、12遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは24.1%であり、上記12遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
実施例5 実施例1~3で用いられた全ての特徴量遺伝子に基づく疲労状態の判別モデルの構築
1)特徴量遺伝子の選択
実施例1~3のいずれかで用いられた特徴量遺伝子の全て(表4に示された計164種の遺伝子)を予測モデル構築に用いる特徴量遺伝子として選択した。
1)特徴量遺伝子の選択
実施例1~3のいずれかで用いられた特徴量遺伝子の全て(表4に示された計164種の遺伝子)を予測モデル構築に用いる特徴量遺伝子として選択した。
2)モデル構築
1)で選択した164の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、164遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは27.6%であり、表4の164遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
1)で選択した164の特徴量遺伝子の発現レベルデータのLog2(RPM+1)値を説明変数とし、疲労状態(健常群か疲労群か)を目的変数として用いて、疲労状態を判別する予測モデルを構築した。R言語の“caret”パッケージにおいてランダムフォレストのアルゴリズムをメソッドとして指定し、1回の決定木の構築に用いる変数の数(mtry値)の最適値をチューニングした。チューニングによって決定したmtry値を用いて、ランダムフォレストのアルゴリズムを実行し、推定誤答率(OOB error rate)を算出した。その結果、164遺伝子の発現レベルデータを変数に用いた場合のモデルではOOB error rateは27.6%であり、表4の164遺伝子を、疲労を検出するためのマーカーとして使用できることが示された。
Claims (11)
- 被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定する工程を含む、当該被験者における疲労の検出方法。
- 遺伝子又はその発現産物の発現レベルがmRNAの発現量の測定である、請求項1~5のいずれか1項記載の方法。
- 発現レベルの測定値を前記各遺伝子又はその発現産物の参照値と比較し、疲労の存在又は不存在を評価する、請求項1~6のいずれか1項記載の方法。
- 高疲労群由来の前記遺伝子又はその発現産物の発現レベルと、健常又は低疲労群由来の同遺伝子又はその発現産物の発現レベルの測定値を教師サンプルとして、高疲労群と健常又は低疲労群を分ける判別式を作成し、被験者の頭皮から採取された皮膚表上脂質から得られた同遺伝子又はその発現産物の発現レベルの測定値を当該判別式に代入し、得られた結果を参照値と比較することによって、被検者における疲労の存在又は不存在を評価する、請求項1~6のいずれか1項記載の方法。
- 疲労に対する予防又は治療的介入の存在下、被験者の頭皮から採取された皮膚表上脂質について、ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる12種の遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物の発現レベルを測定することを含む、当該介入効果の評価方法。
- SSLの採取及び保存に必要な用具及び試薬、並びにSSLから前記遺伝子又はその発現産物の発現レベルを測定するための試薬を含有する、請求項1~8のいずれか1項記載の方法に用いられる疲労検出用キット又は請求項9記載の方法に用いられる介入効果の評価用キット。
- ASS1、VMA21、SMPD3、ANP32E、ARAP3、TUBA1C、ANXA2、KRTAP10_8、SPRED1、SUPT7L、ZNF707及びRNF139からなる遺伝子群より選択される少なくとも1つの遺伝子又はその発現産物からなる疲労マーカー。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021158338A JP2023048811A (ja) | 2021-09-28 | 2021-09-28 | 疲労の検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021158338A JP2023048811A (ja) | 2021-09-28 | 2021-09-28 | 疲労の検出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023048811A true JP2023048811A (ja) | 2023-04-07 |
Family
ID=85779817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021158338A Pending JP2023048811A (ja) | 2021-09-28 | 2021-09-28 | 疲労の検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023048811A (ja) |
-
2021
- 2021-09-28 JP JP2021158338A patent/JP2023048811A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20250137066A1 (en) | Compostions and methods for diagnosing lung cancers using gene expression profiles | |
WO2021230379A1 (ja) | パーキンソン病の検出方法 | |
JP2023157965A (ja) | アトピー性皮膚炎の検出方法 | |
WO2022220298A1 (ja) | 乳幼児おむつ皮膚炎の症度の検出方法 | |
JP2022016416A (ja) | アトピー性皮膚炎の重症度の検出方法 | |
JP2023002298A (ja) | 糖尿病指標値の検出方法 | |
JP2023048811A (ja) | 疲労の検出方法 | |
JP2022049694A (ja) | 乳幼児アトピー性皮膚炎の検出方法 | |
JP2023048810A (ja) | 慢性ストレスレベルの検出方法 | |
US20210087634A1 (en) | Determination of risk for development of cardiovascular disease by measuring urinary levels of podocin and nephrin messenger rna | |
CN116635526A (zh) | 特应性皮炎的重症度的检测方法 | |
JP2023073135A (ja) | 更年期障害の重症度の検出方法 | |
JP2023073134A (ja) | ホットフラッシュの検出方法 | |
WO2022220299A1 (ja) | 乳幼児顔湿疹の症度の検出方法 | |
JP2023045067A (ja) | 不眠の検出方法 | |
WO2008048795A2 (en) | Methods for determining collateral artery development in coronary artery disease | |
JP2021175382A (ja) | 乳幼児アトピー性皮膚炎の検出方法 | |
CN116377053B (zh) | 冠状动脉扩张症的诊断生物标志物及其应用 | |
JP7655721B2 (ja) | 疲労マーカー及びそれを用いた疲労の検出方法 | |
JP2022134127A (ja) | アトピー性皮膚炎による皮膚痒みの症度悪化の検出方法 | |
JP2022134126A (ja) | アトピー性皮膚炎の症度悪化の検出方法 | |
JP2024161911A (ja) | アトピー性皮膚炎の重症度の検出方法 | |
JP2024075099A (ja) | アンモニア代謝能力の検出方法 | |
JP2024045047A (ja) | 肥満改善剤の有効性予測方法 | |
JP2024045048A (ja) | 肥満改善剤の有効性予測方法 |