发明内容
基于现有技术背景,本发明提供了与牛血小板生成相关的SNP标记位点及其及其特异性引物与应用。
为实现上述目的,本发明是通过如下技术方案实现的:
本发明提供了与牛血小板生成相关的SNP标记位点,该SNP标记位点位于牛第1号染色体THPO基因第4内含子1316bp处,G1316T位点(chr1:83431707),碱基变异信息为T>G;该位点GG基因型个体血小板数(PLT)极显著高于GT或TT基因型个体,GG基因型个体的低氧耐受和高原适应能力显著高于GT或TT基因型个体。
上述SNP标记位点在检测牛高原适应能力或选育耐高原低氧环境的牛中的应用。
上述SNP标记位点在制备检测牛高原低氧环境适应性或选育耐高原低氧环境牛的试剂盒中的应用。
本发明还提供了一种检测牛低氧环境适应性的方法:以待测牛的全基因组DNA为模板,检测上述SNP标记位点;若该位点为GG基因型,则待测牛的低氧耐受和高原适应能力较好,判定为低氧耐受优势型;若该位点为GT或TT基因型,则待测牛的低氧耐受和高原适应能力较弱,判定为低氧耐受劣势型。
本发明还提供了一种选育耐高原低氧环境牛的方法,通过检测上述SNP标记位点,选择THPO基因G1316T位点基因型为GG型的个体作为育种亲本。
用于检测上述SNP标记位点的PCR引物:上游引物THPO-F为
CCAGGGACAGAAGAGAC;下游引物THPO-R为GGCGAACTCAGAGATTG。
进一步的,引物PCR扩增反应条件如下:引物PCR扩增反应条件如下:95℃预变性5min;95℃变性45s,59℃退火45s,72℃延伸45s,35个循环;72℃后延伸8min。
本发明还提供了一种辅助选育耐高原低氧环境牛的试剂盒,其包含上述PCR引物。
本发明的有益效果:
本发明提供的SNP标记位于牛第1号染色体THPO基因第4内含子1316bp处,G1316T位点,碱基变异信息为T>G;纯合高地型GG血小板数(PLT)极显著高于杂合子GT和纯合低地型TT(P<0.01),其余指标差异不显著,表明GG基因型可增加血小板数;GG基因型个体的低氧耐受和高原适应能力显著高于GT或TT基因型个体。THPO基因对巨核细胞的增殖、分化、成熟以及血小板生成具有重要作用,因为高海拔低压,高含量血小板可能有助于提高动物因打架等出血性损伤的止血能力。本发明提供的与牛血小板生成和低氧耐受相关的THPO基因上的SNP位点可作为牛低氧耐受和高原适应能力、选育耐高原低氧环境的分子标记,同时对牛特色基因的保存和利用也具有重要意义。
具体实施方式
为了使本发明的目的、技术方案和有益效果更加清楚,下面将对本发明的优选实施例进行详细的说明,以方便技术人员理解。
实施例
1.实验动物及血液样本采集
本发明选择5个海拔梯度分布的藏黄牛和云南本地黄牛共100头用于全基因组重测序,使用MEMEA、FST两种分析方法筛选高原牛低氧适应性SNPs和候选基因。候选基因中发现与牛血小板生成相关的THPO基因存在海拔趋势SNP。在筛选到低氧正选择关联基因及其海拔趋势位点的基础上,选择牦牛139头、中等海拔本地黄牛296头测量其血液生理指标并进行SNP位点分型,样本信息详见表1。
表1血液生理指标测定及SNP位点验证样品信息
2实验方法
2.1血液样本采集及生理指标测定
使用含有EDTA抗凝剂的真空采血管从牛颈静脉采集5ml血液,共535个样本。采集完后迅速放入冰盒中保存,血液生理指标测定在12小时内完成。
新鲜的血液使用兽用全自动血液分析仪(BC-2800Vet)和自动血流变测试仪(ZL6000)进行测定。血液生理指标的测定包括11项血常规指标和13项血液粘稠度指标,详细信息见下表。
表2需测定血液生理指标
2.2基因组DNA的提取
使用天根血液基因组DNA提取试剂盒并按说明书进行操作。
2.3基因组DNA的检测
使用1%的琼脂糖凝胶进行DNA检测,琼脂糖凝胶在配置时需加入核酸染料,使用的Maker为DL2000。在1×TAE缓冲液中以120V电压电泳30min左右。电泳完成后使用凝胶成像系统观察并拍照,保存DNA结果图片。
3牛全基因组重测序、序列比对以及SNP calling
检测合格的DNA样品被打断成300~500bp片段,接着进行末端修饰,加上Illumina测序接头,通过2%的凝胶电泳选择400~500bp的产物,接着进行LM-PCR扩增,进行测序文库制备。文库测序采用的是Illumina HiSeq 2000进行双端测序,由Illumina HiSeqControl Software软件控制整个流程。将测序获得的片段进行质量检测,把末端质量值小于20,长度小于35的片段过滤掉。将剩下的通过质量检测的片段用BWA软件将之比对到黄牛参考基因组(Bos taurus UMD 3.1),参数为“mem-k 32-w 10-B 3-O 11-E 4-t20”,接着用samtools软件对比对的bam文件进行排序和过滤。为了获得高质量的变异信息,采用GATK工具集进行SNP calling。首先利用GATK的HaplotypeCaller包来得到每个个体包含每个位点比对信息的g.vcf文件。接着利用GenotypeGVCFs包,参数设为“-stand_call_conf 30.0”,合并所有个体的g.vcf并获得原始的变异信息。最后用VariantFiltration过滤掉低质量的SNP,条件设为“QD<2.0,MQRankSum<-12.5,ReadPosRankSum<-8.0,DP<4,FS>60.0”,用python脚本过滤缺失值,保留缺失率小于0.1的SNP数据。然后从Ensemble上下载黄牛基因组gff文件,用ANNOVAR软件进行SNP注释。
4低氧适应选择信号分析
4.1MEMEA选择信号分析
基于群体遗传学方法,以环境适应性混合效应模型检测不同群体间受到环境适应性选择的遗传位点,环境因素引起的SNPs位点等位基因频率的改变,在滑窗模式下可以检测受不同环境选择压力的位点,具体模型见吴福泉(2018)。在该分析中将牛生活的海拔梯度作为环境变量,计算等位基因频率与海拔梯度的关联性。通过MEMEA模型,以每一个SNP为中心,前后物理位置长为10kb的窗口大小,在此区间赋予一个与环境相关的p值,提取该SNP上下游10kb附近的基因作为候选基因。将-log(P)值进行从大到小排序,选取Top 1%作为候选基因,分析结果如图1所示,从结果可见SPTB基因在前1%阈值内。
4.2FST选择信号分析
FST分析主要使用的是Vcftools(Danecek et al.,2011)软件,窗口设为10kb,步长设为5kb,高-低群体牛进行比较,其top1%的窗口被设为潜在的候选窗口,使用Ensemble网站(http://asia.ensembl.org/biomart/martview/)提取窗口相关基因作为候选基因。提取全基因组Top1%的基因进行富集分析功能注释,最终选择出有群体分化的基因候选位点,分析结果如图2所示。
4.3候选基因
将两种分析方法分别获得的候选基因取交集,寻找牛低氧适应相关基因,最终筛选到近10000个海拔关联位点,其中在1号染色体上检测到THPO基因有18个SNP位点,有13个SNPs等位基因频率随海拔的上升而明显升高,且chr1:83431707位点海拔趋势明显为同义突变(THPO基因第4内含子G1316T)(图3)。
5SNP标记位点的基因型检测
5.1THPO基因引物的设计与合成
为扩增牛chr1:83431707位点,根据UCSC数据库中公布的黄牛基因组数据(版本号Jun.2014(Bos-taurus_UMD_3.1.1/bosTau8)),以chr1:83431707位点为中心,下载左右各1000bp的碱基序列,将下载的DNA序列导入Premier5.0中进行引物设计,引物由昆明硕擎生物科技有限公司合成,引物信息见表3。
表3THPO基因引物信息
5.2PCR扩增程序
为保证PCR扩增效率,在扩增之前需对每对引物的PCR反应体系进行预试验,一般在保证模板DNA质量的前提下,主要针对退火温度进行调整,也可根据扩增片段的长短,对扩增各程序的反应时间和循环数做适当调整,以优化PCR反应体系。本试验的最佳PCR扩增体系见表4,最佳PCR扩增程序见表5。
表4基因组DNAPCR扩增体系
表5基因组DNAPCR扩增程序
5.3PCR扩增产物的检测
使用1%的琼脂糖凝胶对PCR扩增产物进行检测,将PCR扩增产物与花青素及buffer混匀后,用移液枪加入凝胶孔内,参照用5μLDNAMaker(DL2000)。在1×TAE缓冲液中以120V电压电泳约30min,电泳完成后使用凝胶成像系统观察并拍照保存。
5.4PCR产物的回收、纯化与测序
PCR产物由昆明擎科生物技术有限公司进行纯化和测序,将测序结果导入BioEdit中进行分析比对,寻找SNP位点。
6数据分析
所有的数据使用Excel按照平均数±3倍标准差剔除离群值进行初步处理,再用SAS软件及SPSS软件进行数据分析,表格中数据均用平均数±标准差表示,分析各指标之间是否具有显著性差异。
6.1等位基因频率和基因型频率的计算
等位基因频率(allelic frequency)是指在某一个群体中一个等位基因的数量占同一基因座的所有等位基因数量的比率,取值范围在0~1之间(张沅2001),其计算公式为:
Pi=(2Nii+Nij)/2N
其中,Pi为等位基因i的频率,Nii为基因型ii的个体数,Nij为基因型ij的个体数,N为样本数。
基因型频率(genotypic frequency)是指在二倍体的生物群体中,某一基因座的特定基因型在其全部基因型中占所的比例,取值范围在0~1之间(张沅2001),同一基因座的所有基因型的频率总和为1。计算公式为:
Pij=Nij/N
其中,Pij为基因型ij的频率,Nij为基因型ij的个体数,N为样本数。
6.2计算多态信息含量
多态信息含量(polymorphic information content,PIC)用于估计标记基因的多态性;其中PIC>0.5表示基因高度多态,0.25≤PIC≤0.5表示基因为中度多态,PIC≤0.25表示基因为低度多态(张沅2001)。PIC的计算公式如下:
其中,Pi和Pj分别表示在某一群体中第i和第j个等位基因的频率,n表示等位基因数。
6.3计算杂合度
群体的杂合度(heterozygosity,H)表示在一个群体中标记基因作为杂合子的比例,通过杂合度可以看出一个群体的遗传多样性(张沅2001)。其计算公式为:
其中,n为某一群体中标记基因位点的等位基因数;Pi表示某一群体中第i个等位基因的频率。
6.4Hardy-Weinberg平衡检验
先假设所我们所研究的群体处于Hardy-Weinberg平衡,然后根据理论上该群体的基因型频率计算出各基因型的理论个体数,最后根据各基因型的实际个体数和理论个体数计算出χ2(鲁绍雄and连林生2003)值:
其中,k表示在该群体中有k个基因型,Oi为第i基因型的实际个体数,Ei为第i基因型的理论个体数。将实际计算的χ2值与自由度为df=k-1的临界χ2值进行比较,并据此进行相应的统计推断。
6.5基因型与血液生理指标关联分析
经初步检验,发现基因型和性别、年龄之间无显著互作效应,因此不同基因型、性别、年龄的血液生理指标差异显著性采用三因素无互作最小二乘分析模型(鲁绍雄and连林生2003)进行分析,具体模型如下:
Yijk=μ+Gi+Hj+Sk+eijkl
其中,Yijk为生理指标观察值,μ为群体均值,Gi为THPO基因的第i基因型效应,Hj为第j年龄效应,Sk为第k性别效应,eijkl为随机误差,服从正态分布。
根据上述模型,采用SAS(Ver.9.4)统计的GLM过程计算出SNP位点各基因型相应生理指标的最小二乘均值,并进行差异显著性检验。
7结果与分析
7.1THPO基因多态位点分析
扩大样本对牦牛和中海拔黄牛THPO基因目标片段进行扩增,将测序结果导入BioEdit软件,分别与NCBI数据库下载的黄牛THPO基因序列进行比对分析,验证目标位点是否存在单核苷酸多态性。
7.2THPO基因多态位点测序结果
将测序结果与已发表的牛THPO基因序列(NC_037328)进行比对,突变位点比对结果见图4。比对结果显示THPO基因第4内含子1316bp位点发生突变,但该位点为同义突变,未引起氨基酸的改变。
7.3THPO基因第4内含子G1316T突变位点的基因频率与基因型频率
计算牦牛和中等海拔黄牛THPO基因第4内含子G1316T位点的基因型频率和等位基因频率来确定是否为优势SNP位点,结果见表6。在中等海拔黄牛中检测到三种基因型,纯合高地型GG,杂合子GT和纯合低地型TT,经实验结果分析,其基因型频率分别为0.20、0.37和0.43,从表中可以看出,在中等海拔黄牛群体中,等位基因T(0.61)较G(0.39)更占优势,突变基因型TT为优势基因型。在牦牛群体中,只检测到GG基因型,表明该位点在牦牛中已经因选择达到固定。
中等海拔黄牛两个群体该突变位点属中度多态(0.25<PIC<0.5),遗传多样性较丰富,杂合度(H)为0.48。对这两个群体进行哈迪-温伯格(Hardy-Weinberg)平衡检验,发现丽江本地黄牛处于平衡状态(P>0.05)。
表6THPO基因第4内含子突变位点的基因型频率与基因频率
注:ns代表P>0.05。
7.4THPO基因第4内含子G1316T突变位点不同基因型与血液生理指标之间的关联
THPO基因第4内含子G1316T突变位点与血液生理指标之间的差异显著性分析见表7。在中等海拔黄牛群体中,只有血小板数差异有显著性,纯合高地型GG血小板数极显著(P<0.01)高于杂合子GT和纯合低地型TT,杂合子GT极显著(P<0.01)高于低地型TT,血小板数呈现GG>GT>TT的趋势;其余指标三个基因型间差异均不显著。
表7中海拔黄牛THPO第4内含子基因型与血液生理指标
注:表中数据同行比较标有大写字母的表示差异极显著(P<0.01),未标字母的表示差异不显著(P>0.05)。
7.5THPO基因与低氧适应
血小板是从骨髓成熟的巨核细胞胞浆脱落下来的小块胞质,其主要作用是参与止血和凝血,修补破损的血管。近年来越来越多的人走进高原地区,但高原地区在气候上远不同于平原地区,高原地区存在着不同于平原地区的地理环境和气候特点,这些独特的气候特点造就了它不同于平原气候的生理病理改变,在缺氧的环境下,机体的供氧平衡被打破,导致机体产生生理病理的变化,发生高原低氧相关的急慢性高原疾病,例如:高原性红细胞增多症、高原心脏病、高原肺水肿等。除了上述高原疾病外,近年来有研究显示高海拔低氧环境可导致血栓发生,包括肺栓塞、脑血栓、门静脉血栓、主动脉血栓等(Brosnan 2013)。
本发明对THPO基因第4内含子G1316T多态位点与黄牛血液生理指标进行关联分析,结果显示高地型GG个体血小板数极显著高于低地型TT和杂合型GT(P<0.01),表明GG基因型可增加血小板数。本实验在中等海拔黄牛群体中检测到三种基因型,但是在牦牛群体中只检测到GG基因型,表明牦牛有较高的血小板数。为适应高原低氧环境,动物机体常常表现为红细胞数目和血红蛋白浓度增加。但是红细胞数目增多和血红蛋白浓度升高也会导致血液粘稠度增加,破坏了毛细血管,增加了出血的风险。由于牦牛驯化程度较黄牛低,一般性情较野,尤其在母牦牛发情季节,强壮的公牦牛为争夺交配权会相互打斗,导致受伤流血。这时高的血小板数就能发挥止血作用,减少机体损伤。在高海拔环境中血小板变化趋势的研究中,曾平等发现移居与世居高原者较平原PLT值低。谢慎威等对比分析了不同海拔高原的习服汉族与世居藏族人群血小板数量,发现在3850m和4350m海拔,血小板数量和体积随海拔的变化趋势基本相反。周建丽等研究发现驻训人员在3700m海拔时,血小板数量明显高于上、下海拔高度的人员数值,说明海拔3700m是导致人血小板生理变化的临界点。移居高原人群和动物血液系统习服性变化的特征是红细胞数目和血红蛋白含量受低氧刺激后代偿性增高,但目前血小板及其他血液生理指标的在低氧环境中的变化并未达成一致的结论,可能与其影响因素复杂有关。
THPO基因是黄牛全基因组扫描发现的低氧正选择基因,是调节血小板生成的主要细胞因子,它对巨核细胞的增殖、分化、成熟具有重要作用,动物机体内的血小板由造血干细胞经过一系列分化形成(安世斌et al.2008)。巨核系造血受到多方面的影响,骨髓巨核细胞、循环池中血小板数量、人机体对血小板需求等都可能影响巨核系造血。一系列的造血生成调节因子也会不同程度的影响巨核系造血,其中促血小板生成素(THPO)是血液系统中最重要的调控因子之一。
本发明对THPO基因多态位点进行检测,序列比对后发现THPO基因第4内含子G1316T位点发生突变,但该突变位点为同义突变,没有引起氨基酸的改变。有研究表明,低氧对血小板生成有较大的影响。在成人中,血小板生成包括两步,一是造血干细胞(hematopoieticstem cells,HSCs)分化为成熟巨核细胞(megakaryocytes,MKs)的过程,二是MKs释放血小板的过程,即血小板生成。在这两个过程中影响任意一个因素都可能使血小板的生成受到影响。Spencer等的研究表明氧浓度越高,越利于MKs的成熟和血小板的释放。因此高原缺氧环境不利于牦牛MKs的成熟和血小板的释放,为减少环境对血小板生成带来的不利影响,经过世代选择,可升高血小板数的GG基因型得到固定。而中海拔黄牛受低氧正选择的压力更小,其血小板的生成和释放受环境影响不大,所以经过选择突变基因型TT成为优势基因型。目前在对高原环境中THPO浓度变化与血小板数目的关系的研究中,表明THPO水平与血小板数目成正相关;有人认为高原环境中血小板的生成与THPO无关;还有研究者发现高海拔环境会通过THPO诱导血小板生成增多。因此THPO是否参与高海拔环境中血小板数目的改变目前仍不清楚,THPO在缺氧环境中对巨核细胞的具体调控机制还需进一步研究。
本发明提供的SNP标记位于牛第1号染色体THPO基因第4内含子1316bp处,G1316T位点,碱基变异信息为T>G;纯合高地型GG血小板数(PLT)极显著高于杂合子GT和纯合低地型TT(P<0.01),其余指标差异不显著,表明GG基因型可增加血小板数;GG基因型个体的低氧耐受和高原适应能力显著高于GT或TT基因型个体。THPO基因对巨核细胞的增殖、分化、成熟以及血小板生成具有重要作用,因为高海拔低压,高含量血小板可能有助于提高动物因打架等出血性损伤的止血能力。本发明提供的与牛血小板生成和低氧耐受相关的THPO基因上的SNP位点可作为牛低氧耐受和高原适应能力、选育耐高原低氧环境的分子标记,同时对牛特色基因的保存和利用也具有重要意义。
最后说明的是,以上优选实施例仅用于说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。