关于微生物研究的十问十答 | 学习专栏

2019-5-21 00:19| 编辑: 小桔灯网| 查看: 2823| 评论: 0|来源: 联川生物

摘要: Q1：基于高通量测序的微生物多样性检测技术优势以及原理是什么？A:常规的微生物研究方法包括基因克隆文库、变性梯度凝胶电泳DGGE等，但这些方法的通病是信息量太小，且自然界中99%的微生物在实验室都没有办法纯化培 ...

Q1：基于高通量测序的微生物多样性检测技术优势以及原理是什么？

A:常规的微生物研究方法包括基因克隆文库、变性梯度凝胶电泳DGGE等，但这些方法的通病是信息量太小，且自然界中99%的微生物在实验室都没有办法纯化培养，不能充分反映复杂的环境微生物多样性和分布，且程序繁琐，效率低下，也无法检测到稀有菌群的种类，因此其重复性和分辨率都不甚理想。
二代高通量测序无需构建质粒克隆文库，这避免了文库构建过程中利用宿主菌对样品进行克隆而引起的系统偏差，可以直接对环境样品中的基因组片段进行测序，简化了基本操作，提高了测序效率，它能够对一个群落中微生物的多样性做更加深入和全面的描述，且具有通量高，重复性好，精确度高的优点，因而在微生物生态学研究中逐渐占据了优势。技术原理：16S rDNA普遍存在于原核细胞中，且含量较高、拷贝数较多，便于获取模板，适于作为细菌多样性分析的标准。通常利用保守区域设计引物来扩增单个或多个可变区，进而通过测序分析得到微生物多样性。

Q2：微生物组测序设置生物学重复的意义是什么，一般情况下，设置多少个重复合适？

A:生物学重复是指样本所有的环境因素、处理条件、采样时间都完全一致。生物学重复对于测序的实验设计以及后续信息分析都非常重要，设置生物学重复主要有以下几个作用：
1）能够消除组内误差：生物学重复可以测量变异程度
2）增强结果的可靠性：测序的样本越多，越能够降低背景差异，从而增加结果可信度
3）检测离群样本：异常样本的存在，会严重影响测序结果的准确性，通过后续信息分析可以发现异常样本，将其排除。
一般情况下，自然环境中（比如土壤，根系，植物等）及模式动物（比如大鼠，小鼠等）建议每组至少5个生物学重复，一般推荐10个生物学重复；若是人类肠道，粪便等样品，由于个体之间差别较大（比如环境，饮食，遗传条件，健康状态等影响），建议加大取样量，每组不少于30个生物学重复（取样少，可能会导至组内差异大于组间差异则项目无意义）。值得注意的是，如果将多个样本混在一起建库测序，多个样本则变成了一个样本，仍是无生物学重复的。

Q3：什么是嵌合体，嵌合体是否需要去除？

A:嵌合体，遗传学上用以形容不同遗传性状的嵌合或混杂表现的个体。嵌合体序列是由来自两条或者多条模板链的序列组成，见下图：

图：嵌合体示例图

PCR反应中，在延伸阶段，由于不完全延伸，就会导至嵌合体序列的出现。在扩增序列X的过程中，序列延伸阶段，只产生了部分X序列延伸阶段就结束了，在下一轮PCR的反应中，这部分序列Y的引物接着延伸，扩增就会形成X和Y的嵌合体序列。在PCR过程中，大概有1%的几率会出现嵌合体序列，嵌合体在正常生物体中是不存在的，所以在16S扩增子测序的分析中，需要去除嵌合体序列。将去除后的cleandata再进行后续OTU聚类及分析。

Q4：Alpha多样性和Beta多样性在微生物检测中的意义？

A:Alpha多样性是指一个特定环境或生态系统内的多样性，主要用来反映物种丰富度和均匀度以及测序深度。Beta多样性主要是为了研究不同样品或处理组之间的物种群落结构差异，是生物多样性的重要组成部分。Beta多样性与Alpha多样性差异在于alpha多样性只是用来描述单个样品的物种多样性，而beta多样性则是比较不同样品（生态系统）之间的多样性差异。Beta多样性与alpha多样性一起构成了总体多样性或一定环境群落的生物异质性。 Alpha多样性包括Chao1、Observed_species、Goods_coverage、Shannon、Simpson指数，综合考量态系统的丰富度与多样性，Beta多样性分析通常由计算环境样品间的距离矩阵开始，该矩阵包含任意两个样品间的距离，主要通过主坐标分析（Principal coordinates analysis，PCoA）、主成分分析（Principal component analysis，PCA）、多维尺度分析（Multidimensional scaling，MDS）、聚类分析（Clustering analysis）、相似性分析（Analysis of similarities，ANOSIM）等方法，对群落数据结构进行自然分解并通过对样本排序（Ordination），从而观察样本之间的差异。

Q5：Alpha多样性指数之间有什么区别吗？

A:Alpha多样性包括Chao1、Observed_species、Goods_coverage、Shannon、Simpson等5个指数。其中Chao1,Observed_species指数主要关心样本的物种丰富度（Richness）信息；Goods _coverage反映样本的低丰度OTU覆盖情况;Simpson/Shannon主要综合体现物种的多样性（Diversity）和均匀度(Eveness)。其中Chao1和observed_species主要是估计群落中包含物种的数目；Goods _coverage是指各样品文库的覆盖率，其数值越高，则样本中序列没有被测出的概率越低，该指数实际反映了本次测序结果是否代表样本的真实情况；Shannon指数来源于信息熵，Shannon指数越大，表示不确定性大。不确定性越大，表示这个群落中未知的因素越多，也就是多样性高；Simpson数值范围在0-1之间，当群里只有一种物种的时候，此时Simpson值最小为0，同时也是我们直观理解的多样性最小。当物种种类无限多（丰富度最高），并且每个物种数目都一致（均匀度最高）的时候，Simpson值为最大为1。根据我们的计算公式可得：observed_species、chao1指数高，说明样品物种数目多；shannon、simpson指数高，说明物种丰度以及均匀度都很高。

Q6:如何查找感兴趣的物种信息及其丰度

A:所有样本中每个OTU对应的物种注释信息以及丰度信息（绝对丰度）文件路径

summary/6_taxonomy_community/OTU_table_with_taxonomy.xlsx

所有样本各层级相对丰度top20的结果路径：

summary/6_taxonomy_community/*/1_abundance_stats/all/*_abund_top20.xlsx

分组样本（取平均值）各层级相对丰度top20的结果路径：

summary/6_taxonomy_community/*/1_abundance_stats/Group/*_abund_Group.xlsx

Q7:16S测序物种注释常用的数据库有哪些？这些数据库的特点（或优缺点）是什么？

A:16S测序物种常用的数据库有RDP， SILVA ，Greengenes等，其中SILVA 数据库由于更新比较及时，因此也是目前最常选用的参考数据库之一。Greengenes数据库相对于其它经常更新的数据库，劣势比较突出。

联川目前使用的注释库是RDP+NT-16S。RDP数据库是目前较常用的比对、注释的参考数据库，版本更新比较快，16S序列信息较全，但由于该数据库注释结果只到属水平，而部分客户还是想通过16S得到种水平注释信息，因此我们使用NT-16S（基于NT库提取整理的16S数据库）数据库做为种水平注释结果的补充，并以RDP数据注释结果为优先级。

Q8:16S物种注释中为什么会出现叶绿体？

A:本身的叶绿体含量会比较高，而叶绿体和所研究16S扩增区段的序列相似性很高，也是能被扩增出来的。因此该从实验端用普通的引物是无法避免该问题的。

对叶绿体本身就很高的样本（如叶片等）给出如下建议：

1）预先处理减少叶绿体含量的提前处理，以减少后期测序结果里面的叶绿体序列；

2）使用去除叶绿体的特异性引物扩增，以减少可能产生的叶绿体序列。

Q9：16S测序与其他项目关联原理及注意要点？

A:众所周知，16S rDNA 测序主要用于研究某一特定环境中微生物结构组成，及其在不同处理条件下微生物种类及丰度差异，主要优势在物种多样性层面。由于PICRUSt等分析软件也可以得到功能上的注释结果，但功能预测的结果只能作为参考。如果想对基因层面对微生物代谢功能更深入的研究，就需要结合其他研究手段（宏基因组，宏转录组等）研究复杂微生物群落变化，基因功能层面差异及挖掘潜在的新基因。
16S测序相比宏基因组、宏转录组测序来说，价格上有不少落差。对于经费有限的课题，可以采取分步走策略。首先利用16S技术对大量样本进行测序分析，发现不同条件下样本的物种组成结构以及差异情况，然后挑选个别有代表性的样本（注意：样本挑选的时候，挑选同一条件下样本组成相似，且与其他条件下样本组成差别较大的样本，为了差异分析具有统计学意义，建议每组至少挑取3个样本），进行宏基因组或宏转录组测序，从而更加深入的阐明群落的功能。
宏转录组兴起于宏基因组之后，从整体水平上研究某一特定环境，特定时期群体生命全部基因组转录情况以及转录调控规律，它以生态环境中的全部RNA为研究对象。与宏基因组学相比，宏转录组学能从转录水平研究复杂微生物群落变化，能更好地挖掘潜在的新基因。联合16S、宏基因组、宏转录组三者分析，可以在群落水平，DNA和RNA水平上同时进行研究，实现多重角度互相验证，为全面解析微生物环境群落中的重要物种和基因信息提供了一种有效的手段。

除了与宏基因组和宏转录组联合分析外，16S和代谢组学联合分析也是近年来研究的热点。由于微生物群落的复杂性，研究微生物如何通过功能改变对宿主产生的影响是很困难的。通过测定微生物代谢物发生的改变来研究菌群功能状态是一种有效的方法。通过一定的数据筛选规则，找到可能相关的菌群临床指标以及代谢物。如加上做一些单菌实验以及群体验证，前期猜想将更加好地得到证实。

Q10：测序前通过一代测序鉴定了菌株的信息没有问题，一定能判断菌的纯化就完全没有问题吗？

A:答案是否定的，以细菌完成图为例。我们一般会在建库前对提供的菌株进行菌种鉴定，鉴定的方法通常是通过引物扩增出细菌的16S片段，通过一代测序获得该菌的16S序列，然后与NCBI数据库进行比对得到该菌株的信息，如果获得的信息确实是需要测定的菌株，只能说明没有其它细菌的污染，且前提是一代鉴定是结果中峰图属于单峰，无其它杂峰污染。且细菌完成的菌种鉴定是单菌，仅能说明无其它细菌的污染，并不能说明无真菌混在其中。

声明：

1、凡本网注明“来源：小桔灯网”的所有作品，均为本网合法拥有版权或有权使用的作品，转载需联系授权。
2、凡本网注明“来源：XXX（非小桔灯网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有，如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。