立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索
小桔灯网 门户 资讯中心 技术杂谈 查看内容

生信杂谈:认识泛基因组测序

2018-12-23 11:42| 编辑: 小桔灯网| 查看: 4275| 评论: 0|来源: 生信菜鸟团

摘要: 上个星期休假还没来得及更新更多的内容,所以决定给大家分享一篇我刚刚加入生信菜鸟团写的文章,欢迎对植物泛基因组有兴趣在下文和我进行讨论。什么是泛基因组?2005年,Tettelin等人提出了微生物泛基因组概念(pang ...

上个星期休假还没来得及更新更多的内容,所以决定给大家分享一篇我刚刚加入生信菜鸟团写的文章,欢迎对植物泛基因组有兴趣在下文和我进行讨论。

什么是泛基因组?

2005年,Tettelin等人提出了微生物泛基因组概念(pangenome,pan源自希腊语‘παν’,全部的意思),泛基因组即某一物种全部基因的总称。2009 年,Li等人首次采用新全基因组组装方法对多个人类个体基因组进行拼接,发现了个体独有的DNA序列和功能基因,并首次提出了“人类泛基因组”的概念,即人类群体基因序列的总和。2009 年泛基因组测序首次应用于人类基因组学研究;2013 年泛基因组测序应用于动植物研究领域。

如图,泛基因组进而可以分为,核心基因组(core genome)和可变基因组 (variable genome)。核心基因指的是,在所有动植物品系或者菌株中都存在的基。可变基因组是指,在1个以及1个以上的动植物品系或者菌株中存在的基因。如果某个基因,仅存在某一个动植物品系或者菌株中,该基因还可以细分为品系或者菌株特有基因。一般来说,核心基因组控制着生命体基本生成代谢的功能。另外,结构变异中的存在/缺失变化(presnece/absence variation)是泛基因组的重点研究对象,因为可变基因组可能就是使个体产生不同性状(抗病性,抗寒性等)的原因。

为什么我们要开展泛基因组测序?

在漫长的进化过程中,由于地域因素,环境因素等的影响,每个个体都形成了极其特别的遗传性状,单一个体的基因组已经不能涵盖这个物种的所有遗传信息,另外一个原因,由于基因测序变得更加廉价,为近年来火爆的泛基因组的研究提供了可能性。

泛基因组是近年来比较流行的一种研究方向,通过对不同品种基因组进行测序,组装,然后将组装好的基因序列进行整合注释,进而获取这个物种全部的遗传信息并且对每一个个体间遗传变异信息进行解析。

技术路线

组装技术对比

目前比较流行的研究方法与三种:K-mer based assembly,重头组装和 迭代组装)

下面主要给大家讲解讲:重头组装 和 迭代组装两种方法。

重头组装的方法

这是构建泛基因组最经典的方法,分别对多个个体进行,分别的De novo assembly,然后将所得的每个个体的新组装的序列与参考序列reference基因组进行比对,找出比对不上的区域,再进行进一步的assembly,然后注释。此方法需要更多的电脑资源,因为需要对每一个个体进行分别进行重头组装,然后还需要全基因组比对。该方法比较适合基因组相对较小的植物。

迭代组装的方法

相当于一种迭代的方式,分别将每一个材料的reads比对到参考基因组中,然后找出没有比对上的部分进行组装,得到新的基因序列进而扩展原有的参考序列。一步一步这样迭代,直到所有的种系都处理完。最后建立起的泛基因组,再进行注释。这种方法,相对需要更少电脑资源,比较适合构建基因size相对较大的植物泛基因组,但是可能会产生更多的小片段。

应用

泛基因组测序是运用高通量测序及生物信息分析手段,针对不同亚种/个体材料进行测序及泛组装,构建泛基因组图谱,丰富该物种的遗传信息。泛基因组测序不仅可以获得多个基因组,完善该物种的基因集,还可以获得种群甚至个体特有的DNA序列和功能基因信息,为系统进化分析及功能生物学研究奠定基础。泛基因组也可以看作是对重测序数据的一种挖掘,挖掘发现每一个材料中独特的基因,进而进行进一步的分析。

选择不同亚种材料进行泛基因组测序,可以研究物种的起源及演化等重要生物学问题;选择野生种和栽培种等不同特性的种质资源进行泛基因组测序,可以发掘重要性状相关的基因资源,为科学育种提供指导;选择不同生态地理类型的种质资源进行泛基因组测序,可以开展物种的适应性进化,外来物种入侵性等热门科学问题的研究,为分子生态学等学科提供新的研究手段。

还有我认为泛基因组还可以应用到寻找新的snps。

泛基因优势如下:


  1. 对比单一的reference基因,可以有效提高可发现的snps数量



  2. 用泛基因组去calling snps 意味着你可以节省很多电脑资源和分析时间。(正常snap calling需要比对到不同的个体上,但如果通过泛基因组去calling snps,就可以一步到位,因为这个pangenome 相当于所有个体的集合。另外,这也意味着,你得出的snps 组不需要整合(传统的snp calling需要整合,因为需要比对到不同个体上)



  3. 还有一个好处就是,因为pangenome包括了进一步presence/absence variations 的分析,我们可以区别出这种snp是属于核心基因的,还是属于可变基因的。然后,再结合你表现型的数据,这对利用snp提高农作物产量是很有意义的。


参考文献:

  1. Golicz, Agnieszka A., Jacqueline Batley, and David Edwards. "Towards plant pangenomics." Plant biotechnology journal 14.4 (2016): 1099-1105.

  2. Golicz, Agnieszka A., et al. "The pangenome of an agronomically important crop plant Brassica oleracea." Nature communications 7 (2016): 13390.

  3. Hurgobin, Bhavna, and David Edwards. "SNP Discovery Using a Pangenome: Has the Single Reference Approach Become Obsolete?." Biology 6.1 (2017): 21.

代表文献

  1. Li, Ying-hui, et al. "De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits." Nature Biotechnology32.10 (2014): 1045-1052.

  2. Maretty, Lasse, et al. "Sequencing and de novo assembly of 150 genomes from Denmark as a population reference." Nature (2017).d

声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

鲜花

握手

雷人

路过

鸡蛋

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 官方QQ群 洽谈合作
返回顶部