立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索
小桔灯网 门户 资讯中心 人物专访 查看内容

远毅资本专访希望组创始人汪德鹏:“补全”人类基因密码的三代测序技术,会是基因赛道 ...

2022-5-28 01:08| 编辑: 小桔灯网| 查看: 4635| 评论: 0|来源: 希望组

摘要: 人类基因组的完成既是三代测序技术进步的结果,也是三代测序技术真正落地基因组医学的开始。


2022年4月,生命科学领域发生了一件大新闻:科学家们首次完成了对人类基因组的完整测序,在人类基因组计划完成近20年后,终于补齐了人类基因组的最后一块拼图。这不仅仅是基因组学的新里程碑,同时也将为进化研究、药物开发和精准医学提供新的方向。这次突破的“首功”当属于测序工具的进步,兼具超长读长与高准确度的三代测序为解决基因组难题打开了大门。


借此机会,远毅资本对三代测序公司希望组的创始人、CEO汪德鹏进行了专访。在他看来,人类基因组的完成既是三代测序技术进步的结果,也是三代测序技术真正落地基因组医学的开始。



2022 年 4 月 1 日,赶在愚人节当天,《科学》杂志(Science)刊登系列文章,发表了国际 T2T 联盟攻克的首个人类基因组完成图(CHM13-T2T)研究成果,填补了此前几十年人类基因组研究留下的空白:大约 8% 的人类基因组序列「黑洞」,这些区域因为序列复杂性,一直无法被破译,尽管 2003 年国际人类基因组计划(HGP)曾经号称已经「完成了」人类基因组图谱绘制的工作。
美国国家人类基因组研究所(NHGRI)主管埃里克·格林在声明中,称此次行动「为人类基因组图谱提供了第一个完整的视角」。

回顾历史,自 1869 年,瑞士医生弗里德里希·米歇尔发现核酸(包括 DNA 与 RNA)的存在以来,经过一个多世纪的发展,凭借人们对遗传奥秘执着的好奇心,基因技术得到了飞速发展。人们不仅利用基因技术培育动植物优良品种,同样利用基因技术诊断和治疗人类疾病。

而对于突破这 8% 的基因组漏洞「硬骨头」作出巨大贡献的,就是被称为第三代基因测序的最新技术。相比于上一代测序技术,第三代基因测序技术在读长方面拥有绝对优势,突破了过去技术上无法突破的高重复区域和高多态性区域,为人类「生命密码」的真正完整的解锁提供了全新解决方案。

Science 封面文章:人类基因组完成图

在本次人类基因组学历史性突破之后,人类泛基因组参考联盟的科学家们又开始着手「人类泛基因组计划」的推进,该计划进一步拓展人类基因组完成图的领域,从一个人类样本,扩展到 350 个人类样本;从欧美人样本,扩展到全球不同大洲和区域的样本,使用大规模的人类样本构建基因组完成图,并且形成「泛基因组」单体型集合,将极大的推动基因组参考序列覆盖从局部到全貌。
从欧美人群到全世界代表性人群,从个体的线性参考基因组到群体的图基因组突破。这样的突破,将是人类基因组学领域的下一个最为重要的里程碑,也才是真正完整的「基因组医学」应用的序幕。
而在这项宏伟的计划背后,以 PacBio、ONT 为代表的第三代基因测序技术,以及同时发展起来的三代测序生物信息学技术,也走入人们的视野,作为破解人类基因组奥秘的最新武器,其在解决人类遗传性疾病、罕见病和肿瘤等领域的巨大潜力,也让第三代基因测序赛道逐渐成为投资关注的热点和创业新方向。


三代测序助力破解完整的「生命密码」

1990 年前后,美国科学家们启动人类基因组计划以来,英、法、日、德和中国的科学家们先后加入这项「20 世纪最伟大的科学计划之一」的项目中。经过近 20 年的努力,2003 年,该组织公布了「完整」的人类基因组序列信息。
这里的「完整」被打上了引号,是因为这个项目仅仅是完成了「常染色质」区域的基因组序列,还有大量的「异染色质」区域的基因组信息依然是缺失的。而这「被迫」忽略的部分,主要分布在染色体的「着丝粒」、「端粒」和「大片段重复」的附近,因为含有大量高度相似的重复序列,根据当时的测序技术,根本无法触及这些复杂的区域。
不要小瞧这大约 8% 的基因组信息,其中包括了几百万个未知碱基和无法正确组装的基因组片段,而这些区域被认为具有着重要的生物学意义,甚至与人类疾病密切相关。
出现这样的「缺陷」,是因为早期测序技术有其非常显著的局限性。当时的测序方法是:科学家们将人类 DNA 片段插入到大肠杆菌中进行克隆扩增并测序,然后通过生物信息学方法对序列进行组装。这种方法在科学发展过程中,曾经创造了辉煌的基因组学成就,但是需要耗费大量的人力、物力和时间,并且由于测序长度的限制,只能得到基因组大部分的信息,并不能真正的得到基因组信息的全貌。
而正像大部分科研行业一样,工具和技术的进步,往往能带来真正的变革。最近两年,美国太平洋生物科学公司(PacBio)的 HiFi 测序技术,以及英国牛津纳米孔科技公司(ONT)的 Ultralong 测序技术等全新的三代测序技术,以及全球科学家共同努力开发的三代测序生物信息工具,成为此次「补完」人类基因组计划剩下的约「8%」基因组信息的硬骨头的关键。
PacBio HiFi 测序能够在提供超高准确度(99.9%)的同时,还能测得超过 2 万个碱基的 DNA 大片段;而 ONT Ultralong 测序则能一次测得超过 10 万、甚至百万个碱基的超长片段,不过在准确度上略有不足(98%)。针对非常互补的两种数据结构,生物信息学家们开发了 Hicanu、Miniasm 等生物信息工具,通过这些工具将各种互补的长读长测序数据进行组装,科学家们成功完成了迄今最完整的人类基因组。
第三代基因测序技术之所以能成为破解人类生命密码背后的最大功臣,主要在于该技术最近两年革命性的提升:已经从之前的高错误率(15%-30% 错误率)反转到了高准确度(高达 99.99%),测序读长也从 1-3Kb 长度,大幅提高升级到大于 100Kb,甚至大于 1Mb。这些非常显著的变化让三代测序从一个「丑小鸭」,变成了「白天鹅」,最终在人类基因组完成图的舞台,大放异彩。

纳米孔测序的动画演示|Nanopore


相比于二代基因测序使用「光信号」作为信号媒介(根据 dNTP 在反应中产生的荧光波长不同,由 PTP 板另一侧的 CCD 照相机记录,通过光学信号处理而获得最终的测序结果),以 ONT 为代表的纳米孔技术,则让三代基因测序进化到了「电信号」阶段。
ONT 设计了一种特殊的生物纳米孔,当 DNA 碱基通过纳米孔时,孔中的电阻发生变化,影响流过纳米孔的瞬间电流强度。由于每种碱基引起的电流影响不同,因此使用特殊设备分析微电流变化,即可鉴定通过的碱基对。
由于读长更长,三代基因测序在基因组拼接上比二代测序更「容易」了。基因测序的一个主要应用是拼接物种的基因组(如人类基因组计划)。物种的 DNA 需要先经过打断处理,然后通过一系列的实验过程才能在测序仪上运行,最终得到测序数据。测序技术的不断进步就是一个将基因组拼接得更完整、更清晰的过程。
如果将基因组的拼接比喻成拼拼图的游戏,对于同样的一张图片来说,如果二代测序的拼图中有 10000 块碎片,那么三代测序的拼图可能只有 100 块碎片(三代测序的读长是二代测序的百倍以上)。显而易见,100 块碎片的拼图难度大大降低了。
最明显的例子来自世界著名的生物科技研究中心英国 Sanger Institute 发起的「脊椎动物基因组计划」(Vertebrate Genomes Project)官网上对于二代测序和三代测序的比较。

二代基因测序(左)和三代基因测序(右)的对比 

vertebrategenomesproject.org

左图为一代/二代测序的拼接结果,能看到碎片很小,数量非常多,同时还有不少遗漏的地方(重复区域为主,试想如何区分两块颜色和形状都一样的拼图碎片);右图为三代测序的拼接结果,碎片数量非常少,拼起来很容易。


人类基因组学下一目标:泛基因组

此次人类基因组全部「漏洞」的补齐,是人类基因组学发展的里程碑,同时也开启了人类基因组学研究的下一个里程碑目标——人类泛基因组计划。
在基因组学研究过程中,科学家开始意识到,单一的参考基因组已经不能涵盖物种的多样性遗传信息。正如目前人类参考基因组中高达 93% 的序列都仅仅来自于 11 名个体,他们大部分来自于纽约州布法罗市的报纸广告招募,而这其中又有 70% 的序列实际上来自同一个男性个体。
显然,单一个体的基因组无法起到足够的代表性,会导至参考该基因组进行的研究和诊断会出现「参考偏差」。
于是,在 2019 年,科学家们组建了「人类泛基因组参考联盟」(HPRC),计划从不同的人类样本中建立一个高质量参考基因组的集合,更好地服务于科学与人类。联盟初步宗旨是对来自不同种族和地理背景的至少 350 个人类个体进行完整的基因组测序,以纳入人类泛基因组参考。
根据 HPRC 官网公布的信息,该计划目前已经完成了第一批 47 例样本的测序。这些样本来自于「千人基因组计划」,一个包含了各大洲共 26 个人种的遗传信息数据和样本资源库。
联盟指出,这些样本能够代表的地理区域和基因组多样性仍然十分有限,不能全面反映该地区、该种群的基因组信息,更无法代表一个大洲。
在推进研究的同时,科学家们承认,350 个基因组并不能体现人类的全部多样性。泛基因组项目的研究员、美国国家人类基因组研究所信息部主任亚当·菲利普说:「我不认为这里会是某一个神奇的数字」。
而这样一个宏大的计划,离不开技术,即第三代基因测序技术的成熟。刊登在《自然》杂志中的文章指出,人类泛基因组联盟计划优先使用长读长测序和组装技术生成尽可能高质量的基因组——随着 PacBio HiFi 测序长度和纳米孔测序准确度的不断提高,以及染色体构象捕获方法的进步,我们正在进入一个完整染色体水平组装的新时代。


三代测序进行时

在国内,其实早有团队开始尝试使用第三代基因测序技术,试图构建中国人自己的基因组图谱信息。
2018 年,希望组(GrandOmics)公司启动了「华夏万人 SV」项目,希望在几年时间内对 10 万中国个体进行全基因组第三代测序。项目希望构建中国人群高分辨基因组结构变异图谱、单碱基精确度的 DNA 甲基化图谱,通过对大规模的疾病群体进行基因组结构变异分析,明确广泛的疾病和病症相关的复杂遗传变异。
「『华夏万人 SV』项目将在基因组医学研究、罕见病诊断与治疗、肿瘤基因组学应用等领域产生重要的科学及临床价值。」希望组创始人兼 CEO 汪德鹏说。
时间退回到 11 年前,汪德鹏在武汉成立专注于第三代基因测序技术的「未来组」(NextOmics),先通过微生物、动植物科技服务,积累和发展了核心技术,打造了精通三代测序技术的团队,在此基础上, 建立了聚焦三代测序长读长技术在基因组医学领域转化的希望组 (GrandOmics)。
彼时,以 Illumina 为代表的第二代基因测序技术应用尚在逐步推广中,三代测序其实可以说是「无人问津」的状态,汪德鹏去见投资人,被问到最多的一句话就是「二代还没普及,为什么要看三代技术?」
在国内,2014 年前后,华大、贝瑞基因等公司已经借助二代基因测序技术,坐稳国内基因检测市场的行业领导的位置,基因测序也逐渐为投资人热捧。
不过,汪德鹏笑称自己在那几年做的事情主要是「给投资人普及第三代测序基础知识」。幸运的是,有一些投资人已经开始正视基因检测技术的升级换代潜力。
2018年远毅资本领投了希望组 B 轮融资。汪德鹏与远毅资本合伙人杨瑞荣在后者任职北极光创投时期就认识,等到杨组建了远毅资本,开始布局新的基因测序机会,终于实现了这次投资合作
「远毅资本是少见的有『美元基金逻辑』的人民币基金,所投企业大部分都是细分赛道的潜在龙头。」汪德鹏如此评价自己的 B 轮领投方,正如其言,远毅也在此后针对医疗大健康赛道进行了深度投入。

三代测序对基因的结构变异有更好的检出率|希望组


基因变异是导至人类遗传病的重要原因,例如:约 80%的罕见病被认为是由遗传因素所导至,而绝大部分罕见病又在儿童时期发病,让罕见病诊断和治疗成为非常重要的医学课题。基因组变异大致可分为:单个碱基变异(SNV)、小的插入或缺失(InDel)以及结构变异(SV)。其中,结构变异包括 DNA 序列的插入、缺失、重复、倒位、易位等细分类型,可能导至的疾病已经超过 1000 种,其中不乏已为大众熟知的渐冻症、孤独症、抑郁症、精神分裂症以及癌症等。
虽然在科学研究领域已经获得高速发展,但是三代基因测序技术依然属于「先锋」技术,真正要在临床上落地,还需要大量的探索和研发。
对于此次人类基因组图谱的「最终补完」以及人类泛基因组计划的正式启动,汪德鹏非常激动。他认为两件行业里程碑事件背后,既是第三代基因测序技术进步的结果,又是三代测序技术真正落地基因组医学的开始。汪德鹏认为未来 3-5 年内第三代测序会在罕见病的诊断上有「重磅的医学落地」,接下来则会向肿瘤等更复杂更大的市场进攻。
而随着第三代基因测序技术被更多人关注,也会有更多公司加入到从设备到平台的竞争之中,同时在这样的竞争之中,三代测序的成本将会降低 10 倍,趋近于二代技术的成本水准。
「当然,这一切不是自动发生的,需要很多人做相应的配套工作。」汪德鹏说道,而希望组正是在不断研发配套工具的团队之一。


声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

鲜花

握手

雷人

路过

鸡蛋

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 官方QQ群 洽谈合作
返回顶部