立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
小桔灯网 门户 资讯中心 产品杂谈 测序仪 查看内容

大牛访谈录:两大测序仪缔造者-Jonathan Rothberg

2025-11-11 08:51| 编辑: 沙糖桔| 查看: 316| 评论: 0|来源: 循因辑药

摘要: 四个核心要点
全球视野,深度视角

本文翻译自GenomeWeb,一切版权属于GenomeWeb。
本人只是对翻译进行了校对,并增加了部分补充资料,欢迎大家去GenomeWeb翻阅原文。

#01

背景-牛人


不同于此前咱们聊的Jay Flately,Jonathan属于学以致用型。
是一位美国著名生物医学科学家和连环企业家,以 DNA 测序技术的创新闻名于世。他于 1963 年 4 月 28 日出生于美国康涅狄格州,现居迈阿密。Rothberg 的职业生涯跨越学术研究和商业创新,专注于基因组学、蛋白质组学和医疗设备领域。
他被誉为“下一代测序之父”,其工作推动了基因组学从实验室走向商业化应用。
1984 年获得卡内基梅隆大学(Carnegie Mellon University)化学工程学士学位(BS);1992 年获得耶鲁大学(Yale University)生物学博士学位(PhD)。

2000 年,他创立454 Life Sciences,并领导开发了全球首个商业化下一代 DNA 测序技术—焦磷酸测序法(pyrosequencing),这标志着高通量测序时代的开端,大幅降低了基因组测序成本,并加速了个性化医学的发展。
然而,这只是他学以致用的冰山一角。

2004年,他创立了RainDance公司,开发数字液滴PCR技术,2016年被Bio-Rad公司以大约7270万美元收购。
2007年,他创立Ion Torrent公司,开发半导体测序技术。

2010年,Thermo Fisher以3.75亿美元预付款+3.5以里程碑付款收购了Ion Torrent。
他手头上还有蛋白测序公司Quantum-Si(已上市)、便携超声公司Butterfly Network(已上市)、便携MRI公司Hyperfine(已上市)。

累了...反正大家知道很牛就对了。

#02

访谈内容


Kelsy Ketchum(GenomeWeb编辑):
在您看来,过去25年基因组学领域最值得关注的进展是什么?哪些成果尤为突出?

Jonathan Rothberg:
首当其冲的无疑是高通量DNA测序技术及其规模化应用——这不仅实现了基因测序,更推动了人类及动物全基因组测序的普及。

Kelsy Ketchum:
既然提到测序,您认为短期和长期来看测序领域将如何发展?新一代测序技术的未来趋势是什么?
Jonathan Rothberg:
测序技术包含两个维度。
其一是数据采集——其发展速度曾看似超越摩尔定律,因为这本质上是追赶电子产业进程的过程。
其二是支撑数据分析的计算机科学。我认为将迎来两大转变:一是从传统计算机算法转向更多采用人工智能算法,首次实现海量基因组数据的高效解析,不仅能理解单一疾病,更能攻克复杂疾病。
关于发展方向,我预见AI技术将加速演进。正如新一代DNA测序从基因片段推进到局部基因组再到完整基因组,蛋白质测序也将迎来并行发展。虽然DNA揭示命运轨迹,但蛋白质才反映当下乃至短期的身体状态。
因此重大突破将体现在:AI技术与海量基因组信息的融合,以及蛋白质测序能力的提升。借助先进AI,我们首次能同时获取DNA信息(包括RNA测序所揭示的基因表达)和蛋白质数据。这意味着我们既拥有持续增强的数据采集能力,也正在开发能整合DNA、RNA及蛋白质组数据的计算工具。
Kelsy Ketchum:
您认为当前测序技术需要哪些突破来推动领域持续前进?
Jonathan Rothberg:
DNA测序和蛋白质测序的成本曲线都将持续优化。我预见DNA测序将重现芯片集成度提升的发展路径——从获取扩增子或部分基因组数据跃升至完整基因组测序。蛋白质测序同样如此,从少量蛋白质测序扩展到大规模并行测序。这本质上回归到摩尔定律的逻辑:在单一基底、载玻片或半导体芯片上实现更高集成度。

(补充举例:华大基因多模态大模型)
当前我们目睹的技术演进将持续规模化,特别是被称为"大语言模型"的技术(如ChatGPT)将加速转型。已有系列模型开始消化DNA信息而非文本,未来还将拓展至蛋白质信息。关键在于迭代这些技术,将文本大语言模型的精髓迁移至基因组与蛋白质组信息领域。
Kelsy Ketchum:
您认为基因组学领域最亟待满足的需求是什么?当前哪些关键环节存在缺失?
Jonathan Rothberg:
核心在于数据共享。我们已认识到,新算法随着数据量增长会不断优化。尽管现有公共DNA测序数据丰富,但多数企业尚未共享基因表达或蛋白质数据。要实现真正突破,必须加强数据共享。公共资助机构在推行数据共享政策方面成效显著,但需保持监管力度。我们需要整合学术界与工业界的多维信息——唯有更多数据、更充分共享,算法才能真正释放潜力。



补充资料:

UKB-PPP项目算是一个比较好的范例,蛋白研究费钱啊。
使用Olink蛋白组学检测技术,UKB出样本,联合几家药厂出钱。
当然药厂都是逐利的,获得数据的优先使用权,然后再逐步公开。
国内的药企,你们抓点紧啊。



Kelsy Ketchum:
您预见基因组学未来将出现哪些重大突破?无论是在测序技术还是其他方面,有哪些值得期待的发展?

Jonathan Rothberg:
近期,[Arc研究所]等数据共享机构已开始利用原始基因组数据训练类ChatGPT程序。这虽刚起步,但前景极其令人振奋。未来我们将能直接"对话"基因组。首款基因组信息模型在过去18个月刚刚面世,很快将拓展至蛋白质信息领域。正如早期计算机程序虽稚嫩却快速迭代,这些基因组对话程序也将经历相同发展轨迹。
回到您先前的问题,我预见未来五年内,AI将在蛋白质设计领域实现全方位整合——既能辅助序列设计,也能完成序列修饰。短期来看,专家们正在整合工具集群;中期而言,这些工具将融合形成"对话式基因组"平台。可以说这是基因组学过去25年来最激动人心的时刻:此前海量数据总让我们不堪重负,但如今我们首次拥有随数据增长而愈加强大的算法——这是前所未有的突破。



补充资料:
2025 年 10 月 23 日,华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。
这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

在基因组元件识别、远程调控预测、突变致病性预测等经典评测任务里,Genos 在超过一半的任务里比所有现有模型都表现更好,而在长序列评测任务中,例如突变热点识别和族群分类上,Genos 的表现远超同类模型,展现了其强大的上下文分析能力,有效破译基因组中的“暗物质”。
呃,这并不是华大基因的广告,是在找不出国内其他类似产品了...
由此可见还是比较稀缺的。


#03

最后总结


好,我们总结下大牛的这次访谈的核心要点:
第一,高通量DNA测序是近25年最重要的支柱:最重要的突破是DNA测序技术的规模化,实现了从基因测序到完整人类与动物基因组测序的跨越。
第二,AI将引发革命:传统计算机算法转向AI算法,能够处理海量基因组数据,从而理解复杂疾病,而不仅仅是单一疾病。类似于ChatGPT的大语言模型将被用于理解和分析基因组与蛋白质组信息。
第三,数据共享是最大瓶颈:AI算法的效能取决于数据量。目前,尽管DNA数据较多,但基因表达(RNA)和蛋白质数据的共享严重不足,尤其是在工业界。
第四,未来是AI的世纪:“对话基因组”时代来临,AI驱动的整合与设计,AI不仅能帮助分析数据,未来还将能整合DNA、RNA和蛋白质数据,并辅助甚至完成蛋白质设计。



相关资料:
注1:https://www.genomeweb.com/sequencing/qa-jonathan-rothberg-next-generation-sequencing-artificial-intelligence-and-future
注2:https://www.completegenomics.com/next-generation-sequencing-costs/

声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 官方QQ群 洽谈合作
返回顶部