立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索
小桔灯网 门户 资讯中心 产品杂谈 测序仪 查看内容

纳米孔测序技术原理与发展综述

2026-6-12 10:40| 发布者: 沙糖桔| 查看: 116| 评论: 0|来源: 技术随记

摘要: 纳米孔测序技术在过去十年间经历了从概念验证到广泛应用的快速发展历程。

最近(2026年4月)有极客借助AI在自家客厅给自己用纳米孔测序仪给自己测了序(https://vibe-genomics.replit.app,还完成了数据分析,估计为纳米孔测序技术做了一波广告。但是由于整体使用还是偏少,很多生物医学领域的朋友未必有所了解。另外不久前要给外校来的老师一点基础资料,手头还真没有呢,不如也整理一份吧。

摘要

纳米孔测序(nanopore sequencing)技术由Oxford Nanopore Technologies(ONT)商业化推广,代表了第三代单分子长读长测序(long-read sequencing, LRS)的核心方向之一。与以Illumina为代表的第二代测序(next-generation sequencing, NGS)相比,纳米孔测序在读长、实时性、直接碱基修饰检测及设备便携性等方面具有根本性差异。本文系统介绍纳米孔测序的工作原理、核心组件、与NGS的关键差异、独特应用场景、样品制备要点,以及该领域的最新技术进展与发展趋势,旨在为科研人员提供全面的基础技术参考。

1. 引言

测序技术的发展历程可划分为三个主要阶段。第一代测序以Sanger双脱氧链终止法为代表,读长可达1000 bp,准确率高,但通量极低,难以满足大规模基因组研究需求。2005年前后兴起的第二代测序(NGS)技术,以Illumina短读长测序为主流,通过大规模并行边合成边测序的方式实现了高通量、低成本的基因组分析,推动了基因组学研究和应用的革命性进步。然而,NGS的读长限制(通常150--300 bp)使其在重复序列解析、结构变异检测、单倍型分型及全长转录本测序等方面存在固有局限。

第三代测序技术的出现正是为了突破上述瓶颈。纳米孔测序由ONT公司于2014年正式推出MinION测序仪,开创了单分子、实时、超长读长测序的新时代(ONT官网

国内目前已经有多个厂家研发且量产了纳米孔测序仪,以下讲解仍然是该领域里面当前发展和商业化最靠前的ONT公司的技术为例做讲解。

2. 核心工作原理

2.1 纳米孔蛋白的结构与演化

纳米孔测序的核心元件是嵌入脂质双分子层的蛋白质纳米孔。离子电流在施加电压的驱动下持续通过纳米孔,当DNA或RNA分子穿过孔道时,不同碱基(或碱基组合)对离子电流产生特征性阻断,从而实现序列读取。

ONT商业化产品所用纳米孔经历了显著的蛋白质工程演化历程。早期研究使用α-溶血素(α-hemolysin)作为模型孔蛋白,但其孔径和电学特性限制了测序性能。随后,来自耻垢分枝杆菌(Mycobacterium smegmatis)的MspA孔蛋白因其更窄的孔道(约1.2 nm)和更短的感应区域而展现出更优异的碱基分辨能力。ONT最终选择了来自大肠杆菌(Escherichia coli)的CsgG孔蛋白作为商业化基础,并通过蛋白质工程对其进行了系统优化。R9系列孔蛋白(基于CsgG变体)在2016-2022年间广泛应用,而R10系列(包括R10.4及其优化版本)则通过引入更长的孔道感应区域,显著改善了同聚物(homopolymer)区域的测序准确性和插入缺失(indel)错误率¹。

2.2 马达蛋白控速机制

裸露的DNA或RNA分子穿过纳米孔的速度远超电信号采集能力,因此需要马达蛋白(motor protein)对核酸链的移动速度进行精确控制。ONT使用经过工程改造的解旋酶(helicase)作为马达蛋白,将DNA链的移动速度控制在约400--450个碱基/秒(早期版本)至更高速率,同时保持足够的信号采集时间窗口。2026年London Calling大会上,ONT宣布了新型更快的DNA和RNA马达蛋白的开发进展,全面提升通量²。

2.3 电流信号产生机制

在测序过程中,DNA双链首先在马达蛋白的作用下解链,单链DNA(或RNA)以3'→5'方向穿过纳米孔。R10版本的纳米孔的感应区域(sensing region)同时容纳约9--10个碱基(更新之前的R9感应区域是5-6个碱基),每个时间点的电流信号反映的是当前位于感应区域的碱基组合的综合效应,而非单个碱基的独立信号。这种k-mer依赖性是纳米孔测序信号解析的核心挑战,也是碱基识别算法(basecalling)复杂性的根源³。

2.4 碱基识别算法的演化:从HMM到Dorado

将原始电流信号(raw signal)转化为碱基序列的过程称为碱基识别(basecalling)。早期的碱基识别算法基于隐马尔可夫模型(hidden Markov model, HMM),通过预先建立的k-mer电流信号模型进行序列推断,准确率有限。随着深度学习的兴起,基于循环神经网络(recurrent neural network, RNN)的碱基识别器(如Guppy早期版本)显著提升了准确率¹。随后,基于Transformer架构的碱基识别器进一步提升了对复杂信号模式的建模能力。ONT当前主推的Dorado碱基识别器在2026年London Calling大会上发布v6.0版本,在降低计算资源需求的同时进一步提升了碱基识别质量,并新增了Dorado SmallVar模块,可在碱基识别的同时并发进行变异检测,在PromethION 24(P24)平台上处理30×人类基因组仅需约13分钟²。

2.5 直接RNA测序原理

纳米孔测序的一项独特能力是直接RNA测序(direct RNA sequencing, DRS),可直接读取RNA序列。DRS的核心优势在于:(1)保留RNA上的碱基修饰信息(如m6A、m5C等),可实现转录组水平的表观转录组学分析⁴;(2)读取天然RNA分子,避免逆转录和PCR扩增引入的偏差;(3)可获得全长转录本序列,精确解析可变剪接(alternative splicing)和转录本异构体(isoform)。2026年London Calling大会上,ONT发布了24重直接RNA测序试剂盒,在保持与单重测序相同输出量的前提下实现了多样本并行测序²。

3. 与二代测序(NGS)的核心差异对比

纳米孔测序与Illumina NGS在多个关键维度存在根本性差异,以下表格系统对比两种技术的核心特性:

特性

纳米孔测序

Illumina NGS

读长

10 kb – >1 Mb(超长读长)

150–300 bp

单读长准确率

R10.4.1: >99%(Q20+)

>99.9%

错误类型

随机性indel(可深度纠正)

系统性(GC偏好等)

实时测序

支持(分钟级出数据)

不支持

直接修饰检测

支持(5mC、6mA等)

不支持

设备便携性

MinION(~100 g,USB供电)

大型仪器,实验室专用

最高通量

PromethION P24:数十Tb/次

NovaSeq X Plus:20 Tb/次

样品制备

HMW DNA;可PCR-free

DNA完整性要求低

3.1 读长

Illumina NGS的读长通常为150 bp(单端)或2×150 bp(双端),最长不超过600 bp(MiSeq v3)。纳米孔测序的读长理论上无上限,实际应用中常规读长可达10--100 kb,超长读长(ultra-long reads)可超过1 Mb,具体取决于输入DNA的完整性以及干净程度(蛋白或者其它化学分子可干扰测序)。超长读长使得纳米孔测序能够跨越基因组中的重复区域,直接组装此前难以解析的复杂基因组区域⁵。

3.2 准确率与错误类型

R10.4孔蛋白配合最新碱基识别器可实现>99%的单读长准确率(Q20+),共识准确率(consensus accuracy)可达Q30以上,与NGS相当⁶。Delahaye和Nicolas(2021)在PLoS ONE上系统分析了纳米孔测序的错误特征,指出错误率随碱基识别算法的改进持续下降³。纳米孔测序的错误主要为随机性错误,可通过增加测序深度有效纠正,而NGS的系统性错误(如GC偏好性)则难以通过深度增加完全消除。

3.3 实时测序能力

纳米孔测序支持实时数据输出(real-time sequencing),测序开始后数分钟内即可获得初步序列数据,并可在测序过程中实时进行碱基识别和分析。这一特性对时间敏感的应用场景(如临床急诊诊断、疫情监测)具有重要价值。相比之下,NGS通常需要数小时至数天的测序周期,且数据仅在测序完成后才能进行分析。

4. Nanopore能解决NGS难以解决的问题

4.1 重复序列与结构变异检测

人类基因组中约50%的序列由重复元件组成,NGS的短读长在这些区域往往无法唯一比对,导至结构变异(structural variants, SVs)的检测灵敏度和特异性受限。纳米孔超长读长可直接跨越重复区域,实现精确的SV断点定位。长读长测序检测到的SV数量约为短读长测序的2.86倍,尤其在插入型SV和复杂重排方面优势显著⁷。当然对于测质粒全长这种应用也不在话下,很多实验室或者生物技术公司已经常规用该技术做质粒全长测序了。只是如果质粒本身序列涉及到知识产权保护的时候,实验室或者企业应该对外送这种服务持谨慎态度,尽量考虑内部测序。

4.2 单倍型分型

单倍型分型(haplotype phasing)是解析等位基因特异性变异、理解复合杂合突变的关键。纳米孔超长读长可直接将多个变异位点连接在同一读长内,实现物理相位(physical phasing),无需统计推断。Shafin等人(2021)在Nature Methods上报道的PEPPER-Margin-DeepVariant流程展示了纳米孔测序在单倍型分型方面的卓越性能⁵。

4.3 表观遗传修饰直接检测

纳米孔测序可直接检测DNA上的碱基修饰,包括5-甲基胞嘧啶(5mC)、5-羟甲基胞嘧啶(5hmC)、N6-甲基腺嘌呤(6mA)等,无需亚硫酸氢盐转化(bisulfite conversion)或其他化学处理。Liu和Conesa(2025)在Nature Genetics上的综述系统总结了长读长测序在表观基因组学研究中的应用前景⁸。

4.4 全长转录本测序与T2T组装

纳米孔测序可直接读取全长cDNA或RNA分子,精确鉴定每个转录本的完整外显子组合,分辨率达到单分子水平⁴。超长读长是实现端粒到端粒(T2T)完整基因组组装的关键,Miga等人(2020)在Nature上报道了首个人类X染色体的T2T组装⁹,2026年hifiasm的ONT模式进一步优化了T2T组装流程¹⁰。

4.5 新兴前沿:tRNA修饰测序与单细胞全长转录组

纳米孔直接RNA测序技术的最新进展已拓展至传统mRNA分析之外的领域,展现出独特的应用潜力。

tRNA修饰与氨酰化状态检测

转运RNA(tRNA)是蛋白质翻译的核心分子,平均每个tRNA分子携带约13种化学修饰,这些修饰动态调控翻译效率和保真度。由于tRNA分子短小(约75-90 nt)且高度修饰,传统测序技术难以完整解析其修饰图谱。2023年12月ONT发布的RNA004孔化学显著提升了直接RNA测序的准确率,为tRNA分析提供了关键技术支持。2025年,White等报道了"aa-tRNA-seq"方法,通过在tRNA两端连接接头"夹住"氨基酸,利用纳米孔测序同时读取tRNA序列、修饰状态和氨基酸负载身份,实现了单分子水平的翻译组学分析。该技术已在大肠杆菌中成功鉴定全部43种isoacceptor tRNA,揭示了氧化应激条件下tRNA修饰的交叉调控网络。当前,RNA004化学配合Dorado碱基识别器已支持m6A、m5C、假尿嘧啶(Ψ)和肌苷(I)等八种修饰的同步检测,覆盖rRNA和tRNA分子。然而,哺乳动物tRNA修饰更为复杂(含ncm5U、ncm5S2U等稀有修饰),且算法工具(如EpiNano、Remora)对复杂tRNA修饰的识别精度仍有待提升,这是当前研究的前沿挑战。

单细胞全长转录组测序

单细胞RNA测序(scRNA-seq)已广泛应用于肿瘤异质性、发育生物学和免疫学研究,但传统短读长技术仅能捕获转录本3'末端,无法解析全长isoform。纳米孔长读长与10x Genomics Chromium平台联用,可在单细胞分辨率下读取全长cDNA分子,精确鉴定细胞类型特异性isoform表达和等位基因特异性转录。2026年Xu等开发的SCOTCH算法进一步提升了长读长单细胞数据的isoform定量精度,支持Nanopore和PacBio双平台,并兼容10x Genomics和Parse Biosciences等主流单细胞建库方案。系统比较研究表明,PacBio在novel isoform发现准确率上略优于ONT,而ONT在通量和成本效益方面具有优势;两者均可实现等位基因起源的转录本分配。该技术已应用于小鼠视网膜细胞类型isoform图谱绘制、脑衰老过程中RNA isoform重塑等研究,为理解细胞功能异质性提供了全新维度。

5. 样品制备要点与NGS的差异

5.1 DNA完整性要求

纳米孔测序对输入DNA的完整性要求显著高于NGS。为获得超长读长,需要提取高分子量DNA(high molecular weight DNA, HMW DNA),避免机械剪切和化学降解。推荐使用磁珠法(如Circulomics/Nanobind试剂盒)或改良的CTAB法提取HMW DNA,提取过程中应避免涡旋混合,使用宽口吸头(wide-bore tips)轻柔操作。理想的HMW DNA片段长度应>50 kb,N50>100 kb。相比之下,NGS对DNA完整性要求较低,甚至可以使用降解的DNA样品(如FFPE组织提取的DNA)。

5.2 文库构建方法

ONT提供多种文库构建方案:连接法(Ligation Sequencing Kit)最常用,通过末端修复和接头连接构建文库,适合高质量HMW DNA,可最大化读长;快速法(Rapid Sequencing Kit)使用转座酶快速构建文库,操作时间约10分钟,适合急诊场景;无PCR扩增法(PCR-free)保留原始DNA修饰信息,适合表观遗传学研究;靶向测序可通过Cas9切割或杂交捕获实现特定区域富集,以及独特的adaptive sequencing实现(在测序过程中对测序流程实时控制,通过测出的很短比如800bp数据判断该分子是否目标分子,如果是则继续,如果不是则将分子回吐再测下一个分子的)。

5.3 直接RNA测序样品制备

直接RNA测序(DRS)需要完整的多聚腺苷酸化RNA(poly(A) RNA),通常通过oligo-dT磁珠从总RNA中富集mRNA。样品制备过程中需严格防止RNA降解,使用RNase-free耗材和操作环境。与cDNA测序相比,DRS的文库构建更为简单,但对RNA质量(RIN值)要求更高。

6. 最新技术进展与使用趋势分析

6.1 发表量趋势

根据PubMed数据库检索(检索词:"nanopore sequencing"),纳米孔测序相关文献的年度发表量呈现显著的指数增长趋势:2014年仅58篇,2020年突破600篇,2025年已达1865篇,11年间增长约32倍(图1)。这一增长趋势反映了纳米孔测序技术的快速成熟和应用领域的持续扩展。

图1. Nanopore测序相关文献年度发表趋势(2014–2025)。数据来源:PubMed,检索词:"nanopore sequencing"。

从应用领域分布来看(图2),感染性疾病/病原检测(608篇)、转录组/RNA(442篇)、表观遗传/甲基化(426篇)和基因组组装(414篇)是发表量最多的四个领域,共占总文献量的约65%。免疫基因组/HLA领域(76篇)虽然文献量相对较少,但近年来增长迅速,反映了该领域的新兴热点地位。

图2. Nanopore测序各应用领域年度发表趋势(2014–2025)。数据来源:PubMed,检索词:"nanopore sequencing[Title/Abstract] AND <领域关键词>[Title/Abstract]"(与图1同口径,按年份统计)。注:各领域检索词含AND条件,领域间存在重叠,各领域数值之和不等于总文献量。

6.2 2026年London Calling大会重要发布

2026年5月21日,ONT在伦敦举办的年度London Calling大会上发布了一系列重要技术进展²:

【硬件与流动池】PromethION Plus流动池中位通量达177 Gb(较前代149 Gb提升约20%),消除了清洗重载步骤,计划2026年7月向高通量用户发货;新候选纳米孔降低了背景噪声,改善了indel检测,单个P+流动池可实现250 Gb输出;Q-Line GridION面向监管/临床环境,支持R10.4流动池和RNA流动池,计划2026年6月发货。

【软件与算法】Dorado v6.0在降低计算资源需求的同时提升碱基识别质量,已正式发布;Dorado SmallVar实现碱基识别与变异检测并发运行,处理30×人类基因组约13分钟(P24平台)。

【新应用与试剂盒】24重直接RNA测序试剂盒已于大会后发货;ONT+Lonza mRNA GMP质控方案(合作伙伴包括Moderna、BioNTech、辉瑞、Regeneron)已于2026年5月20日正式发布;靶向甲基化检测试剂盒、药物基因组学胚系检测试剂盒、遗传性癌症胚系检测试剂盒正式发布;肽段测序概念验证(Jayne Wallace,VP of Nanopore Research and Protein Sequencing):ONT已构建超过5亿条肽段信号(来自15万余种肽段)的训练数据库,并开发了首个氨基酸识别器(amino acid caller),使用大肠杆菌约30%蛋白质组的肽段进行训练,演示了从4000蛋白质数据库中准确识别22个随机选取的大肠杆菌蛋白质。这是ONT蛋白质组学长期路线图的重要里程碑,目前尚无商业化时间表,但标志着从肽段分类(peptide classification)向肽段测序(peptide sequencing)的技术跨越。

6.3 与PacBio HiFi的竞争格局

在长读长测序领域,纳米孔测序与PacBio HiFi是两大主要技术路线。PacBio HiFi通过环形共识测序(CCS)实现>99.9%的单读长准确率,但读长通常限于15--25 kb,且设备成本较高。纳米孔测序在读长(可达Mb级)、设备便携性和直接修饰检测方面具有优势。随着R10.4孔蛋白和Dorado碱基识别器的推出,纳米孔测序的准确率已大幅提升,两种技术的互补性和竞争性格局正在动态演变。

7. 局限性与挑战

尽管纳米孔测序技术取得了显著进步,仍面临若干挑战:(1)准确率:在特定序列背景(如长同聚物)仍存在较高错误率;(2)通量与成本:对于大规模人群基因组研究,每Gb成本仍高于Illumina NGS;(3)生物信息学工具生态:相比NGS,工具链成熟度仍有差距,教育和培训更加落后一截;(4)流动池稳定性:孔活性随时间衰减,影响实际通量的可预测性;(5)最有优势的测长序列和直接测修饰,往往不方便或者不能用PCR,导至微量样品仍然面临挑战。长短读长测序技术的比较研究表明,两种技术各有优势,选择需根据具体研究需求权衡¹¹。

8. 结语与展望

纳米孔测序技术在过去十年间经历了从概念验证到广泛应用的快速发展历程。超长读长、实时测序、直接碱基修饰检测和极致便携性等核心优势,使其在基因组组装、结构变异检测、表观基因组学、转录组学和现场检测等领域开辟了NGS无法企及的应用空间。2022年,Nature Methods将长读长测序(long-read sequencing)评选为年度方法(Method of the Year),以表彰其在完成首个完整人类基因组(T2T-CHM13)、解析端粒和高度重复区域、以及推动单细胞转录组学和表观基因组学等领域的突破性贡献。纳米孔测序作为长读长测序的核心技术之一,是该奖项的重要支撑¹3。随着R10.4孔蛋白、Dorado碱基识别器等技术的持续迭代,以及2026年London Calling大会上一系列新产品的发布,纳米孔测序正在向更高准确率、更高通量、更广应用场景快速演进。

9.补充:国产情况

上面提到纳米孔测序技术是一个基于原理的技术名称,由于Oxford Nanopore Technologies(ONT)这家公司首次将这个技术商业化,所以往往提到该技术和产品容易被默认指代这家英国公司的技术和产品。实际上这几年国内已经有多家企业研发了基于纳米孔测序技术的测序仪,且已经实现量产,笔者了解过了有齐碳,今是,普译,华大等等。这些国内公司也在积极进行技术更新和提升,以及布局临床等等。

参考文献

1.Wick RR, Judd LM, Holt KE. Performance of neural network basecalling tools for Oxford Nanopore sequencing. Genome Biol. 2019;20(1):129. doi:10.1186/s13059-019-1727-y

2.Oxford Nanopore Technologies. London Calling 2026 Conference Announcements. May 21, 2026.

3.Delahaye C, Nicolas J. Sequencing DNA with nanopores: troubles and biases. PLoS ONE. 2021;16(10):e0257521. doi:10.1371/journal.pone.0257521

4.Hao Z, Wu D, Zhao BS, et al. m6Anet: elucidating the functional role of N6-methyladenosine in mRNA. Nat Methods. 2022;19(7):843-845. doi:10.1038/s41592-022-01666-1

5.Shafin K, Pesout T, Chang PC, et al. Haplotype-aware variant calling with PEPPER-Margin-DeepVariant enables high accuracy in nanopore long-reads. Nat Methods. 2021;18(11):1322-1332. doi:10.1038/s41592-021-01299-w

6.Sereika M, Kirkegaard RH, Karst SM, et al. Oxford Nanopore R10.4 long-read sequencing enables near-perfect bacterial genomes. Nat Methods. 2022;19(7):823-826. doi:10.1038/s41592-022-01539-7

7.Liu Y, Conesa A. Opportunities and challenges of long-read sequencing in epigenomics. Nat Genet. 2025;57(1):27-40. doi:10.1038/s41588-024-02038-5

8.Miga KH, Koren S, Rhie A, et al. Telomere-to-telomere assembly of a complete human X chromosome. Nature. 2020;585(7823):79-84. doi:10.1038/s41586-020-2547-7

9.Cheng H, Qu H, McKenzie S, et al. Efficient near-telomere-to-telomere assembly of nanopore simplex reads. Nature. 2026;644:10105. doi:10.1038/s41586-026-10105-6

10.White, L.K., Radakovic, A., Sajek, M.P.et al.Nanopore sequencing of intact aminoacylated tRNAs.Nat Commun16, 7781 (2025).

11.Xu, Z., Qu, HQ., Chan, J.et al.SCOTCH: isoform-level characterization of gene expression through long-read single-cell RNA sequencing.Nat Commun(2026)

12.Santos A, et al. Long-read sequencing vs. short-read sequencing: a comparative review. Int J Mol Sci. 2025;26(10):4492. doi:10.3390/ijms26104492

13.Marx, V. Method of the year: long-read sequencing.Nat Methods20, 6–11 (2023).

声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 洽谈合作
返回顶部