核心原因有2个:(1)提升通量、降低成本,提升普及性;(2)精准基因,数字化系统防控。 以人类基因组计划(Human Genome Project, HGP)为例,2003年结束后,预示着科学家将在参考基因组(如 hg19/GRCh37, hg38/GRCh38, 以及 2022 年发布的完成图 CHM v2.0)信息下开展更有意义的研究。已知的人的基因组大小约3Gb,其中编码蛋白的CDS序列约占1%(exome约30Mb)。对人的基因组测序深度30×(3Gb×30=90Gb数据量),按照10元/Gb,则需要900元,而exome与人类疾病密切相关,如果拿exome序列测序,测序深度50-100×(30Mb×50 或 100=1.5-3Gb),则需30元。显而易见的低成本(金钱、时间),为普适性和快速精准治疗夯实基础。
何为靶向,即有目的地研究靶基因(感兴趣的基因)的情况。如果把常规PCR扩增某一个基因理解为靶向基因扩增,那么多个靶基因一起进行PCR扩增后测序,即为多基因靶向测序。如果测序选择的是一代Sanger的方式,则成本是提升的。怎么实现高通量的靶向测序呢?即搭高通量测序平台,实现快速高通量的靶基因序列测序。 如果把上述PCR扩增目的基因的方式理解为靶向,那么其扩增遵循的碱基互补配对也是必不可少的。在这个基础上发展的靶向测序方式通常以多重扩增和探针杂交捕获的方式为主。而这些方法集中用于肿瘤和病原领域中,如肿瘤领域的伴随诊断、肿瘤早期筛查、预后监测评估等,病原领域的呼吸道感染、血流感染、耐药监测等。 多重扩增:又称扩增子建库(如16s)。该方式的关键有3点:模板、引物和扩增酶。(1)模板,可来自人群、动物或病原、真菌、古菌等样本的DNA或RNA。模板的质量高低,是扩增结果的影响因素之一,如FFPE样本,其低质量的DNA/RNA在扩增基因易产生非均一性结果。(2)引物,不同的基因其丰度高低有所不同,对于引物的设计、用量、是否分管扩增等都提出了挑战。(3)扩增酶,基因的扩增,若能保持其扩增不受酶自身的偏好影响,则在低起始量模板下其扩增产量、扩增基因的均一性、覆盖度等是其关键。 探针杂交捕获:了解探针杂交捕获流程的都知道,其杂交前预文库是通过文库制备获取的。所以,前预文库决定了杂交的结果。如预文库的投入量,则影响捕获得率,又如预文库的制备方式影响其杂交前的Blocker的选择(测序平台的文库结构决定Blocker,以及转座酶的Blocker)。因设计的探针遵循碱基互补配对原则,且有文献表明DNA与DNA的杂交结合力弱于DNA与RNA的结合。因此,对探针也提出了不同的要求。如探针是DNA类型还是RNA类型、探针覆盖靶区(CDS、HLA等)的深度(基因丰度)、生物素修饰位置、探针放置位置的组合策略等。探针上的生物素修饰,决定其需要链霉亲和素-生物素系统,故不同厂家的杂交捕获试剂在选择链霉亲和素磁珠时各有不同。如Agilent的需要M270磁珠、IDT的需要用T1磁珠、而纳昂达和诺唯赞的则需要M270磁珠等。具体取决于3个因素,一个是是否对体系扩增存在抑制、一个是对Buffer的盐浓度或pH值、最后一个是链霉亲和素磁珠的一些性质(如磁珠超顺磁性、磁珠响应速度、磁暴露等)。 了解上述对多重扩增方式的概述,应该了解到会存在错位扩增的情况,即基因1的上游引物与基因2的下游引物可以扩增更长的片段,主要是因为扩增子的引物在设计时Tm值得差异不是很大。解决该现象得方式有2种,1种是在测试引物后将存在错位扩增得基因分管扩增,结束后合并一管纯化;另1种是在引物序列上引入可形成发夹形状得序列,即SLIMamp方式。 至于探针杂交捕获的方式,因步骤繁琐,故现有的改进措施一般是缩短探针杂交捕获的时间,如快杂的方式(如针对病原的panel杂交约半个小时)。此外,为降低成本费用,多杂(3杂、12杂等)的方式也普遍使用。接下来我们简要讲解下和探针杂交捕获的3点:探针设计、锁核酸(LNA)、和链霉亲和素。 首先,探针的设计。其设计示意图如上。对于探针的设计方式,一般分为3类,分别是平铺式:常规探针头尾相连;平铺叠瓦式:探针是逐层往上叠加;叠瓦式:突变位点富集式叠瓦探针的设计示意图,将探针交错摆放,实现所有区域均为2×的覆盖。对于难捕获的位点(低频),会针对性加一层探针,使得位点能达到3×的覆盖,这样可提高突变频率低的位点在样本中的富集率(捕获率)及检出率。除了设计方式,还需考虑探针的类型,如Agilent的U型探针,一边结合靶基因,一边与链霉亲和素结合,又如纳昂达的共轭探针,降低非特异性的同时,还提升了捕获率等。 其次,是探针Tm值。我们都知道探针的杂交捕获温度是在一定范围内的,如纳昂达和诺唯赞的捕获通用试剂盒的反应温度65℃杂4-16h。因此,对探针的Tm值是有要求的。因不同的基因、不同设计策略的选择,难免会有探针低于或高于其它基因,该如何调整Tm值均一化在±2℃呢?这里,就需要引入锁核酸技术(Locked Nucleic Acid, LNA)。LNA在进行互补配对时对错配碱基具有更强的识别性,如果LNA-DNA中含有错配碱基,则其杂交链的稳定性下降。利用这一优势,在进行探针修饰时,如果将LNA修饰于错配位点或者其附近,那么可以很好的识别这些单碱基错配。除了在杂交捕获上应用,还可以在分子分型上使用,如SNP分型,通过LNA修饰,显著提升特异性等。 最后,是捕获系统。链霉亲和素磁珠,相较于其它磁珠的不同是其磁珠表面上偶联物。根据应用场景不同,可分为序列特异性捕获、固定化DNA/cDNA、特异性细胞分离、蛋白纯化、免疫测定、单链模板制备、以及药物筛选等,这些都离不开链霉亲和素。
答案是有的。如NEB在探针杂交捕获的基础上推出的商业化直接靶向富集的产品。其通过变性DNA片段成单链DNA形式,利用生物素探针与之结合富集,再通过加A尾等系列操作形成完整文库结构。又如Oxford Nanopore利用精准算法的方式控制电压,精准靶向基因的测序,提升测序的速度。再如优化捕获流程后接PB平台文库,缩短时间等。更值得一提的是Element Biosciences公司的Trinity将杂交后的文库直接加载到测序芯片上进行测序,感兴趣的可以关注其官方资料了解。 尽管靶向测序的方式和应用场景越来越多元化。但依旧面临适用性的挑战。如2025年上半年发表的由药监局联合中日友好医院的《病原靶向高通量测序技术质量评价联合研究》的文章。其在文中指出病原的tNGS结果和5年前的mNGS结果基本等同,其反应体系、流程等方面还需继续提升。可见,未来在体系、设计、流程等方面的具体应用场景成熟化后,其普及性才能继续提升。另外,美国GeneDx公司Q2季度在遗传病上的营收突破,可望是一个不错的方向,毕竟单个季度能实现上亿美元的营收,可见前景辽阔。 |