立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索
小桔灯网 门户 资讯中心 精准医疗 查看内容

基于二代测序原始数据的拷贝数变异分析在原发性免疫缺陷病分子诊断中的应用

2019-12-26 10:20| 编辑: 面气灵| 查看: 5420| 评论: 0|来源: 中华儿科杂志

摘要: 本文刊于:中华儿科杂志2019,57(12):917-921作者:夏宇 朱晓娜 杨军单位:深圳市儿童医院摘要目的探讨基于二代测序原始数据的拷贝数变异(CNV)分析在原发性免疫缺陷病(PID)分子诊断中的应用。方法回顾性研究。对 ...

本文刊于:中华儿科杂志2019,57(12):917-921

作者:夏宇 朱晓娜 杨军

单位:深圳市儿童医院

摘要

目的

探讨基于二代测序原始数据的拷贝数变异(CNV)分析在原发性免疫缺陷病(PID)分子诊断中的应用。


方法

回顾性研究。对于2014年9月至2017年3月深圳市儿童医院风湿免疫科165例(男110例、女55例)疑诊PID患儿的二代测序原始数据进行常规生物信息分析,对未发现致病或可疑致病突变的患儿采用CNVkit软件进行基于二代测序原始数据的CNV分析。以344种PID致病基因名称及别名,检索亚洲原发性免疫缺陷病数据库、人类基因变异数据库、与疾病相关的人类基因组变异数据库查找致病性CNV。以"primary immunodeficiency disease" "copy number variation" "next generation sequencing"为关键词检索2010年1月至2019年5月Pubmed数据库;以"原发性免疫缺陷病" "拷贝数变异"为关键词检索2010年1月至2019年5月维普、万方、中国知网数据库查找PID相关基因致病性CNV文献情况。


结果

165例患儿中95例(57.6%)经常规生物信息分析未发现致病或可疑致病突变,免疫失调性疾病的阴性率最高(68.6%,24/35)。95例患儿中经CNV分析发现大片段缺失12例,其中X连锁遗传7例、常染色体隐性遗传3例、常染色体显性遗传2例;部分外显子缺失4例,所有外显子缺失8例。经检索文献及数据库,共有51个PID基因有CNV致病性变异(14.8%,51/344),以基因组内部的部分外显子缺失为主(70.6%,36/51),常染色体隐性遗传(56.9%,29/51)是致病性CNV最常见的遗传方式。


结论

CNV在PID患者中并不少见,当临床及免疫学表现典型但通过常规生物信息分析未见可疑致病突变时,需考虑CNV因素。基于二代测序原始数据的CNV分析是常规生物信息分析的有力补充。


原发性免疫缺陷病(primary immunodeficiency disease,PID)是先天性基因缺陷导至的免疫分子、细胞功能异常,患者易出现反复感染,易患肿瘤及自身免疫疾病。PID临床表现复杂,异质性大,单纯根据临床表型很难准确推断其致病基因,精准的分子诊断对PID的治疗、预后有重要意义[1]。然而,即便通过二代测序,最高也仅40%左右的PID患者能明确分子诊断[2]。对于主要关注点突变和小片段插入及缺失的常规生物信息分析来说,大片段的染色体结构改变是"盲区" ,因此在二代测序阴性病例中,染色体结构变异逐渐受到重视。拷贝数变异(copy number variation,CNV)是常见的染色体结构变异之一[3],目前国内虽有个别基因大片段缺失所致PID的零星报道,但尚无大样本PID患者CNV分析的相关研究。本研究对于二代测序后常规生物信息分析阴性病例进行基于二代测序原始数据的CNV分析,并检索相关数据库及文献。

对象和方法

一、对象

回顾性研究。以2014年9月至2017年3月在深圳市儿童医院风湿免疫科就诊,根据全美免疫缺陷工作组/欧洲免疫缺陷组织标准[4](Pan-American Group for Immuno-deficiency,PAGID/European society for immunodeficiencies,ESID)疑诊为PID并进行二代测序的165例患儿(男110例、女55例)为研究对象。本研究获得患儿监护人同意并签署书面知情同意书,获得深圳市儿童医院伦理委员会审批同意(批号:2016021)。


二、方法

1.二代测序及生物信息分析方法:

取患儿及其父母外周静脉血提取基因组DNA,构建测序文库。采用Illumina高通量测序系统、免疫芯片(迈基诺,北京)进行测序。将测得的序列片段与人类参考基因组比对进行数据分析,依据外显子变异数据库、千人基因组计划及外显子整合联合数据库,滤除突变频率大于1%的变异,使用3种以上生物信息分析软件对筛选出的突变进行致病性预测,最后根据美国遗传学与基因组协会制定的指南筛选出致病或可疑致病的突变。


2.基于二代测序的CNV分析:

对经二代测序生物信息分析未发现致病或可疑致病突变的患儿采用CNVkit软件进行基于二代测序原始数据的CNV分析。利用同一捕获池的样本做对照进行分析。首先统计目标区域和非目标区域的读数深度,然后在样本内对深度进行均一化和矫正,与对照集进行比较计算得到拷贝数的信息,最后用循环二元分割算法(circular binary segmentation,CBS)对区域进行分割。


3.数据库检索:

以2017年伦敦国际免疫学联合会PID最新344种致病基因名称及别名,分别检索亚洲原发性免疫缺陷病数据库、人类基因变异数据库、与疾病相关的人类基因组变异数据库,查找CNV。以"primary immunodeficiency disease、copy number variation" "next generation sequencing"为关键词检索2010年1月至2019年5月Pubmed数据库文献,以"原发性免疫缺陷病" "拷贝数变异" "二代测序"为关键词检索2010年1月至2019年5月万方、维普及知网数据库PID相关基因致病性CNV文献情况。


三、统计学处理

描述性分析,计数资料以例(%)表示。


结果

一、一般资料

根据2017年伦敦国际免疫学联合会PID分类,165例患儿中抗体缺陷27例、免疫缺陷综合征14例、联合免疫缺陷18例、免疫失调性疾病35例、吞噬细胞缺陷18例、固有免疫缺陷17例、自身炎症性疾病28例、补体缺陷8例。通过常规生物信息分析,70例患儿(42.4%)明确基因诊断,涉及32个PID基因,发现突变新位点28个。95例患儿常规生物信息分析未发现与表型相符合的致病或可疑致病突变。


二、常规生物信息分析阴性病例CNV分析

根据2017年伦敦国际免疫学联合会PID分类,95例常规生物信息分析未发现与表型相符的致病或可疑致病突变患儿中抗体缺陷14例、免疫缺陷综合征6例、联合免疫缺陷9例、免疫失调性疾病24例、吞噬细胞缺陷11例、固有免疫缺陷9例、自身炎症性疾病18例、补体缺陷4例。阴性率最高为免疫失调性疾病68.6%(24/35)。95例患儿中经CNV分析发现大片段缺失患儿12例(表1),分别为Bruton蛋白激酶(Bruton tyrosine kinase,BTK)基因完全缺失3例、胞质分裂蛋白8(dedicator of Cytokinesis 8,DOCK8)基因部分外显子缺失2例、细胞色素B(Cytochrome b,CYBB)基因部分或完全缺失3例、丝氨酸蛋白酶抑制剂(serine protese inhibitor,SPINK5)基因完全缺失1例、可溶性白细胞分化抗原40配体(CD40 antigen ligand,CD40L)基因完全缺失1例、T框蛋白1(T-box protein 1,TBX1)基因完全缺失2例,其中CYBB基因Exon12缺失未见报道。12例患儿中常染色体显性遗传2例、常染色体隐性遗传3例、X连锁遗传7例;部分外显子缺失4例(CYBB 1例、DOCK8 2例、SPIBK51例),所有外显子缺失8例。

三、文献检索

经检索文献及数据库,2017年最新版PID分类344个基因中,51个基因有致病性CNV报道(14.8%)[5,6,7,8,9,10,11,12,13,14,15,16],分布于除第18、19、Y以外的染色体上。除22q11缺失综合征外,共检索到不同基因CNV所致的PID共147例,以CYBB基因及BTK基因最多(15例及14例),基因数目上以免疫失调性疾病最为多见(10个)。CNV主要为基因的大片段缺失(86.3%,44/51),且以基因组内部的部分外显子缺失为主(70.6%,36/51)。存在一类特殊的多基因CNV所致的连锁基因综合征(15.7%,8/51),除PID临床表型外,邻近基因亦受累产生相应的其他临床表型。常染色体隐性遗传是致病性CNV最常见的遗传方式(56.9%,29/51)。致病性CNV的PID基因外显子数目多≥5个(94.1%,48/51)。


讨论

二代测序技术的出现极大的增加了PID的分子诊断率,目前已明确344个PID相关致病基因[1]。然而,仍有大量病例在高通量测序后并没有发现致病基因[2]。随着全基因组技术的应用,在二代测序常规生物信息分析阴性病例中发现了部分患者存在致病性的染色体结构变异。CNV是长度大于1 kb的DNA片段缺失、重复,是常见的染色体结构变异之一。绝大多数的CNV在人群中频率大于1%,而且不编码发育相关的重要基因,被认为是基因组拷贝数多态性。不过,和单核苷酸多态性(single nucleotide polymorphism,SNP)一样,CNV也分为良性、致病性或未知临床意义的改变[17]。致病性CNV频率低于1%,已有越来越多致病性的CNV被发现和关注[17],目前也有染色体异常数据库(www.ukcad.org.uk/cocoon/ukcad、www.isca.genetics.emory.edu/)、染色体非平衡变异数据库(www.ukcad.org.uk/cocoon/ukcad、www.isca.genetics.emory.edu/)等致病性CNV的检索平台。本研究在国内首次关注PID患儿致病性CNV的情况,在165例PID患儿中发现12例(12.6%)存在致病性的CNV变异,涉及BTK、DOCK8等多个基因。不仅如此,经检索文献及数据库发现51个PID基因有CNV致病的报道,CNV在PID中并不罕见。


CNV检测包括传统的细胞遗传方法,如核型分析、荧光原位杂交(fluorescence in situ hybridization,FISH)等,不过识别度低,覆盖范围也有限;而比较基因组杂交芯片(array-based comparative genomic hybridization,aCGH)、基于SNP的芯片虽具有高通量的特点,但芯片的分辨率有限,时间和经济成本高。近年来随着二代测序技术的进展,基于二代测序数据的CNV分析迅猛发展[3]。基于二代测序数据的CNV分析直接在二代测序原始数据基础上进行分析,无需附加进行额外的检测,对于以单基因、点突变为主要致病形式的PID来说大大节省时间和经济成本。不过二代测序读长多在400~600 bp,对于常规生物信息分析来说,大片段的CNV是"盲区" 。基于二代测序原始数据的CNV分析不同于常规分析策略,目前主要有双端测序配对序列比对(paired-end mapping,PEM)、基于拆分序列(split read,SR)方法、基于序列测序读深(read depth,RD)方法、基于组装(assembly-based,AS)的方法等4种方式。基于序列读深的CNV分析是目前最为常用的方法,具有较其他几种方法更高的精确度,而且可以提供断点信息[18]。本研究采用的CNVkit软件是可视化的基于读深策略的CNV分析方法[18]。在本组资料中,通过该方法,在95例常规二代测序生物信息分析阴性样本中,发现12例致病性CNV。经检索文献及比较本组资料,在PID表型上CNV与点突变或小片段缺失或重复所致的患者并无明显差异,仅通过表型并不能提示或排除患者可能存在致病性CNV。在PID的分子诊断中,基于二代测序的CNV分析是常规生物信息分析的重要补充,也是PID分子诊断不能忽视的部分。


CNV包括缺失、插入、重复、复杂多位点变异等,既往文献中,PID患者的CNV以缺失为主,本组患儿均为缺失性突变。发生CNV的机制多为非同源末端连接和非等位同源重组,此种机制更有利于缺失形成,而且基因发生重复仍可保留该基因结构的完整性,携带一个或数个额外的拷贝数通常不具有致病性,因此个体发生基因的大片段缺失并表现出相应的临床表型的可能性较重复性变异可能更大。既往所报道CNV相关PID病例中,以常染色体隐性遗传更为多见,而本组资料以X连锁为主,可能与本中心患儿组成有关,但同时应注意到隐性遗传的CNV在分析时更为隐匿,尤其是个别外显子而非整个基因片段丢失的情况下,被忽略甚至滤过的可能性大,需要临床医师和生物信息分析人员的配合以提高阳性报告率。在51个有致病性CNV报道的PID基因中,以免疫失调性疾病相关的基因最为多见,而本组资料中,二代测序常规生物信息分析后分子诊断阴性率最高的也为免疫失调性疾病,提示在进一步的数据挖掘过程中仍需要关注CNV相关情况。


在国外病例及本组资料中,以CYBB、DOCK8、BTK、CFTR等基因CNV所致的PID较为常见,这些基因外显子数目均大于5个。外显子数目越多是否越易于发生基因的大片段缺失尚未可知,不过,外显子数目相对较少的基因发生CNV时产生的读数深度信号相对微弱,易被当作噪声被滤除[18]。因此,在CNV分析时,应在表型指导下进行重点基因的CNV分析以提高检出率。CNV发生的机制尚不明确,不过在BTK、CYBB基因中都发现CNV缺失的位点可能与短散在元件有关。短散在元件是反转录转座子家族的成员,元件之间的序列同源性潜在地促进基因组区域之间的不平等交叉并产生CNV,提示CNV所致的PID可能存在某些热点基因及区域,值得后期进一步探究。


在检索到的100余例CNV相关的PID患者中,存在一类多基因CNV所致的连锁基因综合征,除引起免疫缺陷表型外,还影响邻近基因而产生其他的临床表型。CYBB基因大片段缺失的同时可伴有临近的XK基因(致McLeod综合征)、DMD基因(致杜氏肌营养不良)缺陷[12,14],除CYBB基因大片段缺失引起的慢性肉芽肿(chronic granulomatous disease,CGD)外尚存在邻近基因受累引起的神经肌肉表型;BTK基因和线粒体内膜转位酶8A基因(translocase of inner mitochondrial membrane 8 A,TIMM8A)基因位置接近,也有报道BTK基因大片段缺失同时累及TIMM8A基因,除X连锁先天性无丙种球蛋白血症外患儿尚存在听力、肌张力障碍、认知障碍等表现[9]。此类连锁基因综合征为多基因CNV所致,可引起除PID临床表型外其他相应的临床表型,且以神经肌肉疾病、精神认知障碍等多见。当单基因缺陷不能解释全部临床表型时,需考虑此类多基因CNV所产生的连锁基因综合征。


CNV在PID患者中并不少见,当患儿临床及免疫学表现典型而高度可疑PID,但通过二代测序常规生物信息学分析未见可疑致病突变时,需考虑CNV因素。基于二代测序原始数据的CNV分析是常规生物信息分析的有力补充,在表型指导下的关键区域CNV分析能提高诊断阳性率。

参考文献(略)

声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

鲜花

握手

雷人

路过

鸡蛋

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 官方QQ群 洽谈合作
返回顶部