2019年12月26日刚上班,还是如往常一样先大概浏览一下这一天的mNGS病原微生物自动解读结果,没问题的话就开始一天的研发工作了。 意外的是,发现有一个样本报出了敏感病原体——SARS冠状病毒,有几十条的序列,且这个样本只有这么一个有意义的病原体,如果是普通病毒,这已经是一个相当可靠的结果了。心头一紧,赶紧后台查看详细的分析数据,发现相似度并不算很高,只有大约94.5%(这跟卡相似度的阈值有关,相当于只筛选下了相似度比较高的序列)。想到有几种可能:1、SARS不同毒株基因组有一定差异;2、RNA病毒容易突变,距离SRAS事件17年了,变异比较大;3、近缘物种的错误比对等等。为了确认结果的可靠性,开始了详细分析。 好在之前已经遇到过几次这种类似的敏感的病原体确认分析工作,而且领导也曾跟我讨论过几次能不能做一个新发病原自动挖掘的分析流程,心里一直记着这个事情,在做其他权重更高优先级更高的项目时也随手做了一个初步的版本出来,这个样本刚好可以派上用场。我给它起了个名字,相比于日常生产用的分析流程,它多了个后缀:“探索版”,包含了几乎所有已测序的病毒基因组。 探索版的分析结果提示这个病原体跟Bat SARS like coronavirus最相似,整体相似度在87%左右,而跟SARS的相似度是约81%。比对上的序列数由几十条上升到了500多条,此外也组装出了5条contig,加起来有1200多bp,此时基本上可以确认是一种冠状病毒,可以针对冠状病毒进行详细分析。分析期间也开始跟解读负责人和领导小范围内部保密讨论。 |