近日,赛陆医疗联合Intel和MemVerge发布《“Intel持久内存+MemVerge大内存软件”助力超分辨空间组学生信分析提效增速》白皮书(以下简称”白皮书“)。白皮书指出,生命科学已进入空间转录组发展阶段。通过对大块组织中的单个细胞的RNA进行测序,不仅能获取遗传信息,还能获得细胞的空间位置信息。基于上述信息可以绘制细胞中RNA的3D分布图,从更高维度揭示细胞网络中细胞间相互作用,全面提升人类对生命的认知和推动疾病重新定义。 赛陆医疗致力于开发自主知识产权的上游测序平台和全球领先的超分辨空间组学平台。今年2月,公司正式发布了基于高密度高分辨率捕获芯片的空间组学方案,联合创始人、首席科学家王谷丰教授予以详细解读。 经过三方专家和技术团队的不断努力,以及联合的软硬件优化与技术创新,基于英特尔傲腾内存和MemVerge Memory Machine大内存软件的方案在生信业务中的并发性能达到了显著的提升,从原来的单台设备只能并发运行1-2个任务,达到同时运行5-6个并发任务,其中个别的关键IO环节的读写性能也达到20%-50%的提升,整体端到端性能提升效果明显。 表2:STARsolo并发性能测试 表3:Seurat并发性能测试 从上述两个表格中的验证数据可以看出,在Baseline(未使用MemVerge软件将英特尔傲腾内存和DRAM内存进行融合)时,STARsolo/Seurat在单台主机中最多只能支持两个并发,而在使用MemVerge软件将英特尔傲腾内存和DRAM内存进行融合后,则可以支持到5个并发,平均每个并发的时间消耗持续下降。 在实际验证过程中,我们发现在业务并发上升时,内存的消耗量会先于CPU核数成为系统的主要瓶颈,而通过英特尔傲腾和系统内存的融合,可以独立地扩展主机的内存容量,消除系统瓶颈,充分释放算力。 在高并发情况下,STARsolo和Seurat两程序的加速效率逐渐接近。程序运行效率的提升除得益于傲腾内存带来的高并发,还依赖于MemVerge自研的动态分级内存技术。频繁访问的热内存页由DRAM资源供给,访问频率低的冷内存页由傲腾内存资源供给。不同的应用进程不共享DRAM资源,消除抢夺DRAM资源带来的损耗。 空间组学数据处理耗时随着测序深度的增加会从几小时到几天不等,偶发因素导至的中断在长期大批量程序运行中难以杜绝。MemVerge Memory Machine高级版软件具有ZeroIO快照功能,可以对整个进程或进程树进行定时快照保护。快照建立和恢复的过程中没有任何IO消耗,同时使用Copy-On-Write增量快照技术,减少了快照对傲腾内存空间的消耗。实测中快照技术可在20秒内对运行中内存占用64GB的STAR程序进行保存/恢复。 该解决方案能够提高分析性能,降低总体成本,实现高可用性以及促进临床诊疗。 应用场景:将赛陆医疗的空间组学平台和安装有该套分析方案的服务器打包作为一整套空间组学解决方案,为客户解决各种临床、科研等问题。例如,大型三甲医院的肿瘤学、生殖健康和病原体检测等研究;生物制药公司和细胞基因治疗CRO的药物作用机制研究、药效评价、靶向药物开发;合成生物学公司和研究机构的高通量筛选、微生物分析和代谢物分析等。值得注意的是,这些分析的算力需求跟上述描述的相当,甚至更大。 扫码获取白皮书PDF版 赛陆医疗成立于2020年10月,专注于开发自主知识产权的上游测序平台,并基于其上构建了全球领先的超分辨空间组学平台,实现基因组学和空间组学产品的自主开发及科研临床端转化。公司突破了以往测序产品在通量、成本、分辨率、自动化等方面的瓶颈,同时实现了平台的国产化。公司成立以来迅速发展,现已拥有国际领先的测序和组学平台,可以为中下游应用提供全面的解决方案,并已和多家机构开展合作。 |