立即注册找回密码

QQ登录

只需一步,快速开始1111

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

小桔灯网

小桔灯网 门户 资讯中心 专栏文章 动力彩虹 查看内容

《Scientific reports》人工神经网络改进类风湿关节炎的诊断

2022-8-5 09:17| 编辑: 归去来兮| 查看: 144| 评论: 0|来源: 小桔灯网 | 作者:动力彩虹

摘要: 类风湿关节炎(RA)是一种慢性多系统自身免疫性疾病


类风湿关节炎(RA)是一种慢性多系统自身免疫性疾病,由持续的炎症性滑膜炎和随后的关节结构侵蚀引起。这种复杂疾病的病因包括遗传和环境风险因素。RA的诊断通常基于两个实验室指标:类风湿因子(RF)和抗环瓜氨酸肽(CCP)抗体。然而,即使这些指标为阴性,患者仍可能发展为RA。同时,如果其中一项指标为阳性,患者也可能不会患上RA。


在之前的一项研究发现在中国北方汉族人群中,CarP抗体和14-3-3η蛋白是RA的有价值的指标,当与RF和抗CCP结合时,检测准确性最大。然而,在诊断过程中,除了上述两个指标外,还忽略了年龄和性别等其他因素。此外,风湿病学家通常使用2010年美国风湿病学会(ACR)/欧洲风湿病联盟(EULAR)分类标准进行诊断,但一些RA病例不符合其标准。因此,正在积极研究更有效的方法和各种临床指标,以进一步提高RA诊断的准确性。


近年来,人工智能在各个科学领域取得了重大突破。深度学习是人工智能的一个子学科,其在医学图像判读中的应用逐渐扩大。在临床环境中,计算机程序在解释医学图像方面的表现优于人类。例如,人工智能广泛用于分析磁共振成像数据和预测早期RA。深度学习在计算机视觉中有着广泛的应用,它在分析许多疾病(例如黑色素瘤、视网膜病变和转移性乳腺癌)的成像数据中发挥着重要作用。深度学习的一个子类称为循环神经网络,是用于纵向预测和应用于电子健康记录数据的最新技术。整合患者的多个数据项以开发基于人工智能的模型已显示出极大的潜力,可以提高诊断的准确性,从而带来临床益处。Fukae及其同事将患者的各种临床信息转换为二维图像,然后对卷积神经网络(CNN)进行微调,以确定他们是否患有RA。这项工作为将深度学习应用于RA的诊断奠定了基础。


近日,来自北京大学的研究团队在杂志Scientific reports上发表了一篇题为“Improved diagnosis of rheumatoid arthritis using an artifcial neural network”的文章,在文章中,研究团队采用6个特征的数据纳入深度学习ANN进行RA诊断:年龄、性别、类风湿因子、抗环瓜氨酸肽抗体(CCP),14-3-3η和抗氨甲酰化蛋白(CarP)抗体。训练后,该神经网络模型为每个样本分配了成为RA患者或非RA患者的概率。在验证数据集上,该神经网络模型的所有样本的F1为0.916。因此,该神经网络算法不仅提高了RA诊断的准确性,而且表明抗CCP对RA诊断的影响最大,而年龄和抗CarP对RA诊断的影响较弱。


图片来源:Scientific reports


主要内容

患者选择及模型中使用的变量。


2017年6月1日至2019年5月31日,北京大学第三医院共招募670名参与者。他们均来自中国北方汉族。RA组包括291名17-85岁的RA患者。严格按照ACR 1987诊断标准和ACR/EULAR9的2010 RA分类标准确定RA。干预对照组包括223名诊断为非RA自身免疫性疾病的患者(系统性红斑狼疮、骨关节炎、溃疡性结肠炎、强直性脊柱炎、桥本氏病、硬皮病、银屑病、痛风、血管炎和皮肌炎)。这些非RA患者年龄为18-86岁。每种非类风湿关节炎自身免疫性疾病(10例以下)合并为“其他”自身免疫性疾病组。健康对照组(HC组)包括156名年龄在23-74岁之间的健康人。干扰对照组和HC组均构成对照组。研究人群的基本特征如下表所示。在模型中考虑了每个患者样本的6个特征,包括年龄、性别、类风湿因子(RF)、抗CCP、14-3-3η和抗CarP。


研究人群的基本特征。图片来源:Scientific reports


这六个特征在RA诊断中都起着重要作用。


为了确定将在模型中使用哪些特征,研究团队使用了最佳子集选择,并尝试了6个特征的所有组合,结果如图A所示;每个灰点表示一个组合,每个特征数的最佳子集为红色,表明模型AUC随着所用特征数的增加而增加。其次,研究团队进行了Boruta测试,表明所有特征都很重要。研究团队还评估了神经网络模型中的特征重要性(图C),抗CCP显示出最重要的意义,抗CarP和年龄在评估中也得分较高,显示出较弱但明显的影响。


特征的选择以及重要性评估。图片来源:Scientific reports


在机器学习方法中,

具有两层隐藏层的神经网络表现最好。


研究团队测试了具有不同结构的不同机器学习模型,所有模型的交叉验证结果,证实了具有2个隐藏层的神经网络在机器学习方法中表现最好。第一层有9个神经元,第二层有4个神经元如下图,神经网络给出了最好的结果。


人工神经网络(ANN)的计算结构。图片来源:Scientific reports


人工神经网络比阈值算法更准确地预测RA诊断。


研究团队探讨了与阈值算法相比,神经网络模型的性能如何。数据集分为两部分,2/3(447,194 RA和253非RA)用于训练,1/3(223,97 RA和126非RA)用于验证。所有评估均在验证集上进行。给出了ANN输出的ROC曲线(图B),AUC为0.951(95%置信区间[0.921,0.981]),也给出了先前阈值算法输出的ROC(图A),AUC为0.878(95%置信区间[0.826,0.930])。混淆矩阵如下表所示;基于混淆矩阵,精确性、召回率、F1和准确度进行计算如下表。尽管人工神经网络方法的召回率略低于阈值方法,但精度、F1和精度优于阈值方法,AUC也显示出令人满意的分类效果。


ANN和阈值算法的比较。图片来源:Scientific reports


模型预测的TN TP FP FN基本特征


下表列出了4个群体的基本特征,即真阴性(TN)、真阳性(TP)、假阳性(FP)和假阴性(FN)。这些FN在传统指标RF和抗CCP中几乎没有表现,在新指标14-3-3η和抗CarP中也是表现有限。4个群体的基本特征表明,这些错误难以避免,模型准确预测了大多数情况。


TN TP FP FN的基本特征。图片来源:Scientific reports


总结和讨论

图像处理和分析技术的进步为RA的自动检测和诊断奠定了坚实的基础。基于机器学习和深度学习的方法可用于自动应用阈值,以根据其可信度进行预测,从而可以用于生成客观疾病特异性RA标志物。在本研究中,研究团队将神经网络引入RA的诊断中,使所有特征的集成能够提高诊断的准确性,并减少阈值分割造成的指标信息浪费。神经网络算法的预测精度(90.6%)优于阈值算法(88.8%)。在这些特征中,抗CCP对RA诊断的影响最大,而年龄和抗CarP对RA诊断的影响较弱但明显,这使我们能够认识到以前未认识到的RA诊断中的年龄因素。基于人工智能的范例有助于RA患者准确的组织特征和风险分层。


不可否认,人工神经网络是一种相对基本的机器学习形式,当特征数较小时,它运行得更好,但由于特征数较小,它往往不能充分反映患者的状况。如果更多的临床信息,例如图像、症状,甚至自我评估,被集成到特征中,与其他机器学习算法的结合将进一步提高RA和其他疾病诊断的准确性和效率。



声明:
1、凡本网注明“来源:小桔灯网”的所有作品,均为本网合法拥有版权或有权使用的作品,转载需联系授权。
2、凡本网注明“来源:XXX(非小桔灯网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。其版权归原作者所有,如有侵权请联系删除。
3、所有再转载者需自行获得原作者授权并注明来源。

鲜花

握手

雷人

路过

鸡蛋

最新评论

关闭

官方推荐 上一条 /3 下一条

客服中心 搜索 官方QQ群 洽谈合作
返回顶部