机器学习算法在预测活检证实的非酒精性脂
肪肝中的显著纤维化方面优于纤维化标志物
DeepLearning深度学习辣汤小组5月19日
来自医院郑明华教授的团队开发了一种新型机器学习算法(MLA)预测非酒精性脂肪性肝病纤维化严重程度,并在JournalofHepato-Biliary-PancreaticSciences(IF:4.)期刊上发表了文章,题目为“Machinelearningalgorithmoutperformsfibrosismarkersinpredicting9significantfibrosisinbiopsy-confirmedNAFLD”。(DOI:10./JHBP.)
非酒精性脂肪肝在全世界是慢性肝病的主要病因。患有非酒精性脂肪肝的个体可能会出现不同程度的肝纤维化,每年一次纤维化进展率接近10%,而晚期纤维化患者的10年生存率接近80%。以前的研究表明,纤维化阶段是非酒精性脂肪性肝病肝相关发病率和死亡率的最强预测因子之一。因此,为了对非酒精性脂肪肝患者进行更好的分层和个性化管理,需要对肝纤维化进行准确的评估。迄今为止,肝活检仍然是非酒精性脂肪肝纤维化分期的“金标准”。然而,肝脏活组织检查是一种侵入性技术,并不是没有并发症。因此,团队研究的目的是建立一个新的预测模型,通过使用MLA,在一个特征明确的患者队列中,非侵入性地识别显著纤维化(定义为组织学上的F≥2纤维化)的存在,其中非酒精性脂肪性肝病的严重程度已经用组织学进行了评估。
事实表明机器学习算法的诊断准确性在预测非酒精性脂肪性肝病的显著纤维化和输出形成的非侵入性生物标志物分数方面具有最高的AUROC。所以团队基于深度机器学习,研究出了新型算法,用于更好的识别预测活检的非酒精脂肪肝中的显著纤维化。
团队将名患者随机细分为一个训练集(n=)和一个验证集(n=),其中训练集用于逻辑回归模型(LRM)和多元线性回归的发展。在超声引导下,用16号肝素针获得经皮穿刺活检标本。活检标本用苏木精、马森三色和曙红染色,随后由经验丰富的肝脏病理学家进行评估。根据非酒精性脂肪性肝病临床研究网络评分系统进行评分。肝纤维化的分期情况从0到4如下:0=无纤维化,1=窦周或部分纤维化;2=窦周和门静脉/门静脉周围纤维化;3=桥接纤维化;和4=高度可疑或明确的肝硬化。显著纤维化被定义为纤维化阶段≥F2,晚期纤维化被定义为≥F3,这对确定预后具有临床重要性。其他用于诊断晚期纤维化的非侵入性纤维化评分(即APRI、NFS和FIB-4评分)是根据已发表的研究计算的。团队使用训练集(n=)开发了一个预测纤维化发展≥F2的逻辑回归模型(LRM)。使用最小绝对收缩和选择算子(LASSO)方法来识别与用于建立最终LRM的纤维化≥F2的存在显著相关的变量。LASSO逻辑回归模型与惩罚参数调整一起使用,惩罚参数调整通过基于最小标准的10倍交叉验证进行。LASSO适合回归高维数据,从23个人口统计学、人体测量、伴随疾病和实验室参数中选择具有非零系数的显著纤维化特征。一个公式是使用一个线性组合的选定特征生成的,这些特征由它们各自的LASSO系数加权;然后,该公式用于计算每个患者的个体风险评分,以反映患严重肝纤维化的风险。在训练集和验证集中,LRM的预测精度通过AUROC(接受者操作特征曲线下面积)来量化。训练组和验证组之间主要临床、生化和组织学肝脏特征的差异通过t-检验,Mann-WhitneyU检验,卡方检验的测试。LASSO方法用于识别与纤维化≥F2存在相关的变量,分别使用随机森林方法和逻辑回归建立MLA和LRM。LRM通过重复采样进行校准,并通过AUROC(接受者操作特征曲线下面积)进行性能评估。两种模型的诊断准确性都是使用AUROC进行评估的。
MLA模型包括以下五个变量(BMI、PC-III、IV-C、AST和A/G比),这些变量被发现在验证集内对显著的纤维化有很强的预测作用。上述变量在多元线性回归中的相对重要性分别为:PC-III为%,IV-C为87%,BMI为78%,AST为68%,A/Gratio为60%。在训练集内,MLA(AUROC0.,95%置信区间0.-0.)识别显著纤维化的诊断准确率远高于LRM(AUROC0.,95%置信区间0.-0.;P.05)。同样,在验证集内,多元线性回归的诊断准确率(0.,95%可信区间0.-0.)也优于LRM(0.,95%可信区间0.-0.;P.05)。
通过结合PC-III、IVC、BMI、AST和A/G,郑明华教授的团队开发了一种用于预测显著纤维化的MLA,并且与LRM、FIB-4、APRI和NFS评分相比,他们新开发的预测模型有着更好的诊断性能。据我们所知,这是第一项使用MLA开发预测模型的观察性研究,对临床诊断具有广泛意义。
表1LRM、FIB-4、APRI和NFS评分的诊断性能,用于识别显著纤维化(定义为纤维化分期≥2)的存在。
表2参与者的主要临床、实验室和组织学特征。
图1机器学习算法(标记为“A”)和LRM(标记为“B”)的诊断性能,用于识别训练集(A)和验证集(B)中显著肝纤维化的存在。
深度学习辣汤AI小组由徐州医科大学医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!
扫码