福建省科技厅社会发展引导性(重点)项目(2022Y0025)
目的探讨机器学习(ML)算法结合能谱CT定量参数和临床模型在预测胃腺癌(GAC)患者淋巴血管浸润(LVI)和神经周围浸润(PNI)的潜在价值。方法收集2017年12月—2022年5月经病理证实的GAC患者114例。研究参数涉及血清肿瘤标志物、CTTN分期、CT评估壁外血管浸润(CTEMVI)以及能谱CT定量参数。通过WEKA软件的Best\|First算法进行特征筛选,并运用贝叶斯网络(BN)及支持向量机(SVM)算法建立模型。结果相较于LVI/PNI阴性组,LVI/PNI阳性组中CTT3~4期、CTN阳性、CTEMVI阳性、血清肿瘤标志物\[糖类抗原(CA)724和CA199\]更为常见,能谱CT参数也更高,差别均有统计学意义(P<0.05)。经特征选择,关键变量包括CTT分期、CTEMVI、VPNIC和EP70 keV CT值。基于这些变量,分别使用BN和SVM构建临床参数模型、能谱CT参数模型和混合模型,共6个模型。6个模型均展现了高预测性能,无过拟合现象。BN的混合模型预测性能最佳,AUC值为0.890~0.933,Delong检验显示其在统计学上具有显著优势(P<0.05);而SVM的混合模型与另外 2种模型间的差别无统计学意义(P>0.05)。结论结合临床和能谱CT参数的ML模型能够高效能评估GAC患者的LVI和PNI状态,其中BN混合模型的准确性最高。
葛慧婷,王莉莉,刘元芬,邹添秀,林维文,薛蕴菁.机器学习优化能谱CT预测胃腺癌的浸润性[J].福建医科大学学报自然版,2024,(3):193-199