發(fā)布時間: 2025-05-08 13:53:55
2025年4月24日,王曉旭等人在《Ren Fail》雜志上發(fā)表了一篇題為《Development and external validation of a machine learning model for cardiac valve calcification early screening in dialysis patients: a multicenter study》的文章。 心臟瓣膜鈣化(CVC)在透析患者中很常見,并且與心血管風(fēng)險增加有關(guān)。然而,早期篩查受到成本問題的限制。該文獻(xiàn)旨在開發(fā)和驗證機器學(xué)習(xí)模型,以增強CVC的早期檢測。
一、研究背景
CVC是透析患者的常見并發(fā)癥,其發(fā)生率是普通人群的8倍,且與心血管風(fēng)險顯著相關(guān)。CVC可導(dǎo)致瓣膜狹窄、心律失常、心肌缺血甚至死亡,但早期篩查因成本和技術(shù)限制未廣泛普及。目前尚無研究利用機器學(xué)習(xí)模型預(yù)測透析患者的CVC風(fēng)險,因此本研究通過整合臨床數(shù)據(jù)和實驗室指標(biāo),構(gòu)建并驗證一種高效篩查工具。
二、數(shù)據(jù)來源
2020年1月至2023年6月期間,在中國四家臨床中心共招募了2681例年齡在18至80歲之間的終末期腎病患者。這些患者在腎內(nèi)科和血液凈化中心接受常規(guī)血液透析(HD)或腹膜透析(PD)。所有患者在住院期間均接受了超聲心動圖評估。研究排除了之前診斷患有心臟瓣膜病、風(fēng)濕性心臟病、心律失?;蛴行呐K手術(shù)史的參與者(圖1)。
三、研究方法
將蘇州醫(yī)院的患者以7:3的隨機分為訓(xùn)練集和驗證集。東南醫(yī)院的患者作為外部驗證集來評估模型。采用六種機器學(xué)習(xí)算法,包括類別提升(CatBooth)、極端梯度提升(XGBooth)、決策樹、支持向量機(SVM)、隨機森林和邏輯回歸,基于特征選擇的結(jié)果來構(gòu)建風(fēng)險模型。使用10倍交叉驗證評估預(yù)測性能。通過接收者操作特征曲線下面積(ROC)和精確度召回曲線(AUPRC)評估模型性能。同時計算準(zhǔn)確性、精確性和F-1評分等指標(biāo)。使用校準(zhǔn)曲線和Brier評分評估校準(zhǔn),決策曲線分析來評估臨床適用性。如果邏輯回歸優(yōu)于其他方法,根據(jù)其結(jié)果構(gòu)建諾模圖以供實際應(yīng)用。使用約登(Youden)指數(shù)和內(nèi)部驗證數(shù)據(jù)集中預(yù)測風(fēng)險概率的分布來確定風(fēng)險閾值,以將參與者分為高、中和低風(fēng)險組,然后在外部驗證數(shù)據(jù)集中驗證這些閾值。(圖2)
四、結(jié)果
1.基線特征
該研究共有2140名透析患者。中位年齡為56歲,其中男性1259人(58.8%)。在這些患者中,782名(36.5%)被診斷出患有CVC。超聲心動圖顯示,CVC患者的IVST和LVEF較低,左心室后壁厚度(LVPW)較高,左心室質(zhì)量(LVM)、左心室質(zhì)量指數(shù)(LVMI)和左心室擴(kuò)張功能障礙(LVDD)患病率增加,見表1。
在852名參與者中,32.9%被診斷出患有CVC。與無CVC的參與者相比,患有CVC的參與者通常年齡較大,透析持續(xù)時間較長,收縮壓(SBP)、天冬氨酸轉(zhuǎn)氨酶(AST)、堿性磷酸酶(ALP)、γ-谷氨酰轉(zhuǎn)移酶(GGT)和空腹血糖(FPG)較高,但收縮壓(DBP)和白蛋白(ALB)水平較低。此外,CVC組糖尿病、冠狀動脈粥樣硬化性心臟?。–HD)和高脂血癥的患病率以及抗糖尿病和降血脂藥物的使用率較高(表2)。
2.獨立危險因素
基于來自四個中心的數(shù)據(jù),調(diào)查了獨立影響CVC的因素。通過單因素回歸分析,確定了20個CVC的潛在危險因素。p <0.05的變量包括年齡、DBP、透析方式(血液透析)、透析持續(xù)時間以及糖尿病、高血壓、CHD、高脂血癥和中風(fēng)病史。最后,多元邏輯回歸分析確定了7個CVC獨立風(fēng)險因素,如表3所示。
3.模型開發(fā)與驗證
LASO回歸分析確定了與透析患者CVC風(fēng)險相關(guān)的12個預(yù)測變量,如圖2所示。使用單變量和多元邏輯回歸進(jìn)一步分析了通過LASO回歸確定的12個預(yù)測變量。最終,確定了五個關(guān)鍵特征:年齡、透析持續(xù)時間、糖尿病、CHD、高血脂癥、中風(fēng)、不含鈣的磷酸鹽結(jié)合劑、抗糖尿病藥物、ALP、FPG、Apo-A1和iPTH(表4)。然后將這些變量用作預(yù)測因子來構(gòu)建CVC存在的風(fēng)險預(yù)測模型。
如圖3所示,Catboost提供了最高的臨床預(yù)測準(zhǔn)確性,AUROC為0.719(95%CI:0.667-0.765),邏輯回歸模型隨后的AUROC為0.710(95%CI:0.619-0.755)。在此基礎(chǔ)上,在內(nèi)部和外部驗證數(shù)據(jù)集上對六種預(yù)測模型的穩(wěn)定性和通用性進(jìn)行了系統(tǒng)驗證。邏輯回歸模型表現(xiàn)出最高的性能,內(nèi)部驗證數(shù)據(jù)集中的AUROC為0.806(95%CI:0.750-0.863),外部驗證數(shù)據(jù)集中的AUROC為0.757(95%CI:0.720-0.793),優(yōu)于所有其他模型(圖4)。
兩個驗證集的模型校準(zhǔn)結(jié)果表明,邏輯回歸模型的校準(zhǔn)曲線更接近理想線,內(nèi)部驗證數(shù)據(jù)集中的Brier評分為0.170,外部驗證數(shù)據(jù)集中的Brier評分為0.221,表明與其他模型相比具有更好的校準(zhǔn)性(圖5)。此外,決策曲線分析表明,基于內(nèi)部和外部驗證集的綜合預(yù)測性能,從邏輯回歸中得出的臨床預(yù)測可實現(xiàn)最高的總體凈效益,并為患者提供跨越大多數(shù)風(fēng)險閾值水平的益處(圖6)。
考慮到邏輯回歸模型在內(nèi)部和外部驗證數(shù)據(jù)集中都顯示出更好的臨床預(yù)測價值,因此將其選為最佳模型,并使用動態(tài)諾模圖進(jìn)行描述(圖7)。
使用Youden指數(shù)來區(qū)分高?;颊吆头歉呶;颊?,根據(jù)62%的比例將患者分為這兩組。圖8結(jié)果顯示,高、中、低風(fēng)險人群CVC的患病率分別為65.6%、20.2%和7.5%。當(dāng)將這些定義的臨界值應(yīng)用于外部驗證數(shù)據(jù)集時,高、中、低風(fēng)險組中CVC的患病率分別為68.9%、43.2%和14.2%。風(fēng)險分層在內(nèi)部和外部驗證組中均表現(xiàn)出良好的差異(所有p值均< 0.001)。(圖8)
五、總結(jié)
基于年齡、透析時長、堿性磷酸酶(ALP)、載脂蛋白A1(Apo-A1)和全段甲狀旁腺激素(iPTH)的邏輯回歸模型能有效識別CVC高風(fēng)險透析患者,其高預(yù)測精度和臨床實用性為早期干預(yù)提供了可靠工具。
上一篇:04.28-05.04 臨床預(yù)測模型研究頂刊快報
下一篇:利用機器學(xué)習(xí)模型預(yù)測新冠疫情后急性和慢性腎臟疾?。豪妹绹鴩译娮咏】涤涗?/a>