Aufbau eines erklärbaren maschinellen Lernmodells zur Vorhersage der Knochenmassenreduktion bei jungen und mittelalten Männern

Li Kai-Yuan ,  

Song Ze-Hui ,  

Yu Miao ,  

Yang Zhen-Wei ,  

Hou Li-Xue ,  

摘要

Ziel: Untersuchung der Risikofaktoren für Knochenmassenreduktion bei jungen und mittelalten Männern basierend auf einem Datensatz von Gesundheitsuntersuchungen, Aufbau eines Vorhersagemodells und Bewertung seiner Effektivität. Methode: Es wurden 989 gesunde junge und mittelalte Männer, die von Mai 2022 bis Mai 2024 im Krankenhaus Nr. 961 der Wehrlogistikabteilung untersucht wurden, für eine retrospektive Datenstudie ausgewählt. Der Datensatz wurde im Verhältnis 7:3 zufällig in Trainingsdatensatz (n=692) und Validierungsdatensatz (n=297) aufgeteilt. Das Auftreten von Knochenmassenreduktion wurde als primärer Studienendpunkt verwendet. LASSO-Regression wurde verwendet, um unabhängige prognostische Faktoren zu selektieren. Sechs maschinelle Lernmodelle – Extreme Gradient Boosting, Support Vector Machine, multifaktorielle logistische Regression, K-Nearest Neighbor Algorithmus, Light Gradient Boosting Machine und Random Forest – wurden zur Vorhersage der Knochenmassenreduktion eingesetzt. Das beste Modell wurde anhand der Fläche unter der ROC-Kurve (AUC), Sensitivität, Spezifität und Brier-Score ausgewählt. Der Schwellenwert für hohe Risikowahrscheinlichkeit wurde nach dem Prinzip der Maximierung des Youden-Index bestimmt. Die Kalibrierung und klinische Leistung des besten Modells wurden mit Kalibrierungskurve und klinischer Entscheidungskurve bewertet. Schließlich wurden die Ergebnisse des besten Modells mit der SHAP-Methode interpretiert. Ergebnisse: Die Studie identifizierte acht unabhängige Einflussfaktoren auf die Knochenmassenreduktion bei jungen und mittelalten Männern: Raucherstatus, HDL-Cholesterin, Triglyzeride, Erythrozytenzahl, regelmäßige Bewegung, Serumalbumin, Hämoglobin und Harnsäure. Von den sechs mit verschiedenen Methoden gebauten maschinellen Lernmodellen zeigte das RF-Modell die beste Vorhersageleistung mit einer AUC von 0,706 (95% KI 0,644~0,769) im Validierungsdatensatz, Spezifität von 0,884, positivem prädiktivem Wert von 0,704, negativem prädiktivem Wert von 0,708, Genauigkeit von 0,704 sowie dem besten Brier-Score von 0,0301 (0,0283~0,0322). Der maximale Youden-Index betrug 0,384 mit Sensitivität 0,579 und Spezifität 0,805. Die Kalibrierungskurve des Validierungsdatensatzes zeigte die geringste Abweichung im Wahrscheinlichkeitsbereich 0,20~0,65. Die klinische Entscheidungskurve des Validierungsdatensatzes zeigte im Risiko-Schwellenbereich 0,12~0,65 einen positiven Nettogewinn, der die Anwendung im klinischen Entscheidungsprozess unterstützt. Fazit: Raucherstatus, HDL-Cholesterin, Triglyzeride, Erythrozytenzahl, regelmäßige Bewegung, Serumalbumin, Hämoglobin und Harnsäure sind unabhängige Einflussfaktoren für die Knochenmassenreduktion bei jungen und mittelalten Männern. Das auf diesen Faktoren basierende Vorhersagemodell besitzt eine gute Vorhersageleistung und kann eine evidenzbasierte Unterstützung für klinische Entscheidungen bieten.

关键词

Knochenmassenreduktion; maschinelles Lernen; SHAP-Methode; Entscheidungsunterstützung

阅读全文