Construction d'un modèle prédictif de diminution de la masse osseuse chez les hommes jeunes et d'âge moyen basé sur un apprentissage automatique interprétable

Li Kai-Yuan ,  

Song Ze-Hui ,  

Yu Miao ,  

Yang Zhen-Wei ,  

Hou Li-Xue ,  

摘要

Objectif : Étudier les facteurs de risque associés à la diminution de la masse osseuse chez les hommes jeunes et d'âge moyen à partir d'un ensemble de données de bilans de santé, construire un modèle prédictif et évaluer son efficacité. Méthodes : 989 hommes jeunes et d'âge moyen en bonne santé ayant effectué un bilan de santé à l'hôpital 961 des forces de soutien logistique entre mai 2022 et mai 2024 ont été inclus dans une étude rétrospective. Le jeu de données a été divisé aléatoirement en proportions 7:3 en ensemble d'entraînement (n=692) et ensemble de validation (n=297). Le principal critère d'étude était la survenue d'une diminution de la masse osseuse. La régression LASSO a été utilisée pour sélectionner les facteurs pronostiques indépendants. Six modèles d'apprentissage automatique—boosting de gradient extrême, machine à vecteurs de support, régression logistique multifactorielle, algorithme des k plus proches voisins, gradient boosting léger et forêt aléatoire—ont été utilisés pour prédire la diminution de la masse osseuse. Les modèles ont été évalués selon la surface sous la courbe ROC (AUC), la sensibilité, la spécificité et le score de Brier. Le seuil de probabilité à haut risque a été déterminé par maximisation de l'indice de Youden. La calibration et la performance clinique du meilleur modèle ont été évaluées par courbe de calibration et courbe de décision clinique. Enfin, la méthode SHAP a été utilisée pour interpréter les résultats du meilleur modèle. Résultats : L'étude a identifié huit facteurs indépendants influençant la diminution de la masse osseuse chez les hommes jeunes et d'âge moyen : tabagisme, cholestérol HDL, triglycérides, nombre de globules rouges, exercice régulier, albumine sérique, hémoglobine et acide urique. Parmi les six modèles construits, le modèle forêt aléatoire (RF) a montré la meilleure performance prédictive, avec une AUC dans l'ensemble de validation de 0,706 (IC 95 % 0,644~0,769), une spécificité de 0,884, une valeur prédictive positive de 0,704, une valeur prédictive négative de 0,708, une précision de 0,704, et le score de Brier optimal à 0,0301 (0,0283~0,0322). L'indice de Youden maximal était de 0,384, correspondant à une sensibilité de 0,579 et une spécificité de 0,805. La courbe de calibration de l'ensemble de validation présentait le moins d'écart dans l'intervalle de probabilité 0,20~0,65. La courbe de décision clinique montrait un bénéfice net positif dans l'intervalle du seuil de risque 0,12~0,65, supportant son usage en prise de décision clinique. Conclusion : Le tabagisme, le cholestérol HDL, les triglycérides, le nombre de globules rouges, l'exercice régulier, l'albumine sérique, l'hémoglobine et l'acide urique sont des facteurs indépendants influençant la diminution de la masse osseuse chez les hommes jeunes et d'âge moyen. Le modèle prédictif basé sur ces facteurs présente une bonne efficacité et pourrait fournir un support décisionnel fondé sur la médecine factuelle en clinique.

关键词

diminution de la masse osseuse; apprentissage automatique; méthode SHAP; support à la décision

阅读全文