Construcción de un modelo predictivo de disminución de la masa ósea en hombres jóvenes y de mediana edad basado en aprendizaje automático interpretable
Objetivo: explorar los factores de riesgo relacionados con la disminución de la masa ósea en hombres jóvenes y de mediana edad basándose en un conjunto de datos de exámenes médicos, construir un modelo predictivo y evaluar su eficacia. Método: se seleccionaron 989 hombres jóvenes y de mediana edad sanos que participaron en un examen físico en el Hospital 961 del Departamento de Apoyo Logístico entre mayo de 2022 y mayo de 2024 para un estudio retrospectivo de datos. El conjunto de datos se dividió aleatoriamente en una proporción de 7:3 en un conjunto de entrenamiento (n=692) y un conjunto de validación (n=297), considerando la ocurrencia de disminución de la masa ósea como el punto final principal del estudio. Se utilizó la regresión LASSO para seleccionar factores pronósticos independientes. Se emplearon seis modelos de aprendizaje automático: potenciación de gradiente extremo, máquina de vectores de soporte, regresión logística multifactorial, algoritmo de k-vecinos más cercanos, potenciación ligera de gradiente y bosque aleatorio para predecir la disminución de la masa ósea. Se seleccionó el mejor modelo usando el área bajo la curva (AUC) ROC, sensibilidad, especificidad y puntuación de Brier. Se determinó el umbral de probabilidad de alto riesgo mediante la maximización del índice de Youden. La calibración y el rendimiento clínico del mejor modelo se evaluaron mediante curvas de calibración y decisión clínica. Finalmente, se interpretaron los resultados del mejor modelo usando el método SHAP. Resultados: el estudio identificó ocho factores independientes que afectan la disminución de la masa ósea en hombres jóvenes y de mediana edad: tabaquismo, colesterol HDL, triglicéridos, recuento de glóbulos rojos, ejercicio regular, albúmina sérica, hemoglobina y ácido úrico. De los seis modelos construidos, el modelo de bosque aleatorio mostró el mejor rendimiento predictivo, con AUC en el conjunto de validación de 0,706 (IC 95 % 0,644~0,769), especificidad de 0,884, valor predictivo positivo de 0,704, valor predictivo negativo de 0,708, precisión de 0,704 y la mejor puntuación de Brier de 0,0301 (0,0283~0,0322). El índice máximo de Youden fue 0,384, con sensibilidad de 0,579 y especificidad de 0,805. La curva de calibración del conjunto de validación mostró la menor desviación en el rango de probabilidad 0,20~0,65. La curva de decisión clínica mostró un beneficio neto positivo en el umbral de riesgo de 0,12~0,65, apoyando su uso para la toma de decisiones clínicas. Conclusión: el tabaquismo, colesterol HDL, triglicéridos, recuento de glóbulos rojos, ejercicio regular, albúmina sérica, hemoglobina y ácido úrico son factores independientes que afectan la disminución de la masa ósea en hombres jóvenes y de mediana edad. El modelo predictivo basado en estos factores tiene buena eficacia y puede proporcionar soporte para la toma de decisiones clínicas basadas en la medicina basada en evidencia.
关键词
disminución de la masa ósea; aprendizaje automático; método SHAP; soporte a la toma de decisiones