Ensemble AI detecta la ERC con una sensibilidad del 91 % en diabéticos y del 92,5 % en no diabéticos
América Latina: IA de conjunto que utiliza datos clínicos de rutina detecta ERC: sensibilidad del 91 % (DT2), 92 % (DT2N)
Un modelo de conjunto impulsado por IA mejora la detección temprana de la enfermedad renal crónica en pacientes diabéticos y no diabéticos en Latinoamérica
Nuevos modelos de aprendizaje automático que utilizan datos clínicos sencillos y de fácil acceso alcanzan una sensibilidad de hasta el 91 % en la identificación de pacientes con enfermedad renal crónica de alto riesgo, con enfoques diferenciados para diabéticos y no diabéticos en una gran cohorte multicéntrica latinoamericana.
Introducción: El desafío de la detección de la enfermedad renal crónica
La enfermedad renal crónica (ERC) afecta de forma asintomática a más del 10 % de los adultos en todo el mundo, y a menudo progresa desapercibida hasta alcanzar estadios avanzados. Este retraso en el diagnóstico contribuye a una alta morbilidad y mortalidad, especialmente en regiones con acceso limitado a pruebas de laboratorio integrales. La identificación temprana de la ERC es fundamental para frenar la progresión y reducir las complicaciones. Sin embargo, el cribado tradicional depende en gran medida de pruebas de laboratorio especializadas, como la tasa de filtración glomerular estimada (TFGe) y el análisis de orina, que pueden no estar disponibles de forma constante en entornos de bajos recursos. Los avances recientes en aprendizaje automático (AA) ofrecen herramientas prometedoras para identificar a los pacientes con riesgo de ERC mediante el análisis de diversos datos clínicos. Sin embargo, los algoritmos actuales suelen depender de una gran cantidad de datos de laboratorio que pueden ser costosos o incompletos en muchos entornos sanitarios, especialmente en Latinoamérica. Además, los modelos anteriores suelen centrarse únicamente en las poblaciones diabéticas, lo que limita su aplicabilidad más amplia. En este contexto, los investigadores desarrollaron un enfoque de AA por conjuntos adaptado tanto a pacientes diabéticos (DT2) como no diabéticos (DT2N), aprovechando parámetros clínicos sencillos que se recopilan de forma rutinaria en el punto de atención. Sus modelos alcanzaron métricas de sensibilidad sólidas, lo que marca un paso significativo hacia el cribado escalable de la ERC en entornos con recursos limitados.
Colaboración y contexto del estudio
Este estudio fue un esfuerzo colaborativo entre Arkangel AI, AstraZeneca Colombia y la Universidad de Caldas, que abarcó instituciones de salud de la región caribeña colombiana y Perú. El contexto latinoamericano es de singular importancia dada la alta incidencia de la ERC, sumada a la limitada infraestructura de laboratorio, lo que hace crucial contar con herramientas de cribado rentables y de fácil implementación.
La población de pacientes representó una cohorte amplia y diversa que incluía tanto a personas diabéticas como no diabéticas, lo que permitió el desarrollo de un modelo matizado y específico para cada población. Al considerar este contexto regional y la heterogeneidad de los pacientes, el estudio aborda una clara brecha en las herramientas de identificación del riesgo de ERC aplicables a los entornos de salud reales de Latinoamérica.
Diseño y metodología del estudio
Los investigadores analizaron retrospectivamente los historiales clínicos de tres bases de datos recopiladas entre años recientes, pero no detallados, que abarcaban 19 194 pacientes diabéticos y 169 842 no diabéticos. Se excluyó a los pacientes sin fecha de diagnóstico de diabetes ni marcadores relevantes de la función renal (creatinina, eGFR). El riesgo de ERC se definió por una TFGe < 60 ml/min/1,73 m² o un diagnóstico oficial previo de ERC.
Las características de entrada incluyeron variables clínicas simples como edad, sexo, índice de masa corporal (IMC), estado de hipertensión y duración de la diabetes en el caso de los diabéticos, excluyendo deliberadamente pruebas de laboratorio complejas para maximizar la accesibilidad.
Se utilizó una plataforma web de IA llamada Arkangel AI para entrenar, probar y comparar diversos algoritmos de aprendizaje automático (ML), incluyendo clasificadores de bosque aleatorio y redes neuronales profundas. Los modelos con mejor rendimiento para cada subgrupo se combinaron en modelos de conjunto (promedios ponderados de los resultados del modelo) para mejorar la sensibilidad predictiva. El equipo también aplicó el análisis SHAP (explicaciones aditivas de Shapley) para interpretar la importancia de las características y garantizar que las decisiones del modelo se alinearan con el conocimiento clínico, lo que confirmó que la edad, la hipertensión y el sexo influyeron en los pacientes no diabéticos, mientras que la edad, el IMC y la duración de la diabetes dominaron las predicciones para la diabetes.
Resultados clave
Para pacientes diabéticos (DT2):
- El modelo de conjunto (bosque aleatorio + red neuronal con ponderación 2:1) alcanzó una sensibilidad del 91 % (frente al 81,5 % y el 97,5 % individualmente para los modelos constituyentes).
- La especificidad disminuyó al 39 %, compensando algunos falsos positivos para priorizar la detección de casos reales de ERC.
- Área bajo la curva ROC El AUC fue de 0,65, lo que refleja una discriminación razonable.
- La precisión se situó en el 69 %, con una puntuación F1 de 0,77 que equilibra la sensibilidad y la precisión.
- Para pacientes no diabéticos (NT2D):
- La red neuronal profunda por sí sola arrojó una sensibilidad moderada del 92,5 %.
- Una alta especificidad del 97,2 % y un AUC muy alto de 0,95 indicaron un rendimiento excelente.
- La precisión y la exactitud fueron igualmente robustas, con un 93 % y un 96 %, respectivamente.
Estos resultados subrayan la ventaja del enfoque de conjunto en pacientes diabéticos, ya que aumenta considerablemente la sensibilidad, lo cual es fundamental para el cribado. Mientras tanto, la red neuronal para personas no diabéticas ofreció una clasificación altamente equilibrada y precisa.
Interpretación e Implicaciones Clínicas
Este estudio presenta herramientas de aprendizaje automático (ML) prácticas y de bajo costo que identifican de forma fiable a las personas con alto riesgo de ERC, tanto en grupos diabéticos como no diabéticos, utilizando características clínicas recopiladas rutinariamente. Priorizar la sensibilidad es apropiado para contextos de cribado donde la omisión de casos tempranos de ERC podría conllevar un retraso en la atención y peores resultados.
Para los profesionales clínicos, estos algoritmos ofrecen un enfoque interpretable y basado en datos para identificar a los pacientes que necesitan pruebas confirmatorias adicionales e intervención temprana sin depender de extensos paneles de laboratorio. Los sistemas de salud en América Latina y otros entornos con recursos limitados se beneficiarán de la implementación de estos modelos para optimizar los flujos de trabajo de cribado de ERC, lo que podría reducir la carga de la enfermedad y los costos.
Sin embargo, existen algunas desventajas, en particular la menor especificidad en el modelo de conjunto de pacientes diabéticos, que puede generar más falsos positivos. Los trabajos futuros deberían explorar la calibración basada en la prevalencia poblacional de ERC y la integración con variables clínicas adicionales para mejorar la precisión.
Consideraciones de Implementación y Escalabilidad
Los modelos de IA se desarrollaron y probaron utilizando Arkangel AI, una aplicación web que facilita el entrenamiento de modelos y la generación de resultados, lo que posiciona este trabajo ideal para su integración en los flujos de trabajo de las historias clínicas electrónicas. Dado que los modelos se basan únicamente en datos demográficos y clínicos simples, superan las barreras impuestas por las pruebas de laboratorio costosas o la falta de ellas, lo que permite una implementación escalable en diversos entornos hospitalarios o de atención primaria.
Los desafíos para la implementación pueden incluir la participación de los médicos, la variabilidad de la calidad de los datos y la garantía de la adaptación local a diferentes patrones epidemiológicos fuera del Caribe y Perú. Sin embargo, la flexibilidad del modelo para ponderar por separado los datos de pacientes diabéticos y no diabéticos resalta su adaptabilidad.
Este enfoque también podría adaptarse para el cribado de otras enfermedades crónicas que comparten factores de riesgo o características clínicas, ampliando su utilidad en la gestión de la salud poblacional.
Conclusión y perspectivas futuras
Este estudio multicéntrico latinoamericano demuestra que los modelos de aprendizaje automático por conjuntos, entrenados con datos clínicos fácilmente disponibles, pueden identificar eficazmente a pacientes con alto riesgo de ERC, mejorando especialmente la sensibilidad en pacientes diabéticos y manteniendo un sólido rendimiento general en pacientes no diabéticos. Proporciona una hoja de ruta prometedora hacia el cribado de ERC asequible y escalable en sistemas de salud con recursos limitados.
Los pasos futuros deberían incluir la validación prospectiva en entornos clínicos, la optimización de las tasas de falsos positivos y la expansión a otras regiones y comorbilidades. La integración de herramientas de IA transparentes e interpretables como estas puede empoderar a los médicos y a los sistemas de salud para abordar la epidemia mundial de ERC de forma más proactiva.
Referencia: Martinez J, Perez A, Zea J, Llano I, Castaño-Villegas N, Caro D, Arango JJ. Desarrollo de un algoritmo de aprendizaje conjunto para detectar pacientes con alto riesgo de enfermedad renal crónica utilizando características clínicas fácilmente disponibles. (2024)