Investigadores de la Universidad de León (ULe) y del Complejo Asistencial Universitario de León (CAULE) han desarrollado modelos de inteligencia artificial capaces de diferenciar entre trastornos de ansiedad y de adaptación en urgencias psiquiátricas, alcanzando una precisión del 96 por ciento.
El hallazgo, publicado en la revista ‘PeerJ Computer Science’ y consultado por EFE, abre la puerta a herramientas que agilicen la atención en salud mental y mejoren la calidad de los datos clínicos.
El estudio responde a uno de los grandes retos de la psiquiatría: la dificultad para clasificar diagnósticos en contextos donde los síntomas se solapan y las listas de espera son largas.
Según la Organización Mundial de la Salud (OMS), más de 970 millones de personas viven con un trastorno mental, y la pandemia disparó los casos de ansiedad en un 26 por ciento.
«La falta de recursos humanos y económicos hace que los tiempos de espera sean elevados; por eso proponemos soluciones que reduzcan la carga asistencial», explican los autores.
Un dataset único en España
La investigación se basa en 12.921 notas de urgencias psiquiátricas redactadas en español entre 2017 y 2022 en el CAULE, de las que se seleccionaron 228 con diagnósticos de ansiedad (ICD-10 F41) o trastorno de adaptación (F43).
El perfil predominante: mujeres (61%) y pacientes de entre 35 y 45 años. «Este dataset, completamente anonimizado y creado desde cero, tiene un valor científico excepcional por la dificultad de acceder a información clínica real», subraya el equipo.
Los investigadores compararon modelos tradicionales de entrenamiento de máquinas —como árboles de decisión, random forest, SVM y XGBoost— con modelos de aprendizaje profundo basados en transformadores (DistilBERT y SciBERT), aplicando además técnicas para equilibrar datos y ajuste de hiperparámetros.
Entre los hallazgos más relevantes, el estudio revela que XGBoost y los modelos basados en BERT fueron los más precisos, alcanzando un 96% de exactitud y un F1-score de 0,97, mientras que los árboles de decisión, tras el ajuste de parámetros, lograron igualar ese rendimiento.
Inteligencia artificial y lenguaje
Los modelos lingüísticos demostraron una notable capacidad para interpretar la compleja terminología clínica, y aunque las técnicas de sobremuestreo -oversampling- apenas aportaron mejoras, SMOTE sí resultó beneficioso para los modelos BERT.
El ajuste de hiperparámetros se confirmó como un factor decisivo, elevando el rendimiento de algoritmos menos robustos como SVM, que pasó del 70% al 88% de precisión.
Los autores insisten en que estas herramientas no sustituyen al diagnóstico clínico, pero pueden estructurar información, reducir tiempos y mejorar la calidad de los datos para auditorías y formación.
También advierten de retos como el coste computacional de los modelos transformadores y la necesidad de ampliar el dataset con casos más diversos.
El trabajo, financiado por la Universidad de León y el Ministerio de Ciencia, se enmarca en el proyecto SUICIDETECT, orientado a detectar intentos de suicidio en historias clínicas mediante IA. Los datos y el código son públicos en
https://doi.org/10.5281/zenodo.14872650.
«Estamos ante un paso importante hacia sistemas que apoyen la toma de decisiones en salud mental, sin reemplazar la labor del profesional», concluyen los investigadores.
EFE