¿Envejece la IA? Los Modelos Más Antiguos Muestran Signos de Deterioro Cognitivo

¿Envejece la IA? Los Modelos Más Antiguos Muestran Signos de Deterioro Cognitivo

En un hallazgo que podría cambiar nuestra percepción sobre la inteligencia artificial (IA), un reciente estudio liderado por Roy Dayan, de la Universidad Hebrea de Jerusalén, revela que los modelos más antiguos de IA presentan signos de deterioro cognitivo leve. Sorprendentemente, este fenómeno tiene paralelismos con el inicio de enfermedades neurodegenerativas en los seres humanos, como el Alzheimer.

El estudio, publicado en la revista BMJ, evaluó el desempeño de los principales chatbots utilizando la misma prueba que se aplica en humanos para detectar problemas cognitivos: la Evaluación Cognitiva de Montreal (MoCA). Los resultados dejaron en evidencia que, salvo ChatGPT 4.0, ningún modelo logró superar la prueba sin mostrar deficiencias en tareas clave.

Resultados de la Prueba: ¿Cómo Rindieron los Chatbots?

La prueba MoCA, conocida por su rigor en la detección de demencia temprana, evalúa habilidades como la memoria, el lenguaje, la atención, y las capacidades visuales y espaciales. ChatGPT 4.0 obtuvo la puntuación más alta, con 26 puntos de un total de 30. En contraste, otros modelos como Claude y ChatGPT 4 lograron 25 puntos, mientras que Gemini 1.0 obtuvo la peor calificación, con apenas 16 puntos.

Los desafíos fueron evidentes en áreas específicas, como las tareas ejecutivas (creación de senderos alfanuméricos) y la prueba de dibujo del reloj, donde se solicita al sujeto que diseñe una esfera marcando una hora específica. Estos mismos ejercicios, frecuentemente usados en pacientes humanos, fueron los que expusieron las mayores debilidades en los modelos más antiguos.

Particularmente preocupante fue el desempeño en la prueba de recuperación retardada, donde se debe recordar una secuencia de palabras tras un intervalo de tiempo. Los modelos Gemini fallaron sistemáticamente, sugiriendo que la antigüedad de los algoritmos podría ser un factor determinante en su capacidad de procesamiento.

¿Qué Significa Esto para la IA?

A pesar de estos fallos, los chatbots mostraron un rendimiento sólido en habilidades como la identificación, atención y abstracción. Sin embargo, el estudio plantea una pregunta crucial: ¿puede la IA mantenerse confiable con el paso del tiempo? Según los investigadores, estas limitaciones desafían la idea de que la IA pueda reemplazar por completo a los profesionales humanos en áreas como el diagnóstico médico.

Además, los resultados abren un debate sobre la sostenibilidad de los modelos de lenguaje en el tiempo. ¿Necesitan los sistemas de IA un «mantenimiento cognitivo» similar al aprendizaje continuo en los humanos?

Los hallazgos de este estudio no solo arrojan luz sobre el funcionamiento interno de los modelos de IA, sino que también subrayan la importancia de comprender sus límites. Aunque estas tecnologías han revolucionado el mundo, queda claro que la inteligencia artificial, como los humanos, tiene mucho que aprender sobre cómo mantenerse eficiente y confiable a largo plazo.