La inteligencia artificial es capaz de responder casi cualquier cosa con precisión. Pero once matemáticos han creado una prueba diseñada para algo distinto: comprobar si realmente entiende lo que hace o solo imita patrones sin razonar

Wait 5 sec.

El proyecto First Proof enfrenta a los modelos de lenguaje a problemas matemáticos inéditos, fuera de su entrenamiento. El objetivo no es que acierten, sino ver cómo piensan. El resultado apunta a una diferencia incómoda: responder bien no es lo mismo que razonar de verdad.