Автор «теста на AGI» объяснил истинную цель своего бенчмарка

Wait 5 sec.

Создатель бенчмарка ARC-AGI-2 Франсуа Шолле ответил на ажиотаж вокруг результата стартапа Poetiq, который с помощью доработанной версии GPT-5.2 X-High достиг результата в 75%, в то время как проходившие бенчмарк люди в среднем показывали 60%. В треде на X Шолле объяснил, что текущие бенчмарки не являются порогом для определения AGI — это "компас, направляющий исследовательское сообщество к правильным вопросам". Читать далее