Новая GPT-5.2 поставила рекорд в сложнейшем «бенчмарке на AGI»

Wait 5 sec.

OpenAI представила GPT-5.2 — свою новую флагманскую модель, которая в ближайшее время заменит GPT-5.1 в API и ChatGPT. А организация ARC Prize уже опубликовала результаты своих бенчмарков ARC-AGI-1 и ARC-AGI-2, которые считаются сложным тестом на абстрактное мышление и нередко называются "экзаменом на AGI". Модель заняла первое место в обоих бенчмарках, но остановимся на результатах ARC-AGI-2 — эта версия была выпущена недавно и считается, что ее задачи еще не "попали" в обучающие дата-сеты для ИИ. Читать далее