В разговоре с Логаном Килпатриком глава Google DeepMind Демис Хассабис заявил, что считает игры одним из самых перспективных бенчмарков для ИИ. Хассабис отметил, что многие существующие тесты, вроде SAT (стандартизированный тест для поступления в колледжи), GRE (тест для аспирантуры) и MMLU (многоуровневый тест на понимание языка), уже почти "пройдены" ИИ. При этом современные модели показывают "неровный интеллект": получают золотые медали на Международной математической олимпиаде (IMO), но совершают элементарные ошибки в простых логических задачах или специально сформулированных играх. Это указывает на отсутствие у моделей ключевых навыков, таких как рассуждение, планирование и память, которые необходимы для достижения настоящего общего искусственного интеллекта. Читать далее