Frontier модели на экзамене в ШАД 2026

Wait 5 sec.

Авторы: Канунников А., Лыков А., к.ф.-м.н., академический руководитель Школы Высшей Математики и ШАДХелпера.В статье разбираем задачи онлайн-экзамена в ШАД 2026 года и смотрим, как с ними справились восемь больших языковых моделей — от ChatGPT до GigaChat.В прошлом году мы тестировали модели на задачах онлайн-экзамена ШАД 2025. Тогда лидировал ChatGPT o3 с 57 баллами, а российские модели не набрали ни одного. В этот раз берём шесть задач онлайн-экзамена 2026 года и тестируем восемь моделей: ChatGPT 5.5, Gemini 3.1 Pro, Claude Opus 4.8, DeepSeek-V4-Pro, YandexGPT 5.1 Pro, GigaChat Ultra, Qwen3.7-Max и GLM-5.2.Сразу скажем результат: Qwen3.7-Max и DeepSeek-V4-Pro набрали по 58 баллов из 60, Gemini 3.1 Pro — 56, ChatGPT 5.5 — 53. Российские модели в этом году уже не нулевые: YandexGPT — 28 баллов, GigaChat — 13. Результаты остальных моделей — в таблице ниже. Переходим к задачам. Читать далее