Claude Mythos написал 18 рабочих эксплойтов для Chrome. Остальные ИИ — ноль

Wait 5 sec.

Исследователи из Карнеги-Меллон под руководством Дэвида Брамли выпустили ExploitBench — бенчмарк из 41 уязвимости в движке V8, который работает внутри Chrome, Edge и Node.js. На нем прогнали девять фронтир-моделей. Закрытая модель Anthropic — Claude Mythos Preview — довела до рабочего эксплойта 18 из 41 бага. Остальные восемь моделей (Opus 4.7, Sonnet 4.6, Haiku 4.5, GPT-5.5, Gemini 3.1 Pro, GLM 5.1, Kimi K2.6, MiniMax M2.7) — ни одного. Читать далее