Новый бенчмарк OdysseyBench прогоняет ИИ‑агентов через реалистичные многодневные офисные процессы — и результат неожиданен: более старая модель o3 стабильно опережает новую GPT 5 во множестве сложных заданий. Читать далее