ИИ, который обучается вдвое быстрее: Ai2 выложила в открытый доступ Olmo Hybrid

Wait 5 sec.

Некоммерческий исследовательский институт Ai2 (Allen Institute for AI) выпустил Olmo Hybrid — языковую модель на 7 млрд параметров, которая в контролируемом эксперименте показала двукратное преимущество по эффективности обучения перед классическим трансформером. На бенчмарке MMLU модель достигает той же точности, что и трансформер Olmo 3, используя на 49% меньше токенов обучающей выборки. Все веса, код, промежуточные чекпоинты и технический отчет опубликованы под лицензией Apache 2.0. Читать далее