Китайская лаборатория MiniMax представила M3 — открытую мультимодальную модель с контекстным окном до миллиона токенов, ориентированную на программирование и автономные агентные задачи. API и собственная агентная среда MiniMax Code доступны уже сейчас, а веса и технический отчет MiniMax обещает выложить на HuggingFace и GitHub в течение примерно десяти дней. Модель обрабатывает текст и изображения как единое целое — мультимодальность, по словам разработчиков, заложена в нее с самого начала обучения, а не добавлена поверх готовой языковой основы. Читать далее