2 апреля 2026 года Google DeepMind выпустила Gemma 4. В отличие от GPT, Claude и Gemini, GigaChat и других облачных API, это открытая модель: ее можно бесплатно скачать и запустить на собственном сервере, ноутбуке и даже смартфоне, используя в коммерческих целях без ограничений и лицензионных отчислений. Впервые открытая LLM практически сравнялась по качеству с лидерами облачного рынка, сохранив при этом «любительские» требования к оборудованию: с одной стороны, флагманская Gemma 4 31B, которая входит в тройку сильнейших открытых моделей (по версии Arena AI), помещаясь на GPU уровня RTX 4090. С другой — младшая Gemma 4 E2B, занимающая около 1,5 ГБ и способная эффективно работать без интернета, прямо на смартфоне. Именно этот диапазон — от локального AI на мобильном устройстве до корпоративных RAG-систем и серверной аналитики — делает Gemma 4 одной из самых интересных open-source-моделей 2026 года. Интересных настолько, что в ряде клиентских проектов, которые требуют внедрения локальной LLM, мы уже используем Gemma 4, заменив ею Ollama. Вот на этой ноте, предлагаем свой взгляд на то, как устроено семейство Gemma 4, чем новые модели отличаются от предыдущих версий, насколько конкурентоспособны на фоне GPT, Claude, Qwen, DeepSeek и GigaChat и сколько стоит их локальное развертывание. Читать далее