Google DeepMind показала первую ИИ-модель для рассуждающих роботов: они анализируют задачи и делятся навыками между платформами

Wait 5 sec.

Google DeepMind представила новую архитектуру, сочетающую физическую платформу (Gemini Robotics 1.5) и рассуждающий модуль (Gemini Robotics-ER 1.5). Первая предоставляет возможность манипуляций и выполнения задач, вторая — анализирует пользовательский запрос, делит комплексную задачу на понятные этапы и выстраивает план действий с учётом справки из открытых источников. Модели не просто реагируют на команды, а строят логические схемы действий и в удобной форме объясняют свой выбор оператору. Эксперименты показали перенос навыков: сценарий, освоенный одним типом робота, быстро внедряется в другой без переобучения, что ускоряет использование технологий в промышленности и сервисе. Система прошла тесты по стандартам индустрии, включая операции с сортировкой предметов, распознаванием условий и выполнением сложных действий. Источник: Google В отличие от предыдущих поколений ИИ, Gemini Robotics не требует от пользователя подробных инструкций — достаточно указать цель. Модель обращается к интернету, учитывает специфические правила (например, сортировку мусора по региону), строит алгоритм работы и мониторит риски на каждом этапе. По заявлению разработчиков, безопасность заложена в механизм принятия решений, ошибки и аномалии фиксируются и автоматически корректируются. Доступ к Gemini Robotics-ER 1.5 открыт для разработчиков, Gemini Robotics 1.5 работает на партнёрских технологических платформах. Новая система предназначена для промышленности, логистики и бытового обслуживания, потенциально сокращая сроки внедрения робототехники и повышая гибкость автоматизированных решений.