O Google criou um novo agente chamado SIMA 2, com capacidade para navegar e solucionar problemas em uma ampla variedade de mundos virtuais 3D. Ele foi construído sobre o Gemini, principal inteligência artificial da big tech, dando ao agente uma capacidade significativamente ampliada.O SIMA (sigla para ‘agente multimundo instruível escalável’) foi apresentado pela primeira vez em 2024, capaz de jogar diversos jogos, como o Goat Simulator 3, um título de ação com física exagerada. Já o SIMA 2, de acordo com pesquisadores, como destacado no site MT Technology Review — possui capacidade para realizar diversas tarefas complexas em ambientes virtuais, conseguindo interagir com usuários por meio de conversas e solucionar desafios por conta própria. Leia mais:O balé robótico da DeepMind: uma IA para coordenar robôs de fabricaçãoMedicamentos mais rápidos: IA pode encurtar pesquisas e salvar vidasGoogle cria IA que pode prever trajetória de ciclonesObjetivo do Google DeepMindGoogle DeepMind investe em inteligência artificial para encontrar maior usabilidade para a tecnologia (Imagem: Photo For Everything / Shutterstock.com)A ideia do Google DeepMind é conseguir construir agentes de próxima geração que tenham habilidades para seguir instruções e realizar ações complexas em ambientes muito sofisticados que vão além de um navegador web. Segundo o MT Technology Review, a big tech, no longo prazo, tem o objetivo de usar para controlar robôs no mundo real. O SIMA 2, por exemplo, já consegue utilizar ferramentas, navegar em um ambiente e colaborar com humanos, coisas tidas como essenciais para robôs companheiros no futuro. O SIMA foi criado para realizar o treinamento do agente para jogar um jogo aberto sem objetivos pré-estabelecidos. Dessa maneira, a ideia é que o agente aprenda a colocar em prática as orientações dadas pelas pessoas. O uso do SIMA 2 pode acarretar em agentes mais versáteis e robôs melhores (Imagem: Google DeepMind/Reprodução)Como funciona o SIMA 2?O SIMA 2 pode ser controlado por humanos por meio de bate-papo via texto, voz ou até mesmo desenhos na tela do jogo. A partir disso, o agente processa, quadro a quadro, os pixels do videogame e estabelece como agir para realizar as tarefas necessárias. O agente também pode ser conectado ao Gemini, o que, segundo os pesquisadores, faz com que ele fique melhor para seguir instruções (realizando perguntas e dando atualizações ao longo do processo). Outra melhoria ao utilizar a IA é que o agente consegue descobrir sozinho a maneira adequada de executar de executar determinadas tarefas complexas.Realização dos testesTreinamentos do agente foram parecidos com os que a primeira versão do agente passou Imagem: Iljanaresvara Studio/ShutterstockO treinamento do SIMA 2 ocorreu por meio de gravações de humanos jogando oito videogames comerciais, como Goat Simulator 3 e No Man’s Sky, além de três mundos virtuais construídos pela empresa. O agente ganhou a capacidade de associar comandos no mouse e no teclado a ações.Os ambientes nos quais o SIMA 2 foi inserido foram criados do zero pelo Genie 3, novo modelo de IA do Google DeepMind, capaz de criar mundos em 3D. O Gemini também foi colocado pelos pesquisadores para elaborar novas tarefas para o agente, que se falhasse, teria a IA como sua aliada para fornecer dicas voltadas a novas tentativas. Assim, o SIMA 2 conseguiu melhorar a cada tentativa até obter êxito. Até então, o SIMA 2 é apenas um experimentoApesar de trazer resultados promissores, o SIMA 2 é, até então, apenas um experimento. Ele ainda possui diversas dificuldades para realizar ações complexas, isto é, exigem diversas etapas.Outro ponto é que sua memória é pequena e ele ainda precisa evoluir significativamente para utilizar teclado e mouse ao interagir com um mundo virtual.O post Google DeepMind cria novo agente para jogos eletrônicos apareceu primeiro em Olhar Digital.