Google presenta nuevas herramientas para optimizar el uso de recursos en agentes de IA

Wait 5 sec.

A medida que los agentes de inteligencia artificial se vuelven más comunes en tareas complejas como búsquedas web, análisis de datos o navegación por documentos, el coste de su operación también se incrementa. En este contexto, Google, junto con investigadores de la Universidad de California en Santa Bárbara, ha desarrollado un marco innovador que permite a estos agentes gestionar mejor su «presupuesto» computacional y de uso de herramientas. Esta solución tiene como objetivo lograr que los agentes sean más conscientes de sus límites y ajusten su comportamiento para mantener un equilibrio entre precisión y coste.El problema del uso indiscriminado de herramientasCuando se piensa en un modelo de lenguaje, es fácil imaginar que cuanto más se le permite «pensar», mejores serán sus respuestas. Sin embargo, los agentes que interactúan con herramientas externas, como navegadores web o motores de búsqueda, enfrentan una realidad distinta. Cada vez que un agente hace una llamada a una herramienta, consume tokens, incrementa la longitud del contexto y añade latencia, lo cual se traduce directamente en un coste más alto. Si este proceso no está controlado, el agente puede perderse en una única vía de investigación sin darse cuenta de que no está generando resultados útiles.Los investigadores observaron que simplemente dar más recursos a un agente no garantiza un mejor rendimiento. De hecho, sin una percepción clara del presupuesto disponible, muchos agentes tienden a profundizar en pistas equivocadas durante muchas iteraciones, desperdiciando recursos sin obtener respuestas más precisas.Budget Tracker: conciencia del presupuesto en tiempo realPara resolver este problema, el equipo propuso inicialmente un enfoque sencillo pero eficaz llamado Budget Tracker. Esta herramienta actúa como un indicador de recursos que acompaña al agente durante todo el proceso de razonamiento. A nivel práctico, se trata de un componente que se integra directamente en el prompt del modelo, sin necesidad de reentrenamiento, lo cual lo convierte en una opción muy fácil de implementar.Budget Tracker proporciona una serie de directrices sobre cómo deben usarse los recursos disponibles. A medida que el agente avanza en su tarea, recibe señales explícitas sobre cuánto ha consumido y cuánto le queda. Este conocimiento lo obliga a ajustar su estrategia, priorizando caminos que puedan generar respuestas más prometedoras con menor consumo de herramientas.En los experimentos realizados, los agentes con Budget Tracker lograron un mejor rendimiento en tareas de búsqueda y navegación bajo diferentes límites presupuestarios. En particular, se observó una reducción significativa en el número de llamadas a herramientas, y una mejora en la precisión con menores costes. Es como si el agente aprendiera a no gastar todo su dinero en investigar una sola pista y, en cambio, supiera cuándo es momento de cambiar de enfoque.BATS: planificación estratégica bajo restriccionesAunque Budget Tracker mejoró notablemente la eficiencia, los investigadores fueron un paso más allá con un marco más completo llamado Budget Aware Test-time Scaling (BATS). Este sistema está diseñado para que el agente no solo sea consciente de su presupuesto, sino que también planifique sus acciones en función de él desde el inicio.BATS incluye varios módulos que trabajan en conjunto para maximizar el rendimiento dentro de los límites dados. Un módulo de planificación decide cuánta energía dedicar a cada paso, mientras que otro módulo de verificación evalúa si vale la pena seguir explorando una línea de razonamiento o si es mejor cambiar a otra. Todo esto ocurre en tiempo real, con un seguimiento constante del presupuesto gracias a Budget Tracker.Cuando el agente empieza a responder una pregunta compleja, BATS genera un plan estructurado que determina qué herramientas usar, cuándo usarlas y cómo evaluar las evidencias obtenidas. Si el agente llega a una posible respuesta, el sistema evalúa si debe seguir profundizando o si es momento de cerrar esa vía y buscar alternativas.Una vez agotados los recursos disponibles, BATS utiliza un modelo adicional para comparar todas las respuestas candidatas y elegir la mejor. Este enfoque asegura no solo un uso eficiente del presupuesto, sino también un mayor control sobre la calidad de las respuestas generadas.Resultados que cambian las reglas del juegoLas pruebas comparativas con otras técnicas estándar, como el enfoque ReAct (que alterna entre razonamiento y acción sin gestión de presupuesto), mostraron resultados contundentes. En tareas como BrowseComp y HLE-Search, BATS no solo logró mayor precisión, sino que también lo hizo con un coste menor.Por ejemplo, en BrowseComp, BATS alcanzó un 24,6% de precisión frente al 12,6% de ReAct, mientras que en HLE-Search obtuvo un 27% frente al 20,5%. Además, el coste para alcanzar estos niveles fue menos de la mitad en algunos casos, lo que representa una mejora significativa en la relación coste-beneficio.Este tipo de avance tiene implicaciones prácticas muy claras para empresas que buscan automatizar tareas complejas como auditorías, investigaciones de mercado, mantenimiento de código, análisis de cumplimiento o exploración documental profunda. Al permitir que los agentes administren sus recursos de forma inteligente, se abren nuevas posibilidades que antes eran inviables por coste o complejidad.Una nueva forma de pensar la inteligencia artificialEl desarrollo de BATS y Budget Tracker refleja una tendencia creciente en el diseño de agentes de IA: dejar de enfocarse únicamente en la potencia bruta y empezar a valorar la eficiencia operativa. Para los investigadores, el futuro de la inteligencia artificial estará definido no solo por su capacidad de razonar, sino por su habilidad para hacerlo dentro de límites económicos razonables.Tal como señalaron Zifeng Wang y Tengxiao Liu, coautores del estudio, los modelos del futuro no solo deberán responder preguntas, sino también razonar sobre el valor de cada acción que tomen. Esto marca un cambio de paradigma, donde la inteligencia se mide también por la capacidad de tomar decisiones eficientes, como lo haría un buen estratega frente a recursos limitados.La noticia Google presenta nuevas herramientas para optimizar el uso de recursos en agentes de IA fue publicada originalmente en Wwwhatsnew.com por Natalia Polo.