OpenAI lanza GPT-5.4, su modelo más potente: es el primero capaz de controlar un ordenador por ti

Wait 5 sec.

OpenAI acaba de presentar GPT-5.4, su modelo de inteligencia artificial más avanzado hasta la fecha. La compañía lo describe como su sistema más capaz y eficiente, y lo ha puesto a disposición en ChatGPT, la API y su plataforma Codex. Lo que diferencia a esta versión de todas las anteriores es una capacidad inédita: GPT-5.4 es el primer modelo generalista de OpenAI capaz de controlar un ordenador de forma nativa, interactuando con webs y aplicaciones como lo haría un usuario humano.La empresa ha lanzado dos variantes. GPT-5.4 Thinking está disponible para los suscriptores de ChatGPT Plus, Team y Pro, mientras que GPT-5.4 Pro queda reservado para los planes Pro y Enterprise. La versión Thinking muestra un plan previo de su razonamiento antes de empezar a trabajar, lo que permite al usuario corregir el rumbo a mitad de la respuesta sin necesidad de empezar de cero.Los números que acompañan al lanzamiento son llamativos. En el benchmark OSWorld-Verified, que mide la capacidad de un modelo para operar un entorno de escritorio real mediante capturas de pantalla y comandos de teclado, GPT-5.4 alcanza un 75 % de éxito, superando el rendimiento humano registrado en un 72,4 %. Su predecesor, GPT-5.2, se quedaba en un 47,3 %.El modelo que trabaja como un profesionalSegún publica OpenAI en su blog oficial, GPT-5.4 ha sido diseñado para tareas de conocimiento profesional. En el test GDPval, que evalúa la capacidad de agentes de IA para producir trabajo real en 44 ocupaciones, el modelo iguala o supera a profesionales humanos en el 83 % de las comparaciones. Las tareas incluyen desde presentaciones de ventas hasta hojas de cálculo contables. El anterior modelo GPT-5 había establecido un listón alto, pero esta iteración lo eleva de forma considerable.OpenAI ha puesto énfasis en mejorar el trabajo con hojas de cálculo y presentaciones. En un benchmark interno de modelado financiero, GPT-5.4 obtiene un 87,3 %, frente al 68,4 % de GPT-5.2. En evaluaciones de presentaciones, los evaluadores humanos prefirieron los resultados de GPT-5.4 un 68 % de las veces por mejor estética y mayor variedad visual. La compañía también destaca que las afirmaciones del modelo tienen un 33 % menos de probabilidades de ser falsas. Cuando Anthropic presentó su sistema de control de ordenador en 2024, abrió un camino que OpenAI lleva ahora más lejos.Herramientas, contexto y eficiencia sin precedentesEn la API, GPT-5.4 soporta ventanas de contexto de hasta un millón de tokens, el mayor tamaño ofrecido por OpenAI. Esto permite a los agentes planificar y verificar tareas a lo largo de horizontes temporales extensos. Además, introduce Tool Search, que permite al modelo buscar definiciones de herramientas bajo demanda. En pruebas con 250 tareas del benchmark MCP Atlas con 36 servidores habilitados, esta configuración redujo el consumo total de tokens un 47 % manteniendo la misma precisión. El agente de ChatGPT lanzado el año pasado ya apuntaba en esta dirección, y con GPT-5.4 OpenAI compite con rivales como Gemini 3 de Google, que también incorpora funciones de uso de ordenador.En programación, GPT-5.4 hereda las capacidades de GPT-5.3-Codex e iguala o supera su rendimiento en SWE-Bench Pro con menor latencia. El modelo también mejora la búsqueda web: en BrowseComp salta al 82,7 % frente al 65,8 % de GPT-5.2. En cuanto a precios, cuesta 2,50 dólares por millón de tokens de entrada y 15 dólares por millón de salida, algo por encima de GPT-5.2, aunque OpenAI asegura que la mayor eficiencia del modelo compensa el incremento al requerir menos tokens para completar las mismas tareas.