ChatGPT Images 2.0: OpenAI lanza su nuevo generador de imágenes con la IPO respirándole en la nuca

Wait 5 sec.

Sam Altman lo ha vendido como «pasar de GPT-3 a GPT-5 de golpe». La realidad es más prosaica: OpenAI necesita desesperadamente un éxito viral como el del fenómeno «Studio Ghibli» de hace un año, y ChatGPT Images 2.0 es la apuesta para conseguirlo antes de que los inversores de su futura salida a bolsa empiecen a mirar las cuentas con lupa.La compañía presentó este 21 de abril su nuevo generador de imágenes en un livestream que comenzó con un anuncio comparando la evolución del modelo con la historia del arte: DALL·E como «pinturas rupestres», Images 1.0 como «arte antiguo» e Images 2.0 como «el Renacimiento». La grandilocuencia del mensaje es inversamente proporcional a la situación de OpenAI en el mercado de generación de imágenes, donde Google lleva meses comiéndole la tostada con Nano Banana Pro. Y ahí está la verdadera historia.¿Qué es ChatGPT Images 2.0 y qué lo diferencia del modelo anterior?ChatGPT Images 2.0 es el nuevo modelo de generación de imágenes integrado en ChatGPT, sucesor directo de la versión GPT Image 1.5 presentada en diciembre de 2025. Según OpenAI, ofrece mejor inteligencia visual, capacidades multilingües mejoradas y mayor atención al detalle. En la demo oficial, el modelo generó una imagen de un cuenco de arroz donde un único grano diminuto llevaba escrito el nombre del modelo. Los investigadores aseguraron que los errores tipográficos son «muy raros», algo que hasta hace pocos meses era el talón de Aquiles de prácticamente todos los generadores de imágenes.El modelo se divide en dos modos claramente diferenciados: instant y thinking. El modo instantáneo es esencialmente una versión más rápida de un generador típico y está disponible desde ya para todos los usuarios de ChatGPT y de la API, incluidos los gratuitos. El modo pensante, más complejo, queda reservado a suscriptores de los planes Plus (20 dólares al mes), Pro (200 dólares al mes) y Business.Y es aquí donde se pone interesante: cuando el modo thinking está activo, Images 2.0 puede buscar información en tiempo real en la web, crear varias imágenes distintas a partir de un único prompt y revisar sus propios resultados antes de entregarlos. El ejemplo más llamativo es la generación de varias páginas de manga con personajes recurrentes y narrativa evolutiva a partir de una sola instrucción. También páginas enteras de revista. La nota de prensa que OpenAI distribuyó, por cierto, fue generada por el propio Images 2.0 con estética de revista retro.¿Por qué OpenAI lanza este modelo justo ahora?La respuesta corta: porque no le queda más remedio. La respuesta larga requiere contexto financiero.OpenAI se está preparando para una salida a bolsa prevista para este año o el próximo, después de haber cerrado en marzo una ronda histórica de 122.000 millones de dólares a una valoración de 852.000 millones. Son cifras vertiginosas, pero tras probar sus últimos productos y leer los reportes financieros filtrados, el cuadro se vuelve incómodo: la compañía sigue sin ser rentable y, según fuentes internas, no espera serlo hasta al menos 2029.Para hacer atractiva la IPO, OpenAI necesita dos cosas: reducir costes y hacer crecer los números visibles. Ya han empezado con lo primero eliminando el generador de vídeo Sora. Lo segundo requiere un golpe viral. En febrero la compañía anunció que ChatGPT había superado los 900 millones de usuarios activos semanales, y el siguiente hito narrativo —arbitrario pero mucho más vendible en un roadshow bursátil— es llegar al billón. Images 2.0 es la palanca para conseguirlo.El precedente está fresco: hace poco más de un año, el fenómeno Studio Ghibli generó una avalancha de usuarios que probaban ChatGPT solo para convertir sus fotos al estilo del estudio japonés. OpenAI quiere replicar esa viralidad, y en el livestream el investigador Gabriel Goh dejó clara cuál es la apuesta: el fotorrealismo. «Activa algo muy interesante», dijo. Léase: activa descargas, compartidos en redes y altas en la plataforma.¿Qué competencia enfrenta OpenAI en generación de imágenes?El golpe más duro no vino de una startup insolente, sino de Google. A finales de 2025 el gigante de Mountain View lanzó Gemini 3 y actualizó su modelo Nano Banana Pro, cuyo realismo desconcertó al sector entero por su capacidad de generar texto legible dentro de imágenes y producir resultados indistinguibles de fotografías reales. La recepción fue tan buena que OpenAI declaró internamente un «código rojo», según filtraciones publicadas en diciembre.Desde entonces, la compañía de Altman ha ido encadenando movimientos defensivos: lanzamiento de Nano Banana 2 Flash por parte de Google, integración de Personal Intelligence en Gemini para personalizar imágenes con datos de Gmail, YouTube y Google Photos… Cada noticia sobre Google en los últimos meses ha sido un recordatorio incómodo para OpenAI de que su dominio de facto del espacio conversacional se está erosionando en el terreno visual.A esto se suma Anthropic, cuyos modelos agénticos Claude Cowork y Claude Code llevan meses arañando cuota de mercado en el segmento empresarial. La preocupación es tal que incluso Jensen Huang, CEO de Nvidia y socio clave de OpenAI, expresó inquietud sobre la dominancia de mercado de la compañía según un reporte del Wall Street Journal a principios de año.Las grietas del modelo: ¿qué puede salir mal?No todo en Images 2.0 es brillo. En los tests previos al lanzamiento, filtrados en Reddit y X desde principios de abril bajo nombres en clave como «maskingtape-alpha» y «gaffertape-alpha», aparecieron ejemplos reveladores. Uno muestra un mapa mundi con países inventados como «Ciger» y «Mharee», y capitales mal ubicadas —Nairobi aparece en Arabia Saudí—. Son las clásicas alucinaciones que arrastran los modelos multimodales desde hace años.El problema va más allá del gazapo geográfico. En un momento donde la desinformación visual es una preocupación real, un modelo fotorrealista capaz de generar imágenes «cándidas» —así las llama OpenAI en sus ejemplos— pero con errores factuales disimulados tras una estética creíble es un arma de doble filo. La industria ya vivió este debate con Nano Banana Pro, y tampoco encontró una solución satisfactoria más allá de marcas de agua invisibles que cualquier usuario avanzado puede eliminar.Mi valoraciónImages 2.0 es un producto sólido y necesario para OpenAI, pero no estamos ante un «Renacimiento» como sugiere el marketing. Estamos ante una compañía que necesita desesperadamente dos cosas: un momento viral que justifique su valoración de 852.000 millones ante inversores bursátiles, y una respuesta contundente a un Google que le ha ganado la batalla técnica en los últimos seis meses.El modo thinking, con búsqueda web integrada y capacidad de generar manga coherente, es genuinamente impresionante y marca una diferencia real frente a la competencia. Pero el modo instant, el que usaremos la mayoría, va a competir en un mercado donde Nano Banana Pro, Midjourney v7, Ideogram 3.0 y Firefly de Adobe ofrecen alternativas muy maduras. Quien ya esté enganchado al ecosistema ChatGPT va a amar Images 2.0; quien haya migrado a Gemini no tiene razones claras para volver.Lo que sí es seguro: tras probar las primeras imágenes generadas por Images 2.0, la calidad técnica está a la altura. La pregunta es si OpenAI conseguirá convertir eso en el fenómeno viral que necesita para que la IPO no sea un baño de agua fría.Preguntas frecuentes sobre ChatGPT Images 2.0¿Puedo usar ChatGPT Images 2.0 gratis? Sí, el modo instant está disponible para todos los usuarios de ChatGPT, incluidos los de la cuenta gratuita, desde el lanzamiento. El modo thinking, con capacidades avanzadas como búsqueda web y generación de varias imágenes por prompt, está reservado a suscriptores de Plus, Pro y Business.¿Cuál es la principal diferencia con Nano Banana Pro de Google? Nano Banana Pro destaca por su realismo y su integración con la base de conocimiento de Gemini y la Búsqueda de Google. Images 2.0 ofrece integración nativa en ChatGPT y, en modo thinking, puede generar contenido secuencial como páginas de manga o revistas completas desde un único prompt.¿Incluye marcas de agua o metadatos para identificar imágenes generadas por IA? OpenAI mantiene los metadatos C2PA que ya incluía en versiones anteriores de su generador. Estos pueden ser eliminados por usuarios avanzados, por lo que no suponen una solución definitiva contra la desinformación.La noticia ChatGPT Images 2.0: OpenAI lanza su nuevo generador de imágenes con la IPO respirándole en la nuca fue publicada originalmente en Wwwhatsnew.com por Natalia Polo.