Jalapeño: el primer chip propio de OpenAI llega en nueve meses de desarrollo y apunta a la independencia de Nvidia

Wait 5 sec.

OpenAI y Broadcom presentaron el 24 de junio de 2026 su primer acelerador de inteligencia artificial diseñado de forma conjunta: Jalapeño, el primer procesador personalizado de OpenAI para inferencia de grandes modelos de lenguaje. La entrega del chip fue física y ceremonial: Hock Tan, presidente y CEO de Broadcom, y Charlie Kawwas, presidente de su división de soluciones en silicio, entregaron en mano una muestra del chip a Sam Altman y Greg Brockman en las oficinas de OpenAI. No es solo un hito técnico: es el primer paso visible de la estrategia de OpenAI de dejar de depender de Nvidia para la etapa del negocio donde más margen hay en juego, la inferencia.El anuncio lo confirma Broadcom en nota oficial y lo amplía TechCrunch. Jalapeño pasó del diseño inicial al tape-out —el punto en que el diseño se envía a fabricación— en solo nueve meses. Broadcom lo califica como posiblemente el ciclo de desarrollo de ASIC de alto rendimiento más rápido de la historia del sector.Qué es Jalapeño y en qué se diferencia de los aceleradores existentesUn acelerador convencional como las GPU H100 o B200 de Nvidia es, en esencia, hardware generalista optimizado para cargas de trabajo de IA pero no exclusivamente para ellas. Jalapeño es un ASIC (circuito integrado de aplicación específica): fue diseñado desde cero pensando únicamente en los patrones de inferencia que OpenAI ejecuta a diario en ChatGPT, Codex, su API y sus productos de IA agentiva.Eso importa porque la inferencia tiene requisitos distintos al entrenamiento. El entrenamiento maximiza el rendimiento bruto de cómputo en ciclos largos. La inferencia maximiza la latencia baja y el throughput en ciclos cortos e interactivos. Las GPU de Nvidia son mejores en entrenamiento que en inferencia a escala interactiva. Jalapeño está diseñado para ser bueno exactamente en lo que Nvidia es comparativamente débil.Richard Ho, director del programa de hardware de OpenAI, lo explica con precisión técnica: el chip fue optimizado alrededor de los kernels de cómputo, el movimiento de memoria, las redes de comunicación y los patrones de servicio que importan para los modelos de frontera de OpenAI. El objetivo es ejecutar las cargas de trabajo más importantes «cerca del límite teórico del hardware», lo que en la práctica significa mayor eficiencia por watt y menor coste por token servido.El chip usa memoria HBM (High Bandwidth Memory), la misma tecnología de memoria de alta densidad que usan los aceleradores premium de Nvidia, lo que indica que OpenAI no está sacrificando rendimiento por coste de fabricación. El socio industrial para los racks y el sistema es Celestica, que aporta la experiencia en integración de sistemas a escala de centro de datos.La alianza con Broadcom para este chip se anunció hace casi un año: en septiembre de 2025 ya sabíamos que OpenAI preparaba su propio chip con Broadcom para reducir su dependencia de Nvidia. Jalapeño convierte ese anuncio en silicio real.Nueve meses de desarrollo: qué significa en términos de ingenieríaEl sector del diseño de chips de alto rendimiento tiene sus propios tiempos. Un ASIC complejo normalmente tarda entre 18 y 36 meses desde el diseño inicial hasta el tape-out. Nueve meses es, si la afirmación se sostiene, un tiempo notablemente corto para un acelerador a escala de gigavatio.¿Cómo lo consiguieron? OpenAI y Broadcom mencionan tres factores. Primero, la co-optimización profunda entre software y hardware: OpenAI conoce exactamente qué hacen sus modelos porque los ejecuta a escala todos los días. Eso reduce el espacio de diseño a explorar y acelera las decisiones de arquitectura. Segundo, la experiencia de Broadcom en diseño de chips de alto rendimiento para IA, que tiene décadas de ventaja sobre cualquier startup nueva. Tercero, y esto es lo más llamativo: OpenAI usó sus propios modelos de IA para acelerar partes del proceso de diseño y optimización del chip.«Los mismos modelos que servimos a los usuarios ayudan a mejorar la infraestructura que servirá los modelos futuros», dice la nota oficial de OpenAI. Es un bucle que, si funciona como describe, reduce el coste de cada generación subsiguiente.Para el calendario comercial: Broadcom confirma que habrá «pequeño desarrollo prototipo» en el último trimestre de 2026, escala gradual durante 2027 y «pleno rendimiento en la primera mitad de 2028». La hoja de ruta es multi-generacional.Por qué OpenAI quiere ser dueño de toda la pilaLa frase de Greg Brockman lo dice sin rodeos: OpenAI «no puede conseguir suficiente cómputo». Hock Tan añade que la demanda de los clientes de Broadcom —incluyendo a OpenAI— es «simplemente insaciable» no solo en 2026 y 2027 sino también en 2028.Esa presión tiene consecuencias económicas directas. Cada token que OpenAI sirve en ChatGPT, en la API o en Codex tiene un coste de infraestructura. Si ese coste baja porque el chip propio es más eficiente que las GPU compradas a Nvidia, el margen de OpenAI sube sin que el precio para el usuario cambie. Para una empresa que levantó 110.000 millones de dólares en su última ronda apuntando a construir infraestructura propia, tener el chip propio es la pieza que cierra el círculo: modelo, producto, centro de datos y ahora chip.Broadcom no pierde en este acuerdo. Sus acciones subieron un 10% en 2026 antes del anuncio, impulsadas en parte por las expectativas de este proyecto. El fabricante multiplica sus ingresos por diseños personalizados de IA: ya tiene acuerdos similares con Google (TPU), Meta (MTIA) y ahora OpenAI.Para Nvidia, el movimiento es un recordatorio de que sus clientes más grandes no son solo clientes: son potenciales competidores en hardware. OpenAI también firmó un acuerdo con AMD para construcción de infraestructura a gran escala, lo que dibuja un ecosistema de hardware donde Nvidia sigue siendo dominante pero ya no imprescindible.Jalapeño está diseñado inicialmente para uso interno de OpenAI. El anuncio no incluye planes de venta a terceros, pero si el chip demuestra eficiencia superior en inferencia, la presión para considerarlo como oferta comercial existirá.Mi valoraciónLlevo cubriendo el mercado de semiconductores para IA desde los primeros aceleradores de Google en 2016, y el movimiento de OpenAI hacia el silicio propio era previsible. Lo que no era obvio era la velocidad.Lo que más me convence es la concreción técnica. No es una presentación de concepto: hay un chip físico, hay benchmarks en desarrollo y hay un calendario de despliegue por fases anunciado públicamente. Eso es diferente de los anuncios de «chip propio» que terminan en nada. Nueve meses de tape-out, si se sostiene, es una demostración real de capacidad.Lo que más me preocupa es el calendario. Tan ha dicho que el desarrollo a escala completa no llega hasta el primer semestre de 2028. Eso significa que durante los próximos 18 meses, OpenAI sigue dependiendo de Nvidia para la mayor parte de su cómputo. Jalapeño no cambia la economía de OpenAI en 2026; la cambia en 2028 si todo va bien.Lo más estructuralmente significativo es que OpenAI ha diseñado el chip usando sus propios modelos de IA. Si eso se convierte en práctica estándar, los ciclos de diseño de hardware se acortarán para cualquier empresa con acceso a buenos modelos. Eso democratiza la capacidad de diseño de chips, aunque solo para los que tienen suficiente cómputo para entrenar esos modelos de diseño.La pregunta a 12 meses no es si Jalapeño es un buen chip: es si el despliegue a pequeña escala en el cuarto trimestre de 2026 demuestra eficiencia de inferencia por debajo del coste de las alternativas de Nvidia. Si los números internos de OpenAI son mejores, 2027 acelerará el plan. Si el rendimiento real decepciona en producción, la narrativa de independencia de Nvidia tardará más de lo esperado.Preguntas frecuentes¿Jalapeño reemplazará a las GPU de Nvidia en los centros de datos de OpenAI?No a corto plazo. Jalapeño está diseñado específicamente para inferencia, y OpenAI reconoce que el entrenamiento de modelos de frontera seguirá requiriendo hardware de Nvidia o equivalente durante años. La estrategia es complementar, no reemplazar: usar Jalapeño donde la inferencia interactiva necesita latencia baja y coste optimizado, y mantener GPU de Nvidia donde el entrenamiento masivo sigue siendo necesario.¿Cuándo estará disponible Jalapeño para empresas externas a OpenAI?El anuncio actual es para uso interno de OpenAI. No hay planes confirmados de venta a terceros. El despliegue en centros de datos con Microsoft y otros socios comenzará a pequeña escala en el cuarto trimestre de 2026, escala progresiva en 2027 y plena operación en el primer semestre de 2028, según Hock Tan de Broadcom.¿Qué diferencia a Jalapeño de los chips de Google (TPU) o Meta (MTIA)?Los TPU de Google son aceleradores diseñados principalmente para los modelos de Google, con décadas de iteración. Los MTIA de Meta están optimizados para las cargas de trabajo de recomendación y ranking de Meta. Jalapeño está diseñado desde cero para los patrones de inferencia específicos de OpenAI, incluyendo modelos de razonamiento, código y cargas agentivas. La diferencia clave de Jalapeño es el uso de los propios modelos de IA de OpenAI para acelerar el proceso de diseño, algo que Google y Meta no han anunciado explícitamente.La noticia Jalapeño: el primer chip propio de OpenAI llega en nueve meses de desarrollo y apunta a la independencia de Nvidia fue publicada originalmente en Wwwhatsnew.com por Natalia Polo.