NVIDIA presenta Nemotron 3 Nano Omni, el nuevo modelo de IA abierta

Wait 5 sec.

La compañía del chip verde acaba de revelar su más reciente apuesta en el competitivo mercado de modelos de inteligencia artificial, y los números que arroja son simplemente impresionantes.Con un rendimiento que multiplica por nueve la capacidad de procesamiento en sistemas agénticos, este nuevo desarrollo ha logrado captar la atención de empresas de la talla de Foxconn, Palantir y Oracle, quienes ya están integrando esta tecnología en sus plataformas.Una Arquitectura Que Redefine la Eficiencia MultimodalLo que hace particularmente interesante a Nemotron 3 Nano Omni es su capacidad para procesar simultáneamente video, audio, imagen y texto dentro de un único sistema integrado.A diferencia de soluciones anteriores que requerían múltiples modelos de percepción trabajando de manera independiente, este nuevo desarrollo consolida todo en una arquitectura híbrida de mezcla de expertos de 30B-A3B, eliminando redundancias y optimizando el rendimiento general.Las cifras hablan por sí solas: este modelo ha conseguido posicionarse en la cima de seis tablas de clasificación diferentes, destacándose especialmente en inteligencia documental compleja, así como en comprensión de contenido audiovisual.Cabe destacar que esta combinación de encoders de visión y audio permite que los sistemas de IA alcancen un throughput nueve veces superior comparado con otros modelos omni de código abierto, manteniendo el mismo nivel de interactividad.La eficiencia no viene a costa de la precisión, algo que resulta fundamental para aplicaciones empresariales. El modelo mantiene una alta exactitud en percepción multimodal mientras reduce significativamente los costos operativos, lo que se traduce en mejor escalabilidad sin sacrificar capacidad de respuesta ni calidad en los resultados finales.Aplicaciones Prácticas Que Transforman Flujos de TrabajoEn el ámbito de agentes de uso computacional, Nemotron 3 Nano Omni demuestra su potencial al impulsar el ciclo de percepción para agentes que navegan interfaces gráficas de usuario.Un caso particularmente notable es el de H Company, cuyo más reciente agente de uso computacional aprovecha una resolución nativa de entrada de 1920×1080 píxeles para lograr razonamiento visual de alta fidelidad. Las evaluaciones preliminares en el benchmark OSWorld han mostrado avances significativos en la navegación de interfaces gráficas complejas.Por otro lado, en inteligencia documental, el modelo interpreta documentos, gráficos, tablas, capturas de pantalla y entradas multimedia mixtas, permitiendo que los agentes razonen de manera coherente a través de estructura visual y contenido textual.Esta capacidad resulta crítica para flujos de trabajo empresariales relacionados con análisis y cumplimiento normativo, donde la precisión en la interpretación de información compleja marca la diferencia.En cuanto a comprensión de audio y video, el sistema mantiene el contexto audiovisual completo, vinculando lo que se dijo, mostró y documentó en un único flujo de razonamiento en lugar de resúmenes desconectados. Esta característica es especialmente valiosa para flujos de trabajo de servicio al cliente, investigación y monitoreo, donde la continuidad contextual es esencial.Adopción Empresarial y Flexibilidad de ImplementaciónLa lista de empresas que ya están adoptando o evaluando Nemotron 3 Nano Omni es impresionante.Además de Foxconn, Palantir y Oracle, compañías como Aible, Applied Scientific Intelligence, Eka Care, H Company y Pyler ya están implementando el modelo en sus sistemas. Paralelamente, gigantes tecnológicos como Dell Technologies, DocuSign, Infosys, K-Dense, Lila y Zefr se encuentran en fase de evaluación.Sin lugar a dudas, una de las ventajas más significativas de este modelo es su capacidad para trabajar en conjunto con otros modelos propietarios en la nube o con otros modelos abiertos de la familia NVIDIA Nemotron.Esta flexibilidad permite que las empresas diseñen arquitecturas híbridas, utilizando Nemotron 3 Super para ejecución de alta frecuencia o Nemotron 3 Ultra para planificación compleja, según las necesidades específicas de cada flujo de trabajo agéntico.Fuente: NVIDIAThe post NVIDIA presenta Nemotron 3 Nano Omni, el nuevo modelo de IA abierta first appeared on PasionMóvil.