DeepSeek-V3.1: velocidad y razonamiento híbrido en código abierto

Wait 5 sec.

DeepSeek-V3.1 ha irrumpido en el panorama de la inteligencia artificial como el modelo de código abierto más ambicioso de la compañía, combinando rapidez, eficiencia y un sistema de razonamiento híbrido pensado para competir con gigantes como OpenAI.Este avance representa una alternativa fuerte para desarrolladores y empresas que buscan una IA potente, flexible y accesible de forma gratuita.Qué es DeepSeek-V3.1: el nuevo referente en IADeepSeek-V3.1 es la evolución natural de la familia DeepSeek, integrando 685 mil millones de parámetros totales (37 mil millones activados por token), una ventana de contexto de 128 mil tokens y una arquitectura Mixture-of-Experts que prioriza el ahorro de recursos de cómputo sin sacrificar potencia.Esto lo convierte en una herramienta clave tanto para análisis de documentos extensos, desarrollo de software o aplicaciones educativas.Modelo híbrido: velocidad y razonamiento inteligenteLa gran novedad está en su sistema híbrido capaz de alternar automáticamente entre modo rápido (Non-Think) para respuestas simples y modo profundo (Think) para tareas complejas.Así, el modelo analiza la consulta y elige el enfoque más eficiente, combinando la velocidad del modelo V3 original y la capacidad de razonamiento del modelo R1.Este enfoque logra resultados detallados sin mermar la velocidad, incluso ante consultas exigentes.Código abierto, eficiencia y bajo costoDeepSeek-V3.1 es completamente open source bajo la licencia MIT, permitiendo su uso y modificación incluso con fines comerciales.Se ha optimizado para reducir costos computacionales frente a otros modelos masivos, soportando diferentes tipos de hardware (incluso chips nacionales chinos), gracias a la activación parcial de parámetros y soporte de formatos BF16, F32 y F8_E4M3.Cualquier interesado puede descargar el modelo gratuitamente, aunque para la versión completa se recomiendan al menos 720 GB de almacenamiento y una GPU moderna de 24 GB o más de VRAM, como la Nvidia RTX 5090.Rendimiento en benchmarks y aplicaciones realesLos resultados en pruebas independientes son contundentes: supera ampliamente a sus predecesores y rivales en retos como SWE-bench (66% frente al 44,6% de R1), xbench-DeepSearch (71% vs 55%), SimpleQA (93,4%) y FRAMES (83,7%).Además, ofrece ventajas claras en tareas de programación, integrando mejor el uso de herramientas externas y acelerando procesos de desarrollo de software. DeepSeek-V3.1 destaca no solo en precisión, sino también en eficiencia y capacidad concisa de razonamiento útil para entornos reales.El modelo puede descargarse para uso local o emplearse vía API, con precios simplificados a partir del 5 de septiembre de 2025 ($0.56 USD por millón de tokens de entrada, $1.68 USD por millón de tokens de salida).También es posible probar el modelo en modo chat completamente gratis.Fuente: DeepSeekThe post DeepSeek-V3.1: velocidad y razonamiento híbrido en código abierto first appeared on PasionMóvil.