¿Nuevo hito en el mercado? DeepSeek lanza un novedoso modelo experimental

Wait 5 sec.

"Desarrollado sobre V3.1-Terminus, presenta DeepSeek Sparse Attention (DSA) para un entrenamiento e inferencia más rápidos y eficientes en un contexto largo", afirma la compañía.