"Desarrollado sobre V3.1-Terminus, presenta DeepSeek Sparse Attention (DSA) para un entrenamiento e inferencia más rápidos y eficientes en un contexto largo", afirma la compañía.