Представлен DeepSeek-V3.2-Exp: в разы дешевле при той же производительности

Wait 5 sec.

Представлена экспериментальная модель DeepSeek-V3.2-Exp, в которой разработчики впервые опробовали новую схему разреженного внимания (DSA). Модель доступна в веб-версии и приложениях (раскатка может идти поэтапно), API, а также на Hugging Face. Читать далее