DeepSeek готовит новую модель V4 без Nvidia: ставку полностью делают на чипы Huawei

Wait 5 sec.

Китайская DeepSeek работает над новой языковой моделью V4, и, по данным источников The Information, она может полностью перейти на аппаратную платформу Huawei. Речь идет не просто о частичном использовании — модель, как утверждается, будет целиком построена на фирменных ИИ-чипах компании. Такие компании, как Alibaba Group, ByteDance и Tencent, недавно заказали оптом чипы Ascend 950PR. Ожидается, что модель DeepSeek V4 будет использовать архитектуру с почти триллионом параметров и, вероятно, сотни тысяч чипов Ascend 950PR. Дополнительные сведения показывают, что DeepSeek в течение нескольких месяцев сотрудничала с Huawei и Cambricon (китайским производителем микросхем) для переписывания и тестирования основных компонентов кода модели. Ни DeepSeek, ни Huawei пока не прокомментировали эту новость. Но существует большая вероятность, что эта информация правдива. DeepSeek уже давно использует чипы Ascend в своих моделях искусственного интеллекта. Поэтому не будет сюрпризом, если этот стартап в области ИИ полностью перейдет на Huawei на фоне конфликтов вокруг поставок продукции Nvidia в Китай. Ожидается, что DeepSeek V4 будет выпущена в ближайшие недели. Кроме того, компания работает над еще двумя новыми версиями, которые могут появиться позже в этом году. DeepSeek — это передовая китайская платформа искусственного интеллекта и серия больших языковых моделей (LLM), разработанная стартапом из Ханчжоу, которая позиционируется как мощный конкурент ChatGPT. Она специализируется на написании кода, математических вычислениях, логических рассуждениях и генерации текста, включая поддержку русского языка.