DeepSeek lança modelo de IA “intermediário” a caminho de próxima geração

Wait 5 sec.

PEQUIM (Reuters) – A desenvolvedora chinesa de inteligência artificial DeepSeek lançou seu modelo “experimental” mais recente, que, segundo ela, é mais eficiente para treinar e melhor no processamento de longas sequências de texto do que as versões anteriores.A empresa sediada em Hangzhou chamou o DeepSeek-V3.2-Exp de “etapa intermediária em direção à nossa arquitetura de próxima geração” em uma publicação no fórum de desenvolvedores Hugging Face. Essa arquitetura provavelmente será o lançamento de produto mais importante da DeepSeek desde que as versões V3 e R1 chocaram o Vale do Silício e investidores de tecnologia.O modelo V3.2-Exp inclui um mecanismo chamado DeepSeek Sparse Attention, que, segundo a empresa chinesa, pode reduzir os custos de computação e aumentar o desempenho de alguns tipos de modelos. A DeepSeek disse nesta segunda-feira na rede social X que está cortando os preços da API em “mais de  50%”.Embora seja improvável que a arquitetura de próxima geração da DeepSeek agite os mercados como as versões anteriores fizeram em janeiro, ela ainda pode exercer uma pressão significativa sobre rivais nacionais como a Qwen, da Alibaba, e contrapartes norte-americanas como a OpenAI se puder repetir o sucesso do DeepSeek R1 e V3.Isso exigirá que a empresa demonstre alta capacidade por uma fração do que os concorrentes cobram e gastam no treinamento de modelos.(Por Eduardo Baptista)The post DeepSeek lança modelo de IA “intermediário” a caminho de próxima geração appeared first on InfoMoney.