DeepSeek lança modelo ‘intermediário’ e promete ‘próxima geração’ da IA

Wait 5 sec.

A chinesa DeepSeek está trabalhando no desenvolvimento do que chamou de “próxima geração” dos modelos de inteligência artificial. Enquanto isso não se torna realidade, a startup vai apresentando algumas novidades.A mais recente é o lançamento de uma versão “intermediária” da tecnologia. Segundo a empresa, o DeepSeek-V3.2-Exp é mais eficiente no processamento de longas sequências de texto do que as ferramentas anteriores.DeepSeek-V3.2-Exp foi lançado oficialmente (Imagem: Mojahid Mottakin/Shutterstock)Passo intermediário, diz startup chinesaSegundo reportagem da Reuters, o novo modelo inclui um mecanismo chamado DeepSeek Sparse Attention. A empresa chinesa afirma que este recurso possibilita reduzir os custos de computação e aumentar o desempenho da IA. A startup ainda afirmou que o DeepSeek-V3.2-Exp é “um passo intermediário em direção à arquitetura de próxima geração” que já está sendo desenvolvida. Este será provavelmente o lançamento mais importante da companhia desde que sacudiu o mercado no início deste ano.Empresa chinesa afirmou que está desenvolvendo a nova geração de IA (Imagem: Anggalih Prasetya/Shutterstock)Apesar de termos poucas informações disponíveis sobre as verdadeiras capacidades da nova geração de inteligência artificial do DeepSeek, a publicação ressalta que a nova ferramenta vai aumentar a pressão sobre as rivais do setor. Basta observar quais serão as reações da OpenAI, dona do ChatGPT, por exemplo.Leia maisDeepSeek revela quanto gastou para treinar seu modelo de IADeepSeek deve lançar agente de IA até o final do anoEUA vs China: DeepSeek tem plano para acelerar na corrida techDeepSeek virou um dos principais concorrentes do ChatGPT (Imagem: Poetra.RH/Shutterstock)Lançamento do DeepSeek foi um marcoA IA do DeepSeek foi projetada para lidar com tarefas complexas de raciocínio e tem apresentado resultados surpreendentes.O grande diferencial é o baixo custo da tecnologia, o que pode ameaçar a posição dominante dos principais players.Para se ter uma ideia, o modelo chinês foi treinado ao custo de aproximadamente US$ 6 milhões, enquanto ferramentas como o Llama 3.1, da Meta, custaram mais de US$ 60 milhões para serem desenvolvidos.A empresa chinesa adota estratégias como o chamado aprendizado por reforço, que permite que os modelos aprendam por tentativa e erro.Além disso, ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.E melhora a capacidade dos modelos de processar dados e identificar padrões complexos.A startup ainda adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos.Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.O post DeepSeek lança modelo ‘intermediário’ e promete ‘próxima geração’ da IA apareceu primeiro em Olhar Digital.