LongCat-2.0: A IA chinesa que operou escondida por meses e surpreendeu especialistas

Wait 5 sec.

A empresa de tecnologia chinesa Meituan revelou oficialmente o LongCat-2.0 em 30 de junho, confirmando que o modelo de inteligência artificial (IA) de mistura de especialistas de licença aberta, com 1,6 trilhão de parâmetros, é o mesmo sistema que operou anonimamente por dois meses no OpenRouter sob o pseudônimo “Owl Alpha“.Parâmetros são o número total de ajustes que um modelo pode lidar durante o treinamento. O modelo ativa aproximadamente 48 bilhões de seus parâmetros por token (a menor unidade de dados que um modelo de inteligência artificial processa), com esse número variando entre 33 bilhões e 56 bilhões, dependendo da exigência da consulta.O período de sigilo valeu a pena. Quando a Meituan se apresentou, o modelo já havia alcançado o primeiro lugar no espaço de trabalho Hermes Agent, o segundo no Claude Code e o terceiro nas implementações do OpenClaw, todos classificados por volume mensal de chamadas.Este é o primeiro modelo de trilhão de parâmetros treinado e implantado de ponta a ponta em ASICs chineses domésticos, não apenas executado neles após o treinamento em outros lugares. O V4-Pro do Deepseek, em comparação, usou chips Huawei apenas para inferência, enquanto o pré-treinamento ocorreu em hardware Nvidia.A Meituan informa que a fase de pré-treinamento, que abrangeu mais de 35 trilhões de tokens em um cluster de mais de 50.000 aceleradores de produção nacional, foi concluída “sem reversões ou picos de perda irrecuperáveis”. Essa alegação de estabilidade é importante, considerando a frequência com que grandes execuções de treinamento em pilhas de hardware não comprovadas falham no meio do processo e como a China parece estar reduzindo sua dependência de hardware dos EUA para treinar seus modelos.Leia também: Anthropic pede ao Congresso dos EUA cerco contra cópia de IA por rivais chinesesO preço é onde o LongCat-2.0 realmente se destaca. O acesso padrão à API custa US$ 0,75 por milhão de tokens de entrada e US$ 2,95 por milhão de saída, reduzido para US$ 0,30/US$ 1,20 durante a promoção de lançamento atual, com leituras de contexto em cache gratuitas. Isso supera o GPT-5.5, que cobra US$ 5/US$ 30 por milhão de tokens, a taxa introdutória de US$ 2/US$ 10 do Claude Sonnet 5, e se aproxima dos US$ 0,435/US$ 0,87 permanentes do Deepseek V4-Pro e do MiMo-V2.5 Pro da Xiaomi, que igualou essa mesma taxa após seus próprios cortes de preços em maio.A Meituan também oferece um plano de tokens, o que torna as coisas ainda mais baratas para programadores e usuários intensivos, com pacotes de 1 bilhão de tokens por cerca de US$ 60.Nós mesmos testamos o LongCat-2.0 em um teste rápido de criação de jogos. Ele cumpriu a tarefa, e a saída se manteve razoavelmente bem após algumas rodadas de iteração. O resultado ficou visivelmente atrás do Claude Fable e do Opus 4.8, facilitando a classificação próxima ao Sonnet 4.6, mas a relação qualidade-preço é difícil de contestar a esses valores.Ele fez as ondas de inimigos virem de diferentes ângulos, com a câmera centralizando automaticamente no inimigo mais próximo. No entanto, a lógica do modelo não levou em consideração o que acontece quando o número de inimigos aumenta com a dificuldade. Em velocidades mais altas, a lógica de troca de alvo tornou-se errática; o foco saltava para um inimigo mais próximo no meio de um prompt de digitação, tornando o jogo frustrantemente injogável.Isso é normal em sessões de codificação “vibe”, onde os modelos não preveem muitas consequências lógicas de uma decisão e, em vez disso, se concentram em entregar um resultado baseado literalmente no que o usuário solicita.É também por isso que um modelo barato é sempre uma boa opção, pois dá ao usuário mais chances de melhorar iterativamente cada resultado até que o produto final atenda às expectativas.Seja como for, sem mais interação, à primeira vista, a qualidade geral se situa entre o DeepSeel v4 Flash e o Deepseek v4 Pro em nossos testes rápidos de codificação.Você pode conferir os resultados em nosso site itch.io.Como a Meituan o construiuO LongCat-2.0 utiliza várias técnicas para tornar o modelo mais rápido e capaz sem aumentar drasticamente seu tamanho.Seu sistema de atenção, baseado no design do DeepSeek, foca apenas nas partes mais relevantes de conversas muito longas, em vez de processar tudo igualmente, ajudando-o a responder mais rapidamente.Além disso, um novo sistema de incorporação de N-gramas (uma forma de ajudar a entender grupos de palavras ou subpalavras juntas) proporciona ao modelo uma compreensão muito mais rica de palavras e frases — cerca de 100 vezes mais representações possíveis — sem adicionar muitos mais componentes de inteligência artificial.Basicamente, ele ensina a IA a reconhecer frases comuns em vez de apenas palavras individuais. Em vez de ver “New”, “York” e “City” como três peças separadas, ele também pode tratar “New York City” como um único conceito significativo. Isso confere ao modelo uma compreensão muito mais rica da linguagem sem torná-lo dramaticamente maior.Após o treinamento, a Meituan também combina três sistemas especializados: um focado no uso de ferramentas (Agente), outro na resolução de problemas (Raciocínio) e um terceiro em conversas (Interação). Um mecanismo de roteamento decide, então, qual combinação desses especialistas deve lidar com cada solicitação, de forma semelhante a designar a equipe certa para o trabalho certo.No SWE-bench Pro, um benchmark que pontua com que frequência um modelo resolve problemas reais do GitHub extraídos de bases de código de produção, o LongCat-2.0 atingiu 59,5, à frente dos 58,6 do GPT-5.5 e dos 54,2 do Gemini 3.1 Pro, embora ainda atrás do Claude Opus 4.7 e 4.8. No FORTE, que avalia agentes em tarefas diárias de escritório em 15 profissões com um limite de tempo de 45 minutos, ele obteve 73,2, empatado com o Claude Opus 4.6, mas atrás dos 77,8 do GPT-5.5.Equipes que constroem agentes de codificação com orçamento limitado, ou qualquer pessoa que execute trabalhos em larga escala de repositórios onde as leituras de cache de contexto gratuitas se acumulam, obtêm a vitória mais clara. O modelo é acessível hoje através dos endpoints de API compatíveis com OpenAI e Anthropic da Meituan, ou através de ferramentas de agente como Hermes, Claude Code e OpenClaw que já o integram.Quem precisar de auto-hospedagem não terá sorte por enquanto. Tanto os repositórios do GitHub quanto do Hugging Face ainda exibem “pesos do modelo em breve”, mas a Meituan não definiu uma data para o envio dos arquivos.* Traduzido e editado com autorização do Decrypt.A porta de entrada para o bitcoin, a maior criptomoeda do mundo, está no MB. É simples, seguro e transparente. Deixe de adiar um investimento com potencial gigantesco. Invista em poucos cliques!O post LongCat-2.0: A IA chinesa que operou escondida por meses e surpreendeu especialistas apareceu primeiro em Portal do Bitcoin.