Uma nova startup chamada Prime Intellect está treinando um grande modelo de linguagem de IA, o INTELLECT-3, utilizando uma abordagem descentralizada de aprendizagem. A empresa busca criar uma alternativa ao atual duopólio de modelos de inteligência artificial, dividido entre os sistemas fechados dos Estados Unidos e as opções de código aberto da China. A empresa utiliza um novo tipo de aprendizado por reforço distribuído para refinar seu modelo de IA, com o objetivo de demonstrar uma nova maneira de construir IAs competitivas sem depender das grandes empresas de tecnologia.Leia mais:Como a inteligência artificial do Google já impacta sua vida no BrasilTeste revela qual é a melhor IA para responder perguntas sem “inventar”14 perguntas e respostas sobre Inteligência Artificial (IA)Prime Intellect quer democratizar a IAVincent Weisser, CEO da Prime Intellect, afirmou ao Wired que a tecnologia que sua empresa está desenvolvendo tem o potencial de democratizar a IA, permitindo que mais pessoas construam e modifiquem sistemas avançados por conta própria. Segundo ele, o aprimoramento dos modelos de IA não depende mais apenas do aumento de dados e computação. O gargalo atual estaria nos ambientes de aprendizado por reforço (reinforcement learning), processo que melhora as capacidades dos modelos em tarefas específicas, como matemática ou resolução de quebra-cabeças, após o treinamento inicial.Treinamento de modelos de linguagem de IA (Imagem: Anggalih Prasetya/Shutterstock)O que é aprendizado por reforço em IA?Para entender melhor esse modelo de aprendizagem de IA, imagine que você está ensinando um cachorro a fazer um truque, como “sentar”. Você não mostra a ele um manual de instruções. Em vez disso, o processo é o seguinte:O cachorro tenta fazer algo (uma ação).Se ele senta, você dá a ele um petisco (uma recompensa positiva).Se ele late ou deita, você não dá nada ou diz “não” (uma recompensa negativa ou ausência de recompensa).Com o tempo, através de tentativa e erro, o cachorro aprende que a ação “sentar” leva à melhor recompensa (o petisco). Ele desenvolve uma estratégia para maximizar o número de petiscos que recebe. O aprendizado por reforço em inteligência artificial funciona exatamente da mesma maneira.Um ambiente de aprendizado por reforço personalizado seria a soluçãoPara resolver essa questão, a Prime Intellect criou uma estrutura que permite a qualquer pessoa desenvolver um ambiente de aprendizado por reforço personalizado. A empresa está combinando os melhores ambientes criados por sua equipe e pela comunidade para treinar o INTELLECT-3. O Wired relata ter testado um desses ambientes, criado pelo pesquisador Will Brown, para resolver quebra-cabeças do jogo Wordle. Normalmente, o aprendizado por reforço é um processo complexo e realizado a portas fechadas pelas gigantes da tecnologia, mas a iniciativa da Prime Intellect pode permitir que startups criem novos produtos de software e agentes de IA especializados.Aprendizagem de IA (Imagem: WANAN YOSSINGKUM/iStock)A abordagem da empresa já recebeu elogios de especialistas. Conforme o Wired, Andrej Karpathy, ex-chefe da equipe de IA da Tesla, descreveu os ambientes de aprendizado por reforço da Prime Intellect como “um grande esforço e ideia”. Ele incentivou a comunidade de código aberto a adaptar esses ambientes para novas tarefas.A Prime Intellect já demonstrou a viabilidade de seus métodos distribuídos anteriormente. No final de 2024, a empresa anunciou o INTELLECT-1, um modelo de 10 bilhões de parâmetros e treinado com hardware distribuído. Em março de 2025, revelou o INTELLECT-2, um modelo maior e com capacidades de raciocínio habilitadas por aprendizado por reforço distribuído.O cenário da IA de código aberto já mudou drasticamente. Após o sucesso inicial do modelo Llama da Meta em 2023, a oferta mais recente da empresa em abril de 2025 foi considerada uma “grande decepção”. Enquanto isso, modelos chineses ganharam popularidade, começando com a DeepSeek em janeiro de 2025, seguida por outros como o Qwen da Alibaba e o Kimi da Moonshot, que são fáceis de modificar. Weisser, em declaração ao Wired, diz: “É quase como se os EUA estivessem sem opções quando se trata de modelos de fronteira abertos. Essa é uma das coisas que estamos tentando mudar”.O post Startup quer ser “DeepSeek americana” e democratizar IA com novo modelo apareceu primeiro em Olhar Digital.