Distillation - Comment Alibaba aurait aspiré l'IA Claude

Wait 5 sec.

Anthropic vient d'accuser frontalement Alibaba d'avoir siphonné les capacités de son IA Claude. Et le plus dingue dans cette histoire, c'est la méthode qui aurait été employée.Car non, rassurez-vous, personne n'a piraté les serveurs d'Anthropic, personne n'a volé le code source de Claude, et personne n'a mis la main sur les fameux "poids" du modèle. En fait, les opérateurs (les bots quoi) liés à Alibaba ont juste discuté avec Claude. Et pas qu'un peu puisqu'ils ont effectué 28,8 millions d'échanges durant 6 semaines !!Alors vous demandez sûrement comment on "vole" une IA juste en lui causant ? Hé bien c'est une technique qui s'appelle ladistillationet que je vais essayer de vous expliquer.En fait, quand vous posez une question à Claude, il vous sort en général une réponse super bien formulée et complète. Et cette réponse, c'est de l'or en barre pour les copieurs car elle contient, en version condensé, le savoir et le raisonnement du modèle. Du coup, si vous récupérez des millions de ces paires question-réponse, vous vous retrouvez au bout d'un moment avec un énorme jeu de données. Et avec ce jeu de données, vous pouvez alors entraîner votre propre modèle, plus petit, à imiter les réponses du plus balèze.En gros, le modèle costaud joue le prof, et votre petit modèle joue l'élève. Ce dernier ne pige pas forcément comment le prof réfléchit, mais à force de recopier tout ce que l'autre lui dit, il finit par lui ressembler beaucoup. Les chercheurs appellent ça la technique du teacher-student et la variante utilisée ici chez Alibaba, c'est la distillation "black-box". En mode black-box (boite noire quoi...), y'a pas besoin de cracker le modèle puisque ses réponses suffisent. Et c'est pour ça que ça marche même quand le modèle d'en face est fermé et accessible seulement via une API.Reste un petit détail quand même... Y'a aucune API au monde qui vous laisse balancer 28 millions de requêtes peinard depuis un seul compte. Y'a des quotas, des limites, des systèmes anti-abus de partout. Ils ont donc du créer environ 25 000 faux comptes pour noyer le poisson, comme ça chaque compte fait sa petite part du boulot, le trafic ressemble à des milliers d'utilisateurs lambda, et hop, ni vu ni connu on chope la data ! C'est ce maquillage à grande échelle qui fait dire à Anthropic que c'est la plus grosse attaque du genre qu'ils aient jamais vue, et menée selon eux par des opérateurs liés à Alibaba et à son laboQwen.Et c'est loin d'être la première fois, souvenez vous, puisqu'en février, Anthropic avait déjà repéré le même manège chezDeepSeek(150 000 échanges), Moonshot AI (3,4 millions) et MiniMax (13 millions). Avant ça, début 2025, OpenAI soupçonnait aussi déjà DeepSeek de piocher dans les réponses de ses modèles, et décrivait des routeurs tiers planqués pour contourner ses blocages. Bref, c'est toujours le même schéma. Le copiage d'IA a même ses variantes maison, comme on l'a vu lors de cescandale Pangu chez Huawei, qui lui est resté entre acteurs chinois.Et le vrai souci pour Anthropic, OpenAI et les autres, c'est qu'ils ne peuvent quasiment rien y faire. Une IA, son produit, c'est justement ses réponses. Vous ne pouvez donc pas vendre des réponses tout en empêchant les gens de les lire et de les stocker. Les labos planchent bien sur des parades (watermarking des sorties, réécriture des traces de raisonnement pour brouiller les pistes, ce genre de trucs), mais pour l'instant ça reste de la rustine de fortune.Après faut pas croire non plus que la distillation soit "sale" par nature. C'est une technique hyper courante et parfaitement légit pour fabriquer des petits modèles rapides qui tournent sur votre laptop. Mais ce qui change tout ici, c'est le consentement car distiller votre propre gros modèle, nickel mais distiller celui du voisin en douce via des faux comptes, c'est moche quand même.Maintenant, moi ce que je n'oublie pas c'est que ces modèles géants se sont gavés en avalant la totalité du web sans rien demander à personne, alors les voir se faire pomper à leur tour pour finir dans des modèles open source, je vois ça comme un juste retour de karma...Reste à voir ce que les tribunaux en penseront...Source