
Pourquoi Anthropic a coupé des modèles IA et ce que ça cache
Cette entreprise de pointe dans le domaine de l’IA doit refuser aux étrangers l’accès à son modèle de cybersécurité. Cette décision controversée du gouvernement américain suscite l’incompréhension et le malaise au niveau international.
Avec « Mythos », Anthropic a voulu montrer ce dont l’IA générative est capable dans le domaine de la cybersécurité. Trois jours après le lancement de la version accessible au public « Fable », les deux modèles sont à nouveau hors ligne. Non pas en raison d’un problème technique, mais sur ordre du gouvernement américain. Cette affaire montre l’étendue de l’influence politique sur les grands groupes technologiques et soulève, à l’échelle internationale, des questions quant à cette dépendance.
Un « risque pour la sécurité nationale »
Dans la soirée du 12 juin, Anthropic a reçu une lettre du ministère de l’économie l’enjoignant à suspendre l’accès à Fable 5 et Mythos 5 pour tous les « ressortissants étrangers », qu’ils se trouvent aux États-Unis ou à l’étranger. La directive mentionnait également les membres du personnel étrangers d’Anthropic. Dans la pratique, l’entreprise n’a pu respecter cette consigne qu’en désactivant les modèles à l’échelle mondiale.
Les modèles Claude classiques restent, quant à eux, accessibles. Fable 5 et Mythos 5 en sont des variantes spécialisées dans l’analyse de code et la recherche de vulnérabilités. Mythos 5 en est le modèle le plus performant, non accessible au grand public ; Fable 5, la version plus largement accessible (en anglais), comporte des couches de protection supplémentaires. Anthropic avait elle-même qualifié Mythos de trop dangereux pour être déployé publiquement. Fable 5 devait bloquer les requêtes risquées concernant l’exploitation de failles ou des outils d’attaque grâce à une interface simplifiée.
Le gouvernement américain justifie cette interdiction par des informations qui proviendraient, entre autres, d’Amazon. Des équipes de recherche y auraient amené Fable 5 à détecter des failles dans le code. Le modèle à certes rejeté la requête directe, mais en reformulant la question de manière à lui faire « corriger le code », le modèle a permis de mettre en évidence des bugs qui pourraient théoriquement être exploités à des fins d’attaques. Washington fait valoir que l’on peut donc contourner les mécanismes de protection et que le modèle constituerait donc un risque pour la sécurité nationale.
Anthropic conteste. Dans une déclaration (en anglais) publique, l’entreprise parle d’un « jailbreak potentiel, limité et non universel ». Le modèle ne permettrait de mettre en évidence que des failles isolées, déjà connues et plutôt mineures. D’autres modèles, comme GPT 5.5, en seraient également capables, parfois même sans contourner les mécanismes de protection. Si un tel cas suffit à retirer un modèle du marché, il serait, selon Anthropic, pratiquement impossible d’exploiter de manière productive un modèle frontière doté de capacités de programmation.
Inquiétudes concernant la Chine et relations tendues
Parallèlement au problème présumé de jailbreak, des indices semblaient indiquer (en anglais) qu’un groupe proche de la Chine avait temporairement eu accès à Mythos. Du point de vue du gouvernement américain, cela présente donc le risque qu’un modèle américain abouti puisse être reproduit par « distillation » ou que certains de ses éléments puissent en être extraits. Il n’y a cependant aucune preuve.
Cette controverse survient dans un contexte déjà tendu. Anthropic et certains services du gouvernement américain sont en conflit depuis des mois. En effet, l’entreprise refuse (en anglais) de mettre ses modèles à disposition pour une surveillance de grande envergure sur le territoire national ou pour des systèmes d’armes autonomes. Le ministère de la Défense a alors classé Anthropic dans la catégorie « risque lié à la chaîne d’approvisionnement », classification contre laquelle le groupe a engagé une action en justice. La situation semblait être plus apaisée depuis que les autorités souhaitaient avoir accès à Mythos (en anglais) pour leurs propres projets de cyberdéfense.

Source : Shutterstock
Une démarche déconcertante
Cette affaire servira de mise à l’épreuve de la nouvelle stratégie américaine en matière d’IA, présentée par D. Trump début juin par décret. Ainsi, les entreprises spécialisées dans l’IA peuvent, de leur propre initiative, faire évaluer les risques liés à leurs modèles frontières 30 jours avant leur publication. Le fait que l’un des premiers modèles lancés sous ce régime fasse désormais l’objet d’une suspension brutale ne manque pas de susciter des inquiétudes dans le secteur. Les associations professionnelles et les thinktanks parlent (en anglais) d’un système d’autorisation de fait : un petit groupe de personnes à la Maison-Blanche décide si un système peut rester sur le marché.
Les acteurs de la sécurité expriment aussi leur inquiétude dans une lettre ouverte (en anglais) réclamant la levée des restrictions. Ils soulignent que l’IA est depuis longtemps utilisée à grande échelle pour la recherche de bugs et de failles. Les modèles comme Mythos se distinguent dans ce domaine, mais ils ne sont pas les seuls. Cette interdiction touche principalement les équipes chargées de sécuriser les systèmes de production et le code legacy. Les cybercriminels pourraient alors se tourner vers des modèles « open-weight » ou vers des techniques plus anciennes. Le gouvernement américain prive donc ses propres entreprises d’un outil essentiel, laissant libre cours aux potentiels agresseurs.

Au niveau international, cette affaire a relancé le débat sur les modèles d’IA indépendants. En Europe, les responsables politiques commencent à prendre conscience (en anglais) qu’en se rendant dépendants d’un petit nombre de fournisseurs états-uniens, les États se rendent vulnérables. La désactivation brutale des modèles Fable 5 et Mythos 5 est considérée par beaucoup comme un signal d’alarme indiquant que, en cas de doute, Washington prend ses décisions en fonction de ses propres intérêts en matière de sécurité, sans tenir compte de ses alliés.
Jusqu’à présent, l’Europe peine à développer ses propres modèles d’IA et ne dispose pas d’une infrastructure de serveurs comparable (en anglais). Mistral, l’acteur français, est certes relativement performant, mais il n’est aucunement à la hauteur de Claude, ChatGPT ou Gemini. Quant à Apertus, le modèle open source de l’EPFZ, il est encore loin derrière sans compter qu’il n’a pas été conçu pour être un chatbot.
Un différend qui pourrait avoir des répercussions négatives sur l’introduction en bourse
Pour Anthropic, ce conflit pose également un problème financier. En effet, l’entreprise prévoit de s’introduire en bourse prochainement. L’interdiction d’un modèle phare et le fait d’être dans le collimateur des autorités de régulation pourraient avoir un impact négatif sur l’appétit des investisseurs. Dans sa prise de position, l’entreprise souligne qu’elle soutient le droit du gouvernement à interdire les modèles présentant un réel danger, mais elle exige une procédure transparente et fondée sur des bases techniques solides. La directive dont les modèles Antrhopic ont fait l’objet ne répond pas à ces critères.
Une chose est déjà claire : cette affaire marque un tournant, le gouvernement américain recourt pour la première fois aux contrôles à l’exportation pour restreindre non seulement l’accès au matériel, mais aussi l’accès à un modèle d’IA spécifique. La clientèle a vu un outil essentiel disparaître du jour au lendemain. À l’avenir, beaucoup examineront de plus près les risques politiques qu’iels acceptent en choisissant leur plateforme d’IA.
Mon empreinte digitale change régulièrement au point que mon MacBook ne la reconnaît plus. Pourquoi ? Lorsque je ne suis pas assis devant un écran ou en train de prendre des photos, je suis probablement accroché du bout des doigts au beau milieu d'une paroi rocheuse.
Des informations intéressantes sur le monde des produits, un aperçu des coulisses des fabricants et des portraits de personnalités intéressantes.
Tout afficher



