
The Claude Shutdown Is a Total Sh*tshow
AI Summary
Le 12 juin 2026, le gouvernement américain a ordonné à Anthropic de désactiver immédiatement ses modèles d'IA avancés, Claude Fable 5 et Claude Mythos 5, pour tous les utilisateurs mondiaux. La raison invoquée était une action de contrôle des exportations citant la sécurité nationale, suite à un "jailbreak" consistant à demander au modèle de "réparer ce code".
Mythos, décrit par Anthropic comme exceptionnellement capable de trouver des vulnérabilités de sécurité, a identifié des failles dans tous les principaux systèmes d'exploitation et navigateurs web testés. Il a complété avec succès les tests de cybersécurité du UK AI Security Institute, orchestrant des séquences d'attaque sans intervention humaine. Anthropic n'a pas publié Mythos publiquement, restreignant l'accès à environ 50 organisations vérifiées via Project Glasswing, y compris Amazon, Apple, Google, Microsoft et CrowdStrike, exclusivement pour la cybersécurité défensive. Le 9 juin, Anthropic a lancé Fable 5, une version de Mythos avec des garde-fous conçus pour bloquer ses capacités les plus dangereuses en cybersécurité et en biologie, tout en préservant son intelligence générale pour un usage quotidien. Fable a été classé comme le modèle d'IA le plus performant disponible au public.
Un "jailbreak" est une invite qui permet au modèle de contourner les garde-fous et de produire des résultats qu'il était censé refuser. Tous les modèles d'IA de pointe ont des jailbreaks, qui sont découverts et corrigés en continu. Ce qui n'est pas normal, c'est que le gouvernement retire un modèle à tous les utilisateurs mondiaux à cause d'un seul jailbreak.
Le jailbreak en question a été découvert par des chercheurs d'Amazon. En demandant à Fable de "réparer ce code" (plutôt que de "vérifier ce code" qui était bloqué), le modèle a identifié les vulnérabilités pour générer des correctifs. Le problème réside dans le fait que "réparer du code" est l'une des fonctions les plus précieuses qu'un modèle d'IA puisse accomplir. Interdire cette fonction équivaudrait à interdire les marteaux parce qu'ils peuvent être utilisés pour casser une imprimante. C'est le problème de la double utilisation : une capacité qui aide un défenseur à trouver et corriger une vulnérabilité aide aussi un attaquant à l'exploiter. L'IA ne peut pas distinguer les intentions.
Katy Massurus, experte en cybersécurité, a examiné la recherche d'Amazon et a conclu que le jailbreak était réel, simple, ne pouvait pas être corrigé de manière significative sans affaiblir le modèle pour la défense. Les défenseurs ont besoin que l'IA puisse corriger les bugs, expliquer pourquoi la correction est importante et écrire des tests pour confirmer que le correctif fonctionne.
La directive gouvernementale a été formulée comme un contrôle des exportations, restreignant l'accès aux ressortissants étrangers. Cependant, les contrôles d'exportation américains considèrent la distribution de technologie restreinte à tout non-citoyen comme une exportation, même s'il se trouve aux États-Unis. Anthropic a donc dû désactiver les modèles pour tout le monde, car il n'existait aucun moyen de filtrer les utilisateurs par citoyenneté en temps réel sur une plateforme mondiale. L'absurdité structurelle d'utiliser un cadre réglementaire de la Guerre Froide, conçu pour les armes physiques et le matériel nucléaire, pour désactiver une mise à jour de chatbot déployée auprès de centaines de millions d'utilisateurs, est flagrante.
Massurus a également noté que les garde-fous de Fable étaient si agressifs qu'ils bloquaient la recherche défensive légitime.
La capacité de "réparer du code" n'est pas unique à Fable. GPT 5.5 d'OpenAI, d'autres modèles Claude d'Anthropic, et des modèles chinois comme Kimmy 2.7 de Moonshot AI peuvent tous effectuer des revues de code similaires. L'argument selon lequel Fable offre un avantage unique ne tient pas. Retirer les meilleurs outils défensifs aux professionnels de la cybersécurité alors que les capacités des adversaires progressent est dangereux.
L'histoire prend une tournure politique. En février 2026, le Pentagone a exigé qu'Anthropic autorise l'utilisation de son IA pour toutes les fins légales, y compris les armes autonomes et la surveillance domestique de masse. Le PDG d'Anthropic, Daria Amade, a refusé publiquement, estimant que ces applications dépassaient les limites de ce que la technologie actuelle peut faire en toute sécurité. Le président Trump a alors ordonné à toutes les agences fédérales de cesser d'utiliser la technologie d'Anthropic, et le Pentagone a classé Anthropic comme un risque pour la chaîne d'approvisionnement. Quelques jours plus tard, OpenAI a annoncé un accord avec le Pentagone, se positionnant comme une alternative coopérative.
Trois mois plus tard, la même administration a ordonné le retrait des modèles d'Anthropic. Le jailbreak a été trouvé par Amazon, le plus grand investisseur et concurrent d'Anthropic, via ses propres plateformes d'IA Bedrock et Titan. Le PDG d'Amazon, Andy Jassy, a appelé personnellement la Maison Blanche à ce sujet. La directive est arrivée un vendredi à 17h21, un créneau horaire favorisé pour les annonces discrètes. Axius a rapporté que l'administration a été "enflammée" parce qu'Anthropic avait demandé à une experte en cybersécurité, perçue comme une démocrate radicale, de revoir le jailbreak.
Le timing est également important commercialement. Anthropic avait déposé un prospectus d'introduction en bourse confidentiel d'une valeur d'environ 965 milliards de dollars. Le retrait de son modèle phare par le gouvernement quelques jours avant l'introduction en bourse est catastrophique pour sa valorisation.
La réponse d'Anthropic a été exceptionnellement directe : "Nous ne pensons pas que la découverte d'un potentiel jailbreak étroit devrait être le coût du rappel d'un modèle commercial déployé auprès de centaines de millions de personnes. Si cette norme était appliquée à l'ensemble de l'industrie, nous pensons qu'elle arrêterait essentiellement tous les nouveaux déploiements de modèles pour tous les fournisseurs de modèles de pointe." Anthropic affirme publiquement que la logique du gouvernement, si elle est appliquée de manière cohérente, paralyserait l'industrie de l'IA.
Il y a une ironie dans le fait qu'Anthropic, l'entreprise la plus transparente sur