
On a dépassé le point de non-retour - Anthropic face au dilemme du prisonnier !
AI Summary
Aujourd'hui, Silicon Carnet explore trois sujets majeurs : le document d'Anthropic "When AI builds itself", la fondation OpenAI et le plan européen "Tech Sovereignty Package" avec l'investissement de SoftBank en France.
**Anthropic et l'auto-amélioration récursive**
Anthropic a publié un document qui révèle que 80 % de son code est désormais écrit par Claude, son intelligence artificielle, et que ses ingénieurs sont huit fois plus productifs. L'entreprise appelle à une pause mondiale dans le développement de l'IA, ce qui est paradoxal étant donné leur propre accélération. Au cœur de ce document se trouve le concept d'auto-amélioration récursive.
Carlos explique que "récursif" signifie qu'un système utilise le résultat d'une étape pour la suivante. Il donne l'exemple d'un jeu où l'on devine un nombre entre 1 et 100 : à chaque proposition, l'intervalle de recherche est réduit. L'auto-amélioration récursive va plus loin : non seulement la réponse s'améliore, mais la méthode de recherche elle-même s'affine. Appliqué aux grands modèles de langage (LLM), cela signifie que chaque morceau de texte généré devient le contexte pour produire le morceau suivant. Cependant, la récursion ne garantit pas l'auto-amélioration : un LLM a besoin d'un objectif, de métriques, d'essais, d'un mécanisme de feedback et d'une mémoire pour s'améliorer réellement.
Carlos illustre ce concept avec un exemple concret de pricing B2B. Un agent IA propose des hypothèses de prix basées sur l'historique, puis teste et affine ces stratégies de manière itérative, segmentant par industrie, urgence ou saisonnalité. Cela montre une auto-amélioration locale sur une tâche précise avec une métrique claire.
Boris Cherny, responsable du code chez Anthropic, confirme cette évolution : il ne code plus directement mais gère des "boucles" d'agents IA qui écrivent et optimisent le code.
Un exemple plus technique est la "Carpathy Loop", un projet open source d'auto-recherche, dont le créateur a été recruté par Anthropic. Un petit modèle de langage (mini GPT) est configuré avec un prompt système, des fichiers de préparation de données et d'entraînement. L'agent modifie le fichier d'entraînement ou le prompt pour réduire le temps d'entraînement, par exemple en ajustant les paramètres d'optimisation ou l'utilisation du GPU. Cette méthode a permis 700 essais et une réduction de 11 % du temps d'entraînement, démontrant une vitesse surhumaine impossible à atteindre manuellement.
Fanny Button observe cette évolution chez les développeurs : de 2021 à 2023, ils codaient manuellement ; de 2023 à 2025, ils utilisaient des chatbots pour des bouts de code ; de 2025 à 2026, les agents écrivaient et éditaient du code. Aujourd'hui, les agents peuvent exécuter du code, déléguer des tâches à d'autres agents et travailler de manière autonome sur des problèmes ouverts. Fanny constate que cela fonctionne très bien pour les MVP et les maquettes, mais que les systèmes existants (legacy) posent problème en raison de la documentation souvent incomplète. Les agents peuvent combler les trous, mais pas toujours de manière optimale, nécessitant l'intervention humaine pour des infrastructures complexes.
Le document d'Anthropic montre que Claude est passé de 26 % à 76 % de réussite sur des problèmes ouverts en six mois, ce qui implique une capacité à se déboguer et résoudre des problèmes sans intervention humaine. Carlos nuance en soulignant que cette productivité accrue génère aussi de la dette technique, nécessitant des systèmes de revue de code plus robustes. Fanny ajoute que la qualité des résultats dépend de la capacité des utilisateurs à "éduquer" les agents. Des études montrent même que les modèles d'IA, comme OPUS 4.5 et Mythos preview, surpassent les chercheurs humains dans la prise de décision sur des problèmes de recherche.
Carlos reste sceptique sur les limites de l'auto-amélioration : découvrir de nouveaux problèmes, choisir la bonne direction, interpréter des résultats ambigus ou inventer de nouvelles approches restent du ressort de la recherche humaine. Il estime que l'automatisation est plus facile pour l'ingénierie dans les petites équipes que dans les grandes structures où la complexité est plus élevée. Dario Amodei, CEO d'Anthropic, a lui-même reconnu l'accumulation d'une dette technique considérable, un aspect non mentionné dans le rapport.
**Le paradoxe d'Anthropic : entre moralité et stratégie**
Le timing de la publication du document d'Anthropic est frappant : une levée de fonds de 65 milliards de dollars valorisant l'entreprise à 965 milliards le 28 mai 2026, un dépôt confidentiel d'introduction en bourse le 1er juin, suivi de la publication du document appelant à une pause mondiale le 4 juin. Evan Kervella y voit une stratégie de communication. La crainte d'une IA s'auto-améliorant est réelle dans la Silicon Valley, avec des risques pour la défense (drones autonomes, armes nucléaires) et le tissu social (deepfakes, ingénierie sociale). Open AI a été fondé sur cette crainte, promettant de publier sa recherche pour le bien commun, une promesse non tenue.
L'analyse suggère que l'appel d'Anthropic à ralentir pourrait être motivé par un manque de "compute" (puissance de calcul) et de cash par rapport à OpenAI. Anthropic n'aurait pas les moyens de rivaliser avec OpenAI sur le long terme. OpenAI a dépassé le milliard d'utilisateurs hebdomadaires, tandis que Claude n'en a qu'une centaine. Sam Altman a affirmé que la distribution est plus importante que le meilleur modèle. De plus, OpenAI a levé 122 milliards de dollars en mars, deux fois plus qu'Anthropic.
Le marché du "compute" est saturé : OpenAI a déjà passé des commandes massives, y compris un gigawatt auprès d'Oracle. Anthropic a dû s'allier à Elon Musk, ce qui témoigne d'un manque de capacité disponible. Le projet Glasswing d'Anthropic, qui s'ouvre à 15 nouveaux pays après avoir affirmé que la technologie était trop dangereuse pour être largement diffusée, est interprété comme un signe de recherche de clients et de capacités.
OpenAI, de son côté, développe de nouveaux modèles comme le 5.5, rivalisant avec Mythos, et met la pression sur le coût par token, Anthropic étant très cher. OpenAI promet un appareil révolutionnaire pour fin 2026, développé avec Johnny Ive, ce qui pourrait changer l'usage de l'IA. En somme, malgré l'avance apparente d'Anthropic en termes de valorisation, OpenAI semble mieux positionné structurellement en termes d'énergie, de compute, de talent, de cash et d'innovation.
**La fondation OpenAI : philanthropie ou pouvoir ?**
La fondation OpenAI est devenue la plus grande fondation philanthropique au monde avec 180 milliards de dollars d'actifs, soit 25 % de la valeur d'OpenAI. Elle contrôle 100 % du conseil d'administration d'OpenAI. Brad Taylor, ancien CTO de Facebook et président de Salesforce, est aujourd'hui président de cette fondation, aux côtés de huit administrateurs indépendants et de Sam Altman.
Cette fondation représente un pouvoir d'influence énorme sur la recherche, la politique et le social. Elle décide des problèmes à financer, des institutions à légitimer et des narratifs acceptables. Avec 180 milliards de dollars, l'équivalent du PIB de l'Ukraine, cette fondation peut orienter les priorités publiques. En finançant des programmes sur l'emploi, le revenu universel ou l'éducation, elle intervient sur des sujets normalement débattus démocratiquement. La question de sa gouvernance, de sa transparence et de ses contre-pouvoirs est cruciale.
Sam Altman a changé son discours sur l'emploi, reconnaissant que le message d'une IA détruisant les emplois et offrant un revenu de base était "horrible". La fondation vise à restaurer la confiance d'OpenAI en finançant des recherches sur la valeur économique dans un monde automatisé. Historiquement, la valeur économique allait au travail (60-70 % du PIB). Si l'IA automatise le travail intellectuel, la valeur pourrait aller au capital, créant un scénario dystopique où quelques milliardaires possèdent les systèmes d'IA et le reste de l'humanité est inutile. Mais même dans ce cas, qui consommerait si personne n'a d'argent ? D'où l'idée d'un revenu universel. Elon Musk va plus loin, suggérant que l'argent perdrait sa signification dans une économie d'abondance.
Carlos explique que la fondation OpenAI ne vise pas à distribuer de l'argent via les gouvernements, mais plutôt à financer un "Universal Basic Compute" ou des crédits de token, comme les 2 millions de dollars de tokens offerts aux startups de Y Combinator. Cette approche s'apparente au libertarianisme plutôt qu'au socialisme, où la redistribution ne se ferait plus par les États mais par des entités privées. L'analogie est faite avec les stablecoins comme l'USDC, où une entreprise privée (Circle) fournit l'infrastructure, gère les réserves et capte la valeur, tandis que les utilisateurs bénéficient de services.
Ces entreprises pourraient fournir des services (éducation, santé) qui concurrencent l'État, faisant baisser les prix. Le modèle d'Uber, une plateforme qui capte de la valeur et la partage avec des millions de personnes sans produire elle-même d'actifs, est un référentiel pour la Silicon Valley. Sam Altman rencontre Bernie Sanders pour discuter de la nationalisation de l'industrie, ce qui montre la nécessité d'alliés face à ces enjeux.
**Le "Tech Sovereignty Package" européen et l'investissement de SoftBank en France**
Le 3 juin, la Commission européenne a dévoilé son "Tech Sovereignty Package", visant à tripler la capacité des data centers européens en 5 à 7 ans et à réduire la dépendance aux technologies américaines. Trois jours plus tôt, lors du forum Choose France, Emmanuel Macron a annoncé un investissement de 75 milliards d'euros de SoftBank dans des data centers français.
Evan Kervella remet en question la nature de cet investissement. Il ne s'agit pas de "data centers français" mais de "data centers en France". L'argent vient du Japon (SoftBank), les puces seront américaines (Nvidia), et les modèles qui y tourneront ne seront pas nécessairement français (Mistral). La France vendrait ainsi son électricité (produite par son parc nucléaire) à des intérêts étrangers pour qu'ils créent de l'intelligence, au lieu de le faire elle-même. Arthur Mench avait souligné que 90 % de la valeur est créée après la consommation d'électricité, en transformant l'électricité en intelligence. La France risque de ne récolter qu'une activité économique marginale (construction, quelques emplois) sans capter la valeur ajoutée de l'IA.
Cet investissement, bien que massif, est perçu comme une continuation d'une tendance où des acteurs étrangers construisent des infrastructures en France sans que la valeur ne reste dans le pays. SoftBank, étant un investisseur majeur d'OpenAI, pourrait louer ces capacités à des entreprises américaines. Si le projet échoue politiquement, les 75 milliards ne seront pas entièrement investis.
Fanny Button souligne que la France attire des investissements et des talents, ce qui est positif malgré le retard dans l'IA. Cependant, le pays excelle dans la recherche grâce à ses talents et sa qualité de vie, mais peine à attirer des entrepreneurs à cause des charges et de la difficulté à penser à l'international. La France a une fenêtre de tir de deux ans pour retenir ses talents dans des domaines comme le quantique.
L'atout majeur de la France est son électricité décarbonée et à faible coût, héritage de son parc nucléaire. C'