
Gavin Baker on Orbital Compute, TSMC, and Frontier Models
Audio Summary
AI Summary
L'évolution de l'IA représente un moment extraordinaire dans l'histoire du capitalisme et des entreprises américaines. Par exemple, Anthropic a ajouté 11 milliards de dollars de revenus annuels récurrents (ARR) en un mois, ce qui est comparable aux efforts combinés de Palantir, Snowflake et Data Bricks sur une décennie. Un tel événement est sans précédent.
Le marché a connu des périodes de baisse où les hypothèses étaient erronées, mais aussi des périodes où la sous-performance était due à une divergence entre le prix des actions et la valeur réelle des entreprises. Mars a été une période où, malgré la baisse du NASDAQ, l'IA a connu une croissance explosive, offrant des opportunités d'investissement. Les investisseurs en technologie parlent souvent de courbes en S et d'exponentielles, mais l'ampleur de cette croissance est inédite.
La situation actuelle est encore plus extrême que celle de DeepSeek en 2015, où une vente massive a eu lieu juste après la publication d'un article montrant l'augmentation de la demande en calcul. Aujourd'hui, il est évident que l'IA augmente considérablement la demande en calcul, avec des prix de DRAM et de GPU en Asie qui montent en flèche et une disponibilité en baisse. Cependant, en mars, il suffisait d'observer la croissance d'Anthropic pour comprendre l'inflexion de l'IA.
Malgré les opportunités d'investissement dans l'IA, le marché a parfois sous-estimé d'autres facteurs. Par exemple, la fermeture du détroit d'Ormuz, bien que perçue comme un risque géopolitique, pourrait être bénéfique pour les États-Unis en réduisant les prix du gaz naturel, un intrant clé pour l'électricité et l'IA. Cela renforcerait la compétitivité manufacturière américaine. Les États-Unis sont moins dépendants de l'énergie qu'avant, étant devenus le plus grand producteur et exportateur de pétrole et de gaz.
Les valorisations d'OpenAI et Anthropic sont remarquables. Anthropic, en particulier, a un coût par jeton beaucoup plus bas qu'OpenAI, ayant brûlé environ 80 % moins de capital pour atteindre un chiffre d'affaires similaire. Cela indique des retours sur capital investi (ROIC) structurellement différents. Si Anthropic avait un accès illimité au calcul, ses revenus pourraient être bien plus élevés, potentiellement 100 à 200 milliards de dollars aujourd'hui. L'intelligence de Claude a été dépréciée, produisant 70 % moins de jetons pour la même question, ce qui affecte la qualité des réponses.
Ces entreprises pourraient lever des capitaux à des valorisations bien plus élevées, mais une approche prudente est justifiée. L'incertitude géopolitique, notamment en Ukraine et à Taïwan, rend la gestion du capital cruciale. Elon Musk, par exemple, a toujours privilégié la rentabilité pour les investisseurs, ce qui lui a conféré un "super-pouvoir" pour lever des capitaux. Cette approche, axée sur la création de valeur à long terme plutôt que sur la maximisation des valorisations à court terme, pourrait être bénéfique pour Anthropic et OpenAI.
Concernant l'infrastructure, la pénurie de puissance (watts) est un défi. Le capitalisme devrait résoudre cette pénurie, à moins d'un fort recul réglementaire. Les goulots d'étranglement se déplacent de l'énergie et des puces vers le zonage et les approbations. L'industrie des turbines augmente sa capacité, et de nouvelles sources d'énergie sont explorées. La pénurie de watts devrait s'atténuer d'ici 2027-2028, avec le calcul orbital comme solution à long terme.
Le calcul orbital n'implique pas des bâtiments massifs dans l'espace, mais des racks de serveurs en orbite. Un rack Blackwell pèse 1,3 tonne et mesure 2,4 mètres de haut. SpaceX a illustré un satellite de la taille d'un rack, avec des ailes solaires de 150 mètres de long de chaque côté, maintenu en orbite héliosynchrone pour une exposition constante au soleil. Le refroidissement est un défi majeur, mais les ingénieurs de SpaceX sont confiants d'avoir trouvé des solutions. La réutilisation des fusées Starship est essentielle pour rendre ce concept économiquement viable. Ces racks seraient interconnectés par des lasers, créant un centre de données virtuel dans l'espace.
L'impact sur les centres de données terrestres ne serait pas nécessairement négatif, car la demande en calcul continuera de croître. L'inférence est particulièrement adaptée au calcul orbital, tandis que la formation restera longtemps sur Terre. Cependant, les entreprises investissant massivement dans la production d'énergie et le refroidissement pour les centres de données terrestres devraient anticiper l'arrivée du calcul orbital.
En ce qui concerne les puces (wafers), la production est dominée par Taiwan Semiconductor Manufacturing Company (TSMC). Jensen Huang de Nvidia entretient une relation unique avec TSMC, basée sur la confiance plutôt que sur des contrats formels. L'histoire des nouvelles technologies montre souvent l'apparition de bulles spéculatives qui financent le développement, suivies d'un crash lorsque l'offre dépasse la demande. Heureusement, le développement actuel de l'IA est majoritairement financé par les flux de trésorerie opérationnels, contrairement à la bulle de 2000. De plus, les GPU fonctionnent à 100 % d'utilisation, ce qui contraste avec le sous-emploi des fibres optiques à l'époque.
TSMC joue un rôle crucial dans la prévention d'une bulle en limitant l'offre de puces. Si TSMC répondait pleinement à la demande, Nvidia pourrait vendre 2 à 3 billions de dollars de GPU d'ici 2026-2027, ce qui pourrait conduire à une surconstruction. Cependant, Intel et Samsung pourraient rompre cette discipline et augmenter leur production, ce qui pourrait entraîner une bulle. La décision de TSMC concernant l'expansion de sa capacité est un indicateur clé pour anticiper une bulle.
Le projet Terrafab, une coentreprise de SpaceX et Tesla avec Intel, vise à construire la plus grande usine de fabrication de puces aux États-Unis. Ce projet bénéficie de l'expertise d'Intel et de l'attrait d'Elon Musk pour les meilleurs ingénieurs. Musk est perçu comme une figure quasi-divine en Asie, capable d'attirer les meilleurs talents et de recréer des communautés pour eux (par exemple, "Taiwan Town" au Texas). Cela pourrait permettre à Terrafab de rivaliser avec TSMC sans l'aliéner.
La question des "jetons frontières" est également essentielle : continueront-ils à capter la majorité de la valeur économique créée au niveau du modèle ? L'expérience avec Gemini 3.1 Pro et Opus montre que les modèles frontières peuvent rapidement devenir obsolètes. Bien que les entreprises prototypent avec les modèles frontières et passent aux solutions open source ou à Vertex pour la production, la majeure partie de la valeur économique provient toujours des jetons frontières.
Google a perdu son leadership en matière de coût par jeton en raison de décisions de conception conservatrices avec le TPU V8. Le "front de Pareto" (intelligence vs. coût) est désormais dominé par Anthropic, OpenAI et Grock 4.3. Gemini 3.1 s'accroche à ce front, peut-être grâce à des subventions.
Le "bitter lesson" de Richard Sutton (plus de calcul surpasse toujours l'ingéniosité algorithmique humaine) est un risque majeur pour l'IA. Bien que les constructeurs de modèles soient sceptiques, l'arrivée de l'ASI (Intelligence Artificielle Générale) pourrait remettre en question cette leçon, car une ASI pourrait s'optimiser pour être plus efficace.
L'apprentissage continu et la mémoire sont d'autres domaines d'innovation. Les "harnais" (environnements d'exécution pour les modèles) améliorent considérablement la performance. Les modèles d'IA sont passés d'un modèle de prix fixe à un modèle de paiement à l'utilisation, ce qui est très bullish pour les entreprises comme OpenAI et Anthropic, car cela permet une croissance exponentielle des revenus.
Concernant les nouvelles entreprises de puces, il est sain d'avoir de la concurrence. La conception de puces implique des compromis entre l'attaque, la défense et la mobilité, comme pour la conception de chars. Les entreprises qui tentent de créer un meilleur GPU (comme Tranium 3) font face à un défi difficile, car Nvidia a des avantages significatifs. Le succès réside dans la différenciation et la difficulté de l'innovation.
La désagrégation du préremplissage (compréhension de la question) et de l'inférence (génération de la réponse) ouvre de nouvelles voies pour la conception de puces. Le préremplissage est limité par la capacité de la mémoire, tandis que l'inférence est limitée par la bande passante de la mémoire. Cela offre aux concepteurs de puces un champ plus riche pour l'optimisation.
Cerebras, par exemple, a développé une architecture radicalement différente pour le calcul à l'échelle du wafer, ce qui leur permet de faire des choses que personne d'autre ne peut faire. Ces innovations dures et différentes sont essentielles pour les startups dans ce domaine.
La durée de vie utile des GPU pourrait être considérablement prolongée grâce à la désagrégation du préremplissage et de l'inférence. Les systèmes comme Cerebras ou les LPU de Groq peuvent être utilisés pour le préremplissage, prolongeant la vie des GPU existants pour l'inférence. Cela réduirait le coût de financement de l'infrastructure IA et bénéficierait à l'industrie du crédit privé.
Pour les fondateurs d'applications IA, le défi est de trouver des niches qui ne sont pas évidentes ou faciles à reproduire par les grandes entreprises de modèles. La "voie du jeton" est cruciale : les entreprises doivent être impliquées dans la génération ou l'utilisation des jetons. Les entreprises qui se concentrent sur le codage (comme Cursor, Cognition, Anthropic) ont eu du succès, car le codage est potentiellement le chemin le plus court vers l'ASI.
La concurrence entre les modèles frontières et l'open source est une nouvelle forme de dilemme du prisonnier. Si les entreprises frontières refusent de libérer leurs modèles via API, l'open source chinois, qui utilise souvent des jetons "volés", pourrait prendre de l'avance. Nvidia pourrait également jouer un rôle en maintenant l'open source en retrait.
La sécurité personnelle est une préoccupation croissante en raison de l'IA, en particulier pour les personnalités publiques. L'IA peut créer des simulations ultra-réalistes, augmentant le risque de cybercriminalité. L'IA a également des implications géopolitiques, comme le montre son utilisation sur le champ de bataille en Ukraine.
Malgré ces défis, l'IA est une force de transformation positive. Des exemples comme la découverte d'un médicament pour une maladie rare grâce à l'IA illustrent son potentiel. Cependant, il est essentiel de veiller à ce que l'IA bénéficie à tous et de résoudre le problème de l'accès exclusif aux meilleurs modèles pour les plus riches. L'humilité et la réflexion sont nécessaires pour naviguer dans cette ère de discontinuité.
Les grandes entreprises technologiques comme Google, Meta, Amazon et Microsoft jouent des rôles différents. Google, avec sa quantité massive de données et de calcul, reste en bonne position. Meta, sous la direction de Zuckerberg, est devenue une entreprise "AI-first". Amazon est forte grâce à Tranium et à ses gains d'efficacité en robotique. Microsoft, bien qu'ayant fait des choix audacieux en investissant dans l'IA interne plutôt que de simplement vendre des GPU, fait face à des défis pour rivaliser avec les leaders des modèles frontières. L'engagement avec les startups est un avantage clé pour Nvidia, Amazon et Google, car les meilleures équipes ne sont pas toujours dans les grandes entreprises.
En conclusion, l'IA est une force de destruction de valeur à l'échelle de l'application, mais une force de création de valeur aux niveaux de l'infrastructure et du modèle.