
🟢 LIVE - The Fable Backlash: Is This the Case for Decentralized AI?
Audio Summary
AI Summary
La discussion porte sur l'avenir de l'IA, en particulier sur la tension entre l'IA centralisée et décentralisée, et les implications en termes de sécurité, d'économie et de gouvernance.
Un point de vue est que l'on verra une prolifération de modèles non-frontaliers et une augmentation des dépenses en jetons vers des modèles qui ne sont pas à la pointe. L'idée est que le coût actuel des modèles frontaliers est insoutenable et que tout le monde n'a pas besoin de ce niveau d'intelligence, surtout avec l'émergence de modèles open source ou open-weight plus abordables. Il est important d'être réfléchi quant à l'utilisation de ces modèles puissants.
Concernant l'IA décentralisée, le concept est vaste. Cela peut signifier l'utilisation de diverses IA par différentes entités, ce qui est déjà le cas avec des plateformes comme Open Router. Cependant, une autre interprétation est l'utilisation de réseaux décentralisés pour entraîner ou exécuter des inférences sur des modèles. Sur ce point, il y a un certain scepticisme quant à la viabilité économique et à la demande du marché pour des modèles entraînés ou inférés de manière décentralisée.
La controverse autour du lancement de Fable est un exemple concret. Il y a eu un sentiment de perte chez les utilisateurs lorsque Fable 5 a été retiré. Cependant, il est rappelé que le lancement initial de Mythos (un modèle similaire) était perçu comme effrayant en raison de sa capacité à exploiter des logiciels. La question est de savoir comment gérer ces capacités accrues. L'intervention du gouvernement américain concernant Fable est jugée "insensée", d'autant plus qu'Anthropic aurait coordonné avec les autorités avant le lancement. L'idée que le gouvernement n'était pas au courant du lancement de Fable est jugée invraisemblable, car la sécurité nationale était déjà impliquée dans le blocage de Mythos et avait sélectionné les partenaires du projet Glass Wing.
La décision de désactiver Fable 5 pour tous les Américains suite à une "faille" est remise en question, suggérant qu'il y a quelque chose d'étrange dans cette gouvernance. Cependant, il est reconnu qu'un appareil de sécurité compétent est nécessaire autour de ces technologies, car ce qui se passe actuellement dans les laboratoires d'Anthropic et d'OpenAI est potentiellement très dangereux. En même temps, une grande valeur économique est détenue dans la distribution de modèles open source et open-weight, et cela doit également se produire.
Un argument est que les experts en cybersécurité préféreraient avoir un accès libre aux modèles, permettant aux entreprises de se préparer et de tester plutôt que d'essayer de contenir la technologie. L'idée est que si tout le monde y a accès, le risque est réduit car tout le monde peut tester et identifier les vulnérabilités. L'analogie est faite avec le fait de vivre dans le "pays de la blockchain", où les catastrophes ne sont pas inévitables même avec une large distribution.
L'exemple de Mythos, un modèle capable de créer des exploits, est utilisé. La valeur de ces exploits est très situationnelle. Restreindre l'accès à de grandes entreprises crée des déséquilibres qui peuvent nuire au marché de la protection. Il serait préférable d'égaliser l'accès, car la tendance du marché est de toute façon vers l'ouverture. Les modèles ouverts, notamment ceux venant des laboratoires chinois, se rapprochent des performances des modèles frontaliers propriétaires. Qu'Anthropic le veuille ou non, les gens auront accès à ces modèles pour protéger leurs systèmes, que ce soit via Anthropic, des laboratoires asiatiques open source, ou des réseaux décentralisés.
Sur la question des garde-fous et des contrôles à l'exportation, il est précisé que le gouvernement américain a exigé que Fable soit désactivé pour tous les non-Américains. Anthropic n'a pas encore l'infrastructure KYC pour garantir cette conformité, et les contrôles à l'exportation sont une responsabilité stricte. L'idée que les ressortissants étrangers vivant en Amérique ne puissent pas utiliser Fable 5 est jugée "assez folle" et difficile à opérationnaliser. Il est probable que ces restrictions seront négociées et modifiées.
Il est important de distinguer Fable de Mythos. Fable est censé être un modèle non-cyber-capable, tandis que Mythos est une arme cyber-offensive. Pour Mythos, le gouvernement américain aurait dit à Anthropic de ne le donner qu'à des personnes spécifiques, ce qui s'apparente plus au projet Manhattan qu'à de simples contrôles à l'exportation. Cela explique pourquoi seules de grandes entreprises triées sur le volet par le gouvernement y ont accès.
Bien qu'il n'y ait pas de solution élégante à la gestion d'une arme cyber-offensive, le traitement de Mythos comme un avion de chasse ou un missile (un outil militaire puissant contrôlé par l'État) n'est pas jugé "fou". Cependant, d'un point de vue commercial, Anthropic voudrait que son produit soit utilisé par tout le monde, pas seulement par 30 entreprises.
Le risque d'une adoption plus large de Mythos est souligné par l'augmentation des piratages liés à l'IA. La question est de savoir si l'IA décentralisée peut concurrencer l'IA centralisée. L'argument est que l'IA décentralisée n'a jamais trouvé son marché, car les modèles étaient soit trop petits pour que la décentralisation ait un sens, soit trop grands pour qu'elle soit facile.
Cependant, un contre-argument est que l'IA décentralisée vise à abaisser le coût et la barrière à l'entrée pour créer des produits d'IA. En modifiant les algorithmes, la formation peut se faire sur des appareils grand public plutôt que sur des GPU haut de gamme, ce qui démocratise l'accès. Ce processus pourrait être réglementé par le gouvernement. L'abaissement des barrières à l'entrée crée plus de concurrence et réduit les coûts pour les consommateurs. Il y a de bonnes raisons pour que ces technologies existent, indépendamment de leur permissivité ou de leur conformité à la réglementation. L'IA est l'un des domaines les plus centralisés et a le plus besoin de cette démocratisation.
Le défi de l'IA décentralisée est le coût de construction. Les architectures comme celles de Nvidia, testées avec des centaines de milliers de GPU, sont difficiles à reproduire de manière décentralisée. Bien qu'il existe des modèles ouverts, le processus de pré-entraînement et de post-entraînement de modèles massifs de manière décentralisée est un défi technique majeur.
Un point intéressant est que beaucoup d'inférence se fait sur des GPU de générations précédentes, ce qui pourrait être un cas d'utilisation pour l'IA décentralisée. La demande massive de puissance de calcul est un moteur pour l'optimisation des algorithmes. Des progrès significatifs sont réalisés pour rendre la formation sur des appareils grand public possible et plus abordable. Des recherches montrent que le post-entraînement RL est beaucoup moins cher et plus rapide. Des projets comme Plurales démontrent la possibilité de former des modèles LLM sérieux sur des appareils grand public, ce qui réduit les coûts d'exploitation par rapport aux centres de données.
Cependant, des doutes subsistent. La contrainte de bande passante est majeure : il est difficile de compenser le fait que les appareils ne soient pas physiquement colocalisés et connectés par des liens à haute bande passante. Les arguments en faveur du stockage décentralisé, qui n'a pas réussi à devenir moins cher ou plus efficace, sont rappelés.
La plus grande contrainte pour l'entraînement de grands modèles est les données. Un modèle de 8 trillions de paramètres nécessite une quantité énorme de données, qui coûtent très cher à générer ou à acquérir. Les entreprises centralisées dépensent des sommes colossales pour cela, tandis que les acteurs décentralisés n'auraient pas accès à ces données.
Concernant la demande, la proposition de valeur fondamentale de la crypto est l'auto-souveraineté et la résistance à la censure, la décentralisation étant un moyen d'y parvenir. Pour l'IA, les gens se soucient du coût, de la propriété (ne pas voir leurs données utilisées dans des ensembles d'entraînement) et de la résistance à la censure (comme ce qui s'est passé avec Fable 5). Les gens ne veulent pas que le gouvernement leur interdise d'utiliser un produit.
L'exemple de Venice, qui utilise l'IA pour le calcul confidentiel et la préservation de la vie privée, est cité. Les modèles les plus utilisés sur Venice sont des modèles open source et open-weight gérés par des entreprises traditionnelles, et non des modèles entraînés de manière décentralisée. Cela suggère que si l'IA bénéficie des technologies décentralisées, ce sera pour les propriétés qu'elles offrent, pas nécessairement pour le mécanisme d'entraînement lui-même.
Un argument est que l'IA décentralisée est "deux générations en retard" sur l'état de l'art. L'innovation en matière de raisonnement et d'apprentissage continu a progressé rapidement dans l'IA centralisée. Le fossé entre les modèles centralisés et décentralisés se serait élargi en raison des ressources (talent, financement) des premiers. Bien qu'il y ait une place pour les petits modèles et le calcul sur appareil, la distillation de modèles à partir de grands modèles fonctionne bien.
Cependant, il est souligné que les "essaims" de formation décentralisés offrent une résilience. Contrairement aux grandes exécutions de formation centralisées où une panne de GPU peut faire échouer tout le processus, les essaims sont conçus pour que des GPU de différentes tailles puissent entrer et sortir du réseau sans affecter la formation. Google lui-même commence à utiliser des algorithmes de style diloco dans ses centres de données, ce qui montre la valeur de ces approches.
L'objectif principal de l'IA décentralisée n'est pas la résistance à la censure, mais d'ouvrir autant de capacité de calcul que possible. Bien qu'une petite poignée d'entreprises ait monopolisé la majorité du calcul haut de gamme, la somme des appareils grand public dans le monde représente plus de flops que les centres de données actuels. Créer un essaim de ces appareils peut offrir une qualité de formation similaire à celle d'un centre de données, mais à moindre coût.
Concernant la bande passante, bien que ce soit un défi, des recherches montrent qu'il est possible d'obtenir des ordres de grandeur d'efficacité en optimisant les algorithmes, même si cela implique des coûts fixes comme la conversion du modèle à un format spécial.
Sur les données, l'argument est que de nombreux clients veulent la meilleure économie pour leur IA. Des entreprises comme Kirkland and Ellis sont prêtes à dépenser des centaines de millions pour entraîner leur propre modèle sur leurs données propriétaires. Si l'IA décentralisée peut offrir un substrat de formation moins cher, elle peut attirer ces clients, à condition que les contraintes de confidentialité soient respectées. Il est concevable que des exécutions de formation décentralisées puissent maintenir la confidentialité ou être soumises à des autorisations. L'idée est que si les poids du modèle sont répartis sur un réseau sans qu'une seule entité ne les possède tous, les utilisateurs paient le réseau, et les revenus sont distribués aux parties prenantes (détenteurs de jetons), ce qui aligne les incitations et offre un modèle économique pour des entités qui ne pouvaient pas se permettre d'entraîner un modèle auparavant.
Si l'IA décentralisée devient aussi capable que l'IA centralisée, cela pourrait "aplatir le monde de manière très peu intuitive". Si l'IA de niveau frontal devient très bon marché et une marchandise, les contrôles à l'exportation deviendront pratiquement impossibles. Cela pourrait entraîner une propagation rapide des cyberattaques à travers le monde, causant des dommages rapides aux logiciels, en particulier ceux qui ne peuvent pas être mis à jour. Les données sur les attaques en chaîne montrent une augmentation spectaculaire du nombre d'incidents.
L'IA est déstabilisatrice, non seulement pour le marché du travail, mais aussi pour la sécurité des infrastructures mondiales qui reposent sur des logiciels. Si tout le monde a accès à une "