
Cette IA bat Opus 4.8, GPT-5.5 et Gemini (Sakana Fugu)
Audio Summary
AI Summary
Une annonce majeure provient d'un laboratoire japonais qui affirme égaler les performances des meilleurs modèles d'IA, tels qu'Anthropic, GPT et Gemini, en les utilisant simultanément. Ce nouveau système, nommé Fugu (poisson-globe), n'est pas un modèle d'IA à proprement parler, mais un orchestrateur conçu pour commander et coordonner d'autres modèles.
Cette innovation survient dans un contexte où le gouvernement américain a restreint l'accès à certains modèles d'Anthropic, comme Claude et Mythos, pour les ressortissants étrangers, obligeant l'entreprise à bloquer l'accès pour éviter les non-conformités. Sakana, l'entreprise derrière Fugu, capitalise sur cette instabilité en proposant une solution qui élimine le risque de dépendance à un fournisseur unique.
Fugu fonctionne comme une API centralisée. Lorsqu'une requête est envoyée, Fugu détermine sa complexité. Pour les tâches simples, il répond directement. Pour les tâches complexes, il décompose le problème, distribue les sous-tâches à des modèles experts spécialisés, vérifie leur travail et assemble une réponse cohérente. L'utilisateur ne perçoit qu'une seule interaction. Fugu lui-même est un modèle de langage entraîné à cette coordination, capable d'appeler d'autres modèles, y compris des instances de lui-même, de manière récursive.
Cette approche s'appuie sur des recherches académiques publiques, notamment sur des coordinateurs légers optimisés par évolution et des modèles entraînés par renforcement pour apprendre des stratégies de coordination en langage naturel.
Les performances annoncées par Sakana sont impressionnantes, plaçant Fugu Ultra en tête de plusieurs benchmarks clés, surpassant même certains des modèles qu'il orchestre. Cependant, il est crucial de noter que ces résultats proviennent de Sakana et n'ont pas encore été vérifiés par des tiers. De plus, Fugu n'a pas été testé directement contre certains modèles restreints comme Mythos et Fable 5.
Un point de vigilance concerne la nature de "boîte noire" de Fugu ; les modèles sélectionnés et leur coordination ne sont pas révélés, rendant l'audit et la reproduction des résultats impossibles, ce qui pose question pour les usages critiques. Les tarifs annoncés peuvent également masquer des coûts d'inférence plus élevés, car chaque appel à un modèle sous-jacent s'ajoute au coût de l'orchestrateur. Enfin, Fugu n'est pas encore disponible dans l'Union Européenne en raison de la conformité RGPD. L'idée centrale de l'orchestration comme nouvelle catégorie de produits, basée sur l'intelligence collective plutôt que sur la taille des modèles, reste néanmoins pertinente.