
Hermes Agent vient de tuer Openclaw ?
Audio Summary
AI Summary
Il y a quelques mois, l'attention médiatique était focalisée sur OpenCL, mais depuis, de nouveaux acteurs ont émergé, dont Hermes Agents, qui suscite un vif intérêt. Sa particularité réside dans sa capacité d'auto-apprentissage en continu, le rendant de plus en plus performant à mesure qu'il est utilisé. Ce succès se reflète dans l'augmentation significative du nombre d'étoiles sur GitHub et une vague de migration d'OpenCL vers Hermes. La question centrale est donc de déterminer s'il s'agit d'une simple mode passagère dans le domaine de l'IA, ou d'une réelle avancée technologique.
Pour répondre à cette interrogation, une analyse approfondie d'Hermes a été menée, incluant son installation, sa configuration et des tests coûteux pour évaluer ses performances. La vidéo propose de détailler ces tests et démonstrations afin d'aider les utilisateurs à décider s'il est judicieux de migrer depuis OpenCL, ou pour les nouveaux venus, de choisir directement Hermes.
OpenCL et Hermes sont présentés comme des agents autonomes qui fonctionnent généralement sur un ordinateur externe, un VPS, ou même un téléphone. Ces agents révolutionnent l'utilisation de l'IA, allant au-delà des chatbots traditionnels comme ChatGPT ou Claude, pour entrer dans le monde des agents autonomes.
Plusieurs raisons expliquent la migration de nombreux utilisateurs d'OpenCL vers Hermes :
1. **Complexité de l'installation d'OpenCL :** Bien que des solutions d'installation simplifiée aient été développées, l'utilisation complète d'OpenCL représentait un défi technique pour de nombreux utilisateurs.
2. **Mémoire volatile d'OpenCL :** OpenCL manquait d'un système de mémoire persistante efficace, ce qui entraînait des plaintes d'utilisateurs concernant l'oubli d'informations par l'agent.
3. **Maintenance complexe d'OpenCL :** L'infrastructure d'OpenCL était jugée compliquée, ce qui est compréhensible pour une première version d'agents IA autonomes.
4. **Problèmes de mise à jour d'OpenCL :** Les mises à jour d'OpenCL entraînaient souvent des dysfonctionnements, créant un dilemme entre les risques de sécurité liés à l'absence de mises à jour et les instabilités provoquées par leur application.
La frustration la plus marquante pour l'auteur était l'incapacité d'OpenCL à retenir des instructions récurrentes, comme des consignes pour des interactions futures, en raison de l'absence de mémoire persistante. Les informations étaient stockées uniquement dans le contexte, qui se compacte et s'efface avec le temps. Bien qu'OpenCL possédât une mémoire persistante, sa configuration n'était pas par défaut et nécessitait un effort supplémentaire.
Hermes, en revanche, adopte par défaut un comportement d'apprentissage continu et d'enregistrement dans sa mémoire persistante.
Il est crucial de distinguer un chatbot d'un agent autonome. Un chatbot est principalement conçu pour la conversation, même s'il peut effectuer quelques actions basiques. Un agent, comme Hermes ou OpenCL, possède une autonomie bien plus grande, avec accès à des outils, une mémoire propre, divers canaux de communication et un prompt système dédié. Bien que les chatbots évoluent vers des fonctionnalités d'agents, Hermes et OpenCL sont de véritables agents IA autonomes capables d'exécuter des tâches complexes.
La différence fondamentale entre Hermes et OpenCL réside dans leur mode de fonctionnement. Hermes intègre une boucle d'auto-amélioration. Comme OpenCL, il dispose d'une mémoire, de compétences (skills), d'outils et d'un prompt système. Cependant, dès qu'une nouvelle tâche lui est confiée, Hermes apprend et améliore ses compétences. Par exemple, si on lui demande de créer un devis, il posera des questions pour comprendre le processus. Une fois la tâche accomplie avec succès, il créera automatiquement un "skill" (compétence) basé sur cette tâche et l'améliorera continuellement. Ce comportement d'auto-apprentissage, naturel pour les humains, est une innovation majeure pour les agents IA, rendant Hermes plus puissant et autonome.
Dans OpenCL, l'ajout de compétences nécessitait une installation manuelle et des instructions explicites pour leur modification. Hermes, quant à lui, gère ce processus de manière autonome, libérant l'utilisateur de la nécessité d'être un expert en IA pour optimiser les compétences de l'agent.
Pour illustrer le fonctionnement de la boucle d'auto-amélioration, une démonstration a été effectuée via WhatsApp. La demande était d'analyser les commentaires de la dernière vidéo YouTube, de synthétiser les 50 premiers commentaires et de fournir un rapport détaillé sur les points à améliorer. Hermes a navigué sur le lien, pris des captures d'écran et analysé les commentaires. Pour cette première exécution, il a utilisé son modèle général pour comprendre la tâche. À la fin, il a proposé de transformer cette analyse en une tâche planifiée (cron job) pour analyser automatiquement les commentaires des vidéos futures et envoyer un rapport.
Ce processus a entraîné la création automatique d'un nouveau "skill" nommé "YouTube comment analysis", enregistré dans l'interface d'Hermes. Ce skill, qui décrit comment réaliser la tâche, s'auto-améliorera au fil des interactions. Un skill est ainsi défini comme une recette ou un fichier décrivant étape par étape comment accomplir une tâche, évitant ainsi de dépenser des tokens inutiles pour trouver la solution et réduisant le risque d'erreurs. Hermes est livré avec de nombreux skills préinstallés, et il est possible d'en installer de nouveaux, mais la véritable puissance réside dans la création de ses propres skills.
Outre les skills, les outils représentent les actions que l'agent peut effectuer. La mémoire est un élément crucial qui distingue l'intelligence d'un agent. Dans Hermes, la mémoire persistante est simplifiée, comprenant des notes utilisateur, des informations sur l'utilisateur lui-même et son "âme" (son identité propre). Contrairement à OpenCL où la mémoire était fragmentée en plusieurs fichiers, Hermes la centralise. Cette mémoire permet à l'agent de se souvenir du profil de l'utilisateur, de sa propre identité et des notes prises lors des interactions, le rendant plus intelligent au fil du temps.
Lors de la tâche d'analyse des commentaires, Hermes a d'abord vérifié s'il possédait déjà un skill correspondant. Ne l'ayant pas, il a cherché une solution autonome. Il est conçu pour persévérer dans ses tentatives (par défaut, 90 essais) jusqu'à réussir. Après succès, il évalue son efficacité, comme lors de la proposition de créer un cron job pour l'analyse future. Il a ensuite généré le skill et, considérant la fréquence des tâches récurrentes, a proposé de mettre en place le cron job automatiquement. Ce skill sera continuellement auto-amélioré.
Les cron jobs sont des tâches programmées qui s'exécutent automatiquement. Un exemple concret est une tâche programmée pour la recherche immobilière. Si cette tâche échoue, l'agent peut la réparer, comme dans l'exemple où un cron job était exécuté dans le mauvais dossier. L'agent a corrigé le wrapper, et la tâche s'exécute désormais toutes les 30 minutes sans erreur. La mise à jour de la mémoire et la boucle d'auto-amélioration se déclenchent suite à ces corrections.
Hermes peut être utilisé de plusieurs manières : via WhatsApp (comme démontré), Telegram, iMessage, ou une interface graphique appelée Web UI. L'utilisation via un terminal, bien que possible, n'est pas optimale. La Web UI de Hermes, un projet open source, offre une expérience utilisateur améliorée, intégrant des fonctionnalités telles que les scheduled jobs, un tableau Kanban, la visualisation de la mémoire, la gestion des workspaces, des to-do lists, des insights d'utilisation et des logs. Cette interface est particulièrement utile lorsqu'on travaille sur ordinateur.
Il est déconseillé d'installer Hermes directement sur son ordinateur personnel en raison des risques de sécurité liés à l'accès complet à ses fichiers. Il est préférable de l'installer sur un ordinateur externe ou un serveur pour une meilleure sécurité.
L'installation d'Hermes peut être complexe. Hostinger est recommandé comme solution d'installation simplifiée, offrant un catalogue de projets open source préconfigurés, y compris Hermes et sa Web UI, intégrés dans un conteneur Docker. L'utilisation du code promo "Shouam Sharma" sur les plans de 12 ou 24 mois offre une réduction.
Une fois installé via Hostinger, l'accès à la Web UI de Hermes nécessite un mot de passe et une clé API d'un LLM (Large Language Model). Pour des raisons de coût, l'utilisation de modèles comme "Deepseek V4 Flash" est recommandée, car ils sont beaucoup moins chers que des modèles comme GPT-4 ou Claude Opus. Il est important de noter que l'utilisation de modèles chinois comme Deepseek implique que les données transitent par la Chine. Pour ceux qui souhaitent une solution locale, il est possible de connecter Hermes à Ollama.
La Web UI de Hermes propose des fonctionnalités avancées comme le Kanban, qui permet de visualiser et de gérer les tâches déléguées à des sous-agents. Par exemple, pour la création d'un site web pour une chaîne YouTube, Hermes déploie des sous-agents pour analyser la chaîne, concevoir le site, et les tâches sont organisées dans un tableau Kanban pour un suivi efficace. Des profils de "workers" (sous-agents) peuvent être créés avec des modèles spécifiques pour chaque tâche.
Concernant le coût d'utilisation des LLM, l'auteur a expérimenté des dépenses importantes avec des modèles coûteux. L'utilisation d'API avec paiement au token peut rapidement devenir très chère. Deepseek V4 propose une alternative économique, avec des coûts minimes observés pour une utilisation intensive.
Le verdict entre OpenCL et Hermes est le suivant : Hermes est plus facile à installer, gère mieux les fichiers et les skills, et offre une meilleure visibilité grâce à sa Web UI. Il oublie moins d'informations grâce à une meilleure gestion de la mémoire persistante. Pour les utilisateurs existants d'OpenCL, la décision de migrer dépend du niveau de configuration déjà atteint. Si l'auto-amélioration et la gestion des fichiers sont déjà optimisées, l'upgrade n'est pas forcément révolutionnaire, sauf pour la Web UI.
Pour les nouveaux utilisateurs, Hermes est fortement recommandé en raison de sa facilité de configuration et de sa Web UI qui simplifie grandement l'expérience. L'erreur principale serait de se limiter à des chatbots basiques et de conclure que l'IA n'est pas encore mature. L'expérimentation avec des plateformes comme Hermes est essentielle pour comprendre l'évolution de l'IA. Il est conseillé de tester, configurer et d'apprendre, plutôt que de se fier uniquement au "hype" observé sur les réseaux sociaux.
L'auteur propose des workshops accessibles via sa liste email privée