
OpenAI Codex Can Now Use Your Computer! (Full Breakdown + Testing)
Audio Summary
AI Summary
Cette semaine dans l'IA, OpenAI progresse avec son agent professionnel Codex, destiné aux travailleurs non techniques. Le produit a été ajusté pour être plus convivial, permettant par exemple de configurer des automatisations pour regrouper e-mails, messages Slack et invitations de calendrier. Bien que similaire à Claude Co-work, Codex se distingue par sa capacité supérieure à utiliser le navigateur.
Des mises à jour récentes incluent non seulement GPT 5.5, axé sur les tâches agentiques et la résolution de problèmes par rétro-ingénierie, mais aussi des modifications de l'interface et de l'intégration pour les consommateurs non techniques. Codex est comme un ChatGPT avec accès à votre ordinateur, conçu pour fonctionner de manière autonome.
La principale différence avec Claude Co-work est l'efficacité de Codex à naviguer sur le web. Des tests ont montré que Codex réussissait des tâches complexes, comme l'analyse de fichiers vidéo sur le bureau, là où Claude Co-work échouait. De plus, Codex intègre un outil de génération d'images, éliminant le besoin de connexions externes. Sa capacité à contrôler le navigateur à distance est impressionnante, comme démontré lors de la création d'un formulaire Google en direct.
Pour utiliser Codex, il faut télécharger l'application de bureau et se connecter. L'interface montre un curseur se déplaçant rapidement, ce qui n'est pas le cas des produits concurrents. La vitesse d'exécution est notable, que ce soit grâce aux mises à jour de Codex ou à GPT 5.5. L'utilisateur n'a pas besoin de suivre l'agent en temps réel et peut consulter d'autres tâches générées, comme une présentation pour un client.
OpenAI suggère dix cas d'utilisation pour Codex, dont le rôle de "chef de cabinet" qui examine les messages, le calendrier et suit les actions. Pour cela, un accès complet aux données est nécessaire, ce que l'orateur n'a pas encore accordé. Codex permet l'utilisation du navigateur et le contrôle à distance des applications sur l'ordinateur, surpassant légèrement les modèles Opus en performance pratique.
Cependant, l'interface de Codex reste orientée développeurs, avec des termes techniques comme "MCP servers" ou "git environments", ce qui contraste avec l'approche grand public de Claude Co-work. Malgré cela, Codex est facile à essayer pour les utilisateurs de ChatGPT avec un compte payant, en installant les fonctions "computer use" ou "browser use".
D'autres cas d'utilisation incluent l'audit de flux de travail et la spécification d'automatisation, la création de tableaux de bord sophistiqués, la conversion de vidéos en GIFs, et la gestion de coffres-forts de transcriptions.
En dehors de Codex, d'autres avancées notables cette semaine incluent l'intégration de Google Workspace avec des connecteurs pour Gmail, Drive, Calendar et Chat, ainsi que l'ajout de nombreux connecteurs à Claude Co-work (Spotify, Instacart, Booking). Des connecteurs pour des applications créatives comme Blender, Adobe et Autodesk sont également en développement, bien que leur fonctionnalité soit encore limitée.
Enfin, un nouveau modèle Deepseek open source, concurrent chinois, est proche de l'état de l'art, et Google teste un chatbot IA pour la recherche sur YouTube, permettant d'interagir directement avec les vidéos. Ces développements indiquent une tendance vers l'unification des expériences internet, où un agent IA gérera toutes les interactions et tâches, libérant ainsi les utilisateurs.