
ChatGPT Just Changed Forever...
Audio Summary
AI Summary
Cette semaine est importante pour OpenAI, qui a non seulement lancé un nouveau modèle phare, GPT 5.5, mais aussi un nouveau modèle d'image. Ce dernier peut créer des graphiques pour les médias sociaux à partir d'une miniature, en différentes tailles comme un carré Instagram, une bannière Twitter ou une épingle Pinterest, et ce, à partir d'une seule invite. Il y a donc quelque chose pour tout le monde, en plus de quelques autres sorties d'IA intéressantes à surveiller.
Commençons par GPT 5.5, le gros morceau. Il faut dire d'emblée que les utilisateurs, moi y compris, sont encore en train de déterminer si ce modèle fera une différence dans leurs flux de travail existants, car il n'est pas optimisé pour le chat. Cela signifie que l'IA est en train de changer. Ma première impression de GPT 5.5 est qu'il est différent. Comme mentionné précédemment, il existe trois niveaux d'IA : l'IA pour les réponses, l'IA comme partenaire de travail, et l'IA qui travaille pour vous. Le niveau supérieur est le niveau agentique, où l'IA fait des choses pour vous, et ce modèle a été développé précisément pour cela. Il est conçu pour des tâches complexes et de longue haleine, comme l'écriture de code, la recherche en ligne, l'analyse d'informations, la création de documents et de feuilles de calcul, et le déplacement entre différents outils. Bien sûr, cela se produit aussi dans le chat, mais ce sont principalement des tâches agentiques. Le codage agentique est sa capacité phare, et OpenAI ne cesse de répéter sa capacité à prendre des entrées très désordonnées et à les transformer en sorties structurées et cohérentes. Cela signifie que vous pouvez simplement apporter un tas de notes et demander de les transformer en présentation, et l'IA le fera pour vous.
Des exemples seront présentés, mais à travers Internet, les avis sont mitigés, tout comme pour Opus 4.7. Je pense que la raison en est que nous avons atteint un plateau en termes de convivialité dans les applications de chat. En ce qui concerne l'écriture de code, la barre est déjà si haute avec d'excellents modèles disponibles que beaucoup de ces nouveaux modèles donnent l'impression d'être une saveur différente de ce qui est déjà très bon.
Voici quelques exemples concrets. La première invite testée, qui fonctionnait immédiatement avec Opus 4.7, a posé problème à GPT 5.5. Il a fallu 3 minutes et 12 secondes pour créer une application de réutilisation YouTube qui n'a pas fonctionné du premier coup, contrairement à Opus. Pour y accéder dans le chat, il faut se rendre dans le sélecteur de modèle. Par défaut, vous serez probablement sur "instant". Le nouveau modèle se cache derrière les options "thinking" et "pro" sur les plans payants (plus, pro, business et enterprise). En configurant, on voit que "instant" utilise l'ancien modèle 5.3 pour des réponses rapides, tandis que les nouveaux modèles "thinking" et "pro" sont disponibles avec le plan pro à 200 $. Pour les tests, nous avons utilisé l'option "extended" pour "thinking", car Opus n'est pas un modèle qui réfléchit pendant 5 minutes.
Un autre test intéressant : "Créer un SVG de l'Étoile de la Mort dans le ciel au-dessus de Los Angeles". Ce modèle semble parfois trop intelligent pour son propre bien. Chaque fois, il réfléchit au processus et se demande s'il doit vraiment faire un SVG, ou s'il doit le faire manuellement. Dans un cas, il a donné un chemin vers un fichier inaccessible. Lors de tests précédents, il passait parfois à l'outil d'image et générait un PNG de ce qui était demandé, puis, après une nouvelle invite, il revenait à ce chemin de données. Ce n'est pas parfait, il semble trop réfléchir. Cela confirme mon point de départ : ce modèle n'est pas fait pour le chat, et c'est bien ainsi. Je le testerai avec ma configuration agentique pour voir s'il fonctionne avec mon "open claw". Mais dans le chat, je n'ai pas vu de version où plusieurs des quelques cas de test de base ne fonctionnent pas.
Je tiens à préciser que je ne dis pas que c'est un mauvais modèle. Par exemple, un autre test a permis de construire un jeu de tir spatial, et c'est de loin le meilleur jeu de tir spatial que j'aie jamais vu généré par un LLM. La complexité de la chose est impressionnante, avec un espace 3D. Donc, il fait clairement quelque chose de bien. Mais ma conclusion est que ce n'est pas un modèle fait pour le chat. Je pense qu'OpenAI anticipe l'état actuel de ChatGPT. Dans les semaines à venir, je pense que nous verrons une refonte de ChatGPT qui le rendra plus agentique, car c'est clairement la direction que prend l'ensemble du domaine. OpenAI est le principal fournisseur d'applications grand public, et ils placent peut-être ce modèle comme une première étape. Si vous créez des choses, c'est excellent. Pour les tâches quotidiennes, c'est similaire. Mais pour certaines tâches spécialisées, le chat semble un peu trop limitant pour ce qu'il veut réellement faire.
En plus de GPT 5.5, une autre grande nouveauté est apparue cette semaine pour les utilisateurs de ChatGPT, et celle-ci est vraiment excitante. Il s'agit du nouveau générateur d'images, GPT Image 2. Ce qui est remarquable, c'est sa capacité à conserver les visages des personnes. C'était un point fort de Nano Banana. Vous pouvez télécharger une photo de vous-même et demander de créer des portraits professionnels, et il maintient votre visage sans régénérer une autre personne qui vous ressemble. C'est une grande victoire, et c'est accessible à tous les utilisateurs de ChatGPT, y compris les comptes gratuits.
Quelques autres points à noter : il s'agit, je crois, du premier modèle d'imagerie des grands fournisseurs qui permet d'activer le mode "thinking". Si vous activez la création d'images et le mode "thinking", il réfléchira plusieurs fois avant de créer l'image, ce qui peut être très utile pour des infographies animalières, par exemple. Ce modèle est non seulement bon pour la création, mais aussi pour l'édition et la réutilisation. Une des grandes nouveautés est qu'il peut générer jusqu'à huit images différentes. En téléchargeant une miniature YouTube récente, j'ai demandé de créer des graphiques pour les médias sociaux en différentes tailles (carré Instagram, bannière Twitter, épingle Pinterest), et il l'a fait à partir d'une seule invite. La composition est parfaite, redimensionnant la police de manière esthétique. C'est incroyable, cela fait le travail d'un graphiste. Vous pouvez facilement réutiliser un élément en plusieurs autres. De plus, il offre un rendu de texte quasi parfait, peut créer des menus de restaurant entiers sans erreurs. Il peut produire des résolutions 2K et divers formats. L'instruction following a été considérablement améliorée, ce qui signifie qu'il inclura réellement les mots demandés sans prendre de liberté créative. Et comme mentionné, la capacité de conserver votre visage et de vous remixer dans différentes situations ou de créer des portraits professionnels est un cas d'utilisation très populaire. Je dirais même que c'est mieux que Nano Banana Pro de Gemini. Globalement, je dirais que c'est probablement le meilleur générateur d'images, et certainement le plus convivial et le plus utile, et il est disponible sur tous les comptes.
En dehors de ces annonces principales, quelques autres éléments ont attiré mon attention. Cohere a ajouté des artefacts dynamiques à son outil de collaboration. Si vous codez une application, elle peut devenir une partie permanente de votre espace de travail et, surtout, elle peut récupérer des données en direct de vos connecteurs. Par exemple, si vous utilisez une application qui fonctionne avec vos e-mails existants et que vous la connectez à Gmail, chaque fois que vous ouvrirez l'application, elle récupérera vos derniers e-mails ou toute autre donnée d'un autre connecteur. Cela simplifie grandement la création d'applications personnalisées avec des données personnalisées. Il est fascinant de voir ces applications d'agents personnels conviviales se développer, et je pense qu'OpenAI suivra le mouvement, car ils auront besoin d'une application de type Cohere dans leur propre écosystème, et je pense qu'ils feront évoluer le chat dans ce sens très bientôt.
Autre point intéressant, plus côté développeur : l'API Deep Research Max de Google Gemini. Si vous êtes familier avec Deep Research, cette API peut se connecter à vos données, au Web, et générer des rapports complets en un seul appel API, surpassant tous les benchmarks. Cela semble être le meilleur outil de recherche sur le marché.
Enfin, je voudrais mentionner Claw Design, lancé la semaine dernière, la première incursion d'Anthropic dans un outil de conception. Il semble très solide et est utilisé. Vous pouvez créer des supports marketing, des pitch decks, des prototypes d'applications, et même exporter directement vers Canva ou PDF. Cela en fait la première grande entreprise d'IA à proposer un produit de conception visuelle complet dans l'interface de chatbot. Cela vaut la peine d'être examiné si vous créez des éléments de conception, ou si vous faites du marketing par e-mail, de la création de contenu pour les médias sociaux ou des choses similaires. Des gens expérimentent même la création de petites vidéos de style PowerPoint avec cet outil.
Voilà tout ce que je voulais partager avec vous aujourd'hui. Une semaine chargée. Nous avons préparé et organisé le Sommet AI Advantage, une conférence en ligne conçue pour vous faire gagner du temps avec l'IA. Je tiens à souligner que cette conférence s'adresse aux personnes qui ne sont pas encore au niveau trois, qui ne construisent pas d'agents, aux entrepreneurs, aux propriétaires de petites entreprises ou aux professionnels non techniques qui découvrent tout cela. Si cela vous intéresse, vous pouvez retrouver les enregistrements en direct sur cette chaîne pendant les sept prochains jours. Mon nom est Igor, et j'espère que vous passerez une merveilleuse semaine.