
On teste ChatGPT Images 2.0 (spoiler : il écrase tout)
AI Summary
Voici un résumé des points clés de la transcription concernant GPT Image 2.0 :
* **Capacités impressionnantes** : GPT Image 2.0 est un modèle "monstrueux" d'OpenAI, disponible pour tous et via API. Il est conversationnel et doté de raisonnement, capable de comprendre des requêtes complexes sans ciblage précis.
* **Recherche web intégrée** : Il peut effectuer des recherches web pour intégrer des informations récentes dans les illustrations demandées, ce qui est "absolument bluffant".
* **Cohérence et texte** : Le modèle excelle dans la cohérence visuelle, par exemple en modifiant un élément dans une image tout en conservant le reste. Il gère également très bien le texte, même en petite taille et dans toutes les langues, une nette amélioration par rapport aux modèles précédents.
* **Modes "Instant" et "Thinking"** : Le modèle propose deux modes, "Instant" et "Thinking", dont les différences d'approche (plus mathématique et précis pour "Thinking") sont explorées.
* **Révolution pour la création** : L'outil est perçu comme une révolution, permettant de générer des images de haute qualité et de moderniser des logos avec une simple instruction. Il peut même générer des "blueprint" détaillés d'un logo, incluant des calculs de proportions et des spécifications de couleurs.
* **Reconnaissance d'images IA** : GPT Image 2.0 est capable d'identifier si une image de référence a été générée par une IA, comme démontré lors d'un test où il a démasqué une photo soumise par l'utilisateur.
* **Gestion des biais** : Le modèle semble mieux gérer les biais, par exemple en générant des personnages roux avec des yeux marron, contrairement à d'autres IA qui tendent à attribuer des yeux bleus ou verts.
* **Limites et défis** : Bien que très performant, il rencontre des difficultés avec certaines modifications précises (par exemple, remplacer des objets dans une zone spécifique d'une photo) et la cohérence des détails sur des changements d'angle importants ou des éléments très spécifiques (comme l'heure exacte sur une horloge avec des aiguilles réalistes).
* **Potentiel pour les workflows** : L'intégration de GPT Image 2.0 dans les workflows de création est envisagée comme un gain de temps considérable pour la production de visuels.