
Nouveautés + tendances
Vous pouvez désormais définir vos sources préférées sur Google
par Samuel Buchmann

Avec GPT-Image 1.5, OpenAI étend les fonctionnalités d'image de ChatGPT. Une nouvelle vue Images regroupe la création et l'édition de contenu visuel et devrait être plus précise et plus rapide que les solutions existantes.
OpenAI a présenté GPT-Image 1.5, un nouveau modèle de génération d'images directement intégré à ChatGPT. La nouvelle vue Images de ChatGPT permet aux utilisateurs de générer des images, de modifier des photos téléchargées et de développer des contenus visuels ciblés. Le tout au sein d'une interface centrale.

Selon OpenAI, le nouveau modèle est beaucoup plus rapide que son prédécesseur et exécute les instructions avec plus de précision. La société tech parle d'une vitesse jusqu'à quatre fois plus élevée et d'un traitement des instructions amélioré qui facilite les modifications ciblées des images et réduit les ruptures de style involontaires.

La nouvelle vue Images de ChatGPT met l'accent sur la création et l'édition d'images. Les utilisateurs peuvent directement mettre en œuvre des idées d'images, comparer des variantes et retravailler des résultats antérieurs. Le chat continue à faire partie du flux de travail, de sorte que les concepts et les textes peuvent toujours être développés en dialogue.

En plus de la génération classique de texte vers l'image, OpenAI met désormais davantage l'accent sur la modification des images existantes. Les photos téléchargées peuvent être modifiées de manière ciblée, certaines zones peuvent être masquées, remplacées ou complétées. Le contrôle se fait exclusivement par des commandes de texte. Selon OpenAI, cette fonction n'est pas destinée à remplacer les logiciels professionnels de retouche d'images, mais plutôt à servir de solution pour des ébauches rapides, des illustrations et des adaptations éditoriales.
Comparé aux générateurs d'images spécialisés tels que Midjourney ou Stable Diffusion, OpenAI adopte une approche différente : la génération d'images est intégrée dans une plateforme d'IA universelle et mise sur l'accessibilité et l'intégration contextuelle. Alors que Midjourney est souvent à l'avant-garde pour les images individuelles à l'esthétique sophistiquée et que Stable Diffusion offre une flexibilité technique, ChatGPT Images met l'accent sur l'efficacité du flux de travail et la simplicité d'utilisation. La différence essentielle réside moins dans la qualité pure de l'image que dans l'intégration du texte, de l'image et de l'édition dans un seul système.

Google poursuit un autre objectif avec Gemini Imagen 4 et Nano Banana Pro. Les nouveaux outils mettent surtout l'accent sur une qualité d'image élevée, une meilleure intégration du texte et une intégration directe dans les applications Google Workspace. Nano Banana Pro s'adresse également à des contenus plus structurés comme les infographies ou les visualisations basées sur des données.
Alors que Google intègre clairement ses générateurs d'images dans des environnements de travail productifs, OpenAI positionne ChatGPT Images comme un outil polyvalent de bas niveau. La différence réside moins dans la qualité pure de l'image que dans l'orientation respective : ici l'intégration dans les flux de travail bureautiques existants, là un espace de travail IA universel.
Mes intérêts sont variés, j'aime simplement profiter de la vie. Toujours à l'affût de l'actualité dans le domaine des fléchettes, des jeux, des films et des séries.
Du nouvel iPhone à la résurrection de la mode des années 80. La rédaction fait le tri.
Tout afficher
Nouveautés + tendances
par Samuel Buchmann

Nouveautés + tendances
par Samuel Buchmann

Nouveautés + tendances
par Jan Johannsen