OpenAI dévoile une IA génératrice d’images intégrée à ChatGPT : le duel avec MidJourney est-il fini ?
L’avenir de la génération d’images assistée par l’IA prend une nouvelle tournure avec la récente annonce d’OpenAI. En effet, la société d’intelligence artificielle vient d’introduire une nouvelle fonctionnalité innovante et amusante dans son offre : la génération d’images natives au sein de ChatGPT, son célèbre chatbot. Coup de maître ou simple coup d’épée dans l’eau face à des concurrents redoutables comme MidJourney ? Découvrons cela ensemble.
OpenAI et sa nouvelle arme : 4o Image Generation
Jusqu’à récemment, OpenAI comptait sur son modèle DALL-E pour générer des images. Pourtant, ce dernier peinait à se mesurer aux géants tels qu’Aurora (xAI), Imagen 3 (Google) et MidJourney. Mais OpenAI semble décidée à ne pas rester en rade. Le 25 mars, la société a annoncé le lancement de sa nouvelle fonctionnalité : 4o Image Generation, directement intégrée à ChatGPT.
Qu’est-ce que 4o Image Generation ?
Nommé « 4o Image Generation », ce nouveau modèle générateur d’images n’est pas un successeur direct de DALL-E, mais plutôt une extension de GPT-4o. Il tire parti des capacités multimodales de GPT-4o et a bénéficié d’un entraînement sur un vaste corpus d’images. Il promet ainsi une meilleure compréhension des instructions en langage naturel.
Des avancées notables
OpenAI a mis l’accent sur la génération de texte dans les images, un frein pour la plupart des modèles existants. Ainsi, ChatGPT peut maintenant créer des affiches, des logos ou des panneaux signalétiques contenant du texte lisible et bien intégré. Plus besoin de maîtriser des prompts complexes pour obtenir un rendu précis : expliquez votre idée naturellement, et l’IA s’occupe du reste.
ChatGPT concurrence Photoshop
Avec cette mise à jour, ChatGPT ne se contente pas de générer des images. Il propose également un outil d’édition avancé. Les utilisateurs peuvent envoyer une image et demander des retouches spécifiques, comme changer l’arrière-plan, ajouter un objet ou transformer un personnage. L’IA peut même garder en mémoire jusqu’à 15 images, ce qui permet d’affiner les résultats au fil des ajustements.
La question des images d’êtres humains
Toutefois, la génération d’images d’êtres humains reste un point de débat. OpenAI assure que son modèle peut produire des visages réalistes, mais impose des restrictions, notamment sur les personnalités publiques. Contrairement à Grok (xAI), qui génère presque tout sans filtre, ChatGPT sera encadré, même si les limites précises ne sont pas encore définies.
Conclusion
La force de cette nouveauté d’OpenAI réside dans son intégration à ChatGPT, une plateforme qui compte 400 millions d’utilisateurs actifs par semaine. L’entreprise prévoit également de rendre cette fonctionnalité accessible à d’autres développeurs via une API. Sora, son générateur de vidéos, bénéficiera lui aussi de ces améliorations à l’avenir. Alors, est-ce le début d’une nouvelle ère pour la génération d’images assistée par l’IA ? Seul l’avenir nous le dira.
Et vous, avez-vous déjà essayé cette nouvelle fonctionnalité d’OpenAI ? Partagez votre expérience dans les commentaires !
Share this content: