Deuxième tour de l'IA

 

Dans mon premier article, j’ai réfléchi à la fascination et aux dangers des images générées par l’IA. J'ai maintenant commencé une petite expérience pour créer de meilleures images d'IA en utilisant l'IA. Cela semble un peu étrange au début. Ça va bien :


Pour générer une image via l’IA, vous devez formuler une description de l’image – ce que l’on appelle « l’invite » . Sur Midjourney, la plateforme où j'entre mes invites, j'ai formulé le texte suivant (vous obtenez de meilleurs résultats en utilisant l'anglais) :

Photographie de vieux bus dans une gare routière. Une femme assise dans l'un d'eux regarde par la fenêtre, des gouttes d'eau s'y déversant. La femme a les cheveux noirs et un visage triste. Zone industrielle, nuit, couleurs froides, sauf à l'intérieur du bus où elle se trouve. La photo devrait ressembler à un tableau d'Edward Hopper, mais en ultra-réalisme. La photo est prise de l'extérieur du bus. On voit le bus en entier et d'autres bus en arrière-plan. Prise de drone avec DJI Mavic 3.

Midjourney a généré quatre images à partir de ce texte :

Des résultats visuellement attrayants, mais qui ne correspondent pas à mon intention. J'ai donc fait appel à l'IA pour m'aider et j'ai demandé à Copilot de Microsoft (merci beaucoup Jannik pour la présentation) de créer une version plus détaillée de mon texte avec dix phrases. Le résultat était le texte suivant :

Cette photographie offre une vue d'ensemble d'une ancienne gare routière, prise de l'extérieur du bus. Située dans une zone industrielle, la station a été prise de nuit. La palette de couleurs est froide, à l'exception de l'intérieur du bus où la femme est assise. Elle a les cheveux noirs et une expression triste. Assise dans l'un des bus, elle regarde par la fenêtre. Des gouttes d'eau y sont visibles, ce qui ajoute à la mélancolie de la photographie. Prise depuis un drone avec un DJI Mavic 3, elle est ultra-réaliste et ressemble à un tableau d'Edward Hopper. Elle capture le bus dans son intégralité, ainsi que d'autres bus en arrière-plan. Elle illustre parfaitement comment la photographie peut capturer l'atmosphère d'un lieu et les émotions d'une personne.

Avec cette description, Midjourney a généré de nouvelles images différentes :

J'ai réessayé :

Cette photographie offre une vue aérienne d'une ancienne gare routière. Située dans une zone industrielle, cette gare routière compte cinq bus. La photographie a été prise par une nuit pluvieuse. Tous les bus sont vides, à l'exception d'un bus dans lequel une femme est assise. La palette de couleurs est froide, sauf à l'intérieur du bus où la femme est assise et regarde par la fenêtre. Des gouttes d'eau y sont visibles, ce qui ajoute à la mélancolie de la photographie. Dans ce bus, une lumière chaude éclaire l'intérieur. La femme a les cheveux noirs et une expression triste. La photographie a été prise depuis un drone avec un DJI Mavic 3. Ultra-réaliste, elle évoque un tableau d'Edward Hopper.

Maintenant, la gare routière est mieux rendue, mais la scène a été montrée de si loin que la personne individuelle n'est plus visible :

J'ai abandonné l'idée de la photographie aérienne et formulé un nouveau texte avec Copilot :

Cette photographie est une image ultra-réaliste, prise avec un Leica M et un objectif 21 mm. Un grand angle saisissant capture la gare routière dans son intégralité. Au premier plan, on aperçoit un bus illuminé de l'intérieur. Une jeune femme aux cheveux noirs est assise à une fenêtre au milieu du bus, regardant tristement par la fenêtre. La photo a été prise à l'heure bleue, ce qui lui confère une palette de couleurs froides. Cependant, l'intérieur du bus où se trouve la femme est baigné d'une lumière chaude, créant un contraste saisissant avec les couleurs froides de l'extérieur. À l'arrière-plan, on aperçoit d'autres bus stationnés dans la gare routière. Ils sont tous vides, et personne d'autre n'est visible sur l'image, à l'exception de la femme assise dans le bus illuminé. Il pleut et des gouttes d'eau apparaissent sur les vitres des bus.

Voici le nouveau résultat :

Ce n'est toujours pas ce que j'avais imaginé, mais c'est mieux. J'ai préféré l'image en bas à droite et j'ai généré quatre versions de cette photo dans Midjourney :

Je n'ai pas vraiment réussi à mettre en œuvre ce que j'avais en tête. L'image ci-dessous capture au moins un peu l'ambiance que j'imaginais :

Addenda

Midjourney vient d'être mis à jour et la version 6.0 est désormais en ligne. Avec cette version, j'ai réussi pour la première fois à générer une image beaucoup plus proche de ma description textuelle. Surtout, le système a désormais correctement détecté que l’image a été prise de l’extérieur du bus. La technologie progresse rapidement et dans quelques mois, nous verrons des résultats encore plus précis.


 
Dos
Dos

Schaffhuuse montre du cœur

Plus loin
Plus loin

Le Pape et le Dalaï Lama buvant du café...