Deuxième tour de l'IA

 

Dans mon premier article J'ai réfléchi à la fascination et aux dangers des images générées par l'IA. Maintenant, j'ai commencé une petite expérience pour créer de meilleures images d'IA en utilisant l'IA. Cela semble un peu étrange au début. Ça va :


Afin de générer une image via l'IA, vous devez formuler une description de l'image - ce qu'on appelle "Rapide". Sur Midjourney, la plateforme sur laquelle je saisis mes invites, j'ai formulé le texte suivant (l'anglais produit de meilleurs résultats) :

Photographie de vieux bus dans une gare routière avec une femme assise dans l'un des bus regardant par la fenêtre avec des gouttes d'eau sur la fenêtre. La femme a les cheveux noirs et un visage à l'expression triste, zone industrielle, nuit, couleurs froides sauf à l'intérieur du bus avec la femme, la photographie devrait ressembler à un tableau d'Edward Hopper mais ultraréaliste. La photo est prise depuis l'extérieur du bus. Sur la photo, vous pouvez voir l'ensemble du bus et d'autres bus en arrière-plan. tir d'un drone sur DJI Mavic 3.

Midjourney a généré quatre images à partir de ce texte :

Des résultats visuellement attrayants, mais qui ne correspondent pas à mon intention. J'ai donc fait appel à l'IA pour m'aider et j'ai demandé à Copilot de Microsoft (merci beaucoup Jannik pour l'introduction) de formuler une version plus détaillée en dix phrases de mon texte. Le texte suivant est sorti :

La photographie est une vue d'ensemble d'une ancienne gare routière prise depuis l'extérieur du bus. La gare est située dans une zone industrielle et la photographie a été prise de nuit. La photographie présente une palette de couleurs froides, à l'exception de l'intérieur du bus où la femme est assise. La femme a les cheveux noirs et une expression triste sur le visage. Elle est assise dans l'un des bus et regarde par la fenêtre. La fenêtre est recouverte de gouttelettes d'eau, ce qui ajoute à l'ambiance mélancolique de la photographie. La photographie est prise depuis un drone utilisant un DJI Mavic 3. La photographie est ultra réaliste et ressemble à un tableau d'Edward Hopper. La photographie capture l'ensemble du bus et les autres bus en arrière-plan. La photographie est un exemple frappant de la façon dont une photographie peut capturer l’ambiance d’un lieu et les émotions d’une personne.

Avec cette description, Midjourney a généré de nouvelles images différentes :

J'ai réessayé :

La photographie est une vue d’ensemble d’une ancienne gare routière prise depuis une perspective aérienne. Il y a cinq bus dans la gare routière située dans une zone industrielle et la photo a été prise une nuit pluvieuse. Tous les bus sont vides, sauf un dans lequel une dame est assise à l'intérieur du bus. La photographie présente une palette de couleurs froides, à l'exception de l'intérieur du bus où la femme est assise et regarde par la fenêtre. La fenêtre est recouverte de gouttelettes d'eau, ce qui ajoute à l'ambiance mélancolique de la photographie. Dans ce bus, une lumière chaude illumine l’intérieur du bus. La femme a les cheveux noirs et une expression triste sur le visage. La photographie est prise depuis un drone utilisant un DJI Mavic 3. La photographie est ultra réaliste et a un style proche d'un tableau d'Edward Hopper.

Aujourd'hui, la gare routière est mieux mise en valeur, mais la scène a été montrée de si loin que l'individu n'est plus visible :

J'ai abandonné l'idée de prendre une photo aérienne et j'ai formulé un nouveau texte avec mon copilote :

La photographie est une image ultra-photoréaliste capturée avec un appareil photo Leica M et un objectif 21 mm. La photographie est une prise de vue grand angle qui capture toute la gare routière. Au premier plan, on aperçoit un bus éclairé de l’intérieur. Une jeune femme aux cheveux noirs est assise à une fenêtre au milieu du bus et regarde tristement par la fenêtre. La photo a été prise pendant l’heure bleue, ce qui lui donne une palette de couleurs froides. Cependant, l’intérieur du bus où est assise la femme est baigné d’une lumière chaude, créant un contraste saisissant avec les couleurs froides de l’extérieur. En arrière-plan, on aperçoit d’autres bus garés dans la gare routière. Ils sont tous vides et aucune autre personne n’est visible sur l’ensemble de l’image, à l’exception de la seule femme assise dans le bus illuminé. Il pleut et on peut voir des gouttes d’eau sur les vitres des bus.

Voici le nouveau résultat :

Ce n'est toujours pas ce que j'imaginais dans mon esprit, mais c'est mieux. J'ai préféré l'image en bas à droite et j'ai demandé à Midjourney de générer quatre versions de cette photo :

Je n’ai pas vraiment réussi à mettre en œuvre ce que j’avais en tête. L’image ci-dessous reflète au moins quelque peu l’ambiance que j’avais en tête :

Addenda

Midjourney vient d'être mis à jour et la version 6.0 est désormais en ligne. Avec cette version, j'ai réussi pour la première fois à générer une image beaucoup plus proche de ma description textuelle. Surtout, le système a désormais correctement enregistré que l'image a été prise depuis l'extérieur du bus. La technologie progresse rapidement et dans quelques mois seulement, nous verrons des résultats encore plus précis.


 
Dos
Dos

Schaffhuuse montre du cœur

Plus loin
Plus loin

Le Pape et le Dalaï Lama boivent du café...