Quand l’intelligence artificielle crée des chefs-d’œuvre sur commande

Un nouveau programme d’intelligence artificielle créé par OpenAI surprend en créant des images basées sur des descriptions (souvent loufoques).

Image créée par DALL · E 2 montrant Mona Lisa mangeant un gâteau pendant la fin du monde @Twitter screenshot

Connaissez-vous DALL · E 2 ? Sinon, c’est normal. C’est la nouvelle technologie créée cette année. Mais ces dernières semaines, il a commencé à faire son chemin sur les réseaux sociaux. La clé de son succès : cette intelligence artificielle (IA) crée des images réalistes à partir de phrases arbitraires, sans intervention humaine. Si on veut résumer, on pourrait dire qu’il s’agit d’illustrer les mots. Un concept très simple mais la qualité est tellement au rendez-vous que l’on est émerveillé par ces créations qui sont toutes des chefs d’oeuvre.

Dalí version babylonienne et astronautes de basket-ball avec des chats

Pour vous donner un exemple, prenons la phrase suivante : « Les jardins suspendus de Babylone au milieu d’une ville, à la manière de Dalí ». Cela n’a aucun sens, mais à partir des différents éléments qui le composent, l’IA créera une toute nouvelle image. Cherchez des photos qui représentent les jardins de Babylone, ceux d’une ville, et inspirez-vous des réalisations de Dalí. En mélangeant le tout, il donne un tableau digne du peintre catalan, bien qu’il ne l’ait manifestement jamais créé. Idem pour une toile représentant un renard à la manière de La Nuit étoilée de Van Gogh ou de Claude Monet.

Le concept est déclinable à l’infini. Vous pouvez demander à DALL · E 2 de créer une représentation d’astronautes jouant au basket avec des chats à la manière d’un livre pour enfants, ou minimaliste, voire à l’aquarelle. L’IA peut également prendre une image existante, comme la célèbre fille avec une boucle d’oreille en perle Vermeer, et en créer de multiples variations. A chaque fois, le résultat est plus que probant. Vous n’avez plus à vous soucier de créer de belles couvertures de livres ou des affiches flashy. La machine le fait pour vous (peu importe le travail de l’artiste en jeu, mais c’est une autre discussion).

Éviter les dérives pour maximiser l’intérêt du programme

Pour obtenir ce résultat, la société OpenAI a d’abord développé DALL · E en janvier 2021. Même alors, l’IA était capable de créer de tels résultats à partir de mots. Une technique appelée “diffusion”. Un an plus tard, DALL · E 2 pousse la barre un peu plus loin avec une résolution multipliée par quatre, résultant en des images beaucoup plus convaincantes. Le réalisme passe clairement à un niveau supérieur et la correspondance avec les légendes est beaucoup plus nette.

Si vous craignez que l’IA crée des images violentes de personnes mal intentionnées, OpenAI dit qu’elle peut vous convaincre. En fait, l’entreprise a créé un algorithme pour supprimer ce type de contenu, au moins explicitement. L’image résultante de telles phrases serait donc très métaphorique. DALL · E 2 évite également d’utiliser de vrais visages d’individus, en particulier de célébrités, afin de ne pas créer le même type d’abus que le deepfake.

“Notre espoir est que DALL · E 2 permettra aux gens de s’exprimer de manière créative. DALL · E 2 nous aide également à comprendre comment les systèmes d’IA avancés voient et comprennent notre monde, ce qui est essentiel à notre mission est de créer une IA qui profite à l’humanité. ” dit OpenAI.

Le “langage secret” de DALL · E 2

De toute évidence, DALL · E 2 n’est pas parfait. Parfois, il identifie mal les concepts présents dans une phrase, notamment lorsqu’il s’agit de néologismes. C’est ce que rapporte The Independent, qui raconte l’histoire d’un doctorant en informatique à Austin, Giannis Daras. Ce dernier a demandé au programme de créer une photo d’agriculteurs parlant à des légumes tout en introduisant le mot “vicottes” (qui n’existe pas). Résultat : l’image montrait des plats avec des légumes. C’est en s’intéressant à ce phénomène que l’Université du Texas a découvert que DALL · E 2 créait son propre vocabulaire (aussi absurde que certaines phrases y soient soumises). Dans sa langue, « Apoploe versrreaitais » signifie par exemple « oiseau ». “La découverte du langage Dalle-2 crée de nombreux défis intéressants en matière de sécurité et d’interprétabilité”, s’émerveillent les informaticiens du Texas après la publication de l’étude. Sa conclusion doit encore être étudiée plus avant pour confirmer ou non que l’IA a créé un langage par lui-même, comme un grand !

DALLE-2 a un langage secret “Apoploe vesrreaitais” signifie oiseaux. “Contarra ccetnxniams luryca tanniounons” signifie insectes ou nuisibles.

Le message : “Apoploe vesrreaitais mangeant Contarra ccetnxniams luryca tanniounons” donne des images d’oiseaux mangeant des insectes.

Un fil (1/n) 🧵 pic.twitter.com/VzWfsCFnZo

— Giannis Daras (@giannis_daras) 31 mai 2022

Si vous voulez vous tester, OpenIA vous permet de vous inscrire sur une liste d’attente pour soumettre une phrase. Le résultat peut ensuite être publié sur les réseaux sociaux. Plusieurs internautes l’ont déjà essayé avec des phrases plus farfelues parmi elles (“Steve Jobs en jouet Happy Meal”, “Darth Vader mangeant des frites”, etc.) avant de partager les images sur ses comptes Twitter ou Instagram.

Dark Vador mangeant des frites, réalisme, croquant, lumineux, art numérique #dalle2 #dalle #openai pic.twitter.com/cBJYfxlkax

– Dalle2 Pics (@ Dalle2Pics) 2 juin 2022

Steve Jobs avec le jouet Happy Meal #dalle2 pic.twitter.com/LPFqo1NU9C

– Toute Technique Sans Passion (@ATNPssion) 7 juin 2022

Dalí version babylonienne et astronautes de basket-ball avec des chats

Éviter les dérives pour maximiser l’intérêt du programme

Le “langage secret” de DALL · E 2

Leave a Comment Cancel Reply