Tu connais ChatGPT par Open IA ? Savais-tu que l’entreprise a créé une autre intelligence artificielle text-to-art qui permet de transformer un texte en image ? Il s’agit de DALL-E 2. Depuis peu, elle est accessible à tous et Études Tech te dévoile tout ce qu’il faut savoir à son sujet : le principe de cette intelligence artificielle (IA), comment l’utiliser, quelles sont ses limites et surtout, quel est son prix.
C’est quoi DALL-E 2 ?
Initialement, DALL-E 2 a vu le jour en avril 2022, avec une version Beta accessible à un petit groupe de personnes. Si tu te demandes d’où vient ce nom qui te rappelle quelque chose, la réponse est simple. Le nom DALL-E est un mot-valise entre l’artiste peintre Salvador Dali, et le film d’animation WALL-E, de Pixar. Après son premier essai, Open IA a lancé une seconde version Beta, cette fois-ci, accessible à tous en s’inscrivant sur liste d’attente. On dit souvent qu’une image vaut mille mots, mais DALL-E 2 n’en demande que quelques-uns ! Simple, rapide et pratique, l’outil te permet de créer une image professionnelle de haute qualité grâce à une description écrite, qui suit quelques règles. Concrètement, l’outil repose sur l’IA GPT-3 d’OpenAI, capable de comprendre et de traiter le langage naturel humain pour le convertir en image.
Avant tout, tu dois garder en tête que, quelle que soit la puissance de l’intelligence artificielle, elle ne pourra pas remplacer la créativité humaine. Cela étant dit, DALL-E 2 offre une quantité impressionnante de possibilités, ce qui peut laisser penser que l’IA pourra se faire une vraie place dans le monde de l’art, dans un futur proche. DALL-E 2 est ce qu’on appelle un « algorithme d’intelligence artificielle ». Il s’appuie sur un réseau de neurones artificiels qui permet de générer des images à partir de phrases courtes, mais précises. C’est un outil pratique non seulement pour les créateurs de contenu, mais aussi pour toutes les personnes dotées d’un esprit artistique qui veulent s’essayer quelque chose de nouveau. Il peut aussi être utilisé pour des travaux universitaires ou des projets artistiques, par exemple.
La promesse de DALL-E 2 est simple : créer de l’art généré par IA avec un minimum d’effort ou d’intervention humaine grâce à 650 millions de possibilités. Pour le moment, cette promesse est tenue, même si obtenir un résultat satisfaisant nécessite la maîtrise de certaines techniques.
Comment utiliser Dall-E 2 ?
Tu l’auras compris, DALLE-E 2 a pour objectif de permettre à tous d’accéder au générateur de texte en image, en toute simplicité. L’utilisation du programme DALL-E 2 est approximativement du même niveau qu’une recherche d’images sur Google. Il te suffit de taper une phrase courte dans la barre de recherche de l’outil pour générer une image. La grande différence réside dans le fait que DALL-E 2 crée de toutes nouvelles images en utilisant une combinaison d’intelligence artificielle (IA) et d’apprentissage automatique (machine learning). Voici les étapes pour commencer à utiliser DALL-E 2 et réveiller l’artiste qui sommeille en toi.
Tout d’abord, tu dois commencer par te rendre sur le site web officiel de DALL-E 2, puis cliquer sur “Sign Up” te permettant de créer un compte. Pour gagner du temps, n’hésite pas à t’inscrire avec ton compte Google ou Microsoft. Sinon, tu peux simplement le faire avec ton adresse e-mail et un mot de passe. Dans tous les cas, le processus d’inscription demande une authentification à deux facteurs : par SMS et par mail. Une fois ton identité confirmée, tu pourras cliquer sur le bouton « Continuer » pour accepter les conditions d’utilisation.
Une fois tout cela terminé, un message de bienvenue s’affiche et Open AI t’explique rapidement ce que tu peux faire avec le programme d’intelligence artificielle. Après avoir pris connaissance des nombreuses possibilités s’offrant à toi, appuie sur le bouton « Continuer ».
Pour créer une nouvelle image avec cette intelligence artificielle, il te suffit de saisir une brève description de ce que tu as en tête, et de ce que tu imagines. DALL-E 2 te permet d’exploiter jusqu’à 400 caractères (plus qu’un tweet qui n’en compte que 280 maximum) pour décrire ce que tu veux voir apparaître. DALLE-E crée quatre images par requête avec un style différent pour chacune. Ensuite, tu peux cliquer sur chacune des quatre images pour effectuer des modifications basiques, comme ajouter des bordures ou encore effacer certaines parties. Sinon, tu peux également demander à DALL-E 2 de créer différentes versions de cette image. Il est important de garder en tête le simple fait de modifier quelques mots ici et là peut faire toute la différence, car chacun a un sens précis. Il peut aussi être utile d’explorer les différents types d’art, comme l’art numérique, les portraits, les rendus 3D, mais aussi les croquis. Globalement, plus tu t’entraîneras et plus le résultat obtenu aura de chances d’être crédible et réaliste.
Les options avec DALL-E sont nombreuses : par exemple, tu peux cliquer sur le bouton « Surprise Me » (surprend-moi), ou télécharger une image existante et demander au programme de la modifier en fonction de tes préférences et de tes attentes. La fonctionnalité Outpainting, récemment ajoutée à DALL-E 2, permet également d’étendre une image au-delà de ses bordures d’origine. Elle peut être appliquée à une image créée par l’IA, ou sur une image que tu as téléchargée au préalable. L’outil a notamment déjà été testé sur des œuvres d’art célèbres comme La Joconde, et a rendu des résultats impressionnants.
Pour utiliser cette fonction, il faut juste générer ou télécharger une image, puis réduire sa taille en tirant les angles. Écrit ton « prompt », et DALL-E 2 se chargera d’ajouter les éléments en reprenant le style de l’œuvre d’origine.
Comment réaliser un bon prompt ?
Pour pouvoir obtenir un résultat convaincant lorsque tu utilises une intelligence artificielle, il est indispensable de formuler une requête correcte. Nommé prompt, c’est la consigne que tu donnes à DALL-E. Pour que le résultat corresponde à tes attentes, il y a plusieurs astuces à voir en tête. Tu dois savoir que le prompt que tu utilises pour ChatGPT et celui pour DALLE-E ne sont pas les mêmes. Pour un générateur d’images, tu dois donner un maximum de détails sur le projet que tu cherches à obtenir. Attention à ne pas produire un prompt trop long. En effet, plus il y a des mots, plus tu risques d’embrouiller l’intelligence artificielle. Pour faire simple, décris le cadre de ton image et les détails qu’il peut y avoir sur les personnages présents comme leurs expressions, la taille et la couleur de leurs yeux ou encore leur style capillaire.
Si tu souhaites préciser davantage ta demande, tu peux lui demander de s’inspirer d’un artiste comme Van Gogh.
Améliorer tes images sur DALLE-E 2
Si tu as déjà essayé de te servir de DALL-E 2, tu as pu constater que le résultat obtenu n’est pas toujours à la hauteur de tes attentes. Pour améliorer tes créations, tu peux utiliser le « Prompt Book » de Guy Parsons, une ressource visuelle spécialement dédiée à l’art IA. Elle aide notamment dans la formulation des descriptions textuelles, et peut également t’inspirer pour exploiter tout le potentiel de DALL-E 2. L’objectif est que les descriptions que tu formules soient facilement compréhensibles par l’intelligence artificielle.
Dans le guide, tu retrouveras 82 pages qui détaillent les meilleures techniques pour perfectionner tes résultats sur DALL-E 2. Un des conseils les plus importants porte sur le choix des adjectifs utilisés pour saisir l’ambiance, l’émotion ou la composition esthétique recherchés. Ce n’est pas tout, le Prompt Book décrypte des astuces pour tous les types d’images : photographie, portraits, paysages, mais aussi différents styles d’illustrations et d’arts historiques ainsi que l’art en 3D, plus complexe à réaliser. Le livre dévoile aussi des conseils pour les angles de vue, l’éclairage, le type d’objectif, ou encore les textures. C’est un outil à ne pas négliger si tu veux t’améliorer !
Comment supprimer la watermark ?
Tu l’as sûrement remarqué si tu t’es déjà essayé à la création artistique avec DALL-E 2, les images générées par l’IA contiennent une signature ressemblant à une ligne de carrés colorés située en bas à droite de l’image, ce qui les rend reconnaissables. Si celle-ci pouvait vite agacé certains utilisateurs, cette époque est révolue. En effet, le règlement de DALL-E 2 autorise dorénavant à supprimer cette watermark, ce qui est indispensable pour les usages à but commercial, par exemple. Il est possible de retirer la signature très facilement avec n’importe quelle application d’édition d’image, comme Photoshop. Si tu n’as aucune idée de comment faire, sache qu’il est aussi possible de télécharger directement l’image sans watermark.
Sur ordinateur, il faut choisir l’option « Inspecter » et cherche l’URL windows.net, en faisant un clic droit. Ensuite, copie le lien de l’image et ouvre-le. L’image devrait apparaître sans le logo. Sur smartphone ou tablette, tu peux directement presser l’image sur la page de génération, et cliquer sur « sauvegarder l’image ».
Les limites de DALL-E 2
Une compréhension des mots encore limitée
La limite principale de DALL-E 2, est que la qualité du rendu dépend en grande partie du texte fourni par l’utilisateur. Plus tu seras précis, plus tu auras de chances d’obtenir le résultat souhaité. Cela étant dit, le système présente certaines limites. Par exemple, DALL-E 2 ne parvient pas souvent à fusionner plusieurs objets ou propriétés d’objets comme la forme, l’orientation et la couleur. De plus, si l’étiquetage des données fait sur DALL-E 2 est incorrect, il peut produire de faux résultats, comme quelqu’un qui aurait appris le mauvais mot. Concrètement, l’intelligence artificielle est en cours de création, alors il est possible qu’elle ne connaisse pas certains mots ou certaines tournures de phrases. Ce sont des problèmes qui disparaîtront avec le temps et les prochaines mises à jour.
Il faut savoir qu’OpenAI à veiller à programmer DALL-E 2 de telle sorte qu’aucun vrai visage, ni personne réelle, ne soit repris dans la création d’image. L’objectif ici est d’empêcher l’utilisation abusive du programme. Cela dit, de plus en plus d’outils similaires existent, ce qui rend possible la démarche de prendre une image de DALL-E et d’y intégrer le visage de quelqu’un d’autre.
Plus DALL-E 2 gagne en popularité, plus la question des droits d’auteur se pose pour les utilisateurs. Même si la société Open AI a attesté que les utilisateurs « bénéficient de tous les droits de commercialisation des images qu’ils créent avec DALL-E, y compris le droit de les réimprimer, de les vendre et de les commercialiser », les générateurs d’art par IA se basent sur des données déjà existantes. Même si elle n’est pas intentionnelle, l’option de la violation du droit de propriété intellectuelle pourrait, à l’avenir, poser problème.
DALL·E 2 : Ce qui est interdit
La priorité d’Open AI pour DALL-E 2 concerne avant tout les questions d’éthique, notamment avec la représentation de la diversité et le respect des limites imposées aux autres types d’images, générées par des humains. Des règles strictes ont été mises en place pour éviter les « biais et la toxicité » des images générées par DALL-E 2. Le genre et l’ethnie sont choisis aléatoirement s’ils ne sont pas précisés dans le descriptif. DALL-E rejettera automatiquement les images contenant des visages humains réalistes ou ressemblant à des personnalités publiques telles que des stars ou des politiciens, qui pourraient être intégrées dans le générateur d’images.
Également, OpenAI n’autorise pas la création d’images considérées comme offensantes. C’est notamment le cas des images illustrant des automutilations, des symboles haineux ou encore des actes illégaux (armes, crimes ou drogues). Des systèmes de surveillance automatisés et des modérateurs humains se chargent de censurer le contenu interdit.
Est-ce que DALL-E 2 est gratuit ?
DALL-E 2 n’est malheureusement pas entièrement gratuit. L’intelligence artificielle génératrice d’images dispose d’un système de crédits pour l’utiliser. Si, lors du lancement de Dalle-E 2, l’utilisateur bénéficiait de 50 crédits afin qu’ils puissent se faire une première idée de l’outil, cette option n’existe plus aujourd’hui. Il est possible d’acheter 115 crédits en déboursant la somme de 15 dollars. Contrairement aux anciens crédits gratuits, les crédits achetés sont valables 12 mois à compter de la date d’achat. Chaque génération de la nouvelle version d’une image te coûtera un crédit.
Où télécharger DALL-E ?
Initialement lancé en avril 2022, DALL-E 2 était uniquement accessible sur liste d’attente pendant cinq mois. Depuis septembre 2022, l’accès est désormais ouvert et n’importe qui peut s’inscrire depuis le site officiel. Tu n’as donc pas besoin de télécharger quoi que ce soit pour utiliser cette intelligence artificielle. Il suffit simplement de s’inscrire sur le site comme expliqué un peu plus haut, puis laisser ta créativité s’exprimer.
Open AI, c’est quoi ?
Ce n’est plus une surprise pour personne, Open AI est l’entreprise à l’origine de la création de DALL-E 2, mais aussi de chatGPT, une intelligence artificielle conversationnelle apparue très en vogue. OpenAI a été fondée en décembre 2015. À l’origine, l’idée a été formulée par Elon Musk, Sam Altman, Greg Brockman, Ilya Sutskever, Wojciech Zaremba, ainsi que d’autres personnes influentes dans le domaine de la technologie.
L’organisation a été créée pour répondre à une préoccupation partagée au sujet du potentiel impact négatif de l’IA, et le besoin de guider son développement de manière responsable. En avril 2016, Open AI publie son premier document de recherche appelé « Une IA amicale ». Dans ce document, l’organisation souligne l’importance de développer une intelligence artificielle « bénéfique pour l’humanité » tout en évitant les risques potentiels. Par la suite, d’autres recherches ont été publiées par l’entreprise pour promouvoir la collaboration, mais surtout encourager la transparence dans le domaine de l’IA.
En 2018, OpenAI annonce le lancement de son projet phare : ChatGPT (Generative Pre-trained Transformer). Il s’agit d’une architecture de modèle de langage basée sur l’apprentissage profond. La deuxième version GPT-2, est, quant à elle, dévoilée en 2019 et attire beaucoup l’attention. Et pour cause : elle surprend par sa capacité à générer du texte de manière créative et cohérente.
En parallèle, OpenAI continue de faire des recherches et prend des mesures pour faire progresser la sécurité de l’IA, notamment en participant à des compétitions de sécurité, en encourageant la recherche sur la robustesse et en promouvant l’adoption de bonnes pratiques dans le domaine. L’organisation met également l’accent sur la collaboration avec d’autres acteurs du domaine de l’IA pour faire progresser collectivement la recherche et assurer des normes éthiques et responsables dans le développement de l’IA.
En 2020, OpenAI lance GPT-3, la version qui suscitera le plus grand engouement autour de ces technologies. Depuis, ChatGPT-4 a vu le jour et fait bien plus encore : écriture créative et technique, composition de chansons, écriture de scénarios, etc. Open Ai a expliqué dans un communiqué : « Nous avons passé 6 mois à rendre GPT-4 plus sûr et plus aligné. GPT-4 est 82% moins susceptible de répondre aux demandes de contenu non autorisé et 40% plus susceptible de produire des réponses factuelles que GPT-3.5 lors de nos évaluations internes. »
Le modèle OpenAi voué à l’échec ?
Si grâce à ChatGPT et DALLE-E, OpenAI a réussi à s’imposer comme un acteur incontournable du monde de l’intelligence artificielle, l’exploitation de telles intelligences artificielles s’avèrent extrêmement coûteux. Pour faire simple, ChatGPT coûte de 700 000 dollars par jour uniquement pour ses frais de fonctionnement. En effet, OpenAI utilisent des énormes cartes graphiques pour que ses IA fonctionnent correctement. Le problème ? Plus ton intelligence artificielle est connue, plus les besoins en carte graphique sont importants. Or, même s’il existe des offres payantes, elles ne sont pas suffisantes pour combler les pertes. Ainsi, les IA qui ont plusieurs fonctions pourraient disparaître au profit d’outils fonctionnant uniquement en réseau local pour diminuer les coûts liés au cloud au fonctionnement de ChatGPT, DALLE-E ou encore Midjouney.
Lire aussi : Combien coûte une intelligence artificielle ?
Pour l’instant, OpenAI continue de dominer dans ce domaine, mais la concurrence de Google, Microsoft et Amazon se fait de plus en plus importante.
Lire aussi : Qui a cofondé Microsoft, le géant américain de l’informatique ?