Midjourney (qui mot à mot signifie voyage intermédiaire) est un laboratoire de recherche indépendant qui produit un programme d'intelligence artificielle générative du même nom. Ce programme permet de créer des images à partir de descriptions textuelles, suivant un fonctionnement similaire à celui de DALL-E d'OpenAI[3],[4]. Il est basé sur des réseaux de neurones et un modèle de diffusion, utilisant des algorithmes d’apprentissage automatique et de traitement du langage naturel pour comprendre les prompts (demandes) des utilisateurs. Les modèles de diffusion permettent à l'IA de générer des images à partir d'un nuage de points en y ajoutant progressivement des détails, tandis que les transformateurs aident à interpréter et à générer des réponses visuelles précises. Midjourney est l'une des deux grandes IA génératrices d'images, l'autre étant DALL-E. Midjourney est souvent présentée comme produisant des images plus artistiques et créatives que DALL-E.
Historique
Midjourney est fondée par David Holz, cofondateur de Leap Motion. Son IA est publiée en version bêta ouverte le 12 juillet 2022, utilisable via un botDiscord. Midjourney est aussi une communauté (par défaut, les images qu'on y génère sont publiques et paragées dans la galerie de l'utilisateur, visibles de tous. Pour les besoins professionnels, une fonction Stealth Mode, permet de rendre « privées » ses images.
V1 : Février 2022 ; elle permet de générer des illustrations à partir de descriptions textuelles simples[5].
V2 : Avril 2022 ; l'IA gagne en performances et en qualité d'image[6].
V3 : Juillet 2022 ; de nouvelles fonctionnalités apparaissent, et l'IA comprend mieux les descriptions textuelles[7].
V4 : Novembre 2022 ; cette version marque un bond qualitatif dans la qualité de l'image, et dans l'interprétation des prompts. Elle est réputée avoir aussi été la plus ludique, inatendue et poétique.
V5 : Mars 2023 ; le réalisme est amélioré et les images gagnent en détail et précision.
V5.1 : Mai 2023 ; quelques ajustements et optimisations améliorent encore la qualité des images.
V5.2 : Juin 2023 ; apparition des fonctionnalités de dézoomage (pilotéess par des flèches directionnelles).
V6 : Décembre 2023 Avancées remarquables, y compris la génération d’images en 3D et la possibilité d’ajouter du texte aux illustrations.
En 2022, le programme est utilisé par le magazine britannique The Economist pour l'illustration de la couverture de son numéro de juin 2022[8].
En aout, le quotidien italien Corriere della Sera publie une bande dessinée créée avec Midjourney par l'écrivain Vanni Santoni[9]. Et quelques jours après (le ), une œuvre générée par une intelligence artificielle gagne un concours de beaux-arts, la Colorado State Fair Fine Arts Competition (Colorado, États-Unis) : Théâtre D’opéra Spatial[10], de Jason M. Allen, générée par Midjourney.
Le caractère exceptionnel et visuellement fascinant de nombreuses images générées avec Midjourney, de même que leur capacité à élargir le champ de l'imagination est rapidement reconnue, tant par les universitaire qui étudient l'IA ou la créativité que par les créateurs praticiens[11],[12],[13]. Dans une étude conduite par Lyu Wang et ses collègues, Midjourney est choisi par un panel d’experts en esthétique pour générer des peintures expérimentales[12]. Jaruga-Rozdolska promeut Midjourney cmme aide à la créativité en architecture[11], tandis que Ruskov l'utilise comme aide à la création d’illustrations inspirées de contes de fées[14]. Y. Zhang et C. Liu, en 2024, confirment que Midjourney a aussi un potentiel important pour les secteurs de la mode et du design, tout en posant de nouvelles questions éthiques, qui engagent à porter attention à « la transparence de la créativité axée sur l’IA pour prévenir les pratiques trompeuses »[15].
En 2023, la version V6 intègre la possibilité de travailler l'image en 3D, ce qui peut notamment intéresser les designers et les créateurs[16]. Midjourney intègre également peu à peu la génération de vidéos[17]. Deux fonctions nouvelles sont le Zoom qui permett, contrairement à ce que leur nom semble indiquer, de dézoomer sur une image : l'IA élargit la composition en prolongeant le fond de l'image existante en ajoutant par exemple du contexte à un portrait, une nature morte, un objet, etc. Des flèches directionnelles permettent d’étendre l’image dans une direction spécifique (gauche, droite, haut et bas) et il est possible de préciser ce que l'on souhaite voir apparaitre dans le fond. La fonction complémentaire Custom Zoom permet de faire ce travail par étape pour mieux contrôler le résultat[18].
Nouvelle plateforme : Une nouvelle plateforme est accessible aux utilisateurs ayant généré plus de 5 000 images, leur permettant de générer des images directement sans passer par Discord. Puis 2023, Midjourney devient également disponible en mode site web (dans besoin de passer par Discord).
Une option mangas apparait (Niji Midjourney), disponible en ajoutant le code « –niji 6 » au prompt.
En 2024 le PDG David Holz a annoncé une version v7 avant la fin de l’année, un modèle vidéo, et un éditeur d’images 3D qui pourrait évoquer l'Holodeck de Star Trek, susceptible de servir à des jeux, des films. Et depuis mai 2024, Midjourney est directement accessible aux personnes ayant créé au moins 100 images.
En août 2022, quand une œuvre générée par une intelligence artificielle gagne le concours de beaux-arts évoqué plus haut, alors que le jury et les autres artistes ignoraient que cette œuvre avait en grande partie été conçue artificiellement, une polémique est née : peut-on, veut-on ou doit-on qualifier d'art une œuvre qui n'a pas été complètement produite de la main et l'esprit d'un artiste ; une œuvre issue d'un système d'intelligence artificielle qui a utilisé des millions d'images existantes pour son apprentissage, ce qui pose la question d'une nouvelle forme de plagiat[20],[21].
Dans ce cas, les organisateurs du concours en ont changé les modalités pour l'année suivante[22].
En janvier 2023, trois artistes — Sarah Andersen, Kelly McKernan et Karla Ortiz — intentent une action en justice contre Stable Diffusion, Midjourney et DeviantArt, créateurs des générateurs d'art par intelligence artificielle Stable Diffusion, Midjourney et DreamUp, affirmant que ces sociétés ont violé les droits de millions d'artistes en entraînant leurs outils d'intelligence artificielle sur cinq milliards d'images extraits du Web « sans le consentement des artistes originaux »[23]. De nombreux artistes s'estiment spoliés ou craignent de le devenir[24],[25], deepfakes[26], manipulation de l'opinion[27], de plus en plus de voix s'élèvent pour que leur usage soit contrôlé et réglementé[28],[29].
En mars 2023, de fausses photos, produites avec Midjourney et diffusées sur Internet, mettant en scène des personnalités dans des situations extravagantes deviennent presqu'instantanément virales — le président Macron ramassant des poubelles, Donald Trump arrêté par des policiers, le Pape habillé en doudoune blanche[19]... —, confortant les craintes de détournement des images créées par AI.
Midjourney est loin de pouvoir prendre en compte la physique des matériaux et les fonctionnalités de l'architecture ainsi que de nombreux objets complexes[30], mais selon S Tanugraha, il se montre intéressant pour ce qui concerne les aspects esthétiques, et il est à ce titre apprécié par de nombreux artistes, créateurs designers, architectes[31] et enseignant considèrent que Midjourney (et d'autres IA de ce type) peuvent contribuer à leur créativité, et à l'innovation méthodologique dans la formation des futurs designers[32]. Selon Mohesh Radhakrishna (2024)), Midjourney peut être utilisé, avec prudence, sans entraver le processus créatif de l'architecte, y compris dans les écoles d'architectures où il devient important d'enseigner et aider à une telle utilisation consciente de l'IA pour les générations futures d'artistes et d'architecte[33].
Galerie
Photographie fictive du Pape François habillé en doudoune blanche.
Photographie fictive de deux pionniers d'internet en 1995.
Réponse à l'invite : « piscine remplie d'une galaxie par une nuit au clair de lune ».
« Une femme assise sous une fleur dans un style art nouveau ».
Notes et références
(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Midjourney » (voir la liste des auteurs).
↑ a et bAnna Jaruga-Rozdolska, « Artificial intelligence as part of future practices in the architect’s work: MidJourney generative tool as part of a process of creating an architectural form », Architectus, no 3(71), (ISSN1429-7507 et 2084-5227, DOI10.37190/arc220310, lire en ligne, consulté le )
↑ a et bYanru Lyu, Xinxin Wang, Rungtai Lin et Jun Wu, « Communication in Human–AI Co-Creation: Perceptual Analysis of Paintings Generated by Text-to-Image System », Applied Sciences, vol. 12, no 22, , p. 11312 (ISSN2076-3417, DOI10.3390/app122211312, lire en ligne, consulté le )
↑Yanru Lyu, Minghong Shi, Yanbo Zhang et Rungtai Lin, « From Image to Imagination: Exploring the Impact of Generative AI on Cultural Translation in Jewelry Design », Sustainability, vol. 16, no 1, , p. 65 (ISSN2071-1050, DOI10.3390/su16010065, lire en ligne, consulté le )
↑Ruskov, M (2023). Grimm in Wonderland: Prompt Engineering with Midjourney to Illustrate Fairytales. arXiv , arXiv:2302.08961.
↑(en) Yanbo Zhang et Chuanlan Liu, « Unlocking the Potential of Artificial Intelligence in Fashion Design and E-Commerce Applications: The Case of Midjourney », Journal of Theoretical and Applied Electronic Commerce Research, vol. 19, no 1, , p. 654–670 (ISSN0718-1876, DOI10.3390/jtaer19010035, lire en ligne, consulté le )
↑(en) Stephen Tanugraha, « Review Using Artificial Intelligence-Generating Images: Exploring Material Ideas from MidJourney to Improve Vernacular Designs », Journal of Artificial Intelligence in Architecture, vol. 2, no 2, , p. 48–57 (ISSN2829-6257 et 2962-5629, DOI10.24002/jarina.v2i2.7537, lire en ligne, consulté le ).
↑(en) Linus Tan et Max Luhrs, « Using Generative AI Midjourney to enhance divergent and convergent thinking in an architect’s creative design process », The Design Journal, vol. 27, no 4, , p. 677–699 (ISSN1460-6925 et 1756-3062, DOI10.1080/14606925.2024.2353479, lire en ligne, consulté le ).
↑(en) Ivan M. Tsidylo et Esteve Sendra Chele, « Artificial intelligence as a methodological innovation in the training of gurure designers : Midjourney tools », Information Technologies and Learning Tools, vol. 97, no 5, , p. 203–214 (ISSN2076-8184, DOI10.33407/itlt.v97i5.5338, lire en ligne, consulté le ).
↑(en) Tanvi Naik, Hrishikumar Gostu et Rahul Sharma, « Navigating Ethics of AI-Powered Creativity in Midjourney », 2024 3rd International Conference for Innovation in Technology (INOCON), IEEE, vol. 2, , p. 1–6 (DOI10.1109/inocon60754.2024.10511571, lire en ligne, consulté le ).