L'art visuel de l'intelligence artificielle, souvent abrégé en Art de l'IA, fait référence aux œuvres d'art visuelles produites ou augmentées par des programmes d'intelligence artificielle (IA), principalement via des modèles texte-image. La pratique de la création artistique automatisée a un précédent historique remontant à l’Antiquité. La discipline formelle de l’intelligence artificielle a émergé dans les années 1950 et les artistes ont ensuite commencé à intégrer l’IA dans leurs processus créatifs. Des œuvres d’art remarquables générées par l’IA ont été exposées dans des musées et ont reçu des distinctions. Historiquement, l'IA a suscité de nombreuses questions philosophiques concernant la cognition humaine, les entités synthétiques et l'essence de l'art dans les cadres collaboratifs homme-IA.
La disponibilité généralisée de modèles de conversion texte-image, notamment Midjourney, DALL-E et Stable Diffusion, lors de la montée en puissance de l'intelligence artificielle des années 2020, a permis aux utilisateurs publics de produire rapidement des images avec un minimum d'effort. Le discours autour de l'art de l'IA dans les années 2020 s'est souvent concentré sur les préoccupations concernant la violation du droit d'auteur, les fausses déclarations, l'atteinte à la réputation et ses implications pour les artistes conventionnels, en particulier le potentiel de chômage technologique.
En août 2023, la Cour suprême des États-Unis a déterminé que l'art généré par l'IA n'était pas éligible à la protection du droit d'auteur, invoquant son manque de paternité humaine. Par la suite, en mars 2026, la Cour a refusé d'examiner une affaire concernant l'éligibilité au droit d'auteur des œuvres d'art produites par l'IA.
Contexte historique
Genèse et premiers développements
Le concept de l'art automatisé peut être attribué aux automates de la civilisation grecque antique, où des personnages comme Dédale et Héros d'Alexandrie étaient reconnus pour avoir conçu des mécanismes capables de générer des textes, de produire du son et de jouer de la musique. Tout au long de l'histoire, des automates sophistiqués sont apparus, comme en témoigne l'automate de Maillardet, développé vers 1800, qui démontrait sa capacité à produire divers dessins et poèmes.
Au XIXe siècle, Ada Lovelace a postulé que les « opérations informatiques » avaient le potentiel de générer de la musique et de la poésie. L'article fondateur d'Alan Turing de 1950, « Computing Machinery and Intelligence », explorait la faisabilité de machines imitant de manière convaincante le comportement humain. Par la suite, le domaine universitaire de l'intelligence artificielle a été officiellement créé lors d'un atelier de recherche organisé au Dartmouth College en 1956.
Depuis sa création, les chercheurs en IA se sont plongés dans des enquêtes philosophiques concernant l'essence de l'esprit humain et les ramifications du développement d'entités artificielles possédant une intelligence semblable à celle de l'humain ; ces questions profondes ont été historiquement abordées dans divers domaines, notamment la mythologie, la littérature et la philosophie, depuis l'Antiquité.
Intégration artistique
Après l'avènement de l'IA dans les années 1950, les artistes ont commencé à exploiter l'intelligence artificielle pour créer des œuvres d'art. Ces productions étaient parfois classées comme art algorithmique, art informatique, art numérique ou art des nouveaux médias.
AARON est l'un des systèmes artistiques d'IA pionniers et les plus influents, initié par Harold Cohen à la fin des années 1960 à l'Université de Californie à San Diego. Utilisant une méthodologie basée sur des règles symboliques caractéristique de l'ère de programmation de la bonne vieille intelligence artificielle (GOFAI), AARON a été conçu par Cohen pour coder informatiquement l'acte de dessiner, générant des images techniques. Son exposition inaugurale a eu lieu en 1972 au Los Angeles County Museum of Art. Entre 1973 et 1975, Cohen a développé AARON lors d'une résidence au laboratoire d'intelligence artificielle de l'université de Stanford. En 2024, le Whitney Museum of American Art a présenté l'art de l'IA couvrant la carrière de Cohen, avec des itérations reconstituées de ses premiers appareils de dessin robotiques.
Depuis les années 1980, Karl Sims présente des œuvres d'art issues de la vie artificielle. Il a obtenu une maîtrise ès sciences en infographie du MIT Media Lab en 1987 et a été artiste en résidence de 1990 à 1996 chez Thinking Machines, un important fabricant de superordinateurs et société d'intelligence artificielle. Sims a reçu le Golden Nica au Prix Ars Electronica en 1991 et 1992 pour ses œuvres vidéo intégrant l'évolution artificielle. En 1997, il a développé Galápagos, une installation interactive d'évolution artificielle, pour le centre d'intercommunication NTT de Tokyo. En reconnaissance de ses contributions exceptionnelles au développement de l'ingénierie, Sims a reçu un Emmy Award en 2019.
En 1999, Scott Draves, en collaboration avec une équipe d'ingénieurs, a développé et lancé Electric Sheep, un logiciel d'économiseur d'écran gratuit. Cette initiative informatique bénévole anime et fait évoluer des flammes fractales, en les distribuant sur des ordinateurs en réseau pour les afficher comme économiseurs d'écran. Le système a utilisé l'intelligence artificielle pour générer une animation continue grâce à l'interaction du public. Draves a reçu le prix Fundacion Telefónica Life 4.0 pour Electric Sheep en 2001.
Stephanie Dinkins a lancé le projet Conversations with Bina48 en 2014. Dans cette série, Dinkins documentait ses dialogues avec BINA48, un robot social conçu pour ressembler à une femme noire d'âge moyen. En 2019, Dinkins a reçu le prix Creative Capital pour son développement d'une intelligence artificielle évolutive, informée par « les intérêts et la(les) culture(s) des personnes de couleur ».
Sougwen Chung a lancé Mimicry (Drawing Operations Unit : Generation 1) en 2015, établissant une collaboration continue entre l'artiste et un bras robotique. Chung a reçu le prix Lumen en 2019 pour ses performances soutenues mettant en scène un bras robotique qui utilise l'intelligence artificielle pour imiter son style de dessin.
Christie's à New York a organisé une vente aux enchères d'œuvres d'art basées sur l'intelligence artificielle en 2018, au cours de laquelle l'œuvre d'art générée par l'IA Edmond de Belamy a atteint 432 500 $. Ce prix de vente a largement dépassé de près de 45 fois sa valeur estimée de 7 000 à 10 000 dollars américains. Le collectif parisien Obvious était responsable de la création de cette œuvre d'art.
Le film japonais generAIdoscope a été créé en 2024. Co-réalisé par Hirotaka Adachi, Takeshi Sone et Hiroki Yamaguchi, la production présentait de la vidéo, de l'audio et de la musique entièrement générés par l'intelligence artificielle.
La série télévisée animée japonaise Twins Hinahima est sortie en 2025. Sa production et son animation incorporaient l'IA. assistance pour des tâches telles que le découpage et la conversion de photographies en illustrations animées, avec retouches ultérieures effectuées par le personnel artistique. La majorité des autres éléments, y compris les personnages et les logos, ont été dessinés manuellement à l'aide de divers logiciels.
Historique technique
L'apprentissage profond, caractérisé par son architecture multicouche conçue pour imiter le cerveau humain, a émergé dans les années 2010, provoquant une transformation profonde dans le domaine de l'art de l'IA. Cette ère d'apprentissage profond présente principalement plusieurs paradigmes de conception artistique générative, notamment les modèles autorégressifs, les modèles de diffusion, les réseaux contradictoires génératifs (GAN) et les flux normalisants.
En 2014, Ian Goodfellow et ses collaborateurs de l'Université de Montréal ont été les pionniers du réseau contradictoire génératif (GAN), une classe de réseaux neuronaux profonds conçus pour reproduire la distribution statistique des données d'entrée, telles que les images. Un GAN fonctionne avec deux composants : un « générateur » qui synthétise de nouvelles images et un « discriminateur » qui évalue l'authenticité de ces images générées. S'écartant de l'art algorithmique antérieur, qui adhérait à des règles prédéfinies, les GAN ont acquis la capacité d'apprendre une esthétique spécifique grâce à l'analyse d'ensembles de données d'images étendus.
En 2015, une équipe de Google a lancé DeepDream, un programme qui utilise un réseau neuronal convolutif pour identifier et amplifier des motifs dans les images grâce à une paréidolie algorithmique. Ce processus produit des images intentionnellement surtraitées, caractérisées par une qualité onirique, évoquant une esthétique psychédélique. Par la suite, en 2017, un GAN conditionnel a démontré sa capacité à générer 1 000 classes d’images à partir d’ImageNet, une base de données visuelle substantielle développée pour la recherche sur les logiciels de reconnaissance visuelle d’objets. En conditionnant le GAN avec à la fois du bruit aléatoire et une étiquette de classe spécifique, cette méthodologie a considérablement amélioré la qualité de la synthèse d'images pour les modèles conditionnels de classe.
Les modèles autorégressifs ont trouvé une application dans la génération d'images, illustrée par PixelRNN (2016), qui génère séquentiellement des pixels individuels à l'aide d'un réseau neuronal récurrent. Suite à l'introduction de l'architecture Transformer dans Attention Is All You Need (2018), elle a été rapidement adoptée pour la génération d'images autorégressives, bien qu'initialement sans conditionnement de texte.
Artbreeder, un site Web lancé en 2018, exploite les modèles StyleGAN et BigGAN pour permettre aux utilisateurs de générer et de manipuler diverses images, notamment des visages, des paysages et des rendus artistiques.
Les années 2020 ont vu l'adoption généralisée de les modèles texte-image, qui produisent des images à partir d'invites textuelles, signifiant ainsi une autre phase de transformation dans le développement d'œuvres d'art générées par l'IA.
En 2021, OpenAI a introduit DALL-E 1, un modèle d'IA texte-image qui générait des images en utilisant l'architecture de modèles de transformateurs pré-entraînés génératifs à grand langage influents, similaires à ceux trouvés dans GPT-2 et GPT-3. DALL-E 1 fonctionne comme un modèle génératif autorégressif, partageant les principes architecturaux fondamentaux avec GPT-3. Parallèlement, plus tard en 2021, EleutherAI a lancé VQGAN-CLIP, un modèle open source dérivé du CLIP d'OpenAI. Alors que les modèles de diffusion, qui sont des modèles génératifs conçus pour synthétiser des données à partir d'ensembles de données existants, ont été initialement proposés en 2015, leurs performances n'ont dépassé les réseaux adverses génératifs (GAN) qu'au début de 2021. Le modèle de diffusion latente, publié en décembre 2021, a ensuite servi de technologie fondamentale pour Stable Diffusion, publié en août 2022, un effort collaboratif de Stability AI, du groupe CompVis du LMU de Munich et Runway.
L'année 2022 a été marquée par une expansion significative de la génération d'images IA, avec la sortie de Midjourney, suivie par Imagen et Parti de Google Brain, tous deux annoncés en mai. Microsoft a introduit NUWA-Infinity et la diffusion stable disponible à la source est devenue publique en août 2022. DALL-E2, une itération avancée de DALL-E, a subi des tests bêta et une version ultérieure, avec son successeur, DALL-E3, émergeant en 2023. Stability AI prend en charge Stable Diffusion via diverses plates-formes, y compris son interface Web, DreamStudio et des plugins dédiés pour Krita, Photoshop, Blender et GIMP. De plus, l'interface utilisateur open source basée sur le Web d'Automatic1111 facilite l'accès. Le principal modèle pré-entraîné pour Stable Diffusion est accessible au public via Hugging Face Hub.
En août 2023, Ideogram a été lancé, se distinguant par sa capacité remarquable à générer du texte lisible dans les images.
L'année 2024 a vu l'introduction de Flux, un modèle capable de générer des images très réalistes. Flux a ensuite été intégré à Grok, le chatbot utilisé sur X (anciennement Twitter), et Le Chat, le chatbot de Mistral AI. Black Forest Labs, créé par les chercheurs originaux de Stable Diffusion, a développé Flux. Cependant, Grok est passé à son modèle exclusif de conversion texte-image, Aurora, en décembre de la même année. Parallèlement, plusieurs entreprises ont avancé des modèles d’IA intégrés aux services de retouche d’images. Adobe a lancé Firefly, l'intégrant dans Premiere Pro, Photoshop et Illustrator, tandis que Microsoft a annoncé publiquement des fonctionnalités de génération d'images AI pour Microsoft Paint. En outre, le milieu des années 2020 a marqué l'émergence de modèles texte-vidéo notables, notamment le Gen-4 de Runway, le VideoPoet de Google, le Sora d'OpenAI (sorti en décembre 2024) et le LTX-2 (sorti en 2025).
L'année 2025 a été caractérisée par la sortie de plusieurs modèles génératifs avancés. GPT Image 1 d'OpenAI, lancé en mars, a introduit un rendu de texte amélioré et des capacités multimodales, facilitant la génération d'images à partir de diverses entrées telles que des croquis et des descriptions textuelles. MidJourney v7, lancé en avril, offrait un traitement raffiné des invites de texte. Mai 2025 a vu l'introduction de Flux.1 Kontext par Black Forest Labs, reconnu pour son efficacité dans la génération d'images haute fidélité, aux côtés d'Imagen 4 de Google, qui présentait un photoréalisme amélioré. Plus tard, en novembre 2025, Flux.2 a été publié, présentant des avancées en matière de référencement d'images, de typographie et de compréhension rapide.
Outils et processus
Approches
Les artistes emploient diverses méthodologies pour générer des œuvres d'art visuelles basées sur l'IA. Dans l'approche texte-image, l'intelligence artificielle synthétise les visuels à partir de descriptions textuelles, en tirant parti de modèles tels que les architectures basées sur la diffusion ou les transformateurs ; les utilisateurs fournissent des invites et l'IA restitue les images correspondantes. La méthode image à image implique que l'IA transforme une image d'entrée existante en un nouveau style ou une nouvelle forme, guidée par une invite ou une référence de style spécifique, illustrée par la conversion d'un croquis en un rendu photoréaliste ou l'application d'une esthétique artistique distincte. Pour les applications image-vidéo, l'IA produit de brefs clips vidéo ou animations à partir d'une seule image ou d'une séquence, incorporant fréquemment des mouvements ou des transitions, qui peuvent aller de l'animation de portraits statiques à la construction de scènes dynamiques. Enfin, les capacités de conversion texte-vidéo permettent à l'IA de générer des vidéos directement à partir d'invites textuelles, ce qui donne lieu à des animations, des scénarios réalistes ou des séquences visuelles abstraites, représentant une évolution de la génération texte-image en mettant l'accent sur la continuité temporelle.
Imagerie
Les artistes utilisant des modèles de diffusion ont accès à un large éventail d'outils. Ceux-ci incluent la possibilité de définir des invites positives et négatives, ainsi que la possibilité d'incorporer ou d'exclure des composants tels que les VAE, les LoRA, les hyperréseaux, les adaptateurs IP et les inversions d'intégration/textuelles. De plus, les artistes peuvent ajuster divers paramètres, notamment l'échelle de guidage (qui module l'équilibre entre liberté de création et fidélité), la graine (pour gérer la stochasticité) et les upscalers (pour améliorer la résolution de l'image). La manipulation du bruit avant l'inférence offre une autre voie d'influence, tandis que les méthodes de post-traitement conventionnelles sont couramment appliquées après l'inférence. Les utilisateurs possèdent également la possibilité de former des modèles personnalisés.
En complément des modèles de diffusion, des techniques de génération d'images procédurales et basées sur des règles ont émergé, employant des modèles mathématiques, des algorithmes qui imitent les coups de pinceau et d'autres effets artistiques, ainsi que des architectures d'apprentissage en profondeur telles que les réseaux contradictoires génératifs (GAN) et les transformateurs. De nombreuses entreprises proposent des applications et des plateformes Web qui rationalisent le processus, permettant aux utilisateurs de se concentrer uniquement sur les invites positives sans nécessiter d'ajustement manuel d'autres paramètres. De plus, il existe des logiciels spécialisés pour styliser les photographies afin de reproduire les caractéristiques visuelles de mouvements artistiques renommés.
Les outils disponibles couvrent un large spectre, depuis les applications mobiles conviviales conçues pour les consommateurs jusqu'aux ordinateurs portables Jupyter sophistiqués et aux interfaces utilisateur Web exigeant des ressources GPU substantielles pour des performances optimales. Parmi les fonctionnalités avancées figure « l'inversion textuelle », qui facilite l'intégration de concepts définis par l'utilisateur, tels que des objets spécifiques ou des styles artistiques, appris à partir d'un ensemble limité d'images. Cela permet la génération de nouvelles œuvres d'art basées sur des descripteurs textuels associés (mots attribués aux concepts appris, souvent abstraits) et grâce à des extensions de modèles ou à des techniques de réglage fin, illustrées par DreamBooth.
Impact et applications
L'intelligence artificielle possède la capacité de profonde transformation sociétale, favorisant potentiellement la prolifération de genres de niche non commerciaux (par exemple, les dérivés cyberpunk comme le solarpunk) par des créateurs amateurs, facilitant de nouvelles formes de divertissement, accélérant le prototypage, améliorant l'accessibilité de la création artistique et améliorant l'efficacité de la production artistique en termes d'effort, de coût ou de temps. Cette efficacité est obtenue grâce à des fonctionnalités telles que la génération d’ébauches préliminaires, la définition de concepts et la production de composants d’image (inpainting). Les images générées servent souvent d’esquisses préliminaires, d’actifs expérimentaux économiques, de sources d’inspiration ou de représentations visuelles pour des idées de validation de principe. En outre, les améliorations peuvent impliquer une édition manuelle post-génération, y compris un affinement ultérieur à l'aide d'un logiciel d'édition d'images.
Les artistes visuels et designers professionnels ont principalement utilisé l'IA générative au cours des premières étapes de conceptualisation (pensée divergente) plutôt que lors de la production finale (pensée convergente). Les disciplines produisant des résultats numériques ou éphémères, telles que la conception UI/UX et l’art conceptuel, intègrent ces technologies plus facilement que celles produisant des artefacts physiques permanents comme la sculpture ou l’architecture. Dans les domaines physiques, les considérations d'intégrité structurelle, de limitations matérielles et d'« ethno-informatique » culturelle limitent souvent l'IA à un rôle d'amélioration complémentaire, plutôt qu'à un substitut direct aux méthodes de production traditionnelles. De plus, les attitudes en matière d’adoption varient considérablement selon les étapes de carrière ; Les professionnels débutants perçoivent souvent l'IA générative comme une extension pratique des outils numériques essentiels à la compétitivité du marché, tandis que les praticiens seniors expriment fréquemment un scepticisme critique quant à la dévaluation potentielle de l'expertise incorporée et à son impact sur le développement des compétences à long terme.
Ingénierie et partage d'invites
Les invites pour certains modèles de conversion texte-image peuvent incorporer des images, des mots clés et des paramètres configurables, notamment le style artistique. Cette spécification de style est fréquemment obtenue grâce à des phrases clés telles que « dans le style de [nom de l'artiste] » dans l'invite, ou en sélectionnant un style esthétique ou artistique large. Des plates-formes dédiées existent pour le partage, l'échange, la découverte, le raffinement et le développement collaboratif d'invites adaptées à la génération d'images spécifiques. Les invites sont généralement diffusées avec les images générées sur diverses plateformes de partage d'images, notamment Reddit, et sur des sites Web spécifiquement dédiés à l'art de l'IA. Il est important de noter qu'une invite ne constitue qu'un élément de l'entrée requise pour la génération d'images ; d'autres déterminants cruciaux incluent la résolution de sortie, la graine aléatoire et les paramètres d'échantillonnage aléatoire.
Terminologie associée
Les médias synthétiques, qui englobent l'art généré par l'IA, ont été identifiés en 2022 comme une tendance technologique importante qui devrait avoir un impact sur diverses industries dans un avenir prévisible. Des chercheurs de la Harvard Kennedy School ont exprimé leurs appréhensions quant au potentiel des médias synthétiques à diffuser de la désinformation politique, à la suite de leur enquête sur l'adoption généralisée de l'art généré par l'IA sur la plateforme X. La Synthographie représente une nomenclature suggérée pour la méthodologie de production d'images de type photographique grâce à l'intelligence artificielle.
Contexte philosophique
L'art visuel généré par l'intelligence artificielle a suscité un vaste discours philosophique concernant les concepts de créativité, de paternité et la nature ontologique inhérente aux représentations visuelles. Une enquête cruciale consiste à déterminer si la valeur intrinsèque de l’art dépend de l’intentionnalité et de la conscience humaine. Les détracteurs soutiennent que l’absence d’expérience subjective et d’intention délibérée dans les systèmes d’IA empêche leurs productions d’être considérées comme des expressions artistiques « authentiques ». À l'inverse, les partisans affirment que la valeur esthétique réside dans la réception d'une œuvre et son utilité culturelle, plutôt que uniquement dans les états internes de son créateur, positionnant ainsi les systèmes d'IA comme des instruments ou des entités collaboratives au sein de paradigmes élargis d'effort créatif.
Les images générées par l'IA remettent également fondamentalement en question les théories établies de la représentation. La photographie et le cinéma sont traditionnellement perçus comme possédant une relation indexicale avec la réalité physique, impliquant un lien de causalité avec des événements ou des objets du monde réel. À l'inverse, les systèmes d'IA générative synthétisent les images via la reconnaissance statistique des formes, plutôt que par le biais d'un enregistrement physique direct, atténuant ou coupant ainsi complètement ce lien indexical.
Le théoricien des médias Johannes Grenzfurthner postule que ce changement de paradigme nécessite une « divulgation ontologique » – une déclaration explicite de la nature d'une image comme étant physiquement référentielle, hybride ou entièrement synthétique – pour maintenir la transparence éthique et politique au sein de la culture visuelle. Ce discours en cours positionne l'art visuel généré par l'IA dans des délibérations philosophiques plus larges concernant la technologie, l'authenticité et la redéfinition dynamique de l'expression artistique.
Analyse de l'art existant à l'aide de l'IA
Au-delà de la génération d'œuvres d'art inédites, des méthodologies de recherche basées sur l'IA ont été développées pour l'analyse quantitative des collections d'art numérique. Cette avancée est imputable à la numérisation poussée des œuvres artistiques au cours des dernières décennies. Comme l'ont noté CETINIC et SHE (2022), l'application de l'intelligence artificielle pour examiner les collections d'art existantes offre de nouvelles perspectives sur l'évolution des styles artistiques et le discernement des influences artistiques.
L'analyse de l'art numérisé utilise généralement deux méthodologies informatiques principales : la lecture rapprochée et la visualisation à distance. Une lecture attentive se concentre sur des attributs visuels particuliers au sein d’œuvres d’art individuelles. Les tâches pilotées par machine dans le cadre d'approches de lecture approfondie englobent l'authentification informatique de l'artiste et l'analyse détaillée du travail au pinceau ou des caractéristiques texturales. À l’inverse, les méthodologies de visualisation à distance permettent la visualisation statistique des similitudes dans l’ensemble d’une collection en fonction d’une caractéristique désignée. Les applications typiques de cette méthode impliquent la classification automatique, la détection d'objets, l'analyse multimodale, l'extraction de connaissances en histoire de l'art et l'esthétique informatique. En outre, l'imagerie synthétique peut être utilisée pour entraîner des algorithmes d'IA à des fins d'authentification artistique et de détection de contrefaçon.
De plus, les chercheurs ont développé des modèles conçus pour prévoir les réponses émotionnelles aux créations artistiques. Un exemple notable est ArtEmis, un ensemble de données complet intégré à des modèles d'apprentissage automatique. ArtEmis comprend des annotations émotionnelles apportées par plus de 6 500 participants, complétées par des explications textuelles correspondantes. Grâce à l'analyse des données visuelles et des descriptions textuelles associées au sein de cet ensemble de données, ArtEmis facilite la production de prédictions émotionnelles sophistiquées.
Autres formes d'art de l'IA
L'intelligence artificielle a trouvé des applications dans des domaines artistiques allant au-delà des arts visuels. L'IA générative a été utilisée dans la composition musicale et dans le développement de jeux vidéo, transcendant la simple imagerie pour inclure la conception de niveaux (par exemple, pour des cartes sur mesure), la génération de nouveau contenu (par exemple, des quêtes ou des dialogues) et la création de récits interactifs. De plus, l'IA a été appliquée aux arts littéraires, offrant une aide contre le blocage de l'écrivain, fournissant une inspiration créative ou facilitant la réécriture de segments textuels. Dans les arts culinaires, certains prototypes de systèmes robotiques possèdent la capacité de dégustation dynamique, aidant ainsi les chefs dans l'analyse en temps réel de la composition des plats et des profils de saveurs pendant la préparation.
Nomenclature : l'application de « l'art »
L'application du terme « art » aux œuvres produites par un logiciel d'intelligence artificielle a suscité un débat considérable parmi les artistes, philosophes, universitaires et autres parties prenantes. De nombreux commentateurs affirment que classer les images générées par des machines dans la catégorie « art » diminue les qualités intrinsèques du talent artistique humain, notamment la créativité, l'habileté et l'intentionnalité. Les définitions contemporaines de la création artistique authentique soulignent fréquemment la nécessité d'intentions au niveau humain, d'expérience personnelle, d'émotion et de contexte historique ou artistique pertinent.
Des recherches menées par la Bibliothèque nationale de médecine indiquent un préjugé humain inhérent à l'égard des œuvres d'art attribuées à l'intelligence artificielle. Dans une étude où les participants ont évalué deux images comparables, dont une explicitement identifiée comme générée par l’IA, les sujets ont systématiquement attribué une valeur artistique inférieure à l’image produite artificiellement. Cette découverte implique que les perceptions socioculturelles influencent de manière significative la classification d'une image comme art, quelles que soient ses caractéristiques visuelles inhérentes.
Dans un rapport de 2023 présenté à la Convention annuelle des observateurs de l'art numérique, Samuel Loomis a postulé que la désignation « art IA » reconnaît sa dualité inhérente : une création résultant à la fois de la direction humaine et de processus génératifs pilotés par la machine, en particulier lorsqu'elle est évaluée par rapport aux références critiques établies pour l'art traditionnel.