Yapay zeka görsel sanatı, genellikle AI sanatı olarak kısaltılır, ağırlıklı olarak metinden resme modeller aracılığıyla yapay zeka (AI) programları tarafından üretilen veya zenginleştirilen görsel sanat eserlerini ifade eder. Otomatik sanat yaratma pratiğinin antik çağlara kadar uzanan tarihsel bir örneği vardır. Yapay zekanın resmi disiplini 1950'lerde ortaya çıktı ve sanatçılar daha sonra yapay zekayı yaratıcı süreçlerine entegre etmeye başladı. Yapay zeka tarafından üretilen dikkate değer sanat eserleri müzelerde sergilendi ve ödüller aldı. Tarihsel olarak yapay zeka, insan bilişi, sentetik varlıklar ve insan-yapay zeka işbirliği çerçevesinde sanatın özüne ilişkin çok sayıda felsefi araştırmayı tetikledi.
2020'lerdeki yapay zeka yükselişi sırasında Midjourney, DALL-E ve Stable Diffusion dahil olmak üzere metinden görüntüye modellerin yaygın olarak bulunması, kamu kullanıcılarının minimum eforla hızlı bir şekilde görüntü üretmesine olanak tanıdı. 2020'lerde yapay zeka sanatına ilişkin söylem sıklıkla telif hakkı ihlali, yanlış beyan, itibarın zedelenmesi ve bunun geleneksel sanatçılar üzerindeki etkileri, özellikle de teknolojik işsizlik potansiyeli ile ilgili endişelere odaklandı.
Ağustos 2023'te Amerika Birleşik Devletleri Yüksek Mahkemesi, yapay zeka tarafından üretilen sanatın, insan kaynaklı olmaması nedeniyle telif hakkı korumasına uygun olmadığına karar verdi. Daha sonra Mart 2026'da Mahkeme, yapay zeka tarafından üretilen sanat eserlerinin telif hakkına uygunluğuyla ilgili bir davayı incelemeyi reddetti.
Tarihsel Bağlam
Oluşum ve İlk Gelişmeler
Otomatik sanat kavramının kökeni, Daedalus ve İskenderiye Kahramanı gibi figürlerin metin oluşturma, ses üretme ve müzik performansı sağlama yeteneğine sahip mekanizmalar geliştirme konusunda itibar edildiği antik Yunan uygarlığının otomatlarına kadar uzanabilir. Tarih boyunca, Maillardet'in 1800'lerde geliştirdiği ve çeşitli çizimler ve şiirler üretme kapasitesini gösteren otomatıyla örneklenen karmaşık otomatlar ortaya çıktı.
19. yüzyılda Ada Lovelace, "bilgi işlem operasyonlarının" müzik ve şiir üretme potansiyeli taşıdığını öne sürdü. Alan Turing'in 1950 tarihli ufuk açıcı makalesi "Bilgisayar Makineleri ve Zeka", insan davranışını ikna edici bir şekilde taklit eden makinelerin fizibilitesini araştırdı. Daha sonra, yapay zekanın akademik alanı, 1956 yılında Dartmouth College'da düzenlenen bir araştırma çalıştayında resmi olarak kuruldu.
Başlangıcından bu yana, yapay zeka araştırmacıları, insan zihninin özü ve insan benzeri zekaya sahip yapay varlıklar geliştirmenin sonuçlarıyla ilgili felsefi araştırmalara daldılar; Bu derin sorular tarihsel olarak antik çağlardan beri mitoloji, edebiyat ve felsefe gibi çeşitli alanlarda ele alınmıştır.
Sanatsal Entegrasyon
1950'lerde yapay zekanın kurulmasının ardından sanatçılar, sanat eserleri yaratmak için yapay zekadan yararlanmaya başladı. Bu yapımlar zaman zaman algoritmik sanat, bilgisayar sanatı, dijital sanat veya yeni medya sanatı olarak kategorize ediliyordu.
AARON, 1960'ların sonlarında San Diego'daki California Üniversitesi'nde Harold Cohen tarafından başlatılan öncü ve en etkili yapay zeka sanat sistemlerinden biri olarak duruyor. Eski Moda Yapay Zeka (GOFAI) programlama döneminin karakteristik sembolik kural tabanlı metodolojisini kullanan AARON, Cohen tarafından çizim eylemini hesaplamalı olarak kodlamak ve teknik görüntüler oluşturmak üzere tasarlandı. Açılış sergisi 1972'de Los Angeles County Sanat Müzesi'nde gerçekleşti. 1973 ile 1975 yılları arasında Cohen, Stanford Üniversitesi Yapay Zeka Laboratuvarı'nda ihtisas yaptığı sırada AARON'u daha da geliştirdi. 2024'te Whitney Amerikan Sanatı Müzesi, Cohen'in kariyerini kapsayan, ilk robotik çizim aparatlarının yeniden yapılandırılmış versiyonlarını içeren yapay zeka sanatını sergiledi.
1980'lerden bu yana Karl Sims, yapay hayattan türetilen sanatı sunuyor. 1987 yılında MIT Medya Laboratuarı'ndan bilgisayar grafikleri alanında Yüksek Lisans derecesi aldı ve 1990'dan 1996'ya kadar önde gelen bir süper bilgisayar üreticisi ve yapay zeka firması olan Thinking Machines'de misafir sanatçı olarak görev yaptı. Sims, yapay evrimi içeren video çalışmaları nedeniyle 1991 ve 1992'de Prix Ars Electronica'da Altın Nica ödülüne layık görüldü. 1997'de Tokyo'daki NTT İletişim Merkezi için etkileşimli bir yapay evrim kurulumu olan Galápagos'u geliştirdi. Mühendislik gelişimine yaptığı olağanüstü katkılardan dolayı Sims, 2019'da Emmy Ödülü'ne layık görüldü.
1999'da Scott Draves, bir mühendis ekibiyle işbirliği yaparak ücretsiz bir ekran koruyucu yazılım olan Electric Sheep'i geliştirdi ve piyasaya sürdü. Bu gönüllü bilgi işlem girişimi, fraktal alevleri canlandırıp geliştiriyor ve bunları ekran koruyucu olarak görüntülenmek üzere ağa bağlı bilgisayarlara dağıtıyor. Sistem, izleyici etkileşimi yoluyla sürekli animasyon oluşturmak için yapay zekayı kullandı. Draves, 2001 yılında Elektrikli Koyun ile Fundacion Telefónica Life 4.0 ödülünü aldı.
Stephanie Dinkins, 2014 yılında Bina48 ile Konuşmalar projesini başlattı. Bu dizi, Dinkins'in orta yaşlı Siyah bir kadına benzeyecek şekilde tasarlanmış bir sosyal robot olan BINA48 ile diyaloglarını belgelemesini içeriyordu. Dinkins, 2019'da "beyaz olmayan insanların ilgi alanları ve kültürleri" ile şekillenen gelişen bir yapay zeka geliştirmesi nedeniyle Creative Capital ödülüne layık görüldü.
Sougwen Chung, 2015 yılında Mimicry'yi (Çizim Operasyonları Birimi: Nesil 1) başlattı ve sanatçı ile robotik kol arasında devam eden bir iş birliği çalışması başlattı. Chung, çizim stilini taklit etmek için yapay zekadan yararlanan robotik bir kol içeren sürekli performansları nedeniyle 2019'da Lumen Ödülü'ne layık görüldü.
New York'taki Christie's, 2018'de yapay zeka sanatı müzayedesine ev sahipliği yaptı ve bu müzayedede yapay zeka tarafından üretilen Edmond de Belamy sanat eseri 432.500 ABD doları fiyata satıldı. Bu satış fiyatı, tahmini 7.000-10.000 ABD Doları değerini yaklaşık 45 kat önemli ölçüde aştı. Bu sanat eserinin yaratılmasından Parisli kolektif Obously sorumluydu.
Japon filmi generAIdoskop'un prömiyeri 2024'te yapıldı. Hirotaka Adachi, Takeshi Sone ve Hiroki Yamaguchi'nin ortak yönetmenliğini üstlendiği yapımda tamamen yapay zeka tarafından oluşturulan video, ses ve müzik yer aldı.
Japon anime televizyon dizisi Twins Hinahima 2025'te gösterime girdi. Prodüksiyonu ve animasyonu yapay zekadan oluşuyordu. fotoğrafların kesilmesi ve anime illüstrasyonlarına dönüştürülmesi gibi görevlerde yardım, ardından sanat ekibi tarafından rötuşlama gerçekleştirilir. Karakterler ve logolar da dahil olmak üzere diğer öğelerin çoğu, çeşitli yazılım uygulamaları kullanılarak manuel olarak çizildi.
Teknik Geçmiş
İnsan beynini taklit etmek için tasarlanan çok katmanlı mimarisiyle öne çıkan derin öğrenme, 2010'larda ortaya çıktı ve yapay zeka sanatı alanında derin bir dönüşümü başlattı. Bu derin öğrenme çağında öncelikle otoregresif modeller, yayılma modelleri, Üretken Rakip Ağlar (GAN'ler) ve normalleştirici akışlar dahil olmak üzere çeşitli üretken sanat tasarımı paradigmaları yer alıyor.
2014 yılında Ian Goodfellow ve Université de Montréal'deki işbirlikçileri, görüntüler gibi girdi verilerinin istatistiksel dağılımını kopyalamak için tasarlanmış bir derin sinir ağları sınıfı olan üretken rakip ağa (GAN) öncülük etti. Bir GAN iki bileşenle çalışır: yeni görüntüleri sentezleyen bir "üretici" ve bu oluşturulan görüntülerin gerçekliğini değerlendiren bir "ayırıcı". Önceden tanımlanmış kurallara bağlı kalan eski algoritmik sanattan farklı olarak GAN'lar, kapsamlı görüntü veri kümelerinin analizi yoluyla belirli estetiği öğrenme kapasitesini elde etti.
2015 yılında bir Google ekibi, algoritmik pareidolia yoluyla görsellerdeki kalıpları tanımlamak ve güçlendirmek için evrişimli bir sinir ağı kullanan bir program olan DeepDream'i tanıttı. Bu süreç, rüya benzeri bir kaliteyle karakterize edilen ve psikedelik bir estetiği çağrıştıran kasıtlı olarak aşırı işlenmiş görüntüler üretir. Daha sonra, 2017'de koşullu bir GAN, görsel nesne tanıma yazılımı araştırmaları için geliştirilen önemli bir görsel veritabanı olan ImageNet'ten 1000 görüntü sınıfı oluşturma yeteneğini gösterdi. Bu metodoloji, GAN'ı hem rastgele gürültüyle hem de belirli bir sınıf etiketiyle koşullandırarak, sınıf koşullu modeller için görüntü sentezinin kalitesini önemli ölçüde iyileştirdi.
Otoregresif modeller, görüntü oluşturmada uygulama alanı buldu; bunun örneği, yinelenen bir sinir ağı kullanarak tek tek pikselleri sırayla üreten PixelRNN (2016) tarafından örneklendi. Transformer mimarisinin İhtiyacınız Olan Tek Şey (2018)'de tanıtılmasının ardından, başlangıçta metin koşullandırma olmaksızın da olsa otoregresif görüntü üretimi için hemen benimsendi.
2018'de başlatılan bir web sitesi olan Artbreeder, kullanıcıların yüzler, manzaralar ve sanatsal görselleştirmeler de dahil olmak üzere çeşitli görüntüler oluşturmasına ve işlemesine olanak sağlamak için StyleGAN ve BigGAN modellerinden yararlanıyor.
2020'ler, bu mimarinin yaygınlaşmasına tanık oldu. Metinsel yönlendirmelerden görseller üreten metinden görsele modellerin benimsenmesi, böylece yapay zeka tarafından üretilen sanat eserlerinin geliştirilmesinde başka bir dönüştürücü aşamaya işaret ediyor.
2021'de OpenAI, GPT-2 ve GPT-3'te bulunanlara benzer, etkili, büyük dil üreten, önceden eğitilmiş transformatör modellerinin mimarisini kullanan görüntüler üreten, metinden görüntüye yapay zeka modeli olan DALL-E 1'i tanıttı. DALL-E 1, GPT-3 ile temel mimari ilkeleri paylaşan, otoregresif üretken bir model olarak işlev görür. Eş zamanlı olarak, 2021'in sonlarında EleutherAI, OpenAI'nin CLIP'inden türetilen açık kaynaklı bir model olan VQGAN-CLIP'i piyasaya sürdü. Mevcut veri kümelerinden verileri sentezlemek için tasarlanmış üretken modeller olan yayılma modelleri ilk olarak 2015'te önerilmiş olsa da, performansları yalnızca 2021'in başlarında Üretken Adversarial Ağları (GAN'ler) geride bıraktı. Aralık 2021'de yayınlanan gizli yayılma modeli, daha sonra CompVis Group Stability AI'nin ortak çalışmasıyla Ağustos 2022'de piyasaya sürülen Stabil Difüzyon için temel teknoloji olarak hizmet etti. LMU Münih ve Runway.
2022 yılı, Mayıs ayında duyurulan Midjourney'in ve ardından Google Brain'in Imagen ve Parti'nin piyasaya sürülmesiyle yapay zeka görüntü oluşturmada önemli bir genişlemeye tanık oldu. Microsoft, NUWA-Infinity'yi tanıttı ve kaynak olarak kullanılabilen Stable Diffusion, Ağustos 2022'de halka açıldı. DALL-E'nin gelişmiş bir yinelemesi olan DALL-E2, beta testinden geçti ve ardından 2023'te ortaya çıkan halefi DALL-E3 ile birlikte piyasaya sürüldü. Stability AI, web arayüzü, DreamStudio ve Krita, Photoshop, Blender ve GIMP için özel eklentiler dahil olmak üzere çeşitli platformlar aracılığıyla Stabil Difüzyonu destekler. Ayrıca, Otomatik1111 web tabanlı açık kaynaklı kullanıcı arayüzü erişimi kolaylaştırır. Stabil Difüzyon için önceden eğitilmiş birincil modele, Hugging Face Hub aracılığıyla herkesin erişimine açıktır.
Ağustos 2023'te, görüntüler içinde okunaklı metin oluşturma konusundaki kayda değer yeteneğiyle öne çıkan Ideogram piyasaya sürüldü.
2024 yılı, son derece gerçekçi görüntüler oluşturabilen bir model olan Flux'un piyasaya sürülmesine tanık oldu. Flux daha sonra X'te (eski adıyla Twitter) kullanılan sohbet robotu Grok'a ve Mistral AI'nın sohbet robotu Le Chat'e entegre edildi. Stable Diffusion'ın orijinal araştırmacıları tarafından kurulan Black Forest Labs, Flux'u geliştirdi. Ancak Grok, aynı yılın Aralık ayında kendi özel metinden resme modeli olan Aurora'ya geçiş yaptı. Eş zamanlı olarak birçok şirket, görüntü düzenleme hizmetleriyle entegre yapay zeka modellerini geliştirdi. Adobe, Firefly'ı Premiere Pro, Photoshop ve Illustrator'a entegre ederek piyasaya sürerken Microsoft, Microsoft Paint için yapay zeka görüntü oluşturma işlevlerini kamuya duyurdu. Ayrıca 2020'lerin ortaları, Runway'in Gen-4'ü, Google'ın VideoPoet'i, OpenAI'nin Sora'sı (Aralık 2024'te yayınlandı) ve LTX-2 (2025'te piyasaya sürüldü) dahil olmak üzere dikkate değer metinden videoya modellerin ortaya çıkışına işaret etti.
2025 yılı, birçok gelişmiş üretken modelin piyasaya sürülmesiyle karakterize edildi. OpenAI'nin Mart ayında piyasaya sürülen GPT Image 1'i, gelişmiş metin oluşturma ve çok modlu yetenekleri sunarak eskizler ve metinsel açıklamalar gibi çeşitli girdilerden görüntü oluşturulmasını kolaylaştırdı. Nisan ayında piyasaya sürülen MidJourney v7, geliştirilmiş metin istemi işleme özelliği sunuyordu. Mayıs 2025'te, Google'ın gelişmiş fotogerçekçilik sunan Imagen 4'ünün yanı sıra, yüksek kaliteli görüntü oluşturmadaki verimliliğiyle tanınan, Black Forest Labs tarafından Flux.1 Kontext'in tanıtımı yapıldı. Daha sonra Kasım 2025'te görsel referanslama, tipografi ve hızlı anlama konularında ilerlemeler içeren Flux.2 piyasaya sürüldü.
Araçlar ve süreçler
Yaklaşımlar
Sanatçılar yapay zeka görsel sanatı oluşturmak için çeşitli yöntemler kullanır. Metinden görüntüye yaklaşımında yapay zeka, dağıtım veya transformatör tabanlı mimariler gibi modellerden yararlanarak görselleri metinsel açıklamalardan sentezler; kullanıcılar istemler sağlar ve yapay zeka da ilgili görüntüleri oluşturur. Görüntüden görüntüye yöntemi, yapay zekanın mevcut bir girdi görüntüsünü, belirli bir bilgi istemi veya stil referansı tarafından yönlendirilerek yeni bir stile veya forma dönüştürmesini içerir; bu, bir taslağın fotogerçekçi bir işleme dönüştürülmesi veya farklı bir sanatsal estetik uygulanmasıyla örneklenir. Görüntüden videoya uygulamalar için yapay zeka, tek bir görüntüden veya bir diziden kısa video klipler veya animasyonlar üretir; bu, sıklıkla hareket veya geçişler içerir; statik portrelerin canlandırılmasından dinamik sahnelerin oluşturulmasına kadar değişebilir. Son olarak, metinden videoya yetenekleri, yapay zekanın doğrudan metin istemlerinden videolar oluşturmasını sağlar; bu da animasyonlar, gerçekçi senaryolar veya soyut görsel dizilerle sonuçlanır ve zamansal sürekliliğe vurgu yaparak metinden görüntüye dönüştürmenin evrimini temsil eder.
Görüntüler
Yayılma modellerinden yararlanan sanatçılar çok çeşitli araçlara erişebilir. Bunlar arasında hem olumlu hem de olumsuz istemleri tanımlama yeteneğinin yanı sıra VAE'ler, LoRA'lar, hiper ağlar, IP bağdaştırıcıları ve yerleştirme/metinsel tersine çevirmeler gibi bileşenleri dahil etme veya hariç tutma seçeneği de yer alır. Ayrıca sanatçılar, rehberlik ölçeği (yaratıcı özgürlük ve aslına uygunluk arasındaki dengeyi düzenleyen), tohum (stokastisiteyi yönetmek için) ve ölçek yükselticiler (görüntü çözünürlüğünü iyileştirmek için) dahil olmak üzere çeşitli parametreleri ayarlayabilir. Gürültünün çıkarım öncesi manipülasyonu, etki için başka bir yol sunarken, geleneksel işlem sonrası yöntemler genellikle çıkarım sonrasında uygulanır. Kullanıcılar aynı zamanda özel modelleri eğitme yeteneğine de sahiptir.
Yayılma modellerini tamamlayıcı olarak, üretken rakip ağlar (GAN'lar) ve transformatörler gibi derin öğrenme mimarilerinin yanı sıra matematiksel desenler, fırça darbelerini ve diğer sanatsal efektleri taklit eden algoritmalar kullanan prosedürel, kural tabanlı görüntü oluşturma teknikleri ortaya çıktı. Çok sayıda şirket, süreci kolaylaştıran ve diğer parametrelerin manuel olarak ayarlanmasına gerek kalmadan kullanıcıların yalnızca olumlu yönlendirmelere odaklanmasını sağlayan uygulamalar ve web platformları sunmaktadır. Ek olarak, ünlü sanatsal hareketlerin görsel özelliklerini taklit etmek amacıyla fotoğrafları stilize etmeye yönelik özel yazılımlar mevcuttur.
Mevcut araçlar, tüketiciler için tasarlanmış kullanıcı dostu mobil uygulamalardan gelişmiş Jupyter dizüstü bilgisayarlara ve optimum performans için önemli GPU kaynakları gerektiren web tabanlı kullanıcı arayüzlerine kadar geniş bir yelpazeyi kapsamaktadır. Gelişmiş işlevler arasında, sınırlı sayıda görüntüden öğrenilen, kullanıcı tanımlı kavramların (belirli nesneler veya sanatsal stiller gibi) entegrasyonunu kolaylaştıran 'metni tersine çevirme' de yer alıyor. Bu, ilgili metinsel tanımlayıcılara (öğrenilen, çoğunlukla soyut kavramlara atanan kelimeler) dayalı olarak ve DreamBooth tarafından örneklenen model uzantıları veya ince ayar teknikleri yoluyla yeni sanat eserlerinin oluşturulmasına olanak tanır.
Etki ve Uygulamalar
Yapay zeka derin bir toplumsal dönüşüm kapasitesine sahiptir; potansiyel olarak amatör yaratıcılar tarafından ticari olmayan niş türlerin (ör. solarpunk gibi siberpunk türevleri) çoğalmasını teşvik eder, yeni eğlence biçimlerini kolaylaştırır, prototip oluşturmayı hızlandırır, sanat yapımının erişilebilirliğini artırır ve çaba, maliyet veya zaman açısından sanatsal çıktı verimliliğini artırır. Bu verimlilik, ön taslakların oluşturulması, kavramların tanımlanması ve görüntü bileşenlerinin üretilmesi (iç boyama) gibi yeteneklerle sağlanır. Oluşturulan görüntüler sıklıkla ön taslaklar, ekonomik deneysel varlıklar, ilham kaynakları veya kavram kanıtlama fikirleri için görsel temsiller olarak hizmet eder. Ayrıca iyileştirmeler, görüntü düzenleme yazılımı kullanılarak daha sonra yapılan iyileştirmeler de dahil olmak üzere üretim sonrası manuel düzenlemeyi içerebilir.
Profesyonel görsel sanatçılar ve tasarımcılar, nihai üretim (yakınsak düşünme) yerine ağırlıklı olarak erken aşama kavramsallaştırma sırasında (ıraksak düşünme) üretken yapay zekayı kullanmışlardır. UI/UX tasarımı ve konsept sanatı gibi dijital veya geçici çıktılar üreten disiplinler, bu teknolojileri heykel veya mimari gibi fiziksel, kalıcı eserler üreten disiplinlerden daha kolay bir şekilde entegre eder. Fiziksel alanlarda, yapısal bütünlük, maddi sınırlamalar ve kültürel 'etno-hesaplama' hususları yapay zekayı geleneksel üretim yöntemlerinin doğrudan yerine geçmek yerine sıklıkla tamamlayıcı bir geliştirme rolüyle sınırlandırmaktadır. Üstelik evlat edinme tutumları kariyer aşamaları arasında önemli farklılıklar göstermektedir; Giriş seviyesindeki profesyoneller genellikle üretken yapay zekayı pazar rekabeti için gerekli olan dijital araçların pratik bir uzantısı olarak algılarken, kıdemli uygulayıcılar somutlaşmış uzmanlığın olası değer kaybı ve uzun vadeli beceri gelişimi üzerindeki etkisi konusunda sıklıkla eleştirel şüphelerini dile getiriyor.
İstem Mühendisliği ve Paylaşım
Belirli metinden resme modellerine yönelik istemler, görselleri, anahtar kelimeleri ve sanatsal stil de dahil olmak üzere yapılandırılabilir parametreleri içerebilir. Bu stil spesifikasyonu sıklıkla bilgi istemindeki "[sanatçının adı] tarzında" gibi anahtar ifadelerle veya geniş bir estetik veya sanat stili seçilerek elde edilir. Belirli görüntü oluşturmaya yönelik istemlerin paylaşılması, paylaşılması, keşfedilmesi, iyileştirilmesi ve işbirliğine dayalı olarak geliştirilmesi için özel platformlar mevcuttur. Bilgi istemleri genellikle Reddit de dahil olmak üzere çeşitli görüntü paylaşım platformlarında ve özellikle yapay zeka sanatına adanmış web sitelerinde oluşturulan görsellerin yanında dağıtılır. Bir istemin, görüntü oluşturmak için gereken girdinin yalnızca bir bileşenini oluşturduğuna dikkat etmek önemlidir; diğer önemli belirleyiciler arasında çıktı çözünürlüğü, rastgele tohum ve rastgele örnekleme parametreleri yer alır.
İlgili Terminoloji
Yapay zeka tarafından üretilen sanatı kapsayan sentetik medya, 2022'de öngörülebilir gelecekte çeşitli sektörleri etkilemesi öngörülen önemli bir teknolojik trend olarak tanımlandı. Harvard Kennedy Okulu'ndaki araştırmacılar, yapay zeka tarafından üretilen sanatın X platformunda yaygın olarak benimsenmesine yönelik araştırmalarının ardından, sentetik medyanın siyasi yanlış bilgileri yayma potansiyeline ilişkin endişelerini dile getirdi. Sentografi, yapay zeka aracılığıyla fotoğraf benzeri görüntüler üretme metodolojisi için önerilen bir terminolojiyi temsil eder.
Felsefi Bağlam
Yapay zeka tarafından üretilen görsel sanat, yaratıcılık, yazarlık ve görsel temsillerin doğasında var olan ontolojik doğası kavramlarıyla ilgili kapsamlı felsefi söylemi teşvik etti. Önemli bir araştırma, sanatın asıl değerinin insanın niyetliliğine ve bilinçli farkındalığına bağlı olup olmadığı etrafında dönüyor. Karşı çıkanlar, yapay zeka sistemlerinde öznel deneyim ve kasıtlı niyetin yokluğunun, üretimlerinin "gerçek" sanatsal ifadeler olarak değerlendirilmesini engellediğini iddia ediyor. Tersine, destekçiler estetik değerin, yalnızca yaratıcısının içsel durumlarından ziyade, bir eserin algılanışında ve kültürel faydasında yattığını ileri sürüyor ve böylece yapay zeka sistemlerini, yaratıcı çabanın genişletilmiş paradigmaları içinde araçlar veya işbirlikçi varlıklar olarak konumlandırıyor.
Yapay zeka tarafından oluşturulan görüntüler aynı zamanda yerleşik temsil teorilerini de temelden sorguluyor. Fotoğraf ve film geleneksel olarak fiziksel gerçeklikle endeksli bir ilişkiye sahip olarak algılanır ve gerçek dünyadaki olaylar veya nesnelerle nedensel bir bağlantıya işaret eder. Bunun tersine, üretken yapay zeka sistemleri, görüntüleri doğrudan fiziksel kayıt yerine istatistiksel model tanıma yoluyla sentezler ve böylece bu dizinsel bağlantıyı zayıflatır veya tamamen keser.
Medya teorisyeni Johannes Grenzfurthner, görsel kültürde etik ve politik şeffaflığı korumak için bu paradigma değişiminin "ontolojik açıklamayı" (bir görüntünün fiziksel olarak referanslı, melez veya tamamen sentetik olduğunun açık bir şekilde beyan edilmesi) gerektirdiğini öne sürüyor. Devam eden bu söylem, yapay zeka tarafından üretilen görsel sanatı, teknoloji, özgünlük ve sanatsal ifadenin dinamik olarak yeniden tanımlanmasıyla ilgili daha geniş felsefi tartışmalar içinde konumlandırıyor.
Yapay Zeka Kullanılarak Mevcut Sanatın Analizi
Yeni sanat eserleri neslinin ötesinde, dijital sanat koleksiyonlarının niceliksel analizi için yapay zeka destekli araştırma metodolojileri geliştirildi. Bu ilerleme, son yıllarda sanatsal çalışmaların kapsamlı bir şekilde dijitalleştirilmesine atfedilebilir. CETINIC ve SHE (2022) tarafından belirtildiği gibi, mevcut sanat koleksiyonlarını incelemek için yapay zekanın uygulanması, sanatsal tarzların evrimi ve sanatsal etkilerin anlaşılması konusunda yeni bilgiler sunmaktadır.
Dijitalleştirilmiş sanatın analizi tipik olarak iki temel hesaplama metodolojisini kullanır: yakın okuma ve uzaktan izleme. Yakın okuma, bireysel sanat eserleri içindeki belirli görsel niteliklere odaklanır. Yakın okuma yaklaşımlarındaki makine odaklı görevler, hesaplamalı sanatçı kimlik doğrulamasını ve fırça işi veya dokusal özelliklerin ayrıntılı analizini kapsar. Tersine, uzaktan görüntüleme metodolojileri, belirlenmiş bir özelliğe dayalı olarak koleksiyonun tamamındaki benzerliklerin istatistiksel olarak görselleştirilmesine olanak tanır. Bu yöntemin tipik uygulamaları arasında otomatik sınıflandırma, nesne tespiti, çok modlu analiz, sanat tarihinde bilgi çıkarma ve hesaplamalı estetik yer alır. Ayrıca sentetik görüntüler, sanat eseri kimlik doğrulaması ve sahtecilik tespiti amacıyla yapay zeka algoritmalarını eğitmek için kullanılabilir.
Ayrıca araştırmacılar, sanatsal yaratımlara verilen duygusal tepkileri tahmin etmek için tasarlanmış modeller geliştirdiler. Dikkate değer bir örnek, makine öğrenimi modelleriyle entegre edilmiş kapsamlı bir veri kümesi olan ArtEmis'tir. ArtEmis, 6.500'den fazla katılımcının katkıda bulunduğu ve ilgili metinsel açıklamalarla tamamlanan duygusal ek açıklamalardan oluşur. Bu veri kümesindeki hem görsel verilerin hem de ilgili metinsel açıklamaların analizi yoluyla ArtEmis, karmaşık duygusal tahminlerin üretilmesini kolaylaştırır.
Yapay Zeka Sanatının Diğer Biçimleri
Yapay zeka, görsel sanatların ötesine uzanan sanatsal alanlarda da uygulama alanı buldu. Üretken yapay zeka, müzik kompozisyonunda ve video oyunu geliştirmede kullanıldı; yalnızca görüntülerin ötesine geçerek seviye tasarımını (örneğin, özel haritalar için), yeni içeriklerin üretilmesini (örneğin, görevler veya diyalog) ve etkileşimli anlatıların işlenmesini içerecek şekilde kullanıldı. Ayrıca yapay zeka, yazma tıkanıklığına yardımcı olmak, yaratıcı ilham sağlamak veya metinsel bölümlerin yeniden yazılmasını kolaylaştırmak için edebi sanatlarda da uygulanmıştır. Mutfak sanatlarında bazı prototip robotik sistemler, dinamik tatma yeteneğine sahiptir ve böylece şeflere, hazırlık sırasında yemek kompozisyonu ve lezzet profillerinin gerçek zamanlı analizinde yardımcı olur.
Adlandırma: 'Sanat'ın Uygulaması
"Sanat" teriminin yapay zeka yazılımı tarafından üretilen çalışmalara uygulanması sanatçılar, filozoflar, akademisyenler ve diğer paydaşlar arasında önemli tartışmalara yol açtı. Çok sayıda yorumcu, makine tarafından üretilen görüntüleri "sanat" olarak sınıflandırmanın, yaratıcılık, beceri ve kasıtlılık dahil olmak üzere insan sanatının kendine özgü niteliklerini azalttığını iddia ediyor. Özgün sanatsal yaratımın çağdaş tanımları sıklıkla insan düzeyindeki niyetlerin, kişisel deneyimin, duyguların ve ilgili tarihsel veya sanatsal bağlamın gerekliliğini vurguluyor.
Ulusal Tıp Kütüphanesi tarafından yürütülen araştırma, yapay zekaya atfedilen sanat eserlerine karşı insanın doğası gereği önyargılı olduğunu gösteriyor. Katılımcıların, biri açıkça yapay zeka tarafından oluşturulmuş olarak tanımlanan iki karşılaştırılabilir görüntüyü değerlendirdiği bir çalışmada, denekler sürekli olarak yapay olarak üretilen görüntüye daha düşük sanatsal değer atfetti. Bu bulgu, sosyo-kültürel algıların, doğal görsel özelliklerinden bağımsız olarak bir görselin sanat olarak sınıflandırılmasını önemli ölçüde etkilediğini ima etmektedir.
Dijital Sanat Gözlemcileri Yıllık Toplantısı'nda sunulan 2023 tarihli bir raporda Samuel Loomis, "Yapay Zeka sanatı" tanımının, onun doğasında olan ikiliği tanıdığını öne sürdü: özellikle geleneksel sanat için yerleşik kritik ölçütlerle karşılaştırıldığında, hem insan yönlendirmesi hem de makine güdümlü üretken süreçlerden kaynaklanan bir yaratım.