|
HOMO LUDENS’İ SAHAYA SÜRMEK: DALL-E 2’NİN NE YAPTIĞINI GÖRELİM Dilara Şentürk Dokuz Eylül Üniversitesi Güzel Sanatlar Enstitüsü Fotoğraf Bölümü Doktora Programı öğrencisi. dilarasenturk@gmail.com, dilara.senturk@ogr.deu.edu.tr, ORCID: 0000-0002-2999-0867
Biyolog Julian Huxley, 1957 yılında kaleme aldığı Transhumanism makalesiyle, evrenin evrimin doğası gereği geçmiş ve gelecek bilinçlerinin farkındalığını kazandığını ve bu öz farkındalığın bilinçle birlikte transhümanizmi başlatabileceğini söylüyordu. Huxley’nin bahsettiği bu üst insan formu, daha çok fizyolojik ve biyolojik anlamda bir kavramı ifade etse de bugün transhümanizm, teknolojinin katmanlaştırdığı yeni oluşumlarla hem teknik bir yapıda hem de ifadelendirmede felsefi olarak konumlandırılıyor. Bilincin farkındalık temelli yapısında kavramsal düşüncenin ve dil yetisinin yeni bir insan üstü deneyime de aktarılacağı fikri, Huxley’nin iddialarının bir miktar ‘aşırı’ görünmesine yol açsa da iddia ettiği transhümanizm formu, bugünün yapay zekâsına karşılık gelen bir biçimde karşımızda duruyor. Huxley’nin makalesindeki son satırlara bir göz atalım, “İnsan, insan olarak kalacak ancak kendi için yeni olasılık ihtimallerini keşfetmek adına doğasını aşacak” (Huxley, 1968, s. 76). Belki insan, Huxley’nin bahsettiği türde bir evrim biçimiyle kendini henüz aşamadı ancak yapay zekâ araçları bilinçle benzer bir yapıda insanı taklit etmeye başladı bile. Fotoğrafçılığın, bilgisayar destekli olarak geliştiği dönemler için, grafiklerin gerçekliği görüntüleme ve iletme aşamasındaki yadsınamaz katkısı adına ne olduğuna bir bakalım. Bu yeni medya pratikleri, insan odaklı estetik ve enformasyon üretimlerini bizlere otomasyon/makineleşme etrafında sunuyor. Sahneyi yakala, tanımla, sınıflandır, oluştur, ilet ve saklanması gerektiğinde onu ağlara teslim et sistemi, Lev Manovich’in deyimiyle vizyonu otomatik hale getirmek adına yeterli olur mu? Manovich’in “sahneyi anlamak, vizyonu betimlemek” (Manovich, 1994, s. 11) olarak bahsettiği kısım, fotoğraftaki nesneyi algılamlara dahil etmeyi -estetik ya da enformasyon yükümlülüğüyle sahnenin kayda alınması- ve görüntünün 3 boyutlu olarak kaydının alınmasını ortaya koyuyor. Manovich’e yeniden kulak verirsek, yapay zekânın hem nesneleri tanıması hem de o nesneyi planlaması için bulunduğu çevresel imgelerin de temsilini oluşturması gerektiğini duyarız. Manovich’in 1994 yılında yazdığı makalesi, bugün bize oldukça tanıdık. Neyi gördüğümüze bakalım. Oyuncuyu Sahaya Süren Apparatus 1984 yapımı Terminator film serisinde bir cyborg’a tanık olduğumuzda 90’lı yılların en heyecanlı sahnelerini de izlemiş olduk. Başka biçimdeki bir transhuman referansını, biraz daha güncele geldiğimizde Black Mirror dizisinin Metalhead bölümünde izledik. Alet ve otomasyon ikilisinin, insan vücuduna eklemlenen organ uzantıları olarak bir süredir teknolojinin odağında olduğunu da görüyoruz. Vilem Flusser, eklemlenen uzantı aletleri, organı simüle eden birer aygıt/apparatus olarak tanımlıyor. Hatta Flusser, bu apparatus kavramını fotoğraf makinesinin kendisi olarak sunuyor. Peki bir fotoğraf makinesi zeitgeist’ın tam ortasında, eklemlenmiş uzantı bir organ olabilir mi? Biraz daha ileriye gidip, fikri ‘aşırı’ya teslim edelim: Gözün denetimini sağlayan, gözün gördüğü ‘gerçek sahne’yi makinenin içine kayda alan fotoğraf makinesi bir transhuman aşaması olabilir mi? Flusser’ın, “işçi değil oyunu oynayan oyuncu/homo ludens” (Flusser, 2006, s. 21) olarak tanımladığı fotoğrafçı ise, fotoğraf makinesinin içinde yer alan, makinenin dişlilerine kadar uzanabilen bir ilişki türünün tam ortasında olarak; olanaklarını keşfeden ve oyunu sahaya sunan bir homo ludens aslında (Flusser, 2006, s. 19). Bu ilişkinin temelinde de esas şu bakış açısı yatar: Ne fotoğrafçı cihaza ne de cihaz fotoğrafçıya sahiptir, otomasyon ve apparatus burada sadece bir uzantı görevi görür, temel soru programlanan görüntülerin hangi verilerle yapılabildiğidir. Tam bu kısımda, kullanıcının girdiği promptlar sayesinde görseller oluşturabilen yapay zekâ aracı Dall-E 2 bize, transhümanizmin bir biçimini, apparatus bakışını ve bilincini otomasyona aktaran fotoğrafçının bir homo ludens olduğunu fark ettirir. Gerçeğe Yakın Fotoğrafik Görüntüler! Mi? Dil girdileri yardımıyla görüntü oluşturan, ilk sürümü Ocak 2021’de, ikinci sürümü Nisan 2022’de OpenAI tarafından piyasaya sürülen Dall-E, kullanıcıya göre değişen öznel girdileri yeniden oluşturmak için 12 milyar parametreden oluşan Generative Pre-trained Transformer 3 (GPT-3) algoritmasını kullanarak bir yapay zekâ deneyimi sunuyor. Aslında bu kısımdan bakınca, yapay zekâ dil modeli olan GPT-3, gerçeğe yakın ya da gerçekte var olmayanları oluşturmasıyla, gerçek ya da hakikat sorgusunun da odağında bulunuyor denebilir. Form olarak, grafik, illüstrasyon, resimsel akımlar ve ressamların çalışma biçimine göre görseller oluşturan Dall-E 2’de photorealistic promptlar sayesinde ‘gerçeğe yakın fotoğrafik görüntüler’ de oluşturulabildiğini deneyimliyoruz. Can alıcı kısmı, bugün gerçek olmadığını bildiğimiz photorealistic bir yapay zekâ görselinin, ağlar yardımıyla herhangi bir coğrafyadan herhangi bir zaman diliminde saniyeler içinde yeniden yaratılması ve hatta bu sayede Dall-E 2’nin bir genesis mitinin uzantısına dönüşmesi. O halde bu kısımda yeni bir soruyu daha düşünelim; yapay zekânın ‘bilinci’, algoritmasıyla dataları melezleyip sunduğunda, hayal gücü ve estetik bakış gücünü yakalamış sayılabilir mi? Fotoğraf karesi, enstantane, diyafram, iso gibi sayısal değerlerin birbiriyle olan bağıntılı ilişkisinin hesaplanarak, fotoğrafçının belirlediği ölçüde, var olan anın tasarılanmış kaydını vermesini sağlar. 0 ve 1 kodlarından oluşan yapay zekâ görseli de estetik görüntünün ham maddesi olarak bilinç ile gören gözün tasarısını vermese de algoritması sayesinde sonsuz arşive dalarak, eşleştirilmiş ve yeniden oluşturulmuş bir sahneyi sunar. Kayıt altına alma güdüsü ve çok görünür olma çabası, bu anlamda hafızayı tetikleyen bir sıçrama tahtası olabilir. Öznel tanımlamalar ve dil yetisinin aracı olduğu, belki “gerçek bir fotoğraf değil!” diye yorumlayabileceğimiz bu görseller, homo ludens’e evrilen kullanıcıların arama kutucuğuna tanımladığı girdiler yani promptlar sayesinde yeni bir üretim biçimi yaratıyor. Bu kısımda görselin ne olacağı, hangi lenslerin kullanılacağı, çekim ölçeği, kavramsal bakış, stil, hangi akımda hangi fotoğrafçının bakış açısıyla şekilleneceği ve nitelik, kullanıcının imgeyi betimleme formuyla şekilleniyor. Sonuç olarak, yapay zekâ henüz o meşhur bilim kurgu anlatılarındaki evrimini tam anlamıyla gerçekleştirmese de eklemlenmiş bir organ, bilinci taklit etmiş bir hafıza ve oyuncuyu da sahaya süren bir apparatus haline gelmiş durumda. Bu apparatusun dil girdileri yardımıyla ne yaptığını görelim. Şimdi kendimi bir homo ludens, Dall-E 2’yi de bir apparatus olarak atayarak Charles Levy, Robert Capa, Rui Palha, Joseph Niepce ve Eadweard Muybridge’in ikonik fotoğraflarını canlandırıyorum. Fotoğrafların orijinalleri ve girilen promptlar sonucu yapay zekânın sunduğu görseller aşağıda. Tuhaf, ikonik, ironik, heyecan verici ve kozmik bir macera. Charles Levy, Nagasaki’ye Atılan Atom Bombası, 1945.

DALL-E 2: Charles Levy, Nagasaki’ye Atılan Atom Bombası, 1945. 
--- Robert Capa, İspanya Cephesi’nde Vurulup Düşen Asker, 1936. 
DALL-E 2: Robert Capa, İspanya Cephesi’nde Vurulup Düşen Asker, 1936. 
----
Rui Palha, Mercado do Bolhao, 2010

Dall-E 2: Rui Palha, Mercado do Bolhao, 2010
 ---
Joseph Niepce, Le Gras, 1826  Dall-E 2: Joseph Niepce, Le Gras, 1826. 
--- Eadweard Muybridge, Galloping Horse, 1887. 
Dall-E 2: Eadweard Muybridge, Galloping Horse, 1887. 
KAYNAKÇA Flusser, V. (2006). Towards a Philosophy of Photography (Mathews, A. Trans.). Reaktions Book. Huxley, J. (1968). Transhumanism. Journal of Humanistic Psychology, 8(1):73-76. Manovich, L. (1994). Automation of Sight: From Photography to Computer Vision. Conference: Photography and the Photographic: Theories, Practices, Histories, University of California at Riverside.
|