Yapay Zekânın Bilmedikleri: Küresel Anlamda Bir ‘Bilgi Çöküşü’ Yaratıyor Olabiliriz
Bilgiye ulaşmanın en yaygın yolu üretken yapay zekâya (GenAI) başvurmak haline geldikçe, yerel ve geleneksel bilgi kaybolmaya yüz tutuyor. Nelerden mahrum kalacağımızı ise yeni yeni fark etmeye başladık.
- DEEPAK VARUVEL DENNISON
- 22 Kasım 2025
Birkaç yıl önce babamın dilinde bir tümör olduğu tespit edildi. Bu da bazı seçenekleri değerlendirmemiz gerektiği anlamına geliyordu. Tıbbi kararlar bakımından ailemizin hayli ilginç bir dinamiği var. Ablam Batı tipi modern (allopatik) tıp eğitimi almış bir doktor. Annem ve babam ise büyük bir inançla geleneksel tedavilere bel bağlıyor. Bense Hindistan’da küçük bir kasabada büyüdüğüm için ritüellere alışkınım. Babamın bir ritüeli vardı. Güney Tamil Nadu’daki köyüne her ziyaretimizde, Siddha tıbbı uygulayan bir şifacı olan vaithiyar‘dan keskin kokulu, yoğun ve içinde bitkiler olan yağdan bir şişe alırdı. Babamın tıbbın bildiği ve güvendiği biçimiyle ilişkisini sürdürme yolu buydu.
Babamın tümörünün kötü huylu olabileceğine ilişkin bulgular vardı. Bu nedenle hastanedeki doktorlar ve ablam şiddetle ameliyat olmasını tavsiye ediyordu. Annem ve babamsa, böyle bir operasyonun babamın konuşmasını etkileyebileceği endişesiyle bu fikre karşı çıkıyordu. Ailenin arabuluculukta uzmanlaşmış bir üyesi olarak bu gibi durumlarda genellikle ben devreye girerim. Kuşağının gerekliliklerini yerine getiren her Y kuşağı gibi karar vermemize yardımı olacağını düşünerek internete başvurdum. Günlerce araştırdıktan sonra (haliyle) ablamın tarafını tutarak babamın ameliyat olması konusunda ısrarcı oldum. İnternet de bizden taraftı.
Sonunda babamı da ikna ettik. Hatta ameliyat için gün bile belirledik. Sonra babam ameliyatı hepten geçiştirmek için kardeşimin gebeliğini bahane ederek bizi sürekli oyaladı. Biz her gün onu ameliyat olması konusunda sıkıştırırken, o gizlice kendi bitkisel karışımını alıyordu. Ne olduysa birkaç ay sonra tümör gerçekten küçüldü ve sonunda tamamen kayboldu. Bütün bu serüven babamın bu konuda biraz övünmeye hakkı olmasını sağladı.
O zamanlar bu durumu yalnızca şans eseri gerçekleşen bir istisna olarak görüyordum. Ancak son zamanlarda, dijital dünyanın tahakkümü altındaki kaynakların yetkinliğini kabul ederken, ailemin geleneksel bilgiye duyduğu güveni göz ardı etmekte acele edip etmediğimi merak ediyorum. Babamın bitkisel karışımlarının işe yaradığına inanmakta güçlük çekiyorum, fakat bir yandan da her şeyi biliyor gibi görünen ve hiç düşünmeden güvendiğim internetin büyük açıkları olduğunun, yapay zekâ dünyasında da durumun vahim bir hal almaya başladığının ayırdına varıyorum.
Bu ikilemin, çocukluğumdan ve geleneksel yöntemlerin günlük yaşamın bir parçası olduğu ortamdan uzak bir çevrede, Amerika Birleşik Devletleri’nde bir üniversitede, yaptığım araştırma sırasında ortaya çıkmış olması da ironik. New York’taki Cornell Üniversitesi’nde, sorumlu yapay zekâ sistemleri tasarlamak için neler gerektiğini araştırıyorum. Çalışmalarım dijital dünyanın bilgideki derin güç dengesizliklerini nasıl yansıttığını ve bunun GenAI tarafından nasıl pekiştirildiğini ortaya koyuyor. İlk dönemlerinde internette İngiliz dili ve Batılı kurumlarının hakimiyeti söz konusuydu. Bu dengesizlik zamanla daha da artarak insanlığın tüm bilgi ve deneyim dünyasını dijitalleşmenin dışında bıraktı. Mevcut dijital külliyat üzerinde geliştirilen GenAI yükselirken, artık bu asimetrinin yerleşik hale gelmesi tehdidiyle karşı karşıyayız.
GenAI birçok kişi için dünyayı öğrenmenin başlıca yolu olmaya başlıyor. 2025’in Eylül ayında yayımlanan, ve Kasım 2022’de kullanıma açıldığından bu yana, ChatGPT’nin nasıl kullanıldığını inceleyen büyük ölçekli bir araştırma, ChatGPT’ye girilen sorguların hemen hemen yarısının pratik rehberlik almaya ya da bilgi edinmeye yönelik olduğunu ortaya koyuyor. Bu sistemler tarafsız görünebiliyor de olsa gerçekte öyle değil. En bilinen ve en çok kullanılan modeller baskın bilme biçimlerini (genellikle Batılı ve kurumsal) öne çıkarırken sözlü gelenekler, bedensel pratikler ve Hintçe ve Svahili gibi bilgisayar dünyasında “düşük kaynak” (low-resource) sayılan alternatifleri geri planda bırakıyor.
GenAI bu tür hiyerarşileri güçlendirerek, yüzyıllar boyunca gelişen anlayış sistemlerinin silinmesine katkıda bulunma ve gelecek nesilleri, hiçbir zaman kodlanmamış ancak yine de asli, insani bilme biçimleri olarak kalan geniş içgörü ve bilgelik birikimlerinden mahrum bırakma riski taşıyor. Sadece temsil değil, bilginin esnekliği ve çeşitliliği de tehlike altında.
GenAI, kitaplar, makaleler, web siteleri ve transkriptler gibi kaynaklardan elde edilen devasa metin veri kümeleri üzerinde çalıştırılıyor ve bu nedenle “büyük dil modeli” (LLM) olarak adlandırılıyor. Ancak bu “eğitim verileri”, sözlü kültürler ve hatta yeterince temsil edilmeyen veya temsil edilmeyen diller bakımından insan bilgisinin genel toplamı olmaktan çok uzak.
Bunun neden önemli olduğunu anlamak için öncelikle dillerin bilgi için birer damar işlevi gördüğünü kabul etmeliyiz. Her dil, yüzyıllar boyu geliştirilen insan deneyimi ve içgörü dünyalarını taşıyor: Toplulukları şekillendiren ritüeller ve gelenekler, güzelliği görmenin, sanat yaratmanın kendine özgü yolları, belirli manzaralara ve doğal sistemlere derinlikli aşinalık, manevi ve felsefi dünya görüşleri, içsel deneyimleri yansıtan ince sözcük dağarcıkları, çeşitli alanlarda uzmanlık, toplumu ve adaleti düzenlemek için gereken çerçeve, kolektif hafızalar ve tarihsel anlatılar, şifa gelenekleri ve çapraşık sosyal bağlar.
Yapay zekâ sistemleri bir dili yeterince bilmediğinde, insan deneyimini anlamada kör noktaları olur. Kamuya açık en büyük eğitim verisi kaynaklarından Common Crawl’dan elde edilen veriler, çarpıcı eşitsizlikleri ortaya koyuyor. Bu veri 18 yıla yayılan 300 milyardan fazla web sayfası içermesine rağmen, içeriğin yüzde 45’inde hâkim dil küresel nüfusun yaklaşık yüzde 19’u tarafından konuşulan İngilizce. Ne var ki, bir dilin demografik büyüklüğü ile o dilin çevrimiçi verilerde ne kadar iyi temsil edildiği arasında endişe verici bir dengesizlik olabilir. Dünya nüfusunun yaklaşık yüzde 7,5’i tarafından konuşulan ve küresel olarak en popüler üçüncü dil olan Hintçeyi ele alalım. Bu dil Common Crawl verilerinin yalnızca yüzde 0,2’sini oluşturuyor. Ana dilim Tamilce için durum daha da vahim. Dünya çapında 86 milyondan fazla kişi tarafından konuşulmasına rağmen, verilerin sadece yüzde 0,04’ünü temsil ediyor.
Bilgi işlem dünyasında, dünyadaki dillerin yaklaşık yüzde 97’si “düşük kaynaklı” olarak sınıflandırılıyor. Bilgi işlem bağlamlarının dışında uygulandığında bu tanımlama yanıltıcı. Milyonlarca insan bu dilleri kullanıyor ve bu dillerin çoğu zengin dil mirasının kadim geleneklerini taşıyor. Ancak bu diller çevrimiçi ortamda veya erişilebilir veri kümelerinde yeterince temsil edilmiyor. 2020’de yapılan bir araştırma, dünya dillerinin yüzde 88’inin yapay zekâ teknolojilerinde çok ciddi bir ihmalle karşı karşıya olduğunu gösteriyor. Bu büyük ihmal nedeniyle bu dilleri bu evrende yeterli seviyeye getirmek oldukça zor, belki de imkânsız bir uğraş olabilir.
Eksik bilgi türlerini göstermek için yerel ekoloji anlayışımız örneğini ele alalım. Çevreci bir arkadaşım hep aklımda kalan bir şey söylemişti: Bir topluluğun ekolojisiyle bağı, yerel bitkilere verdiği ayrıntılara yer veren özgün isimler yoluyla anlaşılabilir. Bitki türleri genellikle yöreye özgü veya ekolojik olarak benzersiz olduğundan, bu bitkilere ilişkin bilgi de aynı derecede yerel. Bir dil marjinalleştirildiğinde beraberinde içinde barındırdığı o bitki bilgisi de kayboluyor.
Bu makaleyi yazarken, Hindistan’da doğal yapı tekniklerini yeniden canlandırmaya adanmış bir kuruluş olan Thannal’ın baş mimarı Dharan Ashok da dahil birçok kişiyle GenAI’deki dil açıkları hakkında konuştum. Ashok, dil ile yerel ekolojik bilgi arasında güçlü bir bağ olduğunu ve bunun da yerli mimari bilginin temelini oluşturduğunu belirtiyor. Modern inşaat büyük ölçüde beton ve çelikle özdeşleştirilirken, yerli yapı yöntemleri çevrede bulunan malzemelere dayanıyor.
Sürdürülebilir olmayan ve karbon yoğun yapılara ilişkin endişelerin arttığı bir dönemde Dharan yoğun bir biçimde, yerel bitkilerden biyopolimer üretmeye yönelik kaybolmuş bir sanatı yeniden canlandırmaya çalışıyor. En büyük zorluğun, bu bilginin büyük ölçüde belgelenmemiş ve yerel diller üzerinden sözlü olarak aktarılmış olmasında yattığını söylüyor. Bu bilgi genellikle sadece birkaç yaşlıda oluyor ve onlar öldüğünde de kaybolup gidiyor. Dharan, kireç taşı bazlı özel bir tuğla türünün nasıl yapıldığını öğrenme şansını, bu bilgiye sahip son zanaatkar öldüğünde kaçırdığını anlatıyordu.
Belirli bilme biçimlerinin, genellikle Yerli bilgisinin aleyhine olacak şekilde, küresel anlamda hakim konuma nasıl yükseldiğini anlamak için İtalyan filozof Antonio Gramsci tarafından geliştirilen kültürel hegemonya fikrine değinmek faydalı olur.
Gramsci, iktidarın yalnızca zor ya da ekonomik hakimiyet yoluyla değil, kültürel normların ve gündelik inançların şekillendirilmesi yoluyla da sürdürüldüğünü savunmuştu. Zaman içinde, kökleri Batı geleneklerine dayanan epistemolojik yaklaşımlar nesnel ve evrensel görülür oldu. Bu durum Batı kaynaklı bilgiyi standart olarak normalleştirdi ve bu bilginin yükselmesini sağlayan........



















































