İş dünyasında “Eval – Değerlendirme Kültürüne” geçiş
Andrej Karpathy, 1986 Slovakya doğumlu, Kanada vatandaşı yapay zekâ araştırmacısı ve eğitimci. Elon Musk ile OpenAI’ın kurucu üyelerinden (2015–2017) ve Tesla’nın eski YZ direktörü (2017–2022). Autopilot sisteminin bilgisayarla görme ekibini yönetti, Musk’la doğrudan ve çok yakın çalıştı. Temmuz 2024’te Eureka Labs adlı yapay zekâ eğitim girişimini kurdu. Halen özellikle eğitim alanında YZ uygulamaları geliştiriyor.
Yapay zekâ konusunda önde giden mühendislerden ve kanaat önderlerinden biri. Bir şey söylediğinde teknoloji dünyası da iş dünyası da kulak kesiliyor. “Eval kültürü» tartışmasının bugün en güçlü sözcüsü. 2025 başında “vibe coding” (doğal dille kodlama) terimini o icat etti. 2026’da ise “agentic engineering’e - ajan tabanlı mühendisliğe” dikkat çekmeye başladı.
Artık, tüm alanlar ve görevler için geçerli olmak üzere, profesyonel çalışma hayatında YZ ile çalışabilme becerisinin zorunluluk haline geldiğini söylüyor. Dikkat: YZ kullanmak demiyor, “YZ ile çalışabilmek” diyor.
İnsan müdahalesi hâlâ şart!
YZ’deki hızlı gelişme nedeniyle artık birkaç satır talimatla raporlar, kodlar, analizler dakikalar içinde çıkıyor. Hız artıp maliyetler düşüyor. YZ bol miktarda içerik üretiyor. İçinde «slop” (çöp) denilen kalitesiz, hatalı, hatta uydurma ya da yanıltıcı kısımlar olabiliyor. İnsan müdahalesi olmadan bu akış kontrolsüz yayılıyor.
O yüzden YZ çıktısını test etmek, doğrulamak, hatalarını bulmak ve bağlama oturtmak gerekiyor. Yani YZ ile çalışırken kazanım, üretilen içerikte değil onun değerlendirilmesinde yatıyor. Karpathy buna “eval (değerlendirme) kültürü” diyor.
Mart 2026’da yayımladığı “otonom araştırma – autoresearch” projesi üzerinde çalışırken küçük bir dil modelinin eğitimini gece boyunca bir AI ajanına emanet etti: iki gün, 700 deney, %11 eğitim hızı ile işlemi tamamladı.
Fortune dergisi bu olguya isim taktı: “The Karpathy Loop” (Karpathy Döngüsü). Karpathy, kendi iş akışında da bu değişimi yaşadığını belirtiyor. Artık “ben yazdım” değil, “ben yönlendirdim ve kontrol ettim” dönemine geçildi diyor.
İş dünyasının her katmanı için geçerli bir doğru var:
Strateji belgesi YZ ile hazırlandıysa pazar dinamiklerine uyuyor mu, riskler doğru hesaplanmış mı, mutlaka işinin ehli iş liderleri tarafından sorgulanmalı. Pazarlama kampanyası YZ önerisiyle şekillendiğinde marka kimliğine ve hedef kitleye gerçekten hitap ediyor mu kontrol edilmeli. Finansal tahminlerde YZ modeli kullanıldığında varsayımlar ve veri kalitesi teyit edilmeli.
Türkiye’de bu becerinin eksikliği şimdiden hissediliyor. Şirketler YZ araçlarını hızla entegre ediyor. Ama verimlilik bir türlü beklenen düzeye çıkmıyor. Çünkü pek çok şirkette YZ körü körüne kullanılıyor.
Oysa bu kültürü kazanmak zor değil;
* Her YZ çıktısını otomatik kabul etme alışkanlığını bırak.
* Kendi test sorularını oluştur: Veri destekliyor mu?
* Mantık tutarlı mı? Eksik yön ne? Gerçek hayatta işe yarar mı?
lKüçük günlük işlerde dene. İterasyon yap, sonuçları karşılaştır. Bu aşamalar zamanla refleks haline geliyor. Aynı zamanda etik bir sorumluluk: YZ’nın ürettiği içeriklerde telif hakları, önyargılar ve mahremiyet sorularını sorgulamak gerekiyor.
Kurum içi eğitim tarafında da uyum şart
Şirket içi programlar, sadece YZ kullanımını değil, eleştirel değerlendirmeyi merkeze almalı. Prompt (komut) tasarımı, doğrulama yöntemleri, etik sorgulama, veri analitiği birlikte öğretilmeli. Ancak bu sayede genç profesyoneller ve şirketleri global arenada rekabet avantajı yakalayabilir. Deneyimli kadrolar içinse zaman daralıyor: onların mahareti olan işlerin önemli bir kısmını yapay zekâ ajanları ve dijital ikizler çok daha iyi yapmaya başladı bile. O zaman bir kez daha hatırlatayım: Yavaş yavaş acele edin, T-İnsan’laşarak yarının işini yarına bırakmayın…
