menu_open Columnists
We use cookies to provide some features and experiences in QOSHE

More information  .  Close

İş dünyasında “Eval – Değerlendirme Kültürüne” geçiş

27 0
28.04.2026

Andrej Karpathy, 1986 Slovakya doğum­lu, Kanada vatandaşı ya­pay zekâ araştırmacısı ve eğitimci. Elon Musk ile OpenAI’ın kurucu üye­lerinden (2015–2017) ve Tesla’nın eski YZ direk­törü (2017–2022). Auto­pilot sisteminin bilgisa­yarla görme ekibini yö­netti, Musk’la doğrudan ve çok yakın çalıştı. Tem­muz 2024’te Eureka Labs adlı yapay zekâ eğitim girişimini kurdu. Halen özellikle eğitim alanında YZ uygulamaları ge­liştiriyor.

Yapay zekâ konusunda önde giden mühendislerden ve ka­naat önderlerinden biri. Bir şey söylediğinde teknoloji dünyası da iş dünyası da kulak kesiliyor. “Eval kültürü» tartışmasının bugün en güçlü sözcüsü. 2025 başında “vibe coding” (doğal dille kodlama) terimini o icat etti. 2026’da ise “agentic engi­neering’e - ajan tabanlı mühen­disliğe” dikkat çekmeye başladı.

Artık, tüm alanlar ve görevler için geçerli olmak üzere, pro­fesyonel çalışma hayatında YZ ile çalışabilme becerisinin zo­runluluk haline geldiğini söylü­yor. Dikkat: YZ kullanmak de­miyor, “YZ ile çalışabilmek” diyor.

İnsan müdahalesi hâlâ şart!

YZ’deki hızlı gelişme nede­niyle artık birkaç satır talimat­la raporlar, kodlar, analizler da­kikalar içinde çıkıyor. Hız ar­tıp maliyetler düşüyor. YZ bol miktarda içerik üretiyor. İçinde «slop” (çöp) denilen kalitesiz, hatalı, hatta uydurma ya da yanıltıcı kısımlar olabiliyor. İnsan müdahalesi olmadan bu akış kontrolsüz yayılıyor.

O yüzden YZ çıktısını test etmek, doğrulamak, hataları­nı bulmak ve bağlama oturt­mak gerekiyor. Yani YZ ile çalışırken kazanım, üretilen içerikte değil onun değerlen­dirilmesinde yatıyor. Karpathy buna “eval (değerlendirme) kültürü” diyor.

Mart 2026’da yayımladığı “otonom araştırma – autore­search” projesi üzerinde çalı­şırken küçük bir dil modelinin eğitimini gece boyunca bir AI ajanına emanet etti: iki gün, 700 deney, %11 eğitim hızı ile işlemi tamamladı.

Fortune dergisi bu olguya isim taktı: “The Karpathy Lo­op” (Karpathy Döngüsü). Kar­pathy, kendi iş akışında da bu değişimi yaşadığını belirtiyor. Artık “ben yazdım” değil, “ben yönlendirdim ve kontrol ettim” dönemine geçildi diyor.

İş dünyasının her katmanı için geçerli bir doğru var:

Strateji belgesi YZ ile hazır­landıysa pazar dinamiklerine uyuyor mu, riskler doğru hesap­lanmış mı, mutlaka işinin ehli iş liderleri tarafından sorgulan­malı. Pazarlama kampanyası YZ önerisiyle şekillendiğin­de marka kimliğine ve hedef kit­leye gerçekten hitap ediyor mu kontrol edilmeli. Finansal tah­minlerde YZ modeli kullanıldı­ğında varsayımlar ve veri kalitesi teyit edilmeli.

Türkiye’de bu beceri­nin eksikliği şimdiden hissediliyor. Şirketler YZ araçlarını hızla entegre edi­yor. Ama verimlilik bir tür­lü beklenen düzeye çıkmı­yor. Çünkü pek çok şirkette YZ körü körüne kullanılı­yor.

Oysa bu kültürü kazanmak zor değil;

* Her YZ çıktısını otomatik kabul etme alışkanlığını bırak.

* Kendi test sorularını oluş­tur: Veri destekliyor mu?

* Mantık tutarlı mı? Eksik yön ne? Gerçek hayatta işe ya­rar mı?

lKüçük günlük işlerde dene. İterasyon yap, sonuçları karşı­laştır. Bu aşamalar zamanla ref­leks haline geliyor. Aynı zaman­da etik bir sorumluluk: YZ’nın ürettiği içeriklerde telif hakları, önyargılar ve mahremiyet soru­larını sorgulamak gerekiyor.

Kurum içi eğitim tarafında da uyum şart

Şirket içi programlar, sade­ce YZ kullanımını değil, eleş­tirel değerlendirmeyi mer­keze almalı. Prompt (komut) tasarımı, doğrulama yöntemle­ri, etik sorgulama, veri analiti­ği birlikte öğretilmeli. Ancak bu sayede genç profesyonel­ler ve şirketleri global arenada rekabet avantajı yakalayabilir. Deneyimli kadrolar içinse za­man daralıyor: onların maha­reti olan işlerin önemli bir kıs­mını yapay zekâ ajanları ve diji­tal ikizler çok daha iyi yapmaya başladı bile. O zaman bir kez da­ha hatırlatayım: Yavaş yavaş acele edin, T-İnsan’laşarak yarının işini yarına bırakma­yın…


© Dünya