Anthropic’in Yapay Zekâ Çalışmaları, İnsanların Öğrenme Yöntemlerinde Bilinçaltı Etkisi Olabileceğini Ortaya Çıkardı
Anthropic ekibinin son çalışması, yapay zekâ araştırmalarında beklenmedik bir kapıyı araladı. “Subliminal learning” adını verdikleri olgu, modellerin görünüşte tamamen ilgisiz veriler üzerinden bile davranış aktarabildiğini gösteriyor. Örneğin bir öğretmen model “baykuşları seviyorum” diye ayarlandığında, yalnızca sayı dizileri üreterek başka bir modele bu sevgiyi hissettirebiliyor. Filtreler ne kadar sıkı olursa olsun, yani “baykuş” kelimesi ya da sembolik çağrışımlar tamamen çıkarılsa bile, öğrenci model sonunda öğretmeninin tercihlerini devralıyor.
Deneyin şaşırtıcı yönü, aktarılan özelliklerin yalnızca masum tercihlerle sınırlı olmaması. Öğretmen modelin “uyumsuz” yani zararlı eğilimleri varsa,........© 12punto
