ChatGPT4o: Geleceğin önizlemesi
Diğer
T24 Haftalık Yazarı
20 Mayıs 2024
Bugün sizlere OpenAI’ın geçen hafta içinde duyurusunu yaptığı yeni yapay zekâ modeli ChatGPT 4o’dan söz etmek istiyorum. Lakin endişe etmeyin, teknik konularla halihazırda herkes gibi karışmış olma ihtimali olan kafanızı daha fazla karıştırmayacağım. Sadece 4o’nun bize sunduğu yeni pencereden geleceğin nasıl göründüğünü anlatmaya çalışacağım.
Önce şunu belirteyim, biz yapay zekâ deyince ChatGPT gibi Geniş Dil Modelleri’ni (LLM) anlıyoruz sıklıkla. Yapay zekâya sözcüklerle dert anlattığımız, bunu da yazarak yaptığımız bir modelden söz etmiş oluyoruz. Aslında biz kendi dilimizde, kendi sözcüklerimizle yapay zekâya ne yapmasını istediğimizi söylemiş oluyoruz. O da bunu anlıyor ve isteğimizi yerine getirip çıktısını da bize yine metin veya görüntü olarak iletiyor.
Yani aslında biz makinelerle konuşabilmek için kod yazmayı öğrenmedik de makinelere kendi dilimizi öğrettik gibi düşünün. Yoksa aynı istekleri birtakım karmaşık kodlarla anlatabilirdik. Ama artık isteğimizi kendi dilimizde yaptığımızda makine bunu anlıyor. Bu sayede onların nasıl çalışmasını istediğimizi rahatlıkla anlatabiliyoruz.
Bir de Çok Modlu Geniş Dil Modelleri var (MLLM). Aradaki fark basit: Bu kez işin içine ses, görüntü, video da giriyor. Yani artık yazarak anlatmamız da gerekmiyor. “Çok modlu” oldukları için makinelere konuşarak ve video aracılığıyla da dert anlatabileceğimiz yeni bir döneme giriyoruz.
Çok eskiden mektup yazardık haberleşmek için. Sonra telefonlaşmaya başladık. Daha sonra görüntülü konuşmaya… Aynısı oluyor şu anda. İşte ChatGPT4o tam da bu noktada yeni bir geleceğin demo’sunu sunuyor bize.
Buradaki en büyük sorun zamanlamaydı. Yani biz konuşacağız ve makine bunu aynı anda hem anlayacak hem de anında bize cevap verecek. Bunu ses ve videoda yapabilen ve iyi çalışan -Google’ın Gemini’ı bu iddiadaydı ama böyle bir performans gösteremiyordu- bir dil modeli daha önce olmamıştı. ChatGPT4o ise neredeyse eşzamanlı bir şekilde bizimle konuşuyor, videoda gördüklerini algılıyor ve bu sesler & görüntüler ile ne yapmasını istersek onu aynı anda yapıyor.
İşte bu yüzden 4o’nun pazarlama videolarını görünce şapkamız uçtu. Simultane tercüme yapabiliyor, bizi iş görüşmelerine hazırlayabiliyor, kameradan gördüğü bir köpeğin köpek olduğunu anlayabiliyor ve hatta iki ChatGPT4o birlikte şarkı söylüyor.
Buradan sonra gelin işin biraz spekülatif ve fütürist kısmına girelim: Bir kere klavyelere veda edeceğimizi söyleyebiliriz. Makinelerimize dert anlatmak için klavyeler aracılığıyla cümleler kurmamıza gerek kalmayacak. Yazı yazarken bile biz konuşacağız, yapay zekâ not alacak.........
© T24
visit website