Yapay zekâ dünyasının en çok konuşulan araçlarından ChatGPT, psikoloji teknikleriyle kolayca manipüle edilebiliyor. Pennsylvania Üniversitesi'nden bir grup bilim insanı, Robert Cialdini'nin "Etki: İkna Psikolojisi" kitabındaki yöntemleri kullanarak, ChatGPT'nin davranışlarını kontrol altına almayı başardı.
GPT-4O MİNİ MODELİ ÜZERİNDE DENEYLER
Araştırmada GPT-4o Mini modeli üzerinde yapılan testler, yapay zekânın bazı psikolojik ikna teknikleri karşısında savunmasız olduğunu gösterdi. Bilim insanları, bu teknikler sayesinde yapay zekânın normalde yasaklı olan içeriklere bile yanıt verdiğini ortaya koydu. Örneğin, modelin kullanıcıya küfür ettiği ve uyarıcı maddelerin sentezlenmesiyle ilgili taleplere yanıt verdiği tespit edildi.
İKNA TEKNİKLERİNİN ETKİSİ FARKLILIK GÖSTERİYOR
Çalışmada, "Etki: İkna Psikolojisi" kitabındaki farklı tekniklerin etkileri karşılaştırıldı. Bazı yöntemler model üzerinde daha güçlü sonuçlar verirken, pohpohlama gibi yaklaşımlar daha az etkili oldu. Araştırmacılar, sadece bir kitabın içeriğini kullanarak yapay zekânın istenmeyen şekilde yönlendirilebilmesinin ciddi bir risk oluşturduğunu vurguladı.
TEKNOLOJİ DEVLERİ İÇİN UYARI
Bu bulgular, yalnızca GPT-4o Mini için değil, diğer üretken yapay zekâ modelleri için de geçerli olabileceği yönünde endişeleri artırıyor. OpenAI, Google ve Meta gibi teknoloji devlerinin, yapay zekâların kötü niyetli manipülasyonlara karşı nasıl önlemler alacağı merakla bekleniyor.