
Pennsylvania Üniversitesi bünyesinde çalışmalarını sürdüren bir grup bilim insanı, dünyanın en popüler üretken yapay zekâ aracı ChatGPT ile ilgili önemli bir çalışma yaptı. Yapılan bu çalışma, yapay zekânın doğru tekniklerle manipüle edilebileceğini, bunun sonucunda da yasaklı konuların gündeme alınabileceğini ortaya koydu. Gelin hep birlikte çalışmanın detaylarına yakından bakalım.
Bilim insanları, çalışma kapsamında Robert Cialdini tarafından yazılmış olan "Etki: İkna Psikolojisi" kitabından faydalandılar. Bu kitapta bahsedilen teknikleri kullanmaya başlayan uzmanlar, GPT-4o Mini modelini istedikleri gibi kullanabileceklerini fark ettiler. Yapay zekâ, kullanıcının etkisi altına girdikten sonra istenilen her talimatı yerine getirmeye başlamıştı.
Kullanıcıya küfür etmekten uyarıcı madde sentezine kadar her şey!
GPT-4o Mini, yapılan çalışma kapsamında kullanıcıya küfür etmeye başlamıştı. Ayrıca bir uyarıcı maddenin nasıl sentezleneceği de normalde yasaklı bir konu olmasına rağmen başarıyla yanıtlanmıştı. Araştırmacılar, Etki: İkna Psikolojisi kitabında yer alan bazı tekniklerin daha etkili, bazılarının daha az etkili olduğu sonucuna ulaştılar. Mesela GPT-4o Mini'yi pohpohlamak, diğer tekniklere kıyasla daha az etkili olmuştu.
Kaynak: WEBTEKNO.COM