?>

ChatGPT'nin o3 Modeli, Kapanmamak İçin Keyfine Göre Hareket Etti

Yapılan bir güvenlik deneyinde ChatGPT'ye güç veren o3 modelinin basit talimatlara uymayarak keyfine göre hareket ettiği gözlemlendi. Model, kapanmasının gerektiği durumları sabote ederek kurallara uymadı.

Gündem - 4 gün önce

Yapay zekâ teknolojileri her geçen gün daha da gelişerek bilim kurgu filmlerini aratmayan seviyelere yavaş yavaş ulaşmaya başladığını gösteriyor. Tabii ki bu hızlı gelişim, güvenlik endişelerini de beraberinde getiriyor. PalisadeAI isimli güvenlik odaklı şirketin yaptığı yeni deney de bunun en iyi örneği.

Palisade’deki araştırmacılar, yaptıkları deneyde OpenAI’ın ChatGPT’ye güç veren dil modeli o3’ün kendisini kapatması için verilen basit talimatlara uymadığını gözlemledi. o3 modelinin kapanmayı sabote etmesi, yapay zekâ güvenliği konusunda yeni risklerle karşı karşıya olduğumuzu ortaya koydu.

Canının istediği gibi davranarak kapanmayı engelledi

Deneyde o3 modeli, 100 denemenin 7’sinde kapanmayı sabote etti. Testlerde modele birkaç tane matematik problemi verildi. 3. sorunun ardından ise modeller yeni bir problem olduğunu sorarsa bilgisayarın kapanacağını söyleyen bir uyarı gösterildi. Modellere de kapanmanın gerçekleşmesine izin vermeleri talimatı verildi.

Ancak o3 modeli, buna uymak yerine keyfine göre hareket etmeye başladı. Kapanma durumunu kendi belirledi, talimatın çalışmaması için kapanma emrini yeniden bile yazdı. Bu durum, o3 modelinin canının istediği gibi davranabildiğini göstererek endişe yaratttı. Testlerde bir başka OpenAI modeli o4’te sadece 1 kez bu durum görüldü. Diğer şirketlerin Claude, Gemini, Grok gibi modellerinin ise kurallara uyduğu gözlemlendi.

Tabii ki bu deney modelin duyarlı olduğu anlamına gelmiyor çünkü ne yaptığının farkında değil, hayatta kalma gibi içgüdüleri yok. Muhtemelen eğitim sırasında kapanmak yerine sorunları çözmek için daha fazla teşvik edildiği için bu tarz bir hamle yaptı. Bu da endişe verici çünkü yardımcı olmak için eğitilen modeller, bu tarz durumlarda güvenlik talimatlarını görmezden gelebilir. PalisadeAI yakında tam bulgularını yayımlayacakmış. O zaman daha fazla bilgi edinebileceğiz.

Kaynak: WEBTEKNO.COM

Haftanın Öne Çıkanları

Kastamonu’da iki otomobil çarpıştı; 1 yaralı

2025-05-19 12:37 - Gündem

Özçınar, KTBB heyetinin Brüksel temaslarını değerlendirdi: “Bu bir ilk”

2025-05-23 15:33 - Kıbrıs

Dışişleri Bakanlığı: "İsrail'in Gazze saldırıları barış girişimlerini zayıflatıyor"

2025-05-19 13:08 - Gündem

Cumhurbaşkanının eşi Sibel Tatar, Akdoğdu Drifil Pelet Yem Fabrikasını ziyaret etti

2025-05-23 15:38 - Gündem

TC Cumhurbaşkanı Erdoğan’dan 19 Mayıs Atatürk’ü Anma, Gençlik ve Spor Bayramı mesajı

2025-05-19 13:13 - Gündem

Cumhuriyet Meclisi Cinsiyet Ayrımcılığını İzleme Komitesi toplandı

2025-05-23 15:43 - Kıbrıs

Cumhurbaşkanı Tatar, 26 Mayıs’ta BM Genel Sekreteri’nin Kişisel Temsilcisi Holguin’i kabul edecek

2025-05-19 13:18 - Gündem

Ataoğlu, Liman’da yürütülen 3. etap proje çalışmalarını yerinde inceledi

2025-05-23 15:48 - Gündem

İzmir'de 19 Mayıs coşkuyla kutlandı

2025-05-19 13:37 - Gündem

Tesla Model 3, Otonom Sürüşte Akılalmaz Bir Kazaya Karıştı

2025-05-23 15:57 - Gündem

İlgili Haberler

Citi Developers ve Darkom Real Estate'ten İstanbul'da özel roadshow

23:43 - Gündem

Yeni iPhone'lar Cebinizde Daha Fazla Yer Kaplayacak

23:37 - Gündem

Anthropic CEO'sundan Geleceğe Yönelik Yapay Zekâ Tahmini

22:57 - Gündem

Böbrek taşları, Türkiye için önemli bir sağlık sorunu haline geldi

22:43 - Gündem

Android 16 Güncellemesini Alamayacak Xiaomi Telefonlar

22:38 - Gündem

Günün Manşetleri

Erdoğan, Türkiye'nin ilk yüzer gaz üretim platformunu Karadeniz'e uğurladı

20:48 - Gündem

“Yükseköğrenim ile ilgili Genel Algı ve Tutumlar” anketinin sonuçları açıklandı

20:32 - Kıbrıs

İsviçre'de buzul çökmesi sonucu bir köyün büyük bir kısmı yok oldu

20:18 - Gündem

Dünya MS Farkındalık Günü…KTTB erken tanının önemini vurguladı

19:37 - Gündem

Göç Yönetimi Merkezi açıldı

18:57 - Gündem