Gündem

GPT-5, GPT-4o'dan Daha Fazla Halüsinasyon Görüyor

Yeni bir halüsinasyon testine göre OpenAI'ın yeni modeli GPT-5, GPT-4o'ya kıyasla daha fazla halüsinasyon görüyor. En çok halüsinasyon gören model de pek şaşırtıcı değil.

GPT-5, GPT-4o'dan Daha Fazla Halüsinasyon Görüyor
11-08-2025 20:43

OpenAI, geçtiğimiz hafta yeni modeli GPT-5'i kullanıma sunmuştu. CEO Sam Altman, bu yeni modelin bugüne kadarki en güçlü, hızlı ve güvenilir sürüm olduğunu söylerken, “halüsinasyon” dediğimiz, yapay zekânın uydurduğu bilgilerin de bu modelle çok daha az olacağının altı çizilmişti.

Vectara isimli bir platform ise bu iddiaları test etti. Sonuçlara göre GPT-5, halüsinasyon oranında GPT-4’ten daha iyi olsa da fark çok küçük. Teste göre GPT-4’ün %1,8’lik oranı, GPT-5’te %1,4’e düşmüş. GPT-4o ise %0,09 farkla GPT-5'in önünde. En iyi sonuç ise %0,795 ile OpenAI’nin o3-mini High Reasoning modelinde.

En çok halüsinasyon gören model ise Grok-4

Grok-4

Yine de GPT-5 hâlâ rakiplerinden çok daha güvenilir durumda. Örneğin Google’ın Gemini-2.5-pro’su %2,6, Grok-4 ise %4,8 oranında halüsinasyon görüyor.

Grok’un arkasındaki şirket xAI, son zamanlarda ünlülerin uygunsuz deepfake videolarını kolayca üretebilen “Spicy” modu yüzünden eleştirilerin odağında. Ayrıca verileri X'e dayalı olduğundan halüsinasyon oranını düşürmekte zorlanıyor.

Kaynak: WEBTEKNO.COM

BUNLAR DA İLGİNİZİ ÇEKEBİLİR
ÇOK OKUNAN HABERLER