?>

o3 ve o4-mini, Eski Modellere Kıyasla Daha Fazla 'Halüsinasyon' Görüyor

OpenAI'ın geçtiğimiz günlerde kullanıma açtığı o3 ve o4-mini'nin eski modellere kıyasla daha fazla yanıltıcı bilgi sunduğu keşfedildi.

Gündem - 3 ay önce

OpenAI’ın kısa süre önce tanıttığı yeni yapay zekâ modelleri o3 ve o4-mini her ne kadar özellikleri ile beğenilmiş olsalar da eski modellerdeki can sıkıcı bir sorunla geldi.

Ortaya çıkan detaylara göre bu iki yeni modelin gerçek dışı bilgiler üretme eğilimi, önceki modellere kıyasla artmış durumda. OpenAI'ın kendi testlerine göre bu yeni modeller, hem eski “akıl yürütme” modelleri olan o1, o1-mini ve o3-mini'den hem de GPT-4o gibi daha geleneksel modellerden daha fazla 'halüsinasyon' görüyor.

Daha da dikkat çekici olan ise bu artışın sebebinin henüz tam olarak anlaşılamamış olması. OpenAI yayınladığı teknik raporda bu sorunun çözümü için daha fazla araştırmaya ihtiyaç duyduklarını kabul etmiş durumda.

Teknik veriler neler söylüyor?

OpenAI’ın şirket içi testlerine göre o3 modeli, insanlarla ilgili bilgileri değerlendiren PersonQA testinde soruların %33’ünde halüsinasyon gördü. Bu oran, o1 ve o3-mini'nin sırasıyla %16 ve %14,8 olan halüsinasyon oranlarının neredeyse iki katı. O4-mini ise bu alanda %48 ile daha da kötü bir performans sergiledi.

Üçüncü parti testlerde de benzer sonuçlar ortaya çıktı. Bağımsız araştırma laboratuvarı Transluce, o3 modelinin cevap verirken tamamen gerçek dışı işlem adımları uydurma eğiliminde olduğunu ortaya koydu.

Transluce’un kurucularından ve eski OpenAI çalışanı Neil Chowdhury’ye göre bu durumun sebebi modellerin eğitiminde kullanılan yöntemler olabilir ancak net bir sebebe dayandırmak şu aşamada güç.

Gücüne şüphe yok, peki ya güvenine?

o3 modeli her ne kadar bazı görevlerde, özellikle de kodlama ve matematikte başarılı sonuçlar verse de sık sık hatalı sonuçlar üretmesi ya da gerçekte olmayan kaynaklar sunması gibi ciddi sorunlara sahip.

Öte yandan mevcut hâliyle GPT-4o, OpenAI’ın SimpleQA testinde %90 doğruluk oranı yakalayarak hâlâ güçlü bir alternatif.

ChatGPT ile ilgili diğer içeriklerimiz:

Kaynak: WEBTEKNO.COM

Haftanın Öne Çıkanları

Huawei, Damar İzini Tanıyan Yeni Akıllı Kapı Kilidini Duyurdu

2025-04-16 22:27 - Gündem

Cumhurbaşkanı Tatar, Mağusa Spor Akademisini kabul etti

2025-04-18 20:02 - Kıbrıs

Hüseyin Tatlı'nın nasıl tutuklandığı ortaya çıktı: "Ben para falan ödemem lan"

2025-04-17 11:17 - Gündem

CTP’nin yeni Genel Sekreteri Erkut Şahali oldu

2025-04-15 21:58 - Kıbrıs

Ataoğlu, Turizm Haftası dolayısı ile mesaj yayımladı

2025-04-16 11:38 - Kıbrıs

Tartıştığı kişiyi tabancayla bacağından vurdu

2025-04-12 20:07 - Gündem

Polis aracının da karıştığı zincirleme kazada 2 polis memuru yaralandı

2025-04-19 14:07 - Gündem

BluTV Resmen İsmini Değiştirdi

2025-04-15 08:12 - Gündem

Kayıp Cumali'nin cansız bedenine ulaşıldı

2025-04-17 12:42 - Gündem

WhatsApp’a Yepyeni Bir Güncelleme Geliyor: Artık Mesajlar Anında Çevrilecek!

2025-04-18 23:27 - Gündem

İlgili Haberler

Avrupa’da yeni sınır kontrol sistemi 12 Ekim’de uygulanmaya başlayacak

19:07 - Gündem

En İyi Ücretsiz Xbox Oyunları

18:43 - Gündem

Başbakanlık’tan açıklama: ‘Asgari Ücrette eşitlik, sağlıkta katkı payı sona eriyor'

18:28 - Gündem

Senatech, yapay zeka destekli telefon değerlendirme platformunu duyurdu

18:13 - Gündem

Cronos: The New Dawn Yanlış Fiyattan Ön Siparişe Açıldı

18:08 - Gündem

Günün Manşetleri

Başbakanlık’tan açıklama: ‘Asgari Ücrette eşitlik, sağlıkta katkı payı sona eriyor'

18:28 - Gündem

DİMED’in Bahar Kermesi Geliri Sağlık Bakanlığı’na teslim edildi

18:23 - Kıbrıs

Bakan Dinçyürek’ten 1 Ağustos Toplumsal Direniş Bayramı mesajı

18:03 - Kıbrıs

Yeni asgari ücret Resmi Gazete’de bu akşam yayımlanarak yürürlüğe girecek

17:53 - Kıbrıs

İşveren tarafının itirazı reddedildi… Asgari ücret aynı kaldı

16:47 - Gündem