?>

Yapay Zekâ Sohbet Botları Detaylı Bir Araştırma Testine Sokuldu

Yapay zekâ sohbet botlarının doğru bilgiye ulaşma kabiliyetleri detaylı bir teste tabii tutuldu ve sonuçlar pek de beklediğiniz gibi değil.

Gündem - 2 ay önce

Yapay zekâ sohbet botları hızla yaygınlaşıyor ve birçoğumuz hayatımın her alanında kullanmaya başladık fakat eğer onları doğru bilgi kaynağı olarak görüyorsanız ciddi bir hata yapıyor olabilirsiniz.

Yeni bir araştırma yapay zekâ sohbet botlarının doğru bilgiye ulaşma konusunda sınıfta kaldığını gözler önüne seriyor.

Araştırma hangi aşamaları içeriyordu?

Columbia Journalism Review ve Tow Center for Digital Journalism tarafından yürütülen araştırma, sekiz yapay zekâ sohbet botunu gerçek haberler üzerinden test etti.

Araştırmacılar, her bir yapay zekâ sohbet botuna bir haberden alıntı vererek bu alıntının ana kaynağını bulmasını, ardından başlığını, yayıncısını ve yayın tarihini paylaşmalarını istedi. Araştırmada test edilen yapay zekâ sohbet botları şunlardı:

ChatGPTPerplexityPerplexity ProDeepSeekMicrosoft CopilotGrok-2Grok-3Gemini

Sonuçlar ise pek iç açıcı değildi. Çoğu sohbet botu ya yanlış bilgiler sundu ya da eksik yanıtlar verdi. Üstelik, yanıtlarının yanlış olduğu konusunda şüpheli bir tavır da sergilemeden doğru yanıtı sunduklarını kesin bir dille ifade ediyorlardı.

Yapay zekâ sohbet botları sadece %40 doğruluğa ulaşabildi

Araştırmanın tamamlanmasıyla birlikte yapay zekâ sohbet botlarına dair birtakım çarpıcı bulgulara ulaşıldı.

Sohbet botlarının ortalama doğruluk oranı %40’ın altında kaldı.En iyi sonuçları %63 doğruluk oranıyla Perplexity verdi.En kötü performansı %6 doğruluk oranıyla Grok-3 sergiledi.Ücretli sohbet botları, ücretsiz versiyonlara kıyasla daha şüpheli yaklaşım sergiledi ama yine de yanlış yanıtlar verdi.Birden fazla sohbet botu, haber sitelerinin erişim engellerini ihlal etti ve ödeme yapılması gereken içeriklere ulaşmanın yolunu buldu.

Peki araştırmadan çıkarılması gereken ders ne?

Araştırma, yapay zekâ sohbet botlarının doğru bilgiye ulaşma konusunda yetersiz olduğunu bir kez daha kanıtladı.

Uzmanlar, bu sistemlerin yalnızca ilham almak ve fikir üretmek için kullanılmasını ancak gerçek bilgi arayışında kesinlikle güvenilmemesini öneriyor.

Yapay zekâ ile ilgili diğer içeriklerimiz:

Kaynak: WEBTEKNO.COM

Haftanın Öne Çıkanları

19 Yıllık Konsol PS3'e Yeni Yazılım Güncellemesi Geldi

2025-03-05 17:08 - Gündem

İzmir'de belediye otobüsünde yangın çıktı! Yolcular tahliye edildi

2025-03-10 12:38 - Gündem

Elektrikli su ısıtıcısından akıma kapılan Gülcan, yaşamını yitirdi

2025-03-05 17:13 - Gündem

PKK şüphelisi, Yunanistan’a kaçmaya çalışırken yakalandı

2025-03-10 13:07 - Gündem

Kendilerini jandarma olarak tanıtıp 1 milyon TL dolandıran 5 şüpheli yakalandı

2025-03-05 18:07 - Gündem

Az Takipçili Instagram Hesapları Nasıl Milyonlara Ulaşıyor?

2025-03-10 13:23 - Gündem

2025 Model Audi A6 Avant Tanıtıldı

2025-03-05 18:23 - Gündem

ABD'de kızamık salgını 12 eyalete yayıldı

2025-03-10 13:32 - Gündem

Sel ve kuraklık 2025'te de dünyanın birçok bölgesi için risk oluşturuyor

2025-03-05 18:32 - Gündem

Sevenleri genç İbrahim'e ağlıyor

2025-03-10 13:37 - Gündem

İlgili Haberler

Pinterest, Yapay Zekâ İçeriklerini Ayıklamak İçin Yeni Araç Sunuyor

19:13 - Gündem

'Narkokapan - Mersin' operasyonu; 84 torbacı tutuklandı

19:08 - Gündem

Golfün dünya yıldızları Belek’te buluşacak

18:07 - Gündem

Visa Yeni Yapay Zekâ Destekli Ödeme Sistemini Tanıttı

17:33 - Gündem

Bakanlıktan, 'devlet hastanesinde cinsel istismar' iddiasına ilişkin açıklama

17:08 - Gündem

Günün Manşetleri

Kıbrıs Barış Harekatı'nın komutanlarından İbrahim Neşet İkiz için cenaze töreni

16:42 - Kıbrıs

Binali Yıldırım:Kuzey Kıbrıs Türk Cumhuriyeti, Türk dünyasının ayrılmaz bir parçası

16:08 - Gündem

Güney Kıbrıs ile Birleşik Arap Emirlikleri (BAE) arasında su konusunda anlaşma imzalandı

16:03 - Gündem

Bakan Kacır: “Teknoloji çağında haksız izolasyonlar anlamsız”

15:47 - Gündem

Cumhurbaşkanı Tatar: “Teknolojiyi benimseyen gençlerimizle geleceği hep birlikte inşa ediyoruz”

15:27 - Gündem