USD 0,0000
EUR 0,0000
USD/EUR 0,00
ALTIN 000,00
BİST 0.000
Gündem

Yandex, Öneri Sistemleri İçin Yeni Veri Seti Yambda’yı Yayımladı

Yandex, Yandex Music verilerinden oluşan ve öneri sistemleri için hazırlanan 4,79 milyar etkileşimlik Yambda veri setini erişime açtı. Yambda, öneri sistemlerine yönelik 10 aylık müzik dinleme, beğenme ve etkileşim verilerini içeren büyük ölçekli açık veri seti olarak sunuldu. V

Yandex, Öneri Sistemleri İçin Yeni Veri Seti Yambda’yı Yayımladı
04-06-2025 19:32

Yandex, müzik akış servisi Yandex Music üzerinden elde ettiği yaklaşık 5 milyar kullanıcı etkileşiminden oluşan veri setini araştırmacıların kullanımına açtı. “Yambda” adı verilen bu set, öneri sistemleri alanında şimdiye kadar yayımlanmış en büyük açık veri kaynağı olma özelliği taşıyor.

Yamba veri seti, 10 aylık bir süreçte toplanan 4,79 milyar anonimleştirilmiş etkileşim verisini içeriyor. Kullanıcıların müzik dinleme, beğenme ve beğenmeme gibi etkileşimlerinden oluşan veri seti, hem örtülü hem açık geri bildirimleri kapsıyor. Aynı zamanda tüm veriler, zaman damgaları ve içerik önerisinin organik olup olmadığını belirten işaretlerle birlikte sunuluyor.

Farklı boyutlardaki veri setleri araştırmacılara açıldı

yandex yamba veri seti

Veri seti, öneri sistemleri üzerine çalışan araştırmacılar için farklı boyutlarda (50 milyon, 500 milyon ve 5 milyar etkinlik) erişilebilir hale getirildi. Apache Parquet formatında sunulan dosyalar, Spark ve Pandas gibi analiz araçlarıyla uyumlu olarak hazırlanmış durumda. Değerlendirme yöntemi olarak ise zaman bağını koruyan Global Temporal Split tekniği kullanılıyor.

Bu veri seti sayesinde araştırmacılar, öneri sistemlerini gerçek dünya senaryolarına daha yakın koşullarda test edebiliyor. Aynı zamanda mevcut temel modellerle karşılaştırmalar yapılmasını sağlayan değerlendirme metrikleri de sistemle birlikte sunuluyor.

Kaynak: WEBTEKNO.COM

ÇOK OKUNANLAR
ARŞİV ARAMA
PUAN DURUMU TÜMÜ
GÜNÜN KARİKATÜRÜ TÜMÜ
Karikatürler