tf-idf nedir?
"computer" kelimesi için tf-idf ağırlığını hesaplamak istiyorsun. Bu kelime, 100 kelimelik bir belgede beş kez geçiyor. 200 belgeden oluşan bir derlemde, "computer" kelimesini 20 belge anıyor. tf-idf, terim sıklığı ile ters belge sıklığının çarpımı olarak hesaplanır.
Terim sıklığı = belgedeki tüm belirteçlere (token) göre kelimenin yüzde payı Ters belge sıklığı = derlemdeki toplam belge sayısının, terimi içeren belge sayısına bölümünün logaritması
Aşağıdaki seçeneklerden hangisi doğrudur?
Bu egzersiz
Python ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırUygulamalı interaktif egzersiz
İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün
Egzersizi başlat