BaşlayınÜcretsiz Başlayın

tf-idf nedir?

"computer" kelimesi için tf-idf ağırlığını hesaplamak istiyorsun. Bu kelime, 100 kelimelik bir belgede beş kez geçiyor. 200 belgeden oluşan bir derlemde, "computer" kelimesini 20 belge anıyor. tf-idf, terim sıklığı ile ters belge sıklığının çarpımı olarak hesaplanır.

Terim sıklığı = belgedeki tüm belirteçlere (token) göre kelimenin yüzde payı Ters belge sıklığı = derlemdeki toplam belge sayısının, terimi içeren belge sayısına bölümünün logaritması

Aşağıdaki seçeneklerden hangisi doğrudur?

Bu egzersiz

Python ile Doğal Dil İşlemeye Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün

Egzersizi başlat