BaşlayınÜcretsiz başlayın

tf-idf nedir?

"computer" kelimesi için tf-idf ağırlığını hesaplamak istiyorsun. Bu kelime, 100 kelimelik bir belgede beş kez geçiyor. 200 belgeden oluşan bir derlemde, "computer" kelimesini 20 belge anıyor. tf-idf, terim sıklığı ile ters belge sıklığının çarpımı olarak hesaplanır.

Terim sıklığı = belgedeki tüm belirteçlere (token) göre kelimenin yüzde payı Ters belge sıklığı = derlemdeki toplam belge sayısının, terimi içeren belge sayısına bölümünün logaritması

Aşağıdaki seçeneklerden hangisi doğrudur?

Bu egzersiz, kursun bir parçasıdır

Python ile Doğal Dil İşlemeye Giriş

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Teoriyi etkileşime dönüştürün, interaktif egzersizlerimizden biriyle

Egzersize başla