tf-idf nedir?
"computer" kelimesi için tf-idf ağırlığını hesaplamak istiyorsun. Bu kelime, 100 kelimelik bir belgede beş kez geçiyor. 200 belgeden oluşan bir derlemde, "computer" kelimesini 20 belge anıyor. tf-idf, terim sıklığı ile ters belge sıklığının çarpımı olarak hesaplanır.
Terim sıklığı = belgedeki tüm belirteçlere (token) göre kelimenin yüzde payı Ters belge sıklığı = derlemdeki toplam belge sayısının, terimi içeren belge sayısına bölümünün logaritması
Aşağıdaki seçeneklerden hangisi doğrudur?
Bu egzersiz, kursun bir parçasıdır
Python ile Doğal Dil İşlemeye Giriş
Uygulamalı etkileşimli egzersiz
Teoriyi etkileşime dönüştürün, interaktif egzersizlerimizden biriyle
Egzersize başla