1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w Pythonie

Connected

ćwiczenie

Czym jest tf-idf?

Chcesz obliczyć wagę tf-idf dla słowa "computer", które pojawia się pięć razy w dokumencie zawierającym 100 słów. Korpus składa się z 200 dokumentów, z czego 20 zawiera słowo "computer". Wartość tf-idf oblicza się, mnożąc częstość terminu przez odwrotną częstość dokumentową.

Częstość terminu = procentowy udział danego słowa względem wszystkich tokenów w dokumencie Odwrotna częstość dokumentowa = logarytm z ilorazu łącznej liczby dokumentów w korpusie i liczby dokumentów zawierających dany termin

Która z poniższych odpowiedzi jest poprawna?

Instrukcje

50 XP

Możliwe odpowiedzi