Aan de slagGa gratis aan de slag

Wat is tf-idf?

Je wilt het tf-idf-gewicht berekenen voor het woord "computer", dat vijf keer voorkomt in een document met 100 woorden. Gegeven een corpus met 200 documenten, waarvan 20 documenten het woord "computer" bevatten, kun je tf-idf berekenen door de termfrequentie te vermenigvuldigen met de inverse documentfrequentie.

Termfrequentie = percentage aandeel van het woord ten opzichte van alle tokens in het document Inverse documentfrequentie = logaritme van het totale aantal documenten in een corpus gedeeld door het aantal documenten dat de term bevat

Welke van de onderstaande opties is correct?

Deze oefening maakt deel uit van de cursus

Introductie tot Natural Language Processing in Python

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen