Aan de slagGa gratis aan de slag

Handmatige berekeningen

Gegeven de volgende 4 opgeschoonde uitspraken hieronder:

t1 <- "government turtle blue ocean"
t2 <- "crazy turtle ocean waves"
t3 <- "massive turtle washington lion"
t4 <- "lion pride massive ocean dinner"

De \(TFIDF\) voor "lion" in t4 kan als volgt worden berekend:

  • \(TF = \frac{1}{5} = 0.2\)

  • \(IDF = log(4/2) = 0.693\)

  • \(TFIDF = .2 * 0.693\)

Bereken de \(TF\)- en \(IDF\)-gewichten voor 'turtle' in t1. Gebruik \(IDF = log \frac{N}{n_{t}}\)

Deze oefening maakt deel uit van de cursus

Introductie tot Natural Language Processing in R

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen