Handmatige berekeningen
Gegeven de volgende 4 opgeschoonde uitspraken hieronder:
t1 <- "government turtle blue ocean"
t2 <- "crazy turtle ocean waves"
t3 <- "massive turtle washington lion"
t4 <- "lion pride massive ocean dinner"
De \(TFIDF\) voor "lion" in t4 kan als volgt worden berekend:
\(TF = \frac{1}{5} = 0.2\)
\(IDF = log(4/2) = 0.693\)
\(TFIDF = .2 * 0.693\)
Bereken de \(TF\)- en \(IDF\)-gewichten voor 'turtle' in t1. Gebruik \(IDF = log \frac{N}{n_{t}}\)
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in R
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen