Manuelle Berechnungen
Gegeben sind die folgenden 4 bereinigten Aussagen:
t1 <- "government turtle blue ocean"
t2 <- "crazy turtle ocean waves"
t3 <- "massive turtle washington lion"
t4 <- "lion pride massive ocean dinner"
Das \(TFIDF\) für "lion" in t4 lässt sich wie folgt berechnen:
\(TF = \frac{1}{5} = 0.2\)
\(IDF = log(4/2) = 0.693\)
\(TFIDF = 0.2 * 0.693\)
Berechne die \(TF\)- und \(IDF\)-Gewichte für 'turtle' in t1. Verwende \(IDF = log \frac{N}{n_{t}}\)
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit R
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten