LoslegenKostenlos loslegen

Manuelle Berechnungen

Gegeben sind die folgenden 4 bereinigten Aussagen:

t1 <- "government turtle blue ocean"
t2 <- "crazy turtle ocean waves"
t3 <- "massive turtle washington lion"
t4 <- "lion pride massive ocean dinner"

Das \(TFIDF\) für "lion" in t4 lässt sich wie folgt berechnen:

  • \(TF = \frac{1}{5} = 0.2\)

  • \(IDF = log(4/2) = 0.693\)

  • \(TFIDF = 0.2 * 0.693\)

Berechne die \(TF\)- und \(IDF\)-Gewichte für 'turtle' in t1. Verwende \(IDF = log \frac{N}{n_{t}}\)

Diese Übung ist Teil des Kurses

Einführung in Natural Language Processing mit R

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten