LoslegenKostenlos starten

Lemmatisierung

Während du deine Analyse von Nutzerbewertungen fortsetzt, ist dir aufgefallen, dass Stemming manchmal nicht standardisierte Wörter wie „fli“ aus „flying“ erzeugt, was die Interpretierbarkeit verringern kann. Um dem entgegenzuwirken, verwendest du jetzt Lemmatisierung, die echte Wörter zurückgibt und die Klarheit und Genauigkeit deiner Analyse verbessert.

WordNetLemmatizer wurde importiert, stop_words ist definiert, und die erforderlichen NLTK-Ressourcen wurden heruntergeladen.

Diese Übung ist Teil des Kurses

<Kurs>Natural Language Processing (NLP) in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle eine Instanz lemmatizer der Klasse WordNetLemmatizer().
  • Verwende den lemmatizer, um die lower_tokens zu lemmatisieren.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create lemmatizer
lemmatizer = ____()

# Lemmatize each token
lemmatized_tokens = [____.____(____) for ____ in clean_tokens]

print(lemmatized_tokens)
Code bearbeiten und ausführen