LoslegenKostenlos loslegen

Stemming

Nachdem du den Text „ review “ bereinigt und Stoppwörter sowie Satzzeichen entfernt hast, kannst du die restlichen Wörter mit Hilfe von Stemming normalisieren, um sie auf ihre Grundform zu reduzieren. So kannst du ähnliche Wörter zusammenfassen, was deine Analyse konsistenter und effizienter macht.

Die Klasse „ PorterStemmer “ wurde bereitgestellt, zusammen mit einer Liste von „ clean_tokens “.

Diese Übung ist Teil des Kurses

Natürliche Sprachverarbeitung (NLP) in Python

Kurs anzeigen

Anleitung zur Übung

  • Initialisiere die „ PorterStemmer() “.
  • Verwende eine Listenkomprimierung, um jedes Token aus der Liste „ clean_tokens “ zu entfernen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create stemmer
stemmer = ____()

# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]

print(stemmed_tokens)
Code bearbeiten und ausführen