Stämme und Lemmata aus GoT

In dieser Übung bekommst du ein paar Sätze aus George R. R. Martins Game of Thrones. Deine Aufgabe ist es, aus dem gegebenen GoT-String Stämme und Lemmata zu erzeugen.

Denk daran: Beim Stemming wird ein Wort auf seinen Wortstamm reduziert, während Lemmatization ein tatsächliches Wörterbuchwort liefert. Die Geschwindigkeit kann sich jedoch deutlich unterscheiden – Stemming ist meist viel schneller. Achte in Schritt 2 und 3 auf die Gesamtzeit, die jede Operation benötigt. Wir verwenden die Methode time.time(), um die Dauer für Stemming und Lemmatization zu messen.

Diese Übung ist Teil des Kurses

Stimmungsanalyse in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the required packages from nltk
from nltk.stem import ____, ____
from nltk import word_tokenize

porter = PorterStemmer()
WNlemmatizer = WordNetLemmatizer()

# Tokenize the GoT string
tokens = ____(GoT)

Code bearbeiten und ausführen