Stämme und Lemmata aus GoT
In dieser Übung bekommst du ein paar Sätze aus George R. R. Martins Game of Thrones. Deine Aufgabe ist es, aus dem gegebenen GoT-String Stämme und Lemmata zu erzeugen.
Denk daran: Beim Stemming wird ein Wort auf seinen Wortstamm reduziert, während Lemmatization ein tatsächliches Wörterbuchwort liefert. Die Geschwindigkeit kann sich jedoch deutlich unterscheiden – Stemming ist meist viel schneller. Achte in Schritt 2 und 3 auf die Gesamtzeit, die jede Operation benötigt. Wir verwenden die Methode time.time(), um die Dauer für Stemming und Lemmatization zu messen.
Diese Übung ist Teil des Kurses
<Kurs>Stimmungsanalyse in Python</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import the required packages from nltk
from nltk.stem import ____, ____
from nltk import word_tokenize
porter = PorterStemmer()
WNlemmatizer = WordNetLemmatizer()
# Tokenize the GoT string
tokens = ____(GoT)