Stammen en lemma’s uit GoT
In deze oefening krijg je een paar zinnen uit George R.R. Martins Game of Thrones. Je taak is om stammen en lemma’s te maken van de gegeven GoT-string.
Onthoud dat stammen een woord terugbrengen tot de wortel, terwijl lemma’s een echt woord opleveren. De snelheid kan echter flink verschillen: stemming is vaak veel sneller. Let in stappen 2 en 3 op de totale tijd die elke bewerking kost. We gebruiken de methode time.time() om te meten hoe lang stemming en lemmatization duren.
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the required packages from nltk
from nltk.stem import ____, ____
from nltk import word_tokenize
porter = PorterStemmer()
WNlemmatizer = WordNetLemmatizer()
# Tokenize the GoT string
tokens = ____(GoT)