Einen String aus GoT tokenisieren
Ein erster Standard-Schritt bei der Arbeit mit Text ist das Tokenisieren, also das Aufteilen eines größeren Strings in einzelne Strings, in der Regel einzelne Wörter (Tokens).
Ein String GoT wurde für dich erstellt; er enthält ein Zitat aus George R.R. Martins Game of Thrones. Deine Aufgabe ist, ihn in einzelne Tokens zu zerlegen.
Diese Übung ist Teil des Kurses
Stimmungsanalyse in Python
Anleitung zur Übung
- Importiere die Wort-Tokenisierungsfunktion aus
nltk. - Wandle den String
GoTin Wort-Tokens um.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the required function
from nltk import ____
# Transform the GoT string to word tokens
print(____(____))