Tokenizza una stringa da GoT
Un primo passo standard quando si lavora con il testo è tokenizzarlo, cioè suddividere una stringa più lunga in stringhe individuali, che di solito sono singole parole (token).
È stata creata per te una stringa GoT che contiene una citazione da Game of Thrones di George R.R. Martin. Il tuo compito è suddividerla in token individuali.
Questo esercizio fa parte del corso
Sentiment Analysis con Python
Istruzioni dell'esercizio
- Importa la funzione di tokenizzazione delle parole da
nltk. - Trasforma la stringa
GoTin token di parola.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the required function
from nltk import ____
# Transform the GoT string to word tokens
print(____(____))