IniziaInizia gratis

Tokenizza una stringa da GoT

Un primo passo standard quando si lavora con il testo è tokenizzarlo, cioè suddividere una stringa più lunga in stringhe individuali, che di solito sono singole parole (token).

È stata creata per te una stringa GoT che contiene una citazione da Game of Thrones di George R.R. Martin. Il tuo compito è suddividerla in token individuali.

Questo esercizio fa parte del corso

Sentiment Analysis con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa la funzione di tokenizzazione delle parole da nltk.
  • Trasforma la stringa GoT in token di parola.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the required function
from nltk import ____

# Transform the GoT string to word tokens
print(____(____))
Modifica ed esegui il codice