Tokenize uma string de GoT
Um primeiro passo padrão ao trabalhar com texto é tokenizar, ou seja, dividir uma string maior em strings individuais, que geralmente são palavras (tokens).
Uma string GoT foi criada para você e contém uma citação de Game of Thrones, de George R.R. Martin. Sua tarefa é dividi-la em tokens individuais.
Este exercício faz parte do curso
Análise de Sentimentos em Python
Instruções do exercício
- Importe a função de tokenização de palavras de
nltk. - Transforme a string
GoTem tokens de palavras.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the required function
from nltk import ____
# Transform the GoT string to word tokens
print(____(____))