Tirando pontuação
Agora que você tirou as palavras irrelevantes do texto do feedback, é hora de cuidar da pontuação. Os tokens que você conseguiu no exercício anterior ainda têm sinais de pontuação, que muitas vezes não são necessários quando a gente está categorizando feedback.
A tua tarefa é tirar a pontuação da lista de tokens que te deram, ajudando a deixar os dados ainda mais limpos.
Este exercício faz parte do curso
Processamento de Linguagem Natural (NLP) em Python
Instruções do exercício
- Limpe a lista “
filtered_tokens
” removendo toda a pontuação.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)