Removendo pontuação
Agora que você removeu as stop words do texto de feedback, é hora de lidar com a pontuação. Os tokens que você obteve no exercício anterior ainda contêm sinais de pontuação, que muitas vezes são desnecessários ao categorizar feedback.
Sua tarefa é remover a pontuação da lista de tokens fornecida, ajudando a limpar ainda mais os dados.
Este exercício faz parte do curso
Processamento de Linguagem Natural (NLP) em Python
Instruções do exercício
- Limpe a lista
filtered_tokensremovendo toda a pontuação.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)