ComeçarComece de graça

Removendo pontuação

Agora que você removeu as stop words do texto de feedback, é hora de lidar com a pontuação. Os tokens que você obteve no exercício anterior ainda contêm sinais de pontuação, que muitas vezes são desnecessários ao categorizar feedback.

Sua tarefa é remover a pontuação da lista de tokens fornecida, ajudando a limpar ainda mais os dados.

Este exercício faz parte do curso

Processamento de Linguagem Natural (NLP) em Python

Ver curso

Instruções do exercício

  • Limpe a lista filtered_tokens removendo toda a pontuação.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Editar e executar o código