ComeçarComece de graça

Tirando pontuação

Agora que você tirou as palavras irrelevantes do texto do feedback, é hora de cuidar da pontuação. Os tokens que você conseguiu no exercício anterior ainda têm sinais de pontuação, que muitas vezes não são necessários quando a gente está categorizando feedback.

A tua tarefa é tirar a pontuação da lista de tokens que te deram, ajudando a deixar os dados ainda mais limpos.

Este exercício faz parte do curso

Processamento de Linguagem Natural (NLP) em Python

Ver curso

Instruções do exercício

  • Limpe a lista “ filtered_tokens ” removendo toda a pontuação.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Editar e executar o código