CommencerCommencez gratuitement

Supprimer la ponctuation

Maintenant que vous avez supprimé les stop words du texte de feedback, il est temps de gérer la ponctuation. Les jetons obtenus dans l’exercice précédent contiennent encore des signes de ponctuation, souvent inutiles pour catégoriser des retours.

Votre objectif est de retirer la ponctuation de la liste de jetons fournie, afin d’assainir davantage les données.

Cet exercice fait partie du cours

<cours>Natural Language Processing (NLP) in Python</cours>
Voir le cours

Instructions de l’exercice

  • Nettoyez la liste filtered_tokens en supprimant toute la ponctuation.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Modifier et exécuter le code