CommencerCommencer gratuitement

Supprimer la ponctuation

Maintenant que vous avez supprimé les stop words du texte de feedback, il est temps de gérer la ponctuation. Les jetons obtenus dans l’exercice précédent contiennent encore des signes de ponctuation, souvent inutiles pour catégoriser des retours.

Votre objectif est de retirer la ponctuation de la liste de jetons fournie, afin d’assainir davantage les données.

Cet exercice fait partie du cours

Natural Language Processing (NLP) in Python

Afficher le cours

Instructions

  • Nettoyez la liste filtered_tokens en supprimant toute la ponctuation.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Modifier et exécuter le code