CommencerCommencer gratuitement

Suppression de la ponctuation

Maintenant que vous avez supprimé les mots vides du texte des commentaires, il est temps de traiter la ponctuation. Les jetons que vous avez obtenus dans l'exercice précédent contiennent encore des signes de ponctuation, qui sont souvent inutiles lors de la catégorisation des commentaires.

Votre tâche consiste à supprimer la ponctuation de la liste de tokens fournie, afin de nettoyer davantage les données.

Cet exercice fait partie du cours

Traitement du langage naturel (NLP) en Python

Afficher le cours

Instructions

  • Veuillez nettoyer la liste d'filtered_tokens s en supprimant tous les signes de ponctuation.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Modifier et exécuter le code