Suppression de la ponctuation
Maintenant que vous avez supprimé les mots vides du texte des commentaires, il est temps de traiter la ponctuation. Les jetons que vous avez obtenus dans l'exercice précédent contiennent encore des signes de ponctuation, qui sont souvent inutiles lors de la catégorisation des commentaires.
Votre tâche consiste à supprimer la ponctuation de la liste de tokens fournie, afin de nettoyer davantage les données.
Cet exercice fait partie du cours
Traitement du langage naturel (NLP) en Python
Instructions
- Veuillez nettoyer la liste d'
filtered_tokens
s en supprimant tous les signes de ponctuation.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)