Supprimer la ponctuation
Maintenant que vous avez supprimé les stop words du texte de feedback, il est temps de gérer la ponctuation. Les jetons obtenus dans l’exercice précédent contiennent encore des signes de ponctuation, souvent inutiles pour catégoriser des retours.
Votre objectif est de retirer la ponctuation de la liste de jetons fournie, afin d’assainir davantage les données.
Cet exercice fait partie du cours
Natural Language Processing (NLP) in Python
Instructions
- Nettoyez la liste
filtered_tokensen supprimant toute la ponctuation.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)