Satzzeichen entfernen
Nachdem du die Stoppwörter aus den Feedback-Texten entfernt hast, ist jetzt die Zeichensetzung dran. Die Tokens aus der vorherigen Übung enthalten noch Satzzeichen, die beim Kategorisieren von Feedback oft nicht benötigt werden.
Deine Aufgabe ist es, die Satzzeichen aus der bereitgestellten Token-Liste zu entfernen, um die Daten weiter zu bereinigen.
Diese Übung ist Teil des Kurses
Natural Language Processing (NLP) in Python
Anleitung zur Übung
- Bereinige die Liste
filtered_tokens, indem du alle Satzzeichen entfernst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)