Satzzeichen entfernen
Nachdem du die Stoppwörter aus den Feedback-Texten entfernt hast, ist jetzt die Zeichensetzung dran. Die Tokens aus der vorherigen Übung enthalten noch Satzzeichen, die beim Kategorisieren von Feedback oft nicht benötigt werden.
Deine Aufgabe ist es, die Satzzeichen aus der bereitgestellten Token-Liste zu entfernen, um die Daten weiter zu bereinigen.
Diese Übung ist Teil des Kurses
<Kurs>Natural Language Processing (NLP) in Python</Kurs>Übungsanweisungen
- Bereinige die Liste
filtered_tokens, indem du alle Satzzeichen entfernst.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)