Interpunktion entfernen
Nachdem du die Stoppwörter aus dem Feedback-Text entfernt hast, ist es Zeit, sich um die Zeichensetzung zu kümmern. Die Tokens, die du in der letzten Übung bekommen hast, haben noch immer Satzzeichen, die beim Sortieren von Feedback oft nicht gebraucht werden.
Deine Aufgabe ist es, die Satzzeichen aus der Liste der bereitgestellten Tokens zu entfernen, um die Daten noch weiter zu bereinigen.
Diese Übung ist Teil des Kurses
Natürliche Sprachverarbeitung (NLP) in Python
Anleitung zur Übung
- Mach die Liste „
filtered_tokens
“ sauber, indem du alle Satzzeichen löschst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)