LoslegenKostenlos starten

Satzzeichen entfernen

Nachdem du die Stoppwörter aus den Feedback-Texten entfernt hast, ist jetzt die Zeichensetzung dran. Die Tokens aus der vorherigen Übung enthalten noch Satzzeichen, die beim Kategorisieren von Feedback oft nicht benötigt werden.

Deine Aufgabe ist es, die Satzzeichen aus der bereitgestellten Token-Liste zu entfernen, um die Daten weiter zu bereinigen.

Diese Übung ist Teil des Kurses

<Kurs>Natural Language Processing (NLP) in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Bereinige die Liste filtered_tokens, indem du alle Satzzeichen entfernst.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Code bearbeiten und ausführen