LoslegenKostenlos loslegen

Satzzeichen entfernen

Nachdem du die Stoppwörter aus den Feedback-Texten entfernt hast, ist jetzt die Zeichensetzung dran. Die Tokens aus der vorherigen Übung enthalten noch Satzzeichen, die beim Kategorisieren von Feedback oft nicht benötigt werden.

Deine Aufgabe ist es, die Satzzeichen aus der bereitgestellten Token-Liste zu entfernen, um die Daten weiter zu bereinigen.

Diese Übung ist Teil des Kurses

Natural Language Processing (NLP) in Python

Kurs anzeigen

Anleitung zur Übung

  • Bereinige die Liste filtered_tokens, indem du alle Satzzeichen entfernst.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Code bearbeiten und ausführen