Aan de slagGa gratis aan de slag

Interpunctie verwijderen

Nu je de stopwoorden uit de feedbacktekst hebt verwijderd, is het tijd om interpunctie aan te pakken. De tokens die je in de vorige oefening hebt gekregen, bevatten nog leestekens, die vaak niet nodig zijn bij het categoriseren van feedback.

Jouw taak is om alle interpunctie uit de gegeven lijst met tokens te verwijderen, zodat de data nog schoner wordt.

Deze oefening maakt deel uit van de cursus

Natural Language Processing (NLP) in Python

Cursus bekijken

Oefeninstructies

  • Maak de lijst filtered_tokens schoon door alle interpunctie te verwijderen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Code bewerken en uitvoeren