Interpunctie verwijderen
Nu je de stopwoorden uit de feedbacktekst hebt verwijderd, is het tijd om interpunctie aan te pakken. De tokens die je in de vorige oefening hebt gekregen, bevatten nog leestekens, die vaak niet nodig zijn bij het categoriseren van feedback.
Jouw taak is om alle interpunctie uit de gegeven lijst met tokens te verwijderen, zodat de data nog schoner wordt.
Deze oefening maakt deel uit van de cursus
Natural Language Processing (NLP) in Python
Oefeninstructies
- Maak de lijst
filtered_tokensschoon door alle interpunctie te verwijderen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)