Rimozione della punteggiatura
Ora che hai rimosso le stop word dal testo dei feedback, è il momento di gestire la punteggiatura. I token ottenuti nell'esercizio precedente contengono ancora segni di punteggiatura, spesso inutili quando si categorizzano i feedback.
Il tuo compito è rimuovere la punteggiatura dall'elenco di token fornito, così da ripulire ulteriormente i dati.
Questo esercizio fa parte del corso
Natural Language Processing (NLP) in Python
Istruzioni dell'esercizio
- Pulisci la lista
filtered_tokensrimuovendo tutta la punteggiatura.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
import string
filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']
# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]
print(clean_tokens)