IniziaInizia gratis

Rimozione della punteggiatura

Ora che hai rimosso le stop word dal testo dei feedback, è il momento di gestire la punteggiatura. I token ottenuti nell'esercizio precedente contengono ancora segni di punteggiatura, spesso inutili quando si categorizzano i feedback.

Il tuo compito è rimuovere la punteggiatura dall'elenco di token fornito, così da ripulire ulteriormente i dati.

Questo esercizio fa parte del corso

Natural Language Processing (NLP) in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Pulisci la lista filtered_tokens rimuovendo tutta la punteggiatura.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

import string

filtered_tokens = ['reached', 'support', 'got', 'helpful', 'response', 'within', 'minutes', '!', '!', '!', '#', 'impressed']

# Remove punctuation
clean_tokens = [____ for word in filtered_tokens if ____ not in ____.____]

print(clean_tokens)
Modifica ed esegui il codice