IniziaInizia gratis

Stemming

Ora che hai pulito il testo di review e rimosso stop word e punteggiatura, sei pronto a normalizzare le parole rimanenti usando lo stemming per ridurle alla loro forma radice. Questo aiuta a raggruppare parole simili, rendendo l’analisi più coerente ed efficiente.

Ti sono stati forniti la classe PorterStemmer e un elenco di clean_tokens.

Questo esercizio fa parte del corso

Natural Language Processing (NLP) in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Inizializza PorterStemmer().
  • Usa una list comprehension per applicare lo stemming a ciascun token della lista clean_tokens.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create stemmer
stemmer = ____()

# Stem each token
stemmed_tokens = [____.____(____) for ____ in clean_tokens]

print(stemmed_tokens)
Modifica ed esegui il codice