IniziaInizia gratis

Lemmatizzazione

Proseguendo l’analisi delle recensioni degli utenti, hai notato che lo stemming a volte produce parole non standard, come "fli" da "flying", riducendo l’interpretabilità. Per risolvere questo problema userai la lemmatizzazione, che restituisce parole reali e aiuta a migliorare chiarezza e accuratezza dell’analisi.

WordNetLemmatizer è stato importato, stop_words è stato definito e le risorse necessarie di NLTK sono state scaricate.

Questo esercizio fa parte del corso

Natural Language Processing (NLP) in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un’istanza lemmatizer della classe WordNetLemmatizer().
  • Usa lemmatizer per lemmatizzare i lower_tokens.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

clean_tokens = ['flying', 'lot', 'lately', 'flights', 'keep', 'getting', 'delayed', 'honestly', 'traveling', 'work', 'gets', 'exhausting', 'endless', 'delays', 'every', 'travel', 'teaches', 'something', 'new']

# Create lemmatizer
lemmatizer = ____()

# Lemmatize each token
lemmatized_tokens = [____.____(____) for ____ in clean_tokens]

print(lemmatized_tokens)
Modifica ed esegui il codice