IniziaInizia gratis

Conversione in minuscolo

Stai analizzando le recensioni degli utenti per un sito di viaggi. Queste recensioni spesso includono maiuscole incoerenti come "TRAVEL" e "travel". Per preparare il testo all'analisi del sentiment e all'estrazione degli argomenti, per prima cosa convertirai tutte le parole in minuscolo, poi le tokenizzerai e le pulirai rimuovendo stop word e punteggiatura.

Sono stati forniti la funzione word_tokenize() e un elenco stop_words. Le risorse NLTK sono già state scaricate.

Questo esercizio fa parte del corso

Natural Language Processing (NLP) in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Converti in minuscolo la review fornita.
  • Tokenizza lower_text in parole.
  • Usa una list comprehension per rimuovere stop word e punteggiatura utilizzando le liste stop_words e string.punctuation.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

review = "I have been FLYING a lot lately and the Flights just keep getting DELAYED. Honestly, traveling for WORK gets exhausting with endless delays, but every trip teaches you something new!"

# Lowercase the review
lower_text = ____

# Tokenize the lower_text into words
tokens = ____

# Remove stop words and punctuation
clean_tokens = [____ if word ____ and word ____]

print(clean_tokens)
Modifica ed esegui il codice