Conversione in minuscolo
Stai analizzando le recensioni degli utenti per un sito di viaggi. Queste recensioni spesso includono maiuscole incoerenti come "TRAVEL" e "travel". Per preparare il testo all'analisi del sentiment e all'estrazione degli argomenti, per prima cosa convertirai tutte le parole in minuscolo, poi le tokenizzerai e le pulirai rimuovendo stop word e punteggiatura.
Sono stati forniti la funzione word_tokenize() e un elenco stop_words. Le risorse NLTK sono già state scaricate.
Questo esercizio fa parte del corso
Natural Language Processing (NLP) in Python
Istruzioni dell'esercizio
- Converti in minuscolo la
reviewfornita. - Tokenizza
lower_textin parole. - Usa una list comprehension per rimuovere stop word e punteggiatura utilizzando le liste
stop_wordsestring.punctuation.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
review = "I have been FLYING a lot lately and the Flights just keep getting DELAYED. Honestly, traveling for WORK gets exhausting with endless delays, but every trip teaches you something new!"
# Lowercase the review
lower_text = ____
# Tokenize the lower_text into words
tokens = ____
# Remove stop words and punctuation
clean_tokens = [____ if word ____ and word ____]
print(clean_tokens)