Altri operatori sulle stringhe e Twitter
In questo esercizio applicherai diversi operatori di stringa a tre stringhe, selezionate dal dataset tweets. Una tweets_list è già stata creata per te.
Devi costruire tre nuove liste applicando diversi operatori di stringa:
- una lista che mantenga solo le lettere
- una lista che mantenga solo i caratteri alfanumerici
- una lista che mantenga solo le cifre
Le funzioni necessarie sono già state importate per te da nltk.
Questo esercizio fa parte del corso
Sentiment Analysis con Python
Istruzioni dell'esercizio
- Crea una lista di token a partire da
tweets_list. - Nella lista
lettersrimuovi tutte le cifre e gli altri caratteri, cioè mantieni solo le lettere. - In
let_digitsmantieni i caratteri alfanumerici ma rimuovi tutti gli altri caratteri. - Crea
digitsrimuovendo lettere e altri caratteri e mantenendo solo i numeri.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]
# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]
# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])