IniziaInizia gratis

Altri operatori sulle stringhe e Twitter

In questo esercizio applicherai diversi operatori di stringa a tre stringhe, selezionate dal dataset tweets. Una tweets_list è già stata creata per te.

Devi costruire tre nuove liste applicando diversi operatori di stringa:

  • una lista che mantenga solo le lettere
  • una lista che mantenga solo i caratteri alfanumerici
  • una lista che mantenga solo le cifre

Le funzioni necessarie sono già state importate per te da nltk.

Questo esercizio fa parte del corso

Sentiment Analysis con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea una lista di token a partire da tweets_list.
  • Nella lista letters rimuovi tutte le cifre e gli altri caratteri, cioè mantieni solo le lettere.
  • In let_digits mantieni i caratteri alfanumerici ma rimuovi tutti gli altri caratteri.
  • Crea digits rimuovendo lettere e altri caratteri e mantenendo solo i numeri.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a list of lists, containing the tokens from list_tweets
tokens = [____(item) for item in tweets_list]

# Remove characters and digits , i.e. retain only letters
letters = [[word for word in item if ____.____] for item in tokens]
# Remove characters, i.e. retain only letters and digits
let_digits = [[word for word in item if ____.____] for item in tokens]
# Remove letters and characters, retain only digits
digits = [[word for word in item if ____.____] for item in tokens]

# Print the last item in each list
print('Last item in alphabetic list: ', letters[2])
print('Last item in list of alphanumerics: ', let_digits[2])
print('Last item in the list of digits: ', digits[2])
Modifica ed esegui il codice