Dati dei tweet sulle compagnie aeree
Il data frame twitter_data contiene oltre 7.000 tweet sulle compagnie aeree. I tweet sono già stati classificati come reclami o non reclami nella colonna complaint_label. Vediamo quanti di questi tweet sono reclami.
Tieni presente che si tratta di dati reali da Twitter e, in quanto tali, c’è sempre il rischio che contengano volgarità o altri contenuti offensivi (in questo esercizio e in eventuali esercizi successivi che usano dati reali di Twitter).
Questo esercizio fa parte del corso
Introduzione all'analisi del testo in R
Istruzioni dell'esercizio
- Carica il pacchetto
tidyverse. - Fatti un’idea della dimensione e del contenuto dei dati stampando
twitter_data. - Filtra
twitter_datain modo che contenga solo i reclami. Quanti reclami ci sono nei dati?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the tidyverse packages
___(___)
# Print twitter_data
___
# Print just the complaints in twitter_data
twitter_data %>%
___(___ == ___)