Dati dei tweet sulle compagnie aeree

Il data frame twitter_data contiene oltre 7.000 tweet sulle compagnie aeree. I tweet sono già stati classificati come reclami o non reclami nella colonna complaint_label. Vediamo quanti di questi tweet sono reclami.

Tieni presente che si tratta di dati reali da Twitter e, in quanto tali, c’è sempre il rischio che contengano volgarità o altri contenuti offensivi (in questo esercizio e in eventuali esercizi successivi che usano dati reali di Twitter).

Questo esercizio fa parte del corso

Introduzione all'analisi del testo in R

Visualizza corso

Istruzioni dell'esercizio

Carica il pacchetto tidyverse.
Fatti un’idea della dimensione e del contenuto dei dati stampando twitter_data.
Filtra twitter_data in modo che contenga solo i reclami. Quanti reclami ci sono nei dati?

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Load the tidyverse packages
___(___)

# Print twitter_data
___

# Print just the complaints in twitter_data
twitter_data %>% 
  ___(___ == ___)

Modifica ed esegui il codice