IniziaInizia gratis

Conteggio dei tipi di utenti

I conteggi sono il riepilogo fondamentale per i dati categoriali. Poiché il testo è categoriale, è importante prendere dimestichezza con il calcolo dei conteggi. twitter_data è composto da lamentele e non-lamentele, come indicato dalla colonna complaint_label, e include anche una colonna che indica se l'utente è verificato oppure no (cioè è stato confermato da Twitter come la persona che dichiara di essere) chiamata usr_verified. Nota che questa colonna è di tipo <lgl>, cioè logico. Gli utenti verificati si lamentano di più?

Questo esercizio fa parte del corso

Introduzione all'analisi del testo in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto tidyverse, che include dplyr e ggplot2.
  • Filtra i dati per tenere solo i tweet che sono lamentele.
  • Conta il numero di utenti verificati e non verificati che si sono lamentati.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the tidyverse package
___(___)

twitter_data %>% 
  # Filter for just the complaints
  ___(___) %>% 
  # Count the number of verified and non-verified users
  ___(___)
Modifica ed esegui il codice