Conteggio dei tipi di utenti
I conteggi sono il riepilogo fondamentale per i dati categoriali. Poiché il testo è categoriale, è importante prendere dimestichezza con il calcolo dei conteggi. twitter_data è composto da lamentele e non-lamentele, come indicato dalla colonna complaint_label, e include anche una colonna che indica se l'utente è verificato oppure no (cioè è stato confermato da Twitter come la persona che dichiara di essere) chiamata usr_verified. Nota che questa colonna è di tipo <lgl>, cioè logico. Gli utenti verificati si lamentano di più?
Questo esercizio fa parte del corso
Introduzione all'analisi del testo in R
Istruzioni dell'esercizio
- Carica il pacchetto
tidyverse, che includedplyreggplot2. - Filtra i dati per tenere solo i tweet che sono lamentele.
- Conta il numero di utenti verificati e non verificati che si sono lamentati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the tidyverse package
___(___)
twitter_data %>%
# Filter for just the complaints
___(___) %>%
# Count the number of verified and non-verified users
___(___)