Contando tipos de usuários
Contagens são o resumo essencial para dados categóricos. Como texto é categórico, é importante ficar à vontade para calcular contagens. O twitter_data é composto por reclamações e não reclamações, conforme indicado pela coluna complaint_label, e também inclui uma coluna que indica se o usuário é verificado ou não (ou seja, se o Twitter confirmou que ele é quem diz ser) chamada usr_verified. Observe que essa coluna é do tipo <lgl>, ou seja, lógica. Usuários verificados reclamam mais?
Este exercício faz parte do curso
Introdução à Análise de Texto em R
Instruções do exercício
- Carregue o pacote
tidyverse, que incluidplyreggplot2. - Filtre os dados para manter apenas os tweets que são reclamações.
- Conte o número de usuários verificados e não verificados que reclamaram.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load the tidyverse package
___(___)
twitter_data %>%
# Filter for just the complaints
___(___) %>%
# Count the number of verified and non-verified users
___(___)