Résumer des données
Pour l’instant, nos données sont encore au format « une ligne par personne et par question ». Pour pouvoir les représenter graphiquement, nous allons transformer cela afin que chaque ligne corresponde à une question avec des informations récapitulatives sur les réponses à cette question.
Cet exercice fait partie du cours
Données catégorielles dans le Tidyverse
Instructions
- Résumez l’ensemble de données en deux colonnes : la question (c.-à-d.
response_var) et une nouvelle colonne,perc_rude, qui est la moyenne de la colonnerudepour chaque question. - Enregistrez le résultat sous
rude_behaviors, puis affichez votre nouveau jeu de données.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
rude_behaviors <- gathered_data %>%
mutate(response_var = str_replace(response_var, '.*rude to ', '')) %>%
mutate(response_var = str_replace(response_var, 'on a plane', '')) %>%
# Remove rows that are NA in the value column
filter(!is.na(value)) %>%
mutate(rude = if_else(value %in% c("No, not rude at all", "No, not at all rude"), 0, 1)) %>%
# Group by response_var
___ %>%
# Create perc_rude, the percent considering each behavior rude
___
rude_behaviors