Résumer des données

Pour l’instant, nos données sont encore au format « une ligne par personne et par question ». Pour pouvoir les représenter graphiquement, nous allons transformer cela afin que chaque ligne corresponde à une question avec des informations récapitulatives sur les réponses à cette question.

Cet exercice fait partie du cours

<cours>Données catégorielles dans le Tidyverse</cours>

Voir le cours

Instructions de l’exercice

Résumez l’ensemble de données en deux colonnes : la question (c.-à-d. response_var) et une nouvelle colonne, perc_rude, qui est la moyenne de la colonne rude pour chaque question.
Enregistrez le résultat sous rude_behaviors, puis affichez votre nouveau jeu de données.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

rude_behaviors <- gathered_data %>%
    mutate(response_var = str_replace(response_var, '.*rude to ', '')) %>%
    mutate(response_var = str_replace(response_var, 'on a plane', '')) %>%
	# Remove rows that are NA in the value column
	filter(!is.na(value)) %>%
    mutate(rude = if_else(value %in% c("No, not rude at all", "No, not at all rude"), 0, 1)) %>%
    # Group by response_var
    ___ %>%
    # Create perc_rude, the percent considering each behavior rude
    ___

rude_behaviors

Modifier et exécuter le code