Résumer des données

Créons maintenant un graphique à facettes pour comparer l’utilité entre différentes plateformes d’apprentissage.

Dans cet exercice, nous allons présenter une nouvelle fonction de dplyr, add_count(). add_count() ajoute une colonne au jeu de données, n, tout en conservant le même nombre de lignes que le jeu de données d’origine. Comme count(), n correspond par défaut au nombre de lignes pour chaque groupe, mais vous pouvez modifier cela avec l’argument wt (poids). Définissez wt égal à une autre colonne pour que n soit désormais égal à la somme de cette colonne pour chaque groupe.

Supposons que vous souhaitiez ajouter à iris une colonne correspondant à la somme de Petal.Length pour toutes les fleurs d’une même Species. Vous écririez :

iris %>%
   add_count(Species, wt = Petal.Length) %>%
   select(Species, Petal.Length, n)

Cela vous renverrait :

# A tibble: 150 x 3
   Species Petal.Length     n
   <fct>          <dbl> <dbl>
 1 setosa           1.4  73.1
 2 setosa           1.4  73.1
 3 virginica        6.4  278.

Cet exercice fait partie du cours

<cours>Données catégorielles dans le Tidyverse</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

learning_platform_usefulness %>%
  # Change dataset to one row per learning_platform usefulness pair with number of entries for each
  ___(___, ___)

Modifier et exécuter le code