Résumer des données
Créons maintenant un graphique à facettes pour comparer l’utilité entre différentes plateformes d’apprentissage.
Dans cet exercice, nous allons présenter une nouvelle fonction de dplyr, add_count(). add_count() ajoute une colonne au jeu de données, n, tout en conservant le même nombre de lignes que le jeu de données d’origine. Comme count(), n correspond par défaut au nombre de lignes pour chaque groupe, mais vous pouvez modifier cela avec l’argument wt (poids). Définissez wt égal à une autre colonne pour que n soit désormais égal à la somme de cette colonne pour chaque groupe.
Supposons que vous souhaitiez ajouter à iris une colonne correspondant à la somme de Petal.Length pour toutes les fleurs d’une même Species. Vous écririez :
iris %>%
add_count(Species, wt = Petal.Length) %>%
select(Species, Petal.Length, n)
Cela vous renverrait :
# A tibble: 150 x 3
Species Petal.Length n
<fct> <dbl> <dbl>
1 setosa 1.4 73.1
2 setosa 1.4 73.1
3 virginica 6.4 278.
Cet exercice fait partie du cours
Données catégorielles dans le Tidyverse
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
learning_platform_usefulness %>%
# Change dataset to one row per learning_platform usefulness pair with number of entries for each
___(___, ___)