Gegevens samenvatten
Laten we nu een gefacetteerde plot maken om de bruikbaarheid tussen verschillende leermiddelen te vergelijken.
In deze oefening introduceren we een nieuwe dplyr-functie, add_count(). add_count() voegt een kolom toe aan de gegevensset, n, waarbij het aantal rijen gelijk blijft aan de oorspronkelijke gegevensset. Net als bij count() is n standaard het aantal rijen per groep, maar je kunt dat aanpassen met het argument wt (gewicht). Je zet wt gelijk aan een andere kolom zodat n gelijk wordt aan de som van die kolom per groep.
Stel dat je een kolom wilt toevoegen aan iris die de som is van de Petal.Length voor alle bloemen van dezelfde Species. Dan schrijf je:
iris %>%
add_count(Species, wt = Petal.Length) %>%
select(Species, Petal.Length, n)
Dit levert het volgende op:
# A tibble: 150 x 3
Species Petal.Length n
<fct> <dbl> <dbl>
1 setosa 1.4 73.1
2 setosa 1.4 73.1
3 virginica 6.4 278.
Deze oefening maakt deel uit van de cursus
Categorische gegevens in de Tidyverse
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
learning_platform_usefulness %>%
# Change dataset to one row per learning_platform usefulness pair with number of entries for each
___(___, ___)