Daten zusammenfassen
Erstellen wir jetzt ein facettiertes Diagramm, um die Nützlichkeit über verschiedene Lernplattformen zu vergleichen.
In dieser Übung lernst du eine neue dplyr-Funktion kennen: add_count(). add_count() fügt dem Datensatz eine Spalte n hinzu und behält dabei die gleiche Zeilenzahl wie der ursprüngliche Datensatz. Genau wie bei count() ist n standardmäßig die Anzahl der Zeilen pro Gruppe, aber das kannst du mit dem Argument wt (weight) ändern. Setze wt gleich einer anderen Spalte, damit n der Summe dieser Spalte pro Gruppe entspricht.
Angenommen, du willst iris eine Spalte hinzufügen, die die Summe von Petal.Length für alle Blumen derselben Species enthält. Das würdest du so schreiben:
iris %>%
add_count(Species, wt = Petal.Length) %>%
select(Species, Petal.Length, n)
Das ergibt:
# A tibble: 150 x 3
Species Petal.Length n
<fct> <dbl> <dbl>
1 setosa 1.4 73.1
2 setosa 1.4 73.1
3 virginica 6.4 278.
Diese Übung ist Teil des Kurses
Kategorische Daten im Tidyverse
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
learning_platform_usefulness %>%
# Change dataset to one row per learning_platform usefulness pair with number of entries for each
___(___, ___)