Daten zusammenfassen

Erstellen wir jetzt ein facettiertes Diagramm, um die Nützlichkeit über verschiedene Lernplattformen zu vergleichen.

In dieser Übung lernst du eine neue dplyr-Funktion kennen: add_count(). add_count() fügt dem Datensatz eine Spalte n hinzu und behält dabei die gleiche Zeilenzahl wie der ursprüngliche Datensatz. Genau wie bei count() ist n standardmäßig die Anzahl der Zeilen pro Gruppe, aber das kannst du mit dem Argument wt (weight) ändern. Setze wt gleich einer anderen Spalte, damit n der Summe dieser Spalte pro Gruppe entspricht.

Angenommen, du willst iris eine Spalte hinzufügen, die die Summe von Petal.Length für alle Blumen derselben Species enthält. Das würdest du so schreiben:

iris %>%
   add_count(Species, wt = Petal.Length) %>%
   select(Species, Petal.Length, n)

Das ergibt:

# A tibble: 150 x 3
   Species Petal.Length     n
   <fct>          <dbl> <dbl>
 1 setosa           1.4  73.1
 2 setosa           1.4  73.1
 3 virginica        6.4  278.

Diese Übung ist Teil des Kurses

<Kurs>Kategorische Daten im Tidyverse</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

learning_platform_usefulness %>%
  # Change dataset to one row per learning_platform usefulness pair with number of entries for each
  ___(___, ___)

Code bearbeiten und ausführen