Anzahl der Ausprägungen ermitteln
Mit mutate() und summarize() in dplyr kannst du die Funktion across() verwenden, um anzugeben, dass das zweite Argument, also eine Funktion, auf alle Spalten angewendet wird, für die das erste Argument zutrifft.
Wir nutzen das zusammen mit tidyr, um die Anzahl der Ausprägungen (Levels) für jede Faktorvariable in multiple_choice_responses zu erhalten. pivot_longer() aus tidyr wandelt einen Datensatz vom Wide- in den Long-Format um. Seine beiden Argumente sind die neuen Spaltennamen — eine enthält die bisherigen Spaltennamen und eine alle Werte.
Diese Übung ist Teil des Kurses
Kategorische Daten im Tidyverse
Anleitung zur Übung
- Wandle alle Character-Spalten in Faktor-Spalten um und speichere den neuen Datensatz als
responses_as_factors. - Erstelle einen neuen Datensatz
number_of_levels, in dem du:summarizemitacrossnutzt, um die Funktionnlevels()auf jede Spalte anzuwenden.- Das Format des Datensatzes von wide zu long änderst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Change all the character columns to factors
responses_as_factors <- multiple_choice_responses %>%
mutate(___(is.character, as.factor))
number_of_levels <- responses_as_factors %>%
# Apply the function nlevels to each column
summarize(___(everything(), ___)) %>%
# Change the dataset from wide to long
___(everything(), names_to = "variable", values_to = "num_levels")