LoslegenKostenlos loslegen

Anzahl der Ausprägungen ermitteln

Mit mutate() und summarize() in dplyr kannst du die Funktion across() verwenden, um anzugeben, dass das zweite Argument, also eine Funktion, auf alle Spalten angewendet wird, für die das erste Argument zutrifft.

Wir nutzen das zusammen mit tidyr, um die Anzahl der Ausprägungen (Levels) für jede Faktorvariable in multiple_choice_responses zu erhalten. pivot_longer() aus tidyr wandelt einen Datensatz vom Wide- in den Long-Format um. Seine beiden Argumente sind die neuen Spaltennamen — eine enthält die bisherigen Spaltennamen und eine alle Werte.

Diese Übung ist Teil des Kurses

Kategorische Daten im Tidyverse

Kurs anzeigen

Anleitung zur Übung

  • Wandle alle Character-Spalten in Faktor-Spalten um und speichere den neuen Datensatz als responses_as_factors.
  • Erstelle einen neuen Datensatz number_of_levels, in dem du:
    • summarize mit across nutzt, um die Funktion nlevels() auf jede Spalte anzuwenden.
    • Das Format des Datensatzes von wide zu long änderst.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Change all the character columns to factors
responses_as_factors <- multiple_choice_responses %>%
    mutate(___(is.character, as.factor))

number_of_levels <- responses_as_factors %>%
	# Apply the function nlevels to each column
    summarize(___(everything(), ___)) %>%
    # Change the dataset from wide to long
    ___(everything(), names_to = "variable", values_to = "num_levels")
Code bearbeiten und ausführen