LoslegenKostenlos starten

Anzahl der Stufen untersuchen

dplyr hat zwei weitere Funktionen, die beim Erkunden eines Datensatzes nützlich sind. Die erste ist slice_max(var, n = x), die dir die ersten x Zeilen eines Datensatzes basierend auf dem Wert von var liefert. Die andere ist pull(), mit der du eine Spalte extrahieren und den Spaltennamen entfernen kannst, sodass nur die Werte der Spalte übrig bleiben.

Wenn wir zum Beispiel aus dem klassischen mtcars-Datensatz die beiden höchsten mpg-Werte als Werte-Menge erhalten möchten, würden wir schreiben:

mtcars %>%
  slice_max(mpg, n = 2) %>%
  pull(mpg)

Das ergibt:

[1] 32.4 33.9

Diese Übung ist Teil des Kurses

<Kurs>Kategorische Daten im Tidyverse</Kurs>
Kurs ansehen

Übungsanweisungen

  • Verwende slice_max(), um die 3 Zeilen mit der höchsten Anzahl an Faktorstufen auszugeben.
  • Filtere nach der Variablen CurrentJobTitleSelect und verwende pull, um die Anzahl ihrer Stufen zu erhalten.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Select the 3 rows with the highest number of levels
number_of_levels %>%
    ___(num_levels, n = 3)
    
number_of_levels %>%
	# Filter for where the column called variable equals CurrentJobTitleSelect
    filter(___) %>%
	# Pull num_levels
    ___
Code bearbeiten und ausführen