1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Kategorická data v Tidyverse

Connected

Cvičení

Zkoumání počtu úrovní

dplyr nabízí dvě další funkce, které se při prozkoumávání datasetu hodí. První je slice_max(var, n = x), která vrátí prvních x řádků datasetu seřazených podle hodnoty var. Druhá je pull(), která umožňuje extrahovat sloupec a ponechat pouze samotné hodnoty bez názvu sloupce.

Například, kdybychom chtěli získat jako sadu hodnot dvě nejvyšší hodnoty mpg z klasického datasetu mtcars, napsali bychom:

mtcars %>%
  slice_max(mpg, n = 2) %>%
  pull(mpg)

Výsledek by byl:

[1] 32.4 33.9

Pokyny

100 XP
  • Pomocí slice_max() vypiš 3 řádky s nejvyšším počtem úrovní faktoru.
  • Vyfiltruj proměnnou CurrentJobTitleSelect a pomocí pull získej počet úrovní, které má.