1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Kategorická data v Tidyverse

Connected

Cvičení

Zjišťování počtu úrovní

S funkcemi mutate() a summarize() z balíčku dplyr můžeš použít funkci across(), která jejich druhý argument – funkci – aplikuje na všechny sloupce splňující podmínku prvního argumentu.

Spolu s balíčkem tidyr je využijeme ke zjištění počtu úrovní každé faktorové proměnné v datové sadě multiple_choice_responses. Funkce pivot_longer() z balíčku tidyr převede datovou sadu z širokého formátu na dlouhý. Přijímá dva argumenty: názvy nových sloupců — jeden obsahuje původní názvy sloupců a druhý všechny hodnoty.

Pokyny

100 XP
  • Převeď všechny textové sloupce na faktorové a novou datovou sadu ulož jako responses_as_factors.
  • Vytvoř novou datovou sadu number_of_levels, ve které:
    • Použiješ summarize s across a aplikuješ funkci nlevels() na každý sloupec.
    • Změníš formát datové sady ze širokého na dlouhý.