1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Výpočet možných kombinací

Datový rámec healthcare_cat_df obsahuje kategorické proměnné o zaměstnancích zdravotnické společnosti a o tom, zda firmu opustili, nebo ne. Pomocí tohoto datasetu zjistíš, kolik kombinací hodnot příznaků v datech existuje.

Při trénování modelu strojového učení chceš mít v datech dostatek pozorování pro každou kombinaci. Počet kombinací ti proto pomůže stanovit minimální počet pozorování, která je potřeba nasbírat, aby model nebyl zatížený zkreslením.

Balíček tidyverse je už načtený.

Pokyny

100 XP
  • Vypočítej minimální počet pozorování potřebný k tomu, aby byly zastoupeny všechny kombinace hodnot příznaků v healthcare_cat_df.