1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Rozdělení na trénovací a testovací sadu

Prvním krokem při trénování modelu je rozdělení dat na trénovací a testovací sadu. Balíček tidymodels tento proces výrazně zjednodušuje. Oddělení testovací sady ti umožní vyhodnotit natrénovaný model na datech, která model dosud neviděl.

Budeš pracovat s daty o odchodu zaměstnanců ze zdravotnické společnosti – obsahují informace o zaměstnancích a o tom, zda firmu opustili, nebo ne. Data jsou dostupná v attrition_df. Cílová proměnná je Attrition.

Balíčky tidyverse a tidymodels jsou už načtené.

Pokyny

100 XP
  • Inicializuj rozdělení dat tak, aby 80 % připadlo na trénovací sadu, a stratifikuj podle cílové proměnné Attrition.
  • Extrahuj trénovací sadu a ulož ji do proměnné train.
  • Extrahuj testovací sadu a ulož ji do proměnné test.