1. Učit se
  2. /
  3. Projekty
  4. /
  5. HR Analytics: Predicting Employee Churn in R

Connected

Cvičení

Rozdělení dat

V tomto cvičení rozdělíš data na trénovací a testovací sadu pomocí balíčku caret. V následujících lekcích použiješ trénovací sadu k sestavení logistických regresních modelů a testovací sadu k jejich ověření.

Pokyny

100 XP
  • Načti balíček caret.
  • Nastav seed na hodnotu 567 a vytvoř datový oddíl, který rozdělí dataset emp_final v poměru 70 % / 30 % na trénovací a testovací část.
  • Vytvoř trénovací dataset výběrem čísel řádků uložených v index_train z datasetu emp_final.
  • Přiřaď zbývající pozorování z emp_final do testovací sady.