1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w R

Connected

ćwiczenie

Podziel dane na zbiór treningowy i testowy

Pierwszym krokiem trenowania modelu jest podział danych na zbiór treningowy i testowy. Pakiet tidymodels bardzo to ułatwia. Wydzielenie zbioru testowego pozwala ocenić wytrenowany model na danych, których wcześniej nie widział.

Skorzystasz z danych dotyczących rotacji pracowników w firmie ochrony zdrowia – zbiór zawiera informacje o pracownikach oraz o tym, czy odeszli z firmy. Dane są dostępne w obiekcie attrition_df. Zmienna docelowa to Attrition.

Pakiety tidyverse i tidymodels są już wczytane.

Instrukcje

100 XP
  • Zainicjalizuj podział danych, przeznaczając 80% na zbiór treningowy, i zastosuj stratyfikację według zmiennej docelowej Attrition.
  • Wyodrębnij zbiór treningowy i zapisz go w zmiennej train.
  • Wyodrębnij zbiór testowy i zapisz go w zmiennej test.