1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w R

Connected

ćwiczenie

Normalizacja i transformacja logarytmiczna

Masz do dyspozycji zbiór danych attrition_num z danymi liczbowymi o pracownikach, którzy odeszli z firmy. Cechy obejmują Age, DistanceFromHome oraz MonthlyRate.

Chcesz wykorzystać te dane do zbudowania modelu, który przewidzi, czy pracownik prawdopodobnie pozostanie w firmie – wynik zapisany jest w zmiennej Attrition, zmiennej binarnej zakodowanej jako factor. Przed przystąpieniem do modelowania chcesz ograniczyć ewentualne skośności rozkładów oraz zapobiec sytuacji, w której niektóre zmienne dominują nad innymi ze względu na różnice w skali.

Zbiór danych attrition_num oraz podziały na train i test są już wczytane.

Instrukcje

100 XP
  • Znormalizuj wszystkie liczbowe predyktory.
  • Zastosuj transformację logarytmiczną do wszystkich cech liczbowych, z przesunięciem o jeden.