1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w R

Connected

ćwiczenie

Imputacja brakujących wartości i tworzenie zmiennych dummy

Po wykryciu brakujących wartości w zbiorze danych attrition i ustaleniu, że brakuje ich całkowicie losowo (MCAR), decydujesz się na imputację metodą K najbliższych sąsiadów (KNN). Podczas konfigurowania przepisu (recipe) inżynierii cech postanawiasz utworzyć zmienne dummy dla wszystkich zmiennych nominalnych oraz zmienić rolę zmiennej ...1 na "ID", aby zachować ją w zbiorze danych jako odniesienie, bez wpływu na model.

Instrukcje

100 XP
  • Zaktualizuj rolę zmiennej ...1 na "ID".
  • Przeprowadź imputację brakujących wartości dla wszystkich predyktorów.
  • Utwórz zmienne dummy dla wszystkich nominalnych predyktorów.