1. 학습
  2. /
  3. 강의
  4. /
  5. Redukcja wymiarowości w R

Connected

연습 문제

Skalowanie danych do regresji lasso

Przed dopasowaniem modelu regresji lasso warto przeskalować dane, tak aby wszystkie cechy były porównywalne. Pełny zbiór danych dotyczących sprzedaży domów w hrabstwie King w Kalifornii jest dostępny w house_sales_df.

W tym ćwiczeniu przeskalujesz zmienną docelową price osobno, zanim podzielisz dane na zbiór treningowy i testowy. Wynika to ze sposobu działania przepisów (ang. recipes) w tidymodels – transformacje zmiennej docelowej nie są uwzględniane w przepisie.

Pakiety tidyverse i tidymodels zostały już załadowane.

지침

100 XP
  • Przeskaluj zmienną docelową price w house_sales_df za pomocą scale().
  • Utwórz zbiór treningowy i testowy, przeznaczając 80% danych na zbiór treningowy.
  • Utwórz przepis (ang. recipe) na podstawie danych treningowych, aby przeskalować wszystkie numeryczne predyktory.