1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Škálování dat pro lasso regresi

Než začneš trénovat model lasso regrese, je důležité data škálovat, aby byly všechny příznaky vzájemně srovnatelné. Kompletní dataset prodejů nemovitostí v King County (Kalifornie) je dostupný v house_sales_df.

V tomto cvičení škáluješ cílovou proměnnou price zvlášť, ještě před rozdělením dat na trénovací a testovací sadu. Je to proto, jak fungují recepty v tidymodels — transformace cílové proměnné do receptu nezahrnujeme.

Balíčky tidyverse a tidymodels jsou už načtené.

Pokyny

100 XP
  • Škáluj cílovou proměnnou price v house_sales_df pomocí scale().
  • Rozděl data na trénovací a testovací sadu tak, aby trénovací sada obsahovala 80 % dat.
  • Vytvoř recept z trénovacích dat, který škáluje všechny numerické prediktory.