IniziaInizia gratis

Scala i dati per la lasso regression

Per prepararti a stimare un modello di lasso regression, è importante scalare i dati in modo che tutte le feature siano tra loro confrontabili. L’insieme completo delle vendite di case della King County, California è disponibile in house_sales_df.

In questo esercizio, scalerai separatamente la variabile target, price, prima di suddividere i dati in set di training e di testing. Questo a causa del funzionamento delle recipe di tidymodels. Non includiamo le trasformazioni della variabile target nella recipe.

I pacchetti tidyverse e tidymodels sono già stati caricati per te.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in R

Visualizza il corso

Istruzioni dell'esercizio

  • Scala la variabile target price in house_sales_df usando scale().
  • Crea i set di training e di testing con l’80% nel training set.
  • Crea la recipe usando i dati di training per scalare tutti i predittori numerici.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Scale the target variable
house_sales_df <-  ___ %>% 
  mutate(price = as.vector(___(___)))

# Create the training and testing sets
split <- ___(___, prop = ___)
train <- ___ %>% ___()
test <-  ___ %>% ___()

# Create recipe to scale the predictors
lasso_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___()) 
Modifica ed esegui il codice