Scala i dati per la lasso regression
Per prepararti a stimare un modello di lasso regression, è importante scalare i dati in modo che tutte le feature siano tra loro confrontabili. L’insieme completo delle vendite di case della King County, California è disponibile in house_sales_df.
In questo esercizio, scalerai separatamente la variabile target, price, prima di suddividere i dati in set di training e di testing. Questo a causa del funzionamento delle recipe di tidymodels. Non includiamo le trasformazioni della variabile target nella recipe.
I pacchetti tidyverse e tidymodels sono già stati caricati per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Scala la variabile target
priceinhouse_sales_dfusandoscale(). - Crea i set di training e di testing con l’80% nel training set.
- Crea la recipe usando i dati di training per scalare tutti i predittori numerici.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Scale the target variable
house_sales_df <- ___ %>%
mutate(price = as.vector(___(___)))
# Create the training and testing sets
split <- ___(___, prop = ___)
train <- ___ %>% ___()
test <- ___ %>% ___()
# Create recipe to scale the predictors
lasso_recipe <-
___(___ ~ ., data = ___) %>%
___(___())