Escala los datos para la regresión lasso
Para preparar el ajuste de un modelo de regresión lasso, es importante escalar los datos para que todas las características sean comparables entre sí. El conjunto completo de datos de ventas de casas de King County, California, está disponible en house_sales_df.
En este ejercicio, escalarás la variable objetivo, price, por separado antes de dividir los datos en conjuntos de entrenamiento y prueba. Esto se debe a cómo funcionan las recetas de tidymodels. No incluimos transformaciones de la variable objetivo en la receta.
Los paquetes tidyverse y tidymodels ya se han cargado por ti.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Escala la variable objetivo
priceenhouse_sales_dfusandoscale(). - Crea los conjuntos de entrenamiento y prueba con un 80% en el conjunto de entrenamiento.
- Crea la receta usando los datos de entrenamiento para escalar todos los predictores numéricos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Scale the target variable
house_sales_df <- ___ %>%
mutate(price = as.vector(___(___)))
# Create the training and testing sets
split <- ___(___, prop = ___)
train <- ___ %>% ___()
test <- ___ %>% ___()
# Create recipe to scale the predictors
lasso_recipe <-
___(___ ~ ., data = ___) %>%
___(___())