Centrado y escalado para la regresión
Ahora que ya has visto las ventajas de escalar los datos, utilizarás una canalización para preprocesar las características de music_df
y construir un modelo de regresión lasso para predecir el volumen de una canción.
X_train
, X_test
, y_train
, y y_test
se han creado a partir del conjunto de datos music_df
, donde el objetivo es "loudness"
y las características son todas las demás columnas del conjunto de datos. Lasso
y Pipeline
también se han importado para ti.
Observa que "genre"
se ha convertido en una característica binaria en la que 1
indica una canción de rock, y 0
representa otros géneros.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones de ejercicio
- Importa
StandardScaler
. - Crea los pasos para el objeto canalización, un objeto
StandardScaler
llamado"scaler"
, y un modelo de lazo llamado"lasso"
conalpha
ajustado a0.5
. - Instanciar una canalización con pasos para escalar y construir un modelo de regresión lasso.
- Calcula el valor R-cuadrado de los datos de prueba.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import StandardScaler
____
# Create pipeline steps
steps = [("____", ____()),
("____", ____(alpha=____))]
# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)
# Calculate and print R-squared
print(____.____(____, ____))