Centrado y escalado para la regresión

Ahora que ya has visto las ventajas de escalar los datos, utilizarás una canalización para preprocesar las características de music_df y construir un modelo de regresión lasso para predecir el volumen de una canción.

X_train, X_test, y_train, y y_test se han creado a partir del conjunto de datos music_df, donde el objetivo es "loudness" y las características son todas las demás columnas del conjunto de datos. Lasso y Pipeline también se han importado para ti.

Observa que "genre" se ha convertido en una característica binaria en la que 1 indica una canción de rock, y 0 representa otros géneros.

Este ejercicio forma parte del curso

Aprendizaje supervisado con scikit-learn

Ver curso

Instrucciones de ejercicio

  • Importa StandardScaler.
  • Crea los pasos para el objeto canalización, un objeto StandardScaler llamado "scaler", y un modelo de lazo llamado "lasso" con alpha ajustado a 0.5.
  • Instanciar una canalización con pasos para escalar y construir un modelo de regresión lasso.
  • Calcula el valor R-cuadrado de los datos de prueba.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Import StandardScaler
____

# Create pipeline steps
steps = [("____", ____()),
         ("____", ____(alpha=____))]

# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)

# Calculate and print R-squared
print(____.____(____, ____))