Centrado y escalado para la regresión
Ahora que ya has visto las ventajas de escalar los datos, utilizarás una canalización para preprocesar las características de music_df y construir un modelo de regresión Lasso para predecir el volumen de una canción.
X_train, X_test, y_train e y_test se han creado a partir del conjunto de datos music_df, donde el objetivo es "loudness" y las características son todas las demás columnas del conjunto de datos. Lasso y Pipeline también se han importado para ti.
Observa que "genre" se ha convertido en una característica binaria en la que 1 indica una canción de rock, y 0 representa otros géneros.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones del ejercicio
- Importa
StandardScaler. - Crea los pasos para el objeto canalización, un objeto
StandardScalerllamado"scaler", y un modelo de operador de selección y contracción mínima absoluta llamado"lasso"conalphaajustado a0.5. - Instancia una canalización con pasos para escalar y construir un modelo de regresión Lasso.
- Calcula el valor r_squared de los datos de prueba.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import StandardScaler
____
# Create pipeline steps
steps = [("____", ____()),
("____", ____(alpha=____))]
# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)
# Calculate and print R-squared
print(____.____(____, ____))