Centratura e scalatura per la regressione
Ora che hai visto i vantaggi di scalare i tuoi dati, userai una pipeline per preelaborare le caratteristiche di music_df e costruire un modello di regressione lazo per prevedere il volume di una canzone.
X_train``X_test, y_train e y_test sono stati creati dal dataset music_df, dove il target è "loudness" e le caratteristiche sono tutte le altre colonne del dataset. Lasso e Pipeline sono stati importati per te.
Nota che "genre" è stato convertito in una caratteristica binaria in cui 1 indica una canzone rock e 0 rappresenta altri generi.
Questo esercizio fa parte del corso
Apprendimento supervisionato con scikit-learn
Istruzioni dell'esercizio
- Importazione
StandardScaler. - Crea i passaggi per l'oggetto pipeline, un oggetto
StandardScalerchiamato"scaler", e un modello lasso chiamato"lasso"conalphaimpostato su0.5. - Istanziare una pipeline con i passaggi per scalare e costruire un modello di regressione lazo.
- Calcola il valore R-squared sui dati di prova.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import StandardScaler
____
# Create pipeline steps
steps = [("____", ____()),
("____", ____(alpha=____))]
# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)
# Calculate and print R-squared
print(____.____(____, ____))