IniziaInizia gratis

Centratura e scalatura per la regressione

Ora che hai visto i vantaggi di scalare i tuoi dati, userai una pipeline per preelaborare le caratteristiche di music_df e costruire un modello di regressione lazo per prevedere il volume di una canzone.

X_train``X_test, y_train e y_test sono stati creati dal dataset music_df, dove il target è "loudness" e le caratteristiche sono tutte le altre colonne del dataset. Lasso e Pipeline sono stati importati per te.

Nota che "genre" è stato convertito in una caratteristica binaria in cui 1 indica una canzone rock e 0 rappresenta altri generi.

Questo esercizio fa parte del corso

Apprendimento supervisionato con scikit-learn

Visualizza il corso

Istruzioni dell'esercizio

  • Importazione StandardScaler.
  • Crea i passaggi per l'oggetto pipeline, un oggetto StandardScaler chiamato "scaler", e un modello lasso chiamato "lasso" con alpha impostato su 0.5.
  • Istanziare una pipeline con i passaggi per scalare e costruire un modello di regressione lazo.
  • Calcola il valore R-squared sui dati di prova.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import StandardScaler
____

# Create pipeline steps
steps = [("____", ____()),
         ("____", ____(alpha=____))]

# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)

# Calculate and print R-squared
print(____.____(____, ____))
Modifica ed esegui il codice