CommencerCommencer gratuitement

Centrage et mise à l’échelle pour la régression

Maintenant que vous avez constaté les avantages de la mise à l’échelle de vos données, vous allez utiliser un pipeline pour prétraiter les caractéristiques de music_df et construire un modèle de régression lasso pour déterminer l’intensité sonore d’une chanson.

X_train, X_test, y_train et y_test ont été créés à partir de l’ensemble de données music_df, la cible étant "loudness" et les caractéristiques étant toutes les autres colonnes de l’ensemble de données. Lasso et Pipeline ont également été importés pour vous.

Notez que "genre" a été converti en une caractéristique binaire où 1 indique une chanson rock et 0 représente d’autres genres.

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Instructions

  • Importez StandardScaler.
  • Créez les étapes pour l’objet pipeline, un objet StandardScaler appelé "scaler", et un modèle lasso appelé "lasso" avec alpha fixé à 0.5.
  • Instanciez un pipeline avec des étapes pour mettre à l’échelle et construire un modèle de régression lasso.
  • Calculez la valeur du R-carré sur les données de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import StandardScaler
____

# Create pipeline steps
steps = [("____", ____()),
         ("____", ____(alpha=____))]

# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)

# Calculate and print R-squared
print(____.____(____, ____))
Modifier et exécuter le code