Centrage et mise à l’échelle pour la régression
Maintenant que vous avez constaté les avantages de la mise à l’échelle de vos données, vous allez utiliser un pipeline pour prétraiter les caractéristiques de music_df
et construire un modèle de régression lasso pour déterminer l’intensité sonore d’une chanson.
X_train
, X_test
, y_train
et y_test
ont été créés à partir de l’ensemble de données music_df
, la cible étant "loudness"
et les caractéristiques étant toutes les autres colonnes de l’ensemble de données. Lasso
et Pipeline
ont également été importés pour vous.
Notez que "genre"
a été converti en une caractéristique binaire où 1
indique une chanson rock et 0
représente d’autres genres.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Importez
StandardScaler
. - Créez les étapes pour l’objet pipeline, un objet
StandardScaler
appelé"scaler"
, et un modèle lasso appelé"lasso"
avecalpha
fixé à0.5
. - Instanciez un pipeline avec des étapes pour mettre à l’échelle et construire un modèle de régression lasso.
- Calculez la valeur du R-carré sur les données de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import StandardScaler
____
# Create pipeline steps
steps = [("____", ____()),
("____", ____(alpha=____))]
# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)
# Calculate and print R-squared
print(____.____(____, ____))