Centrage et mise à l’échelle pour la régression
Maintenant que vous avez constaté les avantages de la mise à l’échelle de vos données, vous allez utiliser un pipeline pour prétraiter les caractéristiques de music_df et construire un modèle de régression lasso pour déterminer l’intensité sonore d’une chanson.
X_train, X_test, y_train et y_test ont été créés à partir de l’ensemble de données music_df, la cible étant "loudness" et les caractéristiques étant toutes les autres colonnes de l’ensemble de données. Lasso et Pipeline ont également été importés pour vous.
Notez que "genre" a été converti en une caractéristique binaire où 1 indique une chanson rock et 0 représente d’autres genres.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions
- Importez
StandardScaler. - Créez les étapes pour l’objet pipeline, un objet
StandardScalerappelé"scaler", et un modèle lasso appelé"lasso"avecalphafixé à0.5. - Instanciez un pipeline avec des étapes pour mettre à l’échelle et construire un modèle de régression lasso.
- Calculez la valeur du R-carré sur les données de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import StandardScaler
____
# Create pipeline steps
steps = [("____", ____()),
("____", ____(alpha=____))]
# Instantiate the pipeline
pipeline = ____(____)
pipeline.fit(X_train, y_train)
# Calculate and print R-squared
print(____.____(____, ____))