1. Apprendre
  2. /
  3. Cours
  4. /
  5. Apprentissage supervisé avec scikit-learn

Connected

Exercice

Centrer et mettre à l'échelle pour la régression

Maintenant que vous avez vu les avantages de la mise à l'échelle des données, vous allez utiliser un pipeline pour prétraiter les variables de music_df et bâtir un modèle de régression lasso afin de prédire l'intensité sonore d'une chanson.

X_train, X_test, y_train et y_test ont été créés à partir de l'ensemble de données music_df, où la cible est "loudness" et les variables explicatives sont toutes les autres colonnes du jeu de données. Lasso et Pipeline ont aussi été importés pour vous.

Notez que "genre" a été convertie en variable binaire où 1 indique une chanson rock et 0 représente les autres genres.

Instructions

100 XP
  • Importez StandardScaler.
  • Créez les étapes pour l'objet pipeline : un objet StandardScaler appelé "scaler" et un modèle lasso appelé "lasso" avec alpha réglé à 0.5.
  • Instanciez un pipeline dont les étapes mettent à l'échelle puis bâtissent un modèle de régression lasso.
  • Calculez la valeur de R au carré sur les données de test.