1. Apprendre
  2. /
  3. Cours
  4. /
  5. Apprentissage supervisé avec scikit-learn

Connected

Exercice

Régression avec des variables catégorielles

Vous avez maintenant créé music_dummies, qui contient des variables binaires pour le genre de chaque chanson; il est temps d'entraîner un modèle de régression de crête (ridge) pour prédire la popularité des chansons.

music_dummies a été préchargé pour vous, ainsi que Ridge, cross_val_score, numpy sous np, et un objet KFold enregistré sous kf.

Le modèle sera évalué en calculant la RMSE moyenne. Mais d'abord, vous devrez convertir les scores de chaque pli en valeurs positives et en prendre la racine carrée. Cette mesure indique l'erreur moyenne des prédictions du modèle; elle peut donc être comparée à l'écart-type de la variable cible — "popularity".

Instructions

100 XP
  • Créez X, qui contient toutes les variables de music_dummies, et y, qui contient la colonne "popularity".
  • Instanciez un modèle de régression de crête en fixant alpha à 0.2.
  • Effectuez une validation croisée sur X et y avec le modèle ridge, en définissant cv à kf, et en utilisant l'erreur quadratique moyenne négative comme mesure d'évaluation.
  • Affichez les valeurs de RMSE en convertissant les scores négatifs en valeurs positives, puis en prenant la racine carrée.