1. Apprendre
  2. /
  3. Cours
  4. /
  5. Apprentissage supervisé avec scikit-learn

Connected

Exercice

Centrage et mise à l'échelle pour la classification

Vous allez maintenant combiner la mise à l'échelle et la construction de modèle dans un pipeline pour la validation croisée.

Votre tâche est de construire un pipeline pour mettre à l'échelle les variables du jeu de données music_df et d'effectuer une validation croisée par recherche en grille en utilisant un modèle de régression logistique avec différentes valeurs pour l'hyperparamètre C. La variable cible ici est "genre", qui contient des valeurs binaires : rock comme 1 et tout autre genre comme 0.

StandardScaler, LogisticRegression et GridSearchCV ont déjà été importés pour vous.

Instructions

100 XP
  • Créez les étapes du pipeline : un objet StandardScaler() nommé "scaler", et un modèle de régression logistique nommé "logreg".
  • Créez parameters, en recherchant 20 valeurs réelles également espacées allant de 0.001 à 1.0 pour l'hyperparamètre C du modèle de régression logistique dans le pipeline.
  • Instanciez l'objet de recherche en grille.
  • Ajustez l'objet de recherche en grille aux données d'entraînement.