ACP dans un pipeline de modèle

Nous avons vu que les Pokémon légendaires ont généralement des statistiques plus élevées. Voyons si nous pouvons ajouter un classifieur à notre pipeline pour distinguer les Pokémon légendaires des non-légendaires à partir des composantes principales.

Les données ont été préchargées et séparées en ensembles d’entraînement et de test : X_train, X_test, y_train, y_test.

Il en va de même pour tous les packages et classes pertinents (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()).

Cet exercice fait partie du cours

<cours>Réduction de dimension en Python</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Build the pipeline
pipe = Pipeline([
        ('scaler', ____),
        ('reducer', ____),
        ('classifier', ____)])

Modifier et exécuter le code