PCA in een modelpipeline
We zagen net dat legendarische Pokémon over het algemeen hogere stats hebben. Laten we kijken of we een classifier aan onze pipeline kunnen toevoegen die legendarische versus niet-legendarische Pokémon detecteert op basis van de hoofdcomponenten.
De data is alvast voor je ingeladen en opgesplitst in trainings- en testgegevenssets: X_train, X_test, y_train, y_test.
Hetzelfde geldt voor alle relevante pakketten en classes (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()).
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build the pipeline
pipe = Pipeline([
('scaler', ____),
('reducer', ____),
('classifier', ____)])