PCA in een modelpipeline

We zagen net dat legendarische Pokémon over het algemeen hogere stats hebben. Laten we kijken of we een classifier aan onze pipeline kunnen toevoegen die legendarische versus niet-legendarische Pokémon detecteert op basis van de hoofdcomponenten.

De data is alvast voor je ingeladen en opgesplitst in trainings- en testgegevenssets: X_train, X_test, y_train, y_test.

Hetzelfde geldt voor alle relevante pakketten en classes (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()).

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Build the pipeline
pipe = Pipeline([
        ('scaler', ____),
        ('reducer', ____),
        ('classifier', ____)])

Code bewerken en uitvoeren