PCA in una pipeline di modello

Abbiamo appena visto che i Pokemon leggendari tendono ad avere statistiche complessivamente più alte. Vediamo se possiamo aggiungere un classificatore alla nostra pipeline che rilevi leggendari vs non leggendari basandosi sulle componenti principali.

I dati sono già stati caricati e suddivisi in insiemi di addestramento e di test: X_train, X_test, y_train, y_test.

Lo stesso vale per tutti i pacchetti e le classi rilevanti (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()).

Questo esercizio fa parte del corso

Riduzione della dimensionalità in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Build the pipeline
pipe = Pipeline([
        ('scaler', ____),
        ('reducer', ____),
        ('classifier', ____)])

Modifica ed esegui il codice