PCA in una pipeline di modello
Abbiamo appena visto che i Pokemon leggendari tendono ad avere statistiche complessivamente più alte. Vediamo se possiamo aggiungere un classificatore alla nostra pipeline che rilevi leggendari vs non leggendari basandosi sulle componenti principali.
I dati sono già stati caricati e suddivisi in insiemi di addestramento e di test: X_train, X_test, y_train, y_test.
Lo stesso vale per tutti i pacchetti e le classi rilevanti (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()).
Questo esercizio fa parte del corso
Riduzione della dimensionalità in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build the pipeline
pipe = Pipeline([
('scaler', ____),
('reducer', ____),
('classifier', ____)])