1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în Python

Connected

exercițiu

PCA într-un pipeline de modelare

Tocmai am văzut că Pokémon legendari tind să aibă statistici mai ridicate în general. Să vedem dacă putem adăuga un clasificator în pipeline-ul nostru care să detecteze Pokémon legendari față de cei non-legendari, pe baza componentelor principale.

Datele au fost preîncărcate și împărțite în seturi de antrenament și de testare: X_train, X_test, y_train, y_test.

Același lucru este valabil și pentru toate pachetele și clasele relevante (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()).

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Adaugă în pipeline un scaler, PCA limitat la 2 componente și un clasificator random forest cu random_state=0.