PCA dalam pipeline model
Kita baru melihat bahwa Pokemon legendaris cenderung memiliki statistik keseluruhan yang lebih tinggi. Mari kita coba menambahkan sebuah classifier ke pipeline kita yang mendeteksi Pokemon legendaris versus non-legendaris berdasarkan principal component.
Data telah dimuat sebelumnya untuk Anda dan dibagi menjadi himpunan data pelatihan dan pengujian: X_train, X_test, y_train, y_test.
Hal yang sama berlaku untuk semua paket dan kelas yang relevan (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()).
Latihan ini adalah bagian dari kursus
Pengurangan Dimensi dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build the pipeline
pipe = Pipeline([
('scaler', ____),
('reducer', ____),
('classifier', ____)])