PCA dalam pipeline model
Kita baru melihat bahwa Pokemon legendaris cenderung memiliki statistik keseluruhan yang lebih tinggi. Mari kita coba menambahkan sebuah classifier ke pipeline kita yang mendeteksi Pokemon legendaris versus non-legendaris berdasarkan principal component.
Data telah dimuat sebelumnya untuk Anda dan dibagi menjadi himpunan data pelatihan dan pengujian: X_train, X_test, y_train, y_test.
Hal yang sama berlaku untuk semua paket dan kelas yang relevan (Pipeline(), StandardScaler(), PCA(), RandomForestClassifier()).
Latihan ini merupakan bagian dari kursus
Pengurangan Dimensi dengan Python
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Build the pipeline
pipe = Pipeline([
('scaler', ____),
('reducer', ____),
('classifier', ____)])