Memilih fitur penting
Pada latihan ini, tugas Anda adalah memilih hanya fitur-fitur paling penting yang akan digunakan oleh model final. Ingat, tingkat kepentingan relatif disimpan pada kolom importance dari DataFrame bernama relative_importances.
Latihan ini adalah bagian dari kursus
Analitik SDM: Memprediksi Perputaran Karyawan dengan Python
Petunjuk latihan
- Pilih hanya fitur dengan nilai
importancelebih tinggi dari 1%. - Buat daftar dari fitur-fitur tersebut dan cetak (ini sudah disiapkan untuk Anda).
- Menggunakan indeks yang disimpan dalam
selected_list, transformasikanfeatures_traindanfeatures_testagar hanya menyertakan fitur dengan importance lebih tinggi dari 1%.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]
# create a list from those features: done
selected_list = selected_features.index
# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]