MulaiMulai sekarang secara gratis

Memilih fitur penting

Pada latihan ini, tugas Anda adalah memilih hanya fitur-fitur paling penting yang akan digunakan oleh model final. Ingat, tingkat kepentingan relatif disimpan pada kolom importance dari DataFrame bernama relative_importances.

Latihan ini adalah bagian dari kursus

Analitik SDM: Memprediksi Perputaran Karyawan dengan Python

Lihat Kursus

Petunjuk latihan

  • Pilih hanya fitur dengan nilai importance lebih tinggi dari 1%.
  • Buat daftar dari fitur-fitur tersebut dan cetak (ini sudah disiapkan untuk Anda).
  • Menggunakan indeks yang disimpan dalam selected_list, transformasikan features_train dan features_test agar hanya menyertakan fitur dengan importance lebih tinggi dari 1%.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# select only features with relative importance higher than 1%
selected_features = relative_importances[relative_importances.____>0.01]

# create a list from those features: done
selected_list = selected_features.index

# transform both features_train and features_test components to include only selected features
features_train_selected = features_train[selected_list]
features_test_selected = ____[____]
Edit dan Jalankan Kode