Mengurutkan fitur penting
Di antara kelebihannya, Decision Tree sangat populer karena dapat diinterpretasikan. Banyak model mampu memberikan prediksi akurat, tetapi Decision Tree juga dapat mengukur dampak berbagai fitur terhadap target. Di sini, model dapat memberi tahu Anda fitur mana yang paling kuat dan paling lemah pengaruhnya terhadap keputusan untuk keluar dari perusahaan. Dalam sklearn, Anda dapat memperoleh informasi ini dengan menggunakan atribut feature_importances_.
Pada latihan ini, Anda akan mendapatkan nilai kepentingan terkuantifikasi untuk setiap fitur, menyimpannya dalam DataFrame pandas (tabel bergaya Python), dan mengurutkannya dari yang paling penting hingga yang kurang penting. Kelasifier Decision Tree model_ best yang digunakan pada latihan sebelumnya tersedia di workspace Anda, begitu juga variabel features_test dan features_train.
pandas telah diimpor sebagai pd.
Latihan ini adalah bagian dari kursus
Analitik SDM: Memprediksi Perputaran Karyawan dengan Python
Petunjuk latihan
- Gunakan atribut
feature_importances_untuk menghitung tingkat kepentingan relatif fitur - Buat daftar fitur
- Simpan hasilnya di dalam sebuah DataFrame menggunakan fungsi
DataFrame(), dengan fitur sebagai baris dan nilai masing-masing sebagai sebuah kolom - Urutkan DataFrame
relative_importancesuntuk menempatkan fitur paling penting di bagian atas menggunakan fungsisort_values()dan cetak hasilnya
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate feature importances
feature_importances = model_best.____
# Create a list of features: done
feature_list = list(features)
# Save the results inside a DataFrame using feature_list as an index
relative_importances = pd.____(index=____, data=feature_importances, columns=["importance"])
# Sort values to learn most important features
relative_importances.____(by="importance", ascending=False)