MulaiMulai sekarang secara gratis

Mengurutkan fitur penting

Di antara kelebihannya, Decision Tree sangat populer karena dapat diinterpretasikan. Banyak model mampu memberikan prediksi akurat, tetapi Decision Tree juga dapat mengukur dampak berbagai fitur terhadap target. Di sini, model dapat memberi tahu Anda fitur mana yang paling kuat dan paling lemah pengaruhnya terhadap keputusan untuk keluar dari perusahaan. Dalam sklearn, Anda dapat memperoleh informasi ini dengan menggunakan atribut feature_importances_.

Pada latihan ini, Anda akan mendapatkan nilai kepentingan terkuantifikasi untuk setiap fitur, menyimpannya dalam DataFrame pandas (tabel bergaya Python), dan mengurutkannya dari yang paling penting hingga yang kurang penting. Kelasifier Decision Tree model_ best yang digunakan pada latihan sebelumnya tersedia di workspace Anda, begitu juga variabel features_test dan features_train.

pandas telah diimpor sebagai pd.

Latihan ini adalah bagian dari kursus

Analitik SDM: Memprediksi Perputaran Karyawan dengan Python

Lihat Kursus

Petunjuk latihan

  • Gunakan atribut feature_importances_ untuk menghitung tingkat kepentingan relatif fitur
  • Buat daftar fitur
  • Simpan hasilnya di dalam sebuah DataFrame menggunakan fungsi DataFrame(), dengan fitur sebagai baris dan nilai masing-masing sebagai sebuah kolom
  • Urutkan DataFrame relative_importances untuk menempatkan fitur paling penting di bagian atas menggunakan fungsi sort_values() dan cetak hasilnya

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Calculate feature importances
feature_importances = model_best.____

# Create a list of features: done
feature_list = list(features)

# Save the results inside a DataFrame using feature_list as an index
relative_importances = pd.____(index=____, data=feature_importances, columns=["importance"])

# Sort values to learn most important features
relative_importances.____(by="importance", ascending=False)
Edit dan Jalankan Kode