Önemli özellikleri sıralama
Decision Trees (Karar Ağaçları) yorumlanabilirlikleri sayesinde pek çok şeyin yanı sıra oldukça popülerdir. Birçok model doğru tahminler yapabilir, ancak Decision Trees farklı özelliklerin hedef üzerindeki etkisini niceliksel olarak da ifade edebilir. Burada, şirketten ayrılma kararını en çok ve en az etkileyen özellikleri söyleyebilir. sklearn içinde bu bilgiye feature_importances_ özniteliğini kullanarak ulaşabilirsin.
Bu egzersizde, her bir özelliğin niceliksel önemini alacak, bunları bir pandas DataFrame'ine (Python tarzı bir tablo) kaydedecek ve en önemliden en az önemliye doğru sıralayacaksın. Önceki egzersizlerde kullanılan model_ best Decision Tree Classifier çalışma alanında mevcut; ayrıca features_test ve features_train değişkenleri de var.
pandas kütüphanesi pd olarak içe aktarılmıştır.
Bu egzersiz
İK Analitiği: Python ile Çalışan Terkini (Churn) Tahmin Etme
kursunun bir parçasıdırEgzersiz talimatları
- Göreli özellik önemlerini hesaplamak için
feature_importances_özniteliğini kullan - Bir özellik listesi oluştur
- Sonuçları
DataFrame()fonksiyonunu kullanarak, özelliklerin satırlar ve bunların değerlerinin bir sütun olduğu bir DataFrame içinde kaydet - En önemli özellikleri üstte görmek için
relative_importancesDataFrame'inisort_values()fonksiyonuyla sırala ve sonucu yazdır
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Calculate feature importances
feature_importances = model_best.____
# Create a list of features: done
feature_list = list(features)
# Save the results inside a DataFrame using feature_list as an index
relative_importances = pd.____(index=____, data=feature_importances, columns=["importance"])
# Sort values to learn most important features
relative_importances.____(by="importance", ascending=False)