En iyi modeli geliştir ve test et
- Bölümde, aşağıdaki parametrelerin daha iyi bir model elde etmene olanak verdiğini buldun:
max_depth = 8,min_samples_leaf = 150,class_weight = "balanced"
Bu bölümde, bazı özelliklerin etkisinin ihmal edilebilir düzeyde olduğunu keşfettin. Sadece seçilmiş ve etkili az sayıda özellikle de doğru tahminler yapabileceğini fark ettin ve buna göre eğitim ve test kümelerini güncelleyerek features_train_selected ve features_test_selected değişkenlerini oluşturdun.
Elindeki tüm bu bilgilerle, artık çalışan ayrılmasını tahmin etmek için en iyi modeli geliştirecek ve uygun metriklerle değerlendireceksin.
features_train_selected ve features_test_selected değişkenleri çalışma alanında hazır; ayrıca recall_score ve roc_auc_score fonksiyonları senin için içe aktarıldı.
Bu egzersiz
İK Analitiği: Python ile Çalışan Terkini (Churn) Tahmin Etme
kursunun bir parçasıdırEgzersiz talimatları
- Açıklamada verilen parametrelerle en iyi modeli başlat.
- Modeli, eğitim setinden yalnızca seçilmiş özellikleri kullanarak eğit.
- Test setinden seçilmiş özelliklere dayalı bir tahmin yap.
- Modelin doğruluk (accuracy), duyarlılık (recall) ve ROC/AUC puanlarını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize the best model using parameters provided in description
model_best = DecisionTreeClassifier(____=____, ____=____, ____=____, random_state=42)
# Fit the model using only selected features from training set: done
model_best.fit(____, target_train)
# Make prediction based on selected list of features from test set
prediction_best = model_best.____(____)
# Print the general accuracy of the model_best
print(____.score(features_test_selected, target_test) * 100)
# Print the recall score of the model predictions
print(____(target_test, prediction_best) * 100)
# Print the ROC/AUC score of the model predictions
print(roc_auc_score(target_test, ____) * 100)