Random Forest Hiperparametrelerini Keşfetme
Hangi hiperparametrelerin mevcut olduğunu ve farklı hiperparametrelerin etkisini anlamak, her veri bilimcinin temel becerisidir. Modeller karmaşıklaştıkça ayarlayabileceğin birçok seçenek olur, ancak sadece bazıları modelin üzerinde büyük etki yaratır.
Şimdi mevcut bir random forest modelini (hiperparametreleri için bazı kötü seçimler yapılmış!) değerlendirecek, ardından yeni bir random forest modeli için daha iyi seçimler yapacak ve performansını ölçeceksin.
Elinde şunlar olacak:
X_train,X_test,y_train,y_testDataFrame'leri- Önceden eğitilmiş bir random forest tahminleyicisi,
rf_clf_old - Mevcut random forest tahminleyicisinin test kümesindeki tahminleri,
rf_old_predictions
Bu egzersiz
Python'da Hiperparametre Ayarlama
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print out the old estimator, notice which hyperparameter is badly set
print(____)
# Get confusion matrix & accuracy for the old rf_model
print("Confusion Matrix: \n\n {} \n Accuracy Score: \n\n {}".format(
confusion_matrix(____, ____),
accuracy_score(____, ____)))