Random Forest'ı Değerlendirme
Bu son egzersizde, Random Forest modelinde çapraz doğrulama sonuçlarını değerlendireceksin.
Aşağıdakiler zaten oluşturuldu:
cv- eğitim verisine zaten fit edilmiş bir cross-validatorevaluator— birBinaryClassificationEvaluatornesnesi veflights_test— test verisi.
Bu egzersiz
PySpark ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Parametre ızgarasındaki tüm modeller için ortalama AUC metriklerinin bir listesini yazdır.
- En iyi model için ortalama AUC değerini göster. Bu listedeki en büyük AUC olacaktır.
- En iyi model için
maxDepthvefeatureSubsetStrategyparametrelerinin açıklamasını yazdır. - Test verisi üzerindeki en iyi model tahminlerinin AUC değerini göster.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Average AUC for each parameter combination in grid
print(cv.____)
# Average AUC for the best model
print(____(____))
# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))
# AUC for best model on testing data
print(evaluator.____(____.____(____)))