BaşlayınÜcretsiz Başlayın

Random Forest'ı Değerlendirme

Bu son egzersizde, Random Forest modelinde çapraz doğrulama sonuçlarını değerlendireceksin.

Aşağıdakiler zaten oluşturuldu:

  • cv - eğitim verisine zaten fit edilmiş bir cross-validator
  • evaluator — bir BinaryClassificationEvaluator nesnesi ve
  • flights_test — test verisi.

Bu egzersiz

PySpark ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Parametre ızgarasındaki tüm modeller için ortalama AUC metriklerinin bir listesini yazdır.
  • En iyi model için ortalama AUC değerini göster. Bu listedeki en büyük AUC olacaktır.
  • En iyi model için maxDepth ve featureSubsetStrategy parametrelerinin açıklamasını yazdır.
  • Test verisi üzerindeki en iyi model tahminlerinin AUC değerini göster.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Average AUC for each parameter combination in grid
print(cv.____)

# Average AUC for the best model
print(____(____))

# What's the optimal parameter value for maxDepth?
print(cv.____.explainParam('____'))
# What's the optimal parameter value for featureSubsetStrategy?
print(cv.____.____(____))

# AUC for best model on testing data
print(evaluator.____(____.____(____)))
Kodu Düzenle ve Çalıştır