Gradient-Boosted Trees ile geciken uçuşlar
Daha önce Karar Ağacı kullanarak gecikme olasılığı yüksek uçuşlar için bir sınıflandırıcı kurmuştun. Bu egzersizde bir Karar Ağacı modelini Gradient-Boosted Trees modeliyle karşılaştıracaksın.
Uçuş verileri rastgele olarak flights_train ve flights_test olarak bölündü.
Bu egzersiz
PySpark ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Karar Ağacı ve Gradient-Boosted Tree sınıflandırıcıları oluşturmak için gereken sınıfları içe aktar.
- Karar Ağacı ve Gradient-Boosted Tree sınıflandırıcıları oluştur. Eğitim verisi üzerinde eğit.
- Bir değerlendirici oluştur ve her iki sınıflandırıcı için test verisi üzerinde AUC hesapla. Hangi model daha iyi performans gösteriyor?
- Gradient-Boosted Tree sınıflandırıcısı için ağaç sayısını ve özelliklerin göreli önemini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the classes required
from pyspark.ml.____ import ____, ____
from pyspark.ml.evaluation import BinaryClassificationEvaluator
# Create model objects and train on training data
tree = ____().____(____)
gbt = ____().____(____)
# Compare AUC on testing data
evaluator = ____()
print(evaluator.____(tree.____(____)))
print(evaluator.____(gbt.____(____)))
# Find the number of trees and the relative importance of features
print(gbt.____)
print(gbt.____)