BaşlayınÜcretsiz Başlayın

Gradient-Boosted Trees ile geciken uçuşlar

Daha önce Karar Ağacı kullanarak gecikme olasılığı yüksek uçuşlar için bir sınıflandırıcı kurmuştun. Bu egzersizde bir Karar Ağacı modelini Gradient-Boosted Trees modeliyle karşılaştıracaksın.

Uçuş verileri rastgele olarak flights_train ve flights_test olarak bölündü.

Bu egzersiz

PySpark ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Karar Ağacı ve Gradient-Boosted Tree sınıflandırıcıları oluşturmak için gereken sınıfları içe aktar.
  • Karar Ağacı ve Gradient-Boosted Tree sınıflandırıcıları oluştur. Eğitim verisi üzerinde eğit.
  • Bir değerlendirici oluştur ve her iki sınıflandırıcı için test verisi üzerinde AUC hesapla. Hangi model daha iyi performans gösteriyor?
  • Gradient-Boosted Tree sınıflandırıcısı için ağaç sayısını ve özelliklerin göreli önemini yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import the classes required
from pyspark.ml.____ import ____, ____
from pyspark.ml.evaluation import BinaryClassificationEvaluator

# Create model objects and train on training data
tree = ____().____(____)
gbt = ____().____(____)

# Compare AUC on testing data
evaluator = ____()
print(evaluator.____(tree.____(____)))
print(evaluator.____(gbt.____(____)))

# Find the number of trees and the relative importance of features
print(gbt.____)
print(gbt.____)
Kodu Düzenle ve Çalıştır