BaşlayınÜcretsiz Başlayın

Bir Logistic Regression modeli kur

Uçuş verilerini kullanarak bir Decision Tree modeli zaten kurdun. Şimdi aynı veriler üzerinde bir Logistic Regression modeli oluşturacaksın.

Amacın, bir uçuşun en az 15 dakika gecikme olasılığını (etiket 1) ya da gecikmemesini (etiket 0) tahmin etmek.

Elinde çeşitli yordayıcılar olsa da, şimdilik yalnızca mon, depart ve duration sütunlarını kullanacaksın. Bunlar, doğrudan bir Logistic Regression modeliyle kullanılabilecek sayısal özellikler. Kategorik özellikleri dahil etmek için biraz daha hazırlık yapman gerekecek. Takipte kal!

Veriler eğitim ve test kümelerine bölündü ve flights_train ile flights_test olarak hazır.

Bu egzersiz

PySpark ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir Logistic Regression sınıflandırıcısı oluşturmak için sınıfı içe aktar.
  • Bir sınıflandırıcı nesnesi oluştur ve eğitim verisi üzerinde eğit.
  • Test verisi için tahminler üret ve bir karmaşıklık matrisi (confusion matrix) oluştur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import the logistic regression class
from pyspark.ml.____ import ____

# Create a classifier object and train on training data
logistic = ____().____(____)

# Create predictions for the testing data and show confusion matrix
prediction = ____.____(____)
prediction.groupBy(____, ____).____().show()
Kodu Düzenle ve Çalıştır