Bir Logistic Regression modeli kur
Uçuş verilerini kullanarak bir Decision Tree modeli zaten kurdun. Şimdi aynı veriler üzerinde bir Logistic Regression modeli oluşturacaksın.
Amacın, bir uçuşun en az 15 dakika gecikme olasılığını (etiket 1) ya da gecikmemesini (etiket 0) tahmin etmek.
Elinde çeşitli yordayıcılar olsa da, şimdilik yalnızca mon, depart ve duration sütunlarını kullanacaksın. Bunlar, doğrudan bir Logistic Regression modeliyle kullanılabilecek sayısal özellikler. Kategorik özellikleri dahil etmek için biraz daha hazırlık yapman gerekecek. Takipte kal!
Veriler eğitim ve test kümelerine bölündü ve flights_train ile flights_test olarak hazır.
Bu egzersiz
PySpark ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Bir Logistic Regression sınıflandırıcısı oluşturmak için sınıfı içe aktar.
- Bir sınıflandırıcı nesnesi oluştur ve eğitim verisi üzerinde eğit.
- Test verisi için tahminler üret ve bir karmaşıklık matrisi (confusion matrix) oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the logistic regression class
from pyspark.ml.____ import ____
# Create a classifier object and train on training data
logistic = ____().____(____)
# Create predictions for the testing data and show confusion matrix
prediction = ____.____(____)
prediction.groupBy(____, ____).____().show()