BaşlayınÜcretsiz Başlayın

Uçuş süresi modeli: Kalkış saatini ekleme

Önceki egzersizde kalkış saatleri dilimlendi (bucket) ve kukla değişkenlere dönüştürüldü. Şimdi bu kukla değişkenleri uçuş süresi için bir regresyon modeline dahil edeceksin.

Veriler flights içinde. km, org_dummy ve depart_dummy sütunları features içine birleştirildi; burada km indeks 0'da, org_dummy indeks 1'den 7'ye, depart_dummy ise 8'den 14'e kadar uzanıyor.

Veriler eğitim ve test kümelerine bölündü ve eğitim verileri üzerinde bir doğrusal regresyon modeli regression kuruldu. Test verileri üzerinde tahminler yapıldı ve predictions olarak mevcut.

Bu egzersiz

PySpark ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Test verileri üzerindeki tahminler için RMSE'yi bul.
  • OGG'den 21:00–24:00 arasında kalkan uçuşlar için yerde geçirilen ortalama süreyi bul.
  • OGG'den 03:00–06:00 arasında kalkan uçuşlar için yerde geçirilen ortalama süreyi bul.
  • JFK'den 03:00–06:00 arasında kalkan uçuşlar için yerde geçirilen ortalama süreyi bul.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Find the RMSE on testing data
from pyspark.ml.____ import ____
rmse = ____(____).____(____)
print("The test RMSE is", rmse)

# Average minutes on ground at OGG for flights departing between 21:00 and 24:00
avg_eve_ogg = regression.____
print(avg_eve_ogg)

# Average minutes on ground at OGG for flights departing between 03:00 and 06:00
avg_night_ogg = regression.____ + regression.____[9]
print(avg_night_ogg)

# Average minutes on ground at JFK for flights departing between 03:00 and 06:00
avg_night_jfk = regression.____ + regression.____[____] + regression.____[____]
print(avg_night_jfk)
Kodu Düzenle ve Çalıştır