BaşlayınÜcretsiz Başlayın

Uçuş süresi modeli: Sadece mesafe

Bu egzersizde uçuş süresini (duration sütunu) tahmin etmek için bir regresyon modeli kuracaksın.

Şimdilik modeli basit tutup, yalnızca uçuşun mesafesini (km sütunu) bir yordayıcı olarak dahil edeceksin.

Veriler flights içinde. İlk birkaç kayıt terminalde gösteriliyor. Bu veriler ayrıca eğitim ve test kümelerine ayrıldı ve flights_train ile flights_test olarak hazır.

Bu egzersiz

PySpark ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir doğrusal regresyon nesnesi oluştur. Etiket sütununun adını belirt. Eğitim verisine uydur.
  • Test verisi üzerinde tahmin yap.
  • Bir regresyon değerlendirme nesnesi oluştur ve test verisinde RMSE'yi değerlendirmek için kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

from pyspark.ml.regression import LinearRegression
from pyspark.ml.evaluation import RegressionEvaluator

# Create a regression object and train on training data
regression = ____(____).____(____)

# Create predictions for the testing data and take a look at the predictions
predictions = ____.____(____)
predictions.select('duration', 'prediction').show(5, False)

# Calculate the RMSE
____(____).____(predictions)
Kodu Düzenle ve Çalıştır