BaşlayınÜcretsiz Başlayın

DataFrame'leri birleştir

Sonraki iki bölümde, üzerinde çalıştığımız uçuş verilerine dayanarak bir uçuşun gecikip gecikmeyeceğini tahmin eden bir model kuracaksın. Bu model, rotayı uçan uçakla ilgili bilgileri de içerecek, bu yüzden ilk adım iki tabloyu birleştirmek: flights ve planes!

Bu egzersiz

PySpark Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Önce, yinelenen sütun adlarını önlemek için planes içindeki year sütununu plane_year olarak yeniden adlandır.
  • tailnum sütununu anahtar olarak kullanarak flights tablosunu planes ile birleştirip model_data adlı yeni bir DataFrame oluştur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Rename year column
planes = planes.withColumnRenamed(____)

# Join the DataFrames
model_data = flights.join(____, on=____, how="leftouter")
Kodu Düzenle ve Çalıştır