1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Unirea zborurilor cu aeroporturile de destinație

Ai fost angajat ca inginer de date pentru o companie de turism internațional. Prima ta sarcină este să ajuți compania să își îmbunătățească operațiunile analizând date despre zboruri. Ai la dispoziție două seturi de date în spațiul de lucru: unul cu detalii despre zboruri (flights) și altul cu informații despre aeroporturile de destinație (airports), ambele disponibile deja în spațiul de lucru.

Obiectivul tău? Combină aceste seturi de date pentru a crea un set de date complet care leagă fiecare zbor de aeroportul său de destinație.

Instrucțiuni

100 XP
  • Examinează DataFrame-ul airports. Identifică ce coloană cheie îți permite să unești airports cu tabelul flights.
  • Unește flights cu DataFrame-ul airports pe coloana "dest". Salvează rezultatul ca flights_with_airports.
  • Examinează din nou flights_with_airports. Observă informațiile noi care au fost adăugate.