1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do PySpark

Connected

ćwiczenie

Łączenie lotów z lotniskami docelowymi

Właśnie zostałeś zatrudniony jako inżynier danych w globalnej firmie turystycznej. Twoje pierwsze zadanie polega na usprawnieniu operacji firmy poprzez analizę danych o lotach. W przestrzeni roboczej masz do dyspozycji dwa zbiory danych: jeden zawierający szczegóły dotyczące lotów (flights) oraz drugi z informacjami o lotniskach docelowych (airports) – oba są już dostępne.

Twój cel? Połącz te zbiory danych, aby stworzyć rozbudowany zbiór łączący każdy lot z odpowiadającym mu lotniskiem docelowym.

Instrukcje

100 XP
  • Zbadaj DataFrame airports. Zwróć uwagę, która kolumna kluczowa pozwoli ci połączyć airports z tabelą flights.
  • Połącz flights z DataFrame airports po kolumnie "dest". Zapisz wynik jako flights_with_airports.
  • Zbadaj ponownie flights_with_airports. Zwróć uwagę na nowe informacje, które zostały dodane.