1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z PySpark

Connected

ćwiczenie

Manipulowanie kolumnami

Federalna Administracja Lotnictwa (FAA) uznaje lot za „opóźniony", gdy przylatuje co najmniej 15 minut po planowym czasie.

Kolejny etap przygotowania danych o lotach składa się z dwóch kroków:

  1. zamiana jednostek odległości – zastąpienie kolumny mile kolumną km;
  2. utworzenie kolumny logicznej (Boolean) wskazującej, czy dany lot był opóźniony.

Instrukcje

100 XP
  • Zaimportuj funkcję, która pozwoli zaokrąglić liczbę do określonej liczby miejsc po przecinku.
  • Na podstawie kolumny mile utwórz nową kolumnę km, zaokrąglając wartości do zera miejsc po przecinku. Jedna mila to 1,60934 km.
  • Usuń kolumnę mile.
  • Utwórz kolumnę label z wartością 1, gdy opóźnienie wynosiło co najmniej 15 minut, i wartością 0 w pozostałych przypadkach. Przemyśl dokładnie warunek logiczny.