1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Uczenie maszynowe z PySpark

Connected

Exercise

Model czasu trwania lotu: sama odległość

W tym ćwiczeniu zbudujesz model regresji do przewidywania czasu trwania lotu (kolumna duration).

Na razie model będzie prosty – jako predyktor uwzględnisz wyłącznie odległość lotu (kolumna km).

Dane znajdują się w zmiennej flights. Pierwsze kilka rekordów jest wyświetlonych w terminalu. Dane zostały już podzielone na zbiory treningowy i testowy, dostępne jako flights_train i flights_test.

Instrukcje

100 XP
  • Utwórz obiekt regresji liniowej. Podaj nazwę kolumny etykiety. Dopasuj model do danych treningowych.
  • Wykonaj predykcje na danych testowych.
  • Utwórz obiekt ewaluatora regresji i użyj go do obliczenia RMSE na danych testowych.