1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with PySpark

Connected

Cvičení

Model doby letu: Pouze vzdálenost

V tomto cvičení sestavíš regresní model pro predikci doby letu (sloupec duration).

Zatím model zjednodušíme — jako prediktor použiješ pouze vzdálenost letu (sloupec km).

Data jsou uložena v proměnné flights. První záznamy jsou zobrazeny v terminálu. Data byla také rozdělena na trénovací a testovací sadu, dostupné jako flights_train a flights_test.

Pokyny

100 XP
  • Vytvoř objekt lineární regrese. Zadej název sloupce s cílovou proměnnou. Natrénuj ho na trénovacích datech.
  • Proveď predikce na testovacích datech.
  • Vytvoř objekt pro vyhodnocení regrese a použij ho k výpočtu RMSE na testovacích datech.