1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with PySpark

Connected

Cvičení

Model doby letu: Přidání času odletu

V předchozím cvičení byl čas odletu rozdělen do skupin a převeden na dummy proměnné. Teď je zahrneš do regresního modelu pro dobu letu.

Data jsou uložena v flights. Sloupce km, org_dummy a depart_dummy byly sestaveny do features, kde km má index 0, org_dummy pokrývá indexy 1 až 7 a depart_dummy indexy 8 až 14.

Data byla rozdělena na trénovací a testovací sadu a na trénovacích datech byl sestaven lineární regresní model regression. Předpovědi na testovacích datech jsou k dispozici jako predictions.

Pokyny

100 XP
  • Zjisti RMSE pro předpovědi na testovacích datech.
  • Zjisti průměrnou dobu strávenou na zemi pro lety odlétající z OGG mezi 21:00 a 24:00.
  • Zjisti průměrnou dobu strávenou na zemi pro lety odlétající z OGG mezi 03:00 a 06:00.
  • Zjisti průměrnou dobu strávenou na zemi pro lety odlétající z JFK mezi 03:00 a 06:00.