De coëfficiënten interpreteren
Het lineaire regressiemodel voor vluchttijd als functie van afstand heeft de vorm
\(\text{duration} = \alpha + \beta \times \text{distance}\)
waarbij
- \(\alpha\) — intercept (het deel van de duur dat niet afhangt van de afstand) en
- \(\beta\) — coëfficiënt (de mate waarin de duur toeneemt als functie van de afstand; ook wel de helling genoemd).
Door naar de coëfficiënten van je model te kijken, kun je afleiden
- hoeveel van de gemiddelde vluchttijd eigenlijk op de grond wordt besteed en
- wat de gemiddelde snelheid tijdens een vlucht is.
Het lineaire regressiemodel is beschikbaar als regression.
Deze oefening maakt deel uit van de cursus
Machine Learning met PySpark
Oefeninstructies
- Wat is het intercept?
- Wat zijn de coëfficiënten? Dit is een vector.
- Haal het element uit de vector dat overeenkomt met de helling voor afstand.
- Bepaal de gemiddelde snelheid in km per uur.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Intercept (average minutes on ground)
inter = regression.____
print(inter)
# Coefficients
coefs = ____.____
print(coefs)
# Average minutes per km
minutes_per_km = ____.____[____]
print(minutes_per_km)
# Average speed in km per hour
avg_speed = ____ / ____
print(avg_speed)