Interprétation des coefficients
Le modèle de régression linéaire pour la durée du vol en fonction de la distance prend la forme suivante :
\(\text{duration} = \alpha + \beta \times \text{distance}\)
où
- \(\alpha\) — interception (composante de la durée qui ne dépend pas de la distance) et
- \(\beta\) — coefficient (taux d'augmentation de la durée en fonction de la distance ; également appelé pente).
En examinant les coefficients de votre modèle, vous pourrez déduire
- Quelle proportion de la durée moyenne d'un vol est réellement passée au sol ?
- Quelle est la vitesse moyenne pendant un vol ?
Le modèle de régression linéaire est disponible à l'adresse regression
.
Cet exercice fait partie du cours
Apprentissage automatique avec PySpark
Instructions
- Quelle est l'interception ?
- Quels sont les coefficients ? Il s'agit d'un vecteur.
- Extrayez l'élément du vecteur qui correspond à la pente pour la distance.
- Veuillez calculer la vitesse moyenne en kilomètres par heure.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Intercept (average minutes on ground)
inter = regression.____
print(inter)
# Coefficients
coefs = ____.____
print(coefs)
# Average minutes per km
minutes_per_km = ____.____[____]
print(minutes_per_km)
# Average speed in km per hour
avg_speed = ____ / ____
print(avg_speed)