Influence
L'influence mesure à quel point un modèle changerait si chaque observation était exclue des calculs du modèle, une à la fois. En d'autres termes, elle mesure à quel point la ligne de prédiction serait différente si vous exécutiez une régression linéaire sur tous les points de données à l'exception de ce point, par rapport à l'exécution d'une régression linéaire sur l'ensemble de l'ensemble des données.
La mesure standard de l'influence est la distance de Cook, qui calcule l'influence en fonction de la taille résiduelle et de l'effet de levier du point.
Vous pouvez voir le même modèle que la dernière fois : le prix du logement en fonction de la racine carrée de la distance par rapport à la station MRT la plus proche dans l'ensemble de données immobilières de Taïwan.
Devinez les observations qui, selon vous, auront une grande influence, puis déplacez le curseur pour le découvrir.
Quelle est l'affirmation la plus vraie ?
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
