Influence
L'influence détermine dans quelle mesure un modèle changerait si chaque observation était exclue des calculs du modèle, une à la fois. En d'autres termes, elle mesure la différence entre la ligne de prédiction obtenue en effectuant une régression linéaire sur tous les points de données à l'exception de ce point, et celle obtenue en effectuant une régression linéaire sur l'ensemble des données.
La mesure standard de l'influence est la distance de Cook, qui calcule l'influence en fonction de la taille résiduelle et de l'effet de levier du point.
Vous pouvez voir le même modèle que la dernière fois : le prix des maisons par rapport à la racine carrée de la distance par rapport à la station de métro la plus proche dans l'ensemble de données immobilières de Taïwan.
Veuillez estimer quelles observations auront une influence élevée, puis déplacez le curseur pour le découvrir.
Quelle affirmation est vraie ?
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice