CommencerCommencer gratuitement

Influence

L'influence détermine dans quelle mesure un modèle changerait si chaque observation était exclue des calculs du modèle, une à la fois. En d'autres termes, elle mesure la différence entre la ligne de prédiction obtenue en effectuant une régression linéaire sur tous les points de données à l'exception de ce point, et celle obtenue en effectuant une régression linéaire sur l'ensemble des données.

La mesure standard de l'influence est la distance de Cook, qui calcule l'influence en fonction de la taille résiduelle et de l'effet de levier du point.

Vous pouvez voir le même modèle que la dernière fois : le prix des maisons par rapport à la racine carrée de la distance par rapport à la station de métro la plus proche dans l'ensemble de données immobilières de Taïwan.

Veuillez estimer quelles observations auront une influence élevée, puis déplacez le curseur pour le découvrir.

Quelle affirmation est vraie ?

Cet exercice fait partie du cours

Introduction à la régression avec statsmodels en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice