Einfluss
Einfluss misst, wie stark sich ein Modell ändern würde, wenn jede Beobachtung der Reihe nach aus den Modellberechnungen weggelassen wird. Das heißt, es misst, wie anders die Regressionsgerade aussehen würde, wenn du eine lineare Regression auf allen Datenpunkten außer diesem Punkt laufen lässt, im Vergleich zu einer linearen Regression auf dem gesamten Datensatz.
Die Standardkennzahl für den Einfluss ist die Cook-Distanz, die den Einfluss basierend auf der Größe des Residuums und der Hebelwirkung des Punkts berechnet.
Du siehst dasselbe Modell wie zuvor: Hauspreis gegenüber der Quadratwurzel der Entfernung zur nächsten MRT-Station im Taiwan-Immobiliendatensatz.
Rate, welche Beobachtungen deiner Meinung nach einen hohen Einfluss haben, und bewege dann den Schieberegler, um es herauszufinden.
Welche Aussage ist richtig?
Diese Übung ist Teil des Kurses
Einführung in Regression mit statsmodels in Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten