LoslegenKostenlos loslegen

Einfluss

Einfluss misst, wie stark sich ein Modell ändern würde, wenn jeweils eine Beobachtung aus den Modellberechnungen herausgelassen wird. Das heißt, es misst, wie anders die Vorhersagelinie aussehen würde, wenn du eine lineare Regression auf allen Datenpunkten außer diesem einen ausführst, im Vergleich zu einer linearen Regression auf dem gesamten Datensatz.

Die Standardkennzahl für den Einfluss ist die Cook-Distanz, die den Einfluss basierend auf der Größe des Residuums und der Hebelwirkung des Punkts berechnet.

Hier siehst du dasselbe Modell wie zuvor: Hauspreis im Verhältnis zur Quadratwurzel der Entfernung zur nächsten MRT-Station im Taiwan-Immobiliendatensatz.

Schätze, welche Beobachtungen deiner Meinung nach einen hohen Einfluss haben, und bewege dann den Schieberegler, um es herauszufinden.

Welche Aussage ist richtig?

Diese Übung ist Teil des Kurses

Einführung in Regression mit R

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten