Invloed
Invloed meet hoeveel een model zou veranderen als je elke observatie één voor één uit de berekeningen weglaat. Met andere woorden: het meet hoe anders de regressielijn eruit zou zien als je een lineaire regressie draait op alle punten behalve dat punt, vergeleken met een regressie op de volledige gegevensset.
De standaardmaat voor invloed is Cook's distance, die invloed berekent op basis van de grootte van het residu en de leverage van het punt.
Je ziet hetzelfde model als de vorige keer: huizenprijs versus de vierkantswortel van de afstand tot het dichtstbijzijnde MRT-station in de Taiwan real-estate-gegevensset.
Raad welke observaties volgens jou veel invloed hebben en schuif daarna met de slider om het te controleren.
Welke bewering is waar?
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Interactieve oefening met praktijkervaring
Zet theorie om in actie met een van onze interactieve oefeningen
Begin oefening