Aan de slagBegin gratis

Invloed

Invloed meet hoeveel een model zou veranderen als je elke observatie één voor één uit de berekeningen weglaat. Met andere woorden: het meet hoe anders de regressielijn eruit zou zien als je een lineaire regressie draait op alle punten behalve dat punt, vergeleken met een regressie op de volledige gegevensset.

De standaardmaat voor invloed is Cook's distance, die invloed berekent op basis van de grootte van het residu en de leverage van het punt.

Je ziet hetzelfde model als de vorige keer: huizenprijs versus de vierkantswortel van de afstand tot het dichtstbijzijnde MRT-station in de Taiwan real-estate-gegevensset.

Raad welke observaties volgens jou veel invloed hebben en schuif daarna met de slider om het te controleren.

Welke bewering is waar?

Deze oefening maakt deel uit van de cursus

Introductie tot regressie met statsmodels in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening