Invloed
Invloed meet hoeveel een model zou veranderen als je elke observatie één voor één uit de modelberekeningen zou weglaten. Met andere woorden: het meet hoe anders de trendlijn eruit zou zien als je een lineaire regressie uitvoert op alle punten behalve dat ene punt, vergeleken met een regressie op de hele gegevensset.
De standaardmaat voor invloed is Cook's distance, die invloed berekent op basis van de grootte van het residu en de leverage van het punt.
Je ziet hetzelfde model als de vorige keer: huizenprijs versus de vierkantswortel van de afstand tot het dichtstbijzijnde MRT-station in de Taiwan-realestatedataset.
Raad eerst welke observaties volgens jou veel invloed hebben en beweeg daarna de schuifregelaar om het te controleren.
Welke uitspraak is waar?
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen