Invloed
Invloed meet hoeveel een model zou veranderen als je telkens één observatie uit de berekeningen weglaat. Met andere woorden: het meet hoe anders de voorspellingslijn eruit zou zien als je een lineaire regressie uitvoert op alle punten behalve dat ene punt, vergeleken met een lineaire regressie op de volledige gegevensset.
De standaardmaatstaf voor invloed is Cook's distance, die invloed berekent op basis van de grootte van het residu en de leverage van het punt.
Hier zie je hetzelfde model als de vorige keer: huizenprijs versus de vierkantswortel van de afstand tot het dichtstbijzijnde MRT-station in de Taiwan-vastgoedgegevensset.
Raad welke observaties jij denkt dat veel invloed hebben en beweeg daarna de schuifregelaar om het te zien.
Welke uitspraak is waar?
Deze oefening maakt deel uit van de cursus
Introductie tot regressie in R
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen