Home run!
Regressie naar het gemiddelde is een belangrijk concept in veel domeinen, ook in sport.
Hier zie je een gegevensset met slagstatistieken uit het honkbal voor 2017 en 2018. Elk punt stelt een speler voor, en meer home runs is beter. Een naïeve voorspelling zou zijn dat de prestatie in 2018 hetzelfde is als in 2017. Met andere woorden: een lineaire regressie zou op de lijn "y is x" liggen.
Verken de plot en maak voorspellingen. Wat zegt regressie naar het gemiddelde over het aantal home runs in 2018 voor een speler die in 2017 zeer succesvol was?
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen