Home run!
Regressie naar het gemiddelde is een belangrijk concept in veel domeinen, waaronder sport.
Hier zie je een gegevensset met honkbalknuppeldata uit 2017 en 2018. Elk punt stelt een speler voor, en meer home runs is beter. Een naïeve voorspelling zou zijn dat de prestatie in 2018 hetzelfde is als in 2017. Met andere woorden: een lineaire regressie zou op de "y equals x"-lijn liggen.
Verken de plot en maak voorspellingen. Wat zegt regressie naar het gemiddelde over het aantal home runs in 2018 voor een speler die in 2017 zeer succesvol was?
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Interactieve oefening met praktijkervaring
Zet theorie om in actie met een van onze interactieve oefeningen
Begin oefening