Een lineair regressiemodel fitten
Er is sinds 2015 jaarlijks een anonieme salarisenquête gehouden onder Europese IT-specialisten. In 2018 deden honderden respondenten vrijwillig mee. In de enquêtedata staan onder andere het aantal jaren werkervaring van de respondenten en hun huidige salaris.
Je gaat de relatie tussen deze twee variabelen analyseren om te ontdekken of meer jaren ervaring leiden tot een hoger of lager salaris.
Je onafhankelijke variabele is experience_years, en je afhankelijke variabele is current_salary.
De data is voor je ingeladen als data, samen met statsmodels.api en pandas, respectievelijk als sm en pd.
Deze oefening maakt deel uit van de cursus
Enquètegegevens analyseren in Python
Oefeninstructies
- Definieer de variabelen
xeny. - Voeg de constante term toe.
- Voer de
OLS()-regressie uit en.fit()het model. - Print de samenvattingstabel.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____
# Add the constant term
x = ____.____(x)
# Perform .OLS() regression and fit
result = ____.____(y,x).____()
# Print the summary table
print(____.____())