Aan de slagGa gratis aan de slag

Een lineair regressiemodel fitten

Er is sinds 2015 jaarlijks een anonieme salarisenquête gehouden onder Europese IT-specialisten. In 2018 deden honderden respondenten vrijwillig mee. In de enquêtedata staan onder andere het aantal jaren werkervaring van de respondenten en hun huidige salaris.

Je gaat de relatie tussen deze twee variabelen analyseren om te ontdekken of meer jaren ervaring leiden tot een hoger of lager salaris.

Je onafhankelijke variabele is experience_years, en je afhankelijke variabele is current_salary.

De data is voor je ingeladen als data, samen met statsmodels.api en pandas, respectievelijk als sm en pd.

Deze oefening maakt deel uit van de cursus

Enquètegegevens analyseren in Python

Cursus bekijken

Oefeninstructies

  • Definieer de variabelen x en y.
  • Voeg de constante term toe.
  • Voer de OLS()-regressie uit en .fit() het model.
  • Print de samenvattingstabel.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____

# Add the constant term
x = ____.____(x)

# Perform .OLS() regression and fit
result = ____.____(y,x).____()

# Print the summary table
print(____.____())
Code bewerken en uitvoeren