Aan de slagBegin gratis

Een lineair regressiemodel fitten

Er is sinds 2015 jaarlijks een anonieme salarisenquête gehouden onder Europese IT-specialisten. In 2018 deden honderden respondenten vrijwillig mee. In de enquêtedata staan onder andere het aantal jaren werkervaring van de respondenten en hun huidige salaris.

Je gaat de relatie tussen deze twee variabelen analyseren om te ontdekken of meer jaren ervaring leiden tot een hoger of lager salaris.

Je onafhankelijke variabele is experience_years, en je afhankelijke variabele is current_salary.

De data is voor je ingeladen als data, samen met statsmodels.api en pandas, respectievelijk als sm en pd.

Deze oefening maakt deel uit van de cursus

Enquètegegevens analyseren in Python

Bekijk cursus

Oefeninstructies

  • Definieer de variabelen x en y.
  • Voeg de constante term toe.
  • Voer de OLS()-regressie uit en .fit() het model.
  • Print de samenvattingstabel.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____

# Add the constant term
x = ____.____(x)

# Perform .OLS() regression and fit
result = ____.____(y,x).____()

# Print the summary table
print(____.____())
Code bewerken en uitvoeren