Ein lineares Regressionsmodell anpassen
Seit 2015 wird jährlich eine anonyme Gehaltsumfrage unter europäischen IT-Spezialistinnen und -Spezialisten durchgeführt. 2018 haben Hunderte von Teilnehmenden freiwillig mitgemacht. In den Umfragedaten sind unter anderem die Anzahl der Berufsjahre der Teilnehmenden sowie ihr aktuelles Gehalt enthalten.
Du analysierst nun die Beziehung zwischen diesen beiden Variablen, um herauszufinden, ob mehr Berufserfahrung zu einem höheren oder niedrigeren Gehalt führt.
Deine unabhängige Variable ist experience_years, und deine abhängige Variable ist current_salary.
Die Daten wurden bereits als data geladen, außerdem statsmodels.api und pandas als sm bzw. pd.
Diese Übung ist Teil des Kurses
Umfragedaten in Python analysieren
Anleitung zur Übung
- Definiere die Variablen
xundy. - Füge den Konstanten-Term hinzu.
- Führe die Regression mit
OLS()aus und.fit()das Modell. - Gib die Zusammenfassungstabelle aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____
# Add the constant term
x = ____.____(x)
# Perform .OLS() regression and fit
result = ____.____(y,x).____()
# Print the summary table
print(____.____())