LoslegenKostenlos loslegen

Ein lineares Regressionsmodell anpassen

Seit 2015 wird jährlich eine anonyme Gehaltsumfrage unter europäischen IT-Spezialistinnen und -Spezialisten durchgeführt. 2018 haben Hunderte von Teilnehmenden freiwillig mitgemacht. In den Umfragedaten sind unter anderem die Anzahl der Berufsjahre der Teilnehmenden sowie ihr aktuelles Gehalt enthalten.

Du analysierst nun die Beziehung zwischen diesen beiden Variablen, um herauszufinden, ob mehr Berufserfahrung zu einem höheren oder niedrigeren Gehalt führt.

Deine unabhängige Variable ist experience_years, und deine abhängige Variable ist current_salary.

Die Daten wurden bereits als data geladen, außerdem statsmodels.api und pandas als sm bzw. pd.

Diese Übung ist Teil des Kurses

Umfragedaten in Python analysieren

Kurs anzeigen

Anleitung zur Übung

  • Definiere die Variablen x und y.
  • Füge den Konstanten-Term hinzu.
  • Führe die Regression mit OLS() aus und .fit() das Modell.
  • Gib die Zusammenfassungstabelle aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____

# Add the constant term
x = ____.____(x)

# Perform .OLS() regression and fit
result = ____.____(y,x).____()

# Print the summary table
print(____.____())
Code bearbeiten und ausführen