IniziaInizia gratis

Adattare un modello di regressione lineare

Dal 2015 viene condotta ogni anno un'indagine anonima sugli stipendi tra specialisti IT europei. Nel 2018, centinaia di partecipanti hanno aderito volontariamente. Nei dati del sondaggio sono inclusi il numero di anni di esperienza dei rispondenti e il loro stipendio attuale.

Analizzerai la relazione tra queste due variabili per capire se più anni di esperienza comportano uno stipendio più alto o più basso.

La tua variabile indipendente è experience_years e la variabile dipendente è current_salary.

I dati sono già stati caricati come data, insieme a statsmodels.api e pandas, rispettivamente come sm e pd.

Questo esercizio fa parte del corso

Analisi dei dati da sondaggio in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Definisci le variabili x e y.
  • Aggiungi il termine costante.
  • Esegui la regressione OLS() e .fit() il modello.
  • Stampa la tabella di riepilogo.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____

# Add the constant term
x = ____.____(x)

# Perform .OLS() regression and fit
result = ____.____(y,x).____()

# Print the summary table
print(____.____())
Modifica ed esegui il codice