Adattare un modello di regressione lineare
Dal 2015 viene condotta ogni anno un'indagine anonima sugli stipendi tra specialisti IT europei. Nel 2018, centinaia di partecipanti hanno aderito volontariamente. Nei dati del sondaggio sono inclusi il numero di anni di esperienza dei rispondenti e il loro stipendio attuale.
Analizzerai la relazione tra queste due variabili per capire se più anni di esperienza comportano uno stipendio più alto o più basso.
La tua variabile indipendente è experience_years e la variabile dipendente è current_salary.
I dati sono già stati caricati come data, insieme a statsmodels.api e pandas, rispettivamente come sm e pd.
Questo esercizio fa parte del corso
Analisi dei dati da sondaggio in Python
Istruzioni dell'esercizio
- Definisci le variabili
xey. - Aggiungi il termine costante.
- Esegui la regressione
OLS()e.fit()il modello. - Stampa la tabella di riepilogo.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____
# Add the constant term
x = ____.____(x)
# Perform .OLS() regression and fit
result = ____.____(y,x).____()
# Print the summary table
print(____.____())