Variazione in due parti
Dati due insiemi di dati distanza-verso-tempo, uno con velocità molto piccola e uno con velocità grande. Nota che entrambi possono avere lo stesso errore standard della pendenza, ma un R-quadrato diverso per l'intero modello, a seconda dell'ampiezza della pendenza ("dimensione dell'effetto") rispetto all'errore standard ("incertezza").
Se tracciamo entrambi gli insiemi come scatter plot sugli stessi assi, il contrasto è evidente. La variazione dovuta alla pendenza è diversa dalla variazione dovuta alla dispersione casuale attorno alla linea di tendenza. In questo esercizio, il tuo obiettivo è calcolare l'errore standard e l'R-quadrato per due insiemi di dati e confrontarli.

Questo esercizio fa parte del corso
Introduzione alla modellazione lineare in Python
Istruzioni dell'esercizio
- Crea e
fit()un modellools()per entrambi gli insiemi di datidistances1edistances2. - Usa
.bsedei modelli risultantimodel_1emodel_2, e la chiave'times'per estrarre i valori dell'errore standard della pendenza da ciascun modello. - Usa l'attributo
.rsquaredper estrarre il valore di R-quadrato da ciascun modello. - Stampa i risultati
se_1,rsquared_1,se_2,rsquared_2e confrontali visivamente.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Build and fit two models, for columns distances1 and distances2 in df
model_1 = ols(formula="____ ~ times", data=df).____()
model_2 = ols(formula="____ ~ times", data=df).____()
# Extract R-squared for each model, and the standard error for each slope
se_1 = model_1.____['times']
se_2 = model_2.____['times']
rsquared_1 = model_1.____
rsquared_2 = model_2.____
# Print the results
print('Model 1: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))
print('Model 2: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))