Variazione in due parti

Dati due insiemi di dati distanza-verso-tempo, uno con velocità molto piccola e uno con velocità grande. Nota che entrambi possono avere lo stesso errore standard della pendenza, ma un R-quadrato diverso per l'intero modello, a seconda dell'ampiezza della pendenza ("dimensione dell'effetto") rispetto all'errore standard ("incertezza").

Se tracciamo entrambi gli insiemi come scatter plot sugli stessi assi, il contrasto è evidente. La variazione dovuta alla pendenza è diversa dalla variazione dovuta alla dispersione casuale attorno alla linea di tendenza. In questo esercizio, il tuo obiettivo è calcolare l'errore standard e l'R-quadrato per due insiemi di dati e confrontarli.

Questo esercizio fa parte del corso

Introduzione alla modellazione lineare in Python

Visualizza corso

Istruzioni dell'esercizio

Crea e fit() un modello ols() per entrambi gli insiemi di dati distances1 e distances2.
Usa .bse dei modelli risultanti model_1 e model_2, e la chiave 'times' per estrarre i valori dell'errore standard della pendenza da ciascun modello.
Usa l'attributo .rsquared per estrarre il valore di R-quadrato da ciascun modello.
Stampa i risultati se_1, rsquared_1, se_2, rsquared_2 e confrontali visivamente.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Build and fit two models, for columns distances1 and distances2 in df
model_1 = ols(formula="____ ~ times", data=df).____()
model_2 = ols(formula="____ ~ times", data=df).____()

# Extract R-squared for each model, and the standard error for each slope
se_1 = model_1.____['times']
se_2 = model_2.____['times']
rsquared_1 = model_1.____
rsquared_2 = model_2.____

# Print the results
print('Model 1: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))
print('Model 2: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))

Modifica ed esegui il codice